Google AI 赋能!Openjourney 成为 MidJourney 的开源“杀手级”替代品

AI ToolBox
AI ToolBox
2025年7月24日

创新开源项目引发关注

近日,开发者 @ammaar 推出的开源项目 Openjourney 引发广泛关注。该项目不仅在界面设计上借鉴了 MidJourney,更在技术底层深度整合了 Google Gemini SDK,并融合了 Imagen4 与 Veo2/3 模型,打造了一套完整的 AI 图像与视频生成系统。

图片

Openjourney 的核心目标是让用户便捷地借助 AI 技术创作高质量图像与视频,同时享受 MidJourney 般流畅的操作体验。

图像生成:高效清晰,操作便捷

借助 Imagen4 模型,Openjourney 能根据用户输入的文字描述,生成四张分辨率为 1024x1024 的高清图像。其界面采用 MidJourney 经典的四宫格布局,并加入动态加载效果,显著提升交互体验。

用户可直接下载生成的图片、放大查看细节,甚至一键将图片转化为视频内容。

视频生成:文字转动画,静态变动态

在视频创作方面,Openjourney 同样表现出色。通过 Veo3 模型,用户输入文字描述即可生成一段 3-5 秒、720p 分辨率并配有音频的短视频。

借助 Veo2 模型,用户还可将静态图像"动"起来------选择一张图片并添加描述文字,即可自动生成动画视频。

视频以 2x2 网格形式展示,鼠标悬停即可自动播放,交互性极强。

用户体验:流畅直观,操作贴心

Openjourney 在用户交互设计方面也充分考虑使用习惯。其输入框简洁明了,用户输入提示词后,点击"生成"按钮或按下回车即可启动生成流程。

平台支持全屏预览与下载作品,并提供便捷的翻页功能,用户可使用方向键快速浏览生成历史,犹如翻看相册。

界面动画效果基于 Framer Motion 实现,加载过程中还加入了"骨架屏"占位,整体视觉效果专业且流畅。

技术架构:现代前沿,适合二次开发

Openjourney 采用现代前端技术栈,具备良好的可扩展性与稳定性,非常适合开发者学习和定制化开发。

  • 前端框架使用 Next.js15(含 App Router 和 Turbopack),保障性能与开发效率
  • 采用 TypeScript 提高代码质量与可维护性
  • 界面布局基于 Tailwind CSS v4,快速构建美观 UI
  • 交互动画由 Framer Motion 驱动,提升用户体验
  • 整合 ShadCN 与 Radix UI,确保界面美观并符合无障碍标准

图像与视频生成功能通过 Google Gemini SDK 调用 Imagen4 和 Veo2/3 模型实现,展现了 Google AI 技术在创意领域的强大能力。

开源社区新亮点

Openjourney 的发布,为开源社区提供了一个 MidJourney 的有力替代方案,标志着 AI 图像与视频生成技术正加速走向开放与普及。

该项目不仅展示了 Google AI 模型在创意工具领域的应用潜力,也为开发者和创作者提供了探索未来视觉内容生成的新平台。