Google AI 赋能!Openjourney 成为 MidJourney 的开源“杀手级”替代品
创新开源项目引发关注
近日,开发者 @ammaar 推出的开源项目 Openjourney 引发广泛关注。该项目不仅在界面设计上借鉴了 MidJourney,更在技术底层深度整合了 Google Gemini SDK,并融合了 Imagen4 与 Veo2/3 模型,打造了一套完整的 AI 图像与视频生成系统。
Openjourney 的核心目标是让用户便捷地借助 AI 技术创作高质量图像与视频,同时享受 MidJourney 般流畅的操作体验。
图像生成:高效清晰,操作便捷
借助 Imagen4 模型,Openjourney 能根据用户输入的文字描述,生成四张分辨率为 1024x1024 的高清图像。其界面采用 MidJourney 经典的四宫格布局,并加入动态加载效果,显著提升交互体验。
用户可直接下载生成的图片、放大查看细节,甚至一键将图片转化为视频内容。
视频生成:文字转动画,静态变动态
在视频创作方面,Openjourney 同样表现出色。通过 Veo3 模型,用户输入文字描述即可生成一段 3-5 秒、720p 分辨率并配有音频的短视频。
借助 Veo2 模型,用户还可将静态图像"动"起来------选择一张图片并添加描述文字,即可自动生成动画视频。
视频以 2x2 网格形式展示,鼠标悬停即可自动播放,交互性极强。
用户体验:流畅直观,操作贴心
Openjourney 在用户交互设计方面也充分考虑使用习惯。其输入框简洁明了,用户输入提示词后,点击"生成"按钮或按下回车即可启动生成流程。
平台支持全屏预览与下载作品,并提供便捷的翻页功能,用户可使用方向键快速浏览生成历史,犹如翻看相册。
界面动画效果基于 Framer Motion 实现,加载过程中还加入了"骨架屏"占位,整体视觉效果专业且流畅。
技术架构:现代前沿,适合二次开发
Openjourney 采用现代前端技术栈,具备良好的可扩展性与稳定性,非常适合开发者学习和定制化开发。
- 前端框架使用 Next.js15(含 App Router 和 Turbopack),保障性能与开发效率
- 采用 TypeScript 提高代码质量与可维护性
- 界面布局基于 Tailwind CSS v4,快速构建美观 UI
- 交互动画由 Framer Motion 驱动,提升用户体验
- 整合 ShadCN 与 Radix UI,确保界面美观并符合无障碍标准
图像与视频生成功能通过 Google Gemini SDK 调用 Imagen4 和 Veo2/3 模型实现,展现了 Google AI 技术在创意领域的强大能力。
开源社区新亮点
Openjourney 的发布,为开源社区提供了一个 MidJourney 的有力替代方案,标志着 AI 图像与视频生成技术正加速走向开放与普及。
该项目不仅展示了 Google AI 模型在创意工具领域的应用潜力,也为开发者和创作者提供了探索未来视觉内容生成的新平台。