AI 在线工具 | 最新人工智能新闻与工具

创新开源项目引发关注

近日，开发者 @ammaar 推出的开源项目 Openjourney 引发广泛关注。该项目不仅在界面设计上借鉴了 MidJourney，更在技术底层深度整合了 Google Gemini SDK，并融合了 Imagen4 与 Veo2/3 模型，打造了一套完整的 AI 图像与视频生成系统。

Openjourney 的核心目标是让用户便捷地借助 AI 技术创作高质量图像与视频，同时享受 MidJourney 般流畅的操作体验。

借助 Imagen4 模型，Openjourney 能根据用户输入的文字描述，生成四张分辨率为 1024x1024 的高清图像。其界面采用 MidJourney 经典的四宫格布局，并加入动态加载效果，显著提升交互体验。

用户可直接下载生成的图片、放大查看细节，甚至一键将图片转化为视频内容。

在视频创作方面，Openjourney 同样表现出色。通过 Veo3 模型，用户输入文字描述即可生成一段 3-5 秒、720p 分辨率并配有音频的短视频。

借助 Veo2 模型，用户还可将静态图像"动"起来------选择一张图片并添加描述文字，即可自动生成动画视频。

视频以 2x2 网格形式展示，鼠标悬停即可自动播放，交互性极强。

Openjourney 在用户交互设计方面也充分考虑使用习惯。其输入框简洁明了，用户输入提示词后，点击"生成"按钮或按下回车即可启动生成流程。

平台支持全屏预览与下载作品，并提供便捷的翻页功能，用户可使用方向键快速浏览生成历史，犹如翻看相册。

界面动画效果基于 Framer Motion 实现，加载过程中还加入了"骨架屏"占位，整体视觉效果专业且流畅。

Openjourney 采用现代前端技术栈，具备良好的可扩展性与稳定性，非常适合开发者学习和定制化开发。

图像与视频生成功能通过 Google Gemini SDK 调用 Imagen4 和 Veo2/3 模型实现，展现了 Google AI 技术在创意领域的强大能力。

Openjourney 的发布，为开源社区提供了一个 MidJourney 的有力替代方案，标志着 AI 图像与视频生成技术正加速走向开放与普及。

该项目不仅展示了 Google AI 模型在创意工具领域的应用潜力，也为开发者和创作者提供了探索未来视觉内容生成的新平台。