免费商用!开源LTX-Video 13B解放所有创作者

AI ToolBox
AI ToolBox
2025年7月18日

技术突破:多尺度渲染重塑视频生成

LTX-Video13B引入创新的多尺度渲染机制,通过先构建低分辨率的视频框架,再逐层提升细节的方式,显著提升了生成效率与画质表现。该模型运行速度快达同类产品的30倍,在NVIDIA RTX4090等主流显卡上即可流畅运行,仅需2秒即可生成5秒视频,大幅降低硬件门槛。

基于DiT(Diffusion Transformer)架构,结合内核优化与bfloat16数据格式,LTX-Video13B支持1216×704分辨率、30帧/秒的实时生成,兼容文本到视频、图像到视频、视频到视频等多种生成模式,满足多样化的创作需求。

强大功能:精准控制与无限创意

该模型在动作连贯性、场景结构与镜头逻辑理解方面表现出色,能生成逻辑清晰、细节丰富的视频内容。其支持关键帧控制、角色与镜头运动调节以及多镜头组合,为创作者提供精细的操作体验。

例如,用户可通过文本提示或参考图像,精准调整角色动作、场景转换或镜头角度,打造电影级视觉效果。同时,LTX-Video13B还支持视频延展与风格替换功能,用户可将现有视频延长至60秒,或将实景转换为动画风格,拓展了其在短片、广告、社交媒体内容创作中的应用边界。

开源生态:赋能开发者与创作者

LTX-Video13B已开源,可在GitHub与Hugging Face平台免费获取,支持开发者自由定制与优化。Lightricks同步推出LTX-Video-Trainer工具,支持2B与13B模型的完整微调及LoRA训练,便于开发深度、姿态或边缘检测等控制模型。

模型兼容ComfyUI流程,新增的Looping Sampler节点可生成任意长度视频,确保画面与动作的一致性。为提升可用性,Lightricks还推出8位量化版本(ltxv-13b-fp8)与IC-LoRA Detailer,优化低内存设备运行表现。对年收入低于1000万美元的组织完全免费,彰显其推动AI创作普及的愿景。

视频生成的新里程碑

LTX-Video13B的发布,标志着开源视频生成技术迈入新阶段。其多尺度渲染技术与对消费级硬件的适配,打破了传统AI视频生成对高性能设备的依赖,为中小团队与个人创作者提供了专业级工具。

目前,该模型已集成至LTX Studio平台,用户可通过官方网站GitHub获取模型与文档。Lightricks将持续优化模型,拓展多模态与控制类型支持,为创作者带来更强大的功能。

未来展望:开启AI视频创作新篇章

Lightricks表示,LTX-Video13B的成功离不开与Getty Images等机构合作提供的高质量数据集,确保输出内容的商业安全性与视觉吸引力。未来,团队将探索时间变化提示与多模态生成技术,以满足更复杂的创作需求。

随着开源社区的持续推动,LTX-Video13B有望成为AI视频生成领域的标杆之作,引领行业迈向更高水平。