LTX VIDEO

LTX-Video：具有角色一致性和多图像参考的实时高质量视频生成

1000+设计师推荐

凭借LTX VIDEO的DiT基础架构，优化效率，生成768x512分辨率的24 FPS视频速度比你看完还快。

采用先进的视频VAE，实现1:192时空下采样，确保高质量输出，而不影响运行效率或一致性。

轻松从详细提示或使用图像参考创建视频，使LTX VIDEO适合各种创意应用和故事讲述。

LTX VIDEO的开源性质允许开发者为特定项目进行微调和定制，支持LoRA和管道并行，实现无缝多GPU设置。

LTX VIDEO利用尖端优化技术，在中端GPU如RTX 4060上不到一分钟即可生成720x480视频。使用8位优化版本LTX-VideoQ8，可享受高达3倍的性能提升。

通过LoRA支持和Diffusion-Pipe对LTX VIDEO进行特定用例的微调。通过ComfyUI或Diffusers集成自定义节点和工作流程，使模型适应您的独特需求。

LTX VIDEO是一款基于DiT的视频潜在扩散模型，专为实时生成高分辨率视频而设计，提供文本转视频和图像转视频功能。

LTX VIDEO能在NVIDIA H100上仅用2秒钟生成5秒的24 FPS视频，分辨率为768×512，速度和效率超过其他模型。

虽然LTX VIDEO针对NVIDIA GPU进行了优化，但它可以在具有至少8GB VRAM的大多数GPU上运行。性能会随着更高性能的硬件而提升，实现超快速生成。

克隆官方GitHub仓库，创建Python虚拟环境，并安装依赖项。然后下载模型检查点，并使用提供的推理脚本开始生成视频。

是的。与Lightricks的开放合作理念一致，源代码和预训练模型公开可用，鼓励社区贡献和改进。

绝对可以。LTX VIDEO支持基于LoRA的训练和管道并行，允许创作者根据自己的独特需求和领域定制模型。

LTX VIDEO在32的倍数分辨率和8+1（例如257）帧数上表现最佳。为了获得最佳结果，建议保持在720×1280以下。

LTX VIDEO支持扩展的帧序列，并为可扩展性而构建，允许您生成具有平滑过渡和连贯场景的更长视频。

详细的电影式提示，描述动作、环境和照明，将获得最佳结果。要全面且按时间顺序，就像为电影分镜头设计一样。

查看官方LTX VIDEO GitHub仓库，加入社区讨论论坛，或查阅README和问题跟踪器以获得故障排除和高级提示。