LTX-Video 是首个基于DiT架构的实时高质量视频生成模型。该模型能以1216×704分辨率生成30帧/秒的视频,生成速度甚至快于视频播放时长。通过在大规模多样化视频数据集上的训练,该模型能够生成内容逼真且丰富的高清视频。

该模型支持以下功能:

  • 文本生成图像

  • 图像生成视频

  • 基于关键帧的动画制作

  • 视频延展(支持前后双向扩展)

  • 视频到视频的转换

  • 以及上述功能的任意组合使用

(注:DiT指Diffusion Transformer,是一种结合扩散模型和Transformer架构的生成模型)

https://github.com/Lightricks/LTX-Video