是由七火山科技开发的一个平台,专注于提供先进的人工智能视频生成服务。这个平台的核心产品是Etna(埃特纳)模型,它是一个AIGC(AIGeneratedContent,人工智能生成内容)模型,能够根据用户提供的简短文本描述生成相应的视频内容。
Etna模型的技术架构基于Diffusion架构,并正在实验和适配一个与Sora相似的Diffusion+Transform架构,这使得它能够更好地处理视频数据,考虑图像序列中的时间连续性。它在语言模型和图像模型中插入了时空卷积和注意力层,从而拥有一定的时空理解能力,能够理解并生成具有时间维度的视频内容。
Etna模型的训练过程采用了先进的深度学习技术策略,包括大规模训练(LDS)、复杂的超参数优化(HPO)和微调(DPO),这些技术的应用确保了模型的强大性能和生成能力。