5月6日消息,估值超200亿的国内 AI 大模型独角兽公司“智谱 AI”正在研发对标美国Sora的高质量文生视频模型,预计最快年内发布。 “今年将是文生视频大模型的爆发期。智谱也将通过使用更高质量的数据和更大的参数,开发高质量的文生视频产品。”智谱 AI 内部人士坦言,对标Sora的文生视频模型发展突破的关键主要包括技术路线选择、训练所用的高质量视频素材语料两个方面。 “技术路线上,Transformer 与Diffusion 的结合架构如何在效率和效果上进行优化,如何解决连续帧之间的抖动问题,如何在满足高分辨率的同时实现高一致性的长序列生成,如何获取高质量数据泛化到更多更细节的真实场景,都是技术上需要解决和通过大量实验试错的问题;数据集方面,此前 Sora 被评价模型对摄影术语(跟拍、平移、镜头切换)的理解有限,所生成的视频后期还需要对视频素材进行超分处理。公司会注重更全面的优质数据版权与使用。”上述人士称。(钛媒体) OpenAI推出Memory功能