智谱上线视频生成模型：30秒生成6秒时长，免费不限次！B 站也有研发功劳？

AI前线

2024-09-17

整理 | 华卫

Sora 毫无疑问带来 AI 大模型的全新玩法，大模型可基于任意文字生成视频，包括 Runway 的 Gen 系列、微软的 Nuwa、Meta 的 Emu、谷歌的 Phenaki/VideoPoet、智谱 CogVideo 等。

7 月 26 日，智谱 AI CEO 张鹏在智谱 Open Day 上宣布，AI 生成视频模型清影（Ying）正式上线智谱清言，只需要 30 秒时间就能生成 6 秒时长、1440x960 清晰度的 3:2 比例视频。当日起，所有 C 端用户都能通过清影（Ying）体验到 AI 文生视频、图生视频能力。

PC 端链接：https://chatglm.cn/video
移动端链接：https://chatglm.cn/download?fr=web_home

输入一段文字后（俗称 Prompt），用户可以选择自己想要生成的风格，包括卡通 3D、黑白、油画、电影感等，配上清影自带的音乐，就能够生成充满 AI 想象力的视频片段。

除了文本生成视频，也可以到清影上玩图片生成视频。图生视频带来了更多的新玩法，包括表情包梗图、广告制作、剧情创作、短视频创作等。同时，基于清影的「老照片动起来」小程序也会同步上线，只需一步上传老照片，就能让凝练在旧时光中的照片灵动起来。

现在，清影（Ying）API 已同步上线大模型开放平台 bigmodel.cn，企业和开发者通过调用 API 的方式，体验和使用文生视频以及图生视频的模型能力。

据了解，清影（Ying）的付费方案是：在首发测试期间，所有用户均可免费使用，不限次数。此后，付费 5 元可解锁一天（24 小时）的高速通道权益，付费 199 元可解锁一年的付费高速通道权益。

清影上线后，我们也第一时间测试了它的实际效果。

文生视频

先来看看对于可爱动物的视频生成效果。我们输入了以下两个提示词：

prompt1：两只小浣熊打架抢苹果

prompt2：一只奶牛猫在看猫和老鼠的动画片

图生视频

再来看看对于人类的视频生成效果，我们输入了一张“仕女拉小提琴”的图片：

得到的视频如下：

背后自研技术，

推理速度比前代提升 6 倍

据介绍，清影（Ying）底座的视频生成模型是 CogVideoX，它能将文本、时间、空间三个维度融合起来，参考了 Sora 的算法设计；它也是一个 DiT 架构，通过优化，CogVideoX 相比前代（CogVideo）推理速度提升了 6 倍。

并且，智谱自研了一个端到端视频理解模型，用于为海量的视频数据生成详细的、贴合内容的描述，这样可以增强模型的文本理解和指令遵循能力，使得生成的视频更符合用户的输入，能够理解超长复杂 prompt 指令。

在内容连贯性上，智谱 AI 自研高效三维变分自编码器结构（3D VAE），将原视频空间压缩至 2% 大小，配合 3D RoPE 位置编码模块，更有利于在时间维度上捕捉帧间关系，建立起视频中的长程依赖。

该生成式视频模型的研发中，Scaling Law 继续在算法和数据两方面发挥作用。“我们积极在模型层面探索更高效的 scaling 方式。”张鹏表示：“随着算法、数据不断迭代，相信 Scaling Law 将继续发挥强大威力。”

bilibili 作为合作伙伴也参与并支持清影的研发过程。同时，合作伙伴华策影视也参与了模型共建。

此外，智谱 AI 生成式视频研发得到北京市的大力支持，海淀区是智谱 AI 总部所在地，为智谱 AI 开展大模型研发提供了产业投资、算力补贴、应用场景示范、人才等全方位支持。智谱 AI 生成式视频研发算力支持则来自于亦庄集群，目前北京亦庄人工智能公共算力平台已建成。

内容推荐

在这个智能时代，AI 技术如潮水般涌入千行百业，深度重塑生产与生活方式。大模型技术引领创新，精准提升行业效率，从教育个性化教学到零售精准营销，从通信稳定高效到金融智能风控，AI 无处不在。它不仅是技术革新的先锋，更是社会经济发展的强大驱动力。在 AI 的赋能下，我们正迈向一个更加智能、便捷、高效的新未来，体验前所未有的生活变革与行业飞跃。关注「AI 前线」公众号，回复「千行百业」获取免费案例资料。

活动推荐

8 月 16-17 日，FCon 全球金融科技大会将在上海举办。本届大会由中国信通院铸基计划作为官方合作机构，致力于展示金融数字化在“十四五”期间的关键进展，帮助金融机构在“交卷”前更具针对性地“查缺补漏”。

大会还邀请了来自工银科技、北京银行、平安银行、广发银行、中信银行、度小满、蚂蚁集团等金融机构及金融科技公司的资深专家，现身说法分享其在金融科技应用实践中的经验与深入洞察，分享近一年来金融行业 AI 大模型的落地实践经验和成果。

大会火热报名中，7 月 31 日前可以享受 9 折优惠，单张门票节省 480 元（原价 4800 元），详情可联系票务经理 17310043226 咨询。

今日荐文

两天内，Meta 和 Mistral 两款主流大模型打擂台！已经不仅卷性能了，谁更便宜就用谁？
Llama 3.1 源模型泄露背后：失手的 GitHub，破碎的 Meta，好在最小参数都能打脸GPT-4o！
Claude Sonnet 3.5 口碑爆棚！10 倍速开发，“2 个月内用 Rust 从零构建完一款产品”
没投简历却被陌生HR随机辱骂，HR道歉称压力大；OPPO 回应“大量裁撤华为系员工”；传百度新任公关一号位或为蒋昕捷｜AI 周报
开源独角兽 GitLab 走上“卖身”路！前工程师拆台：赚钱的业务不好好运营，开发了一堆没用的功能

你也「在看」吗？👇

继续滑动看下一个

AI前线

向上滑动看下一个

故意按摩让女生“产生欲望”后发生关系，算性侵吗？

炸大瓜！君子固穷豪刷阿哲，锤“姓氏哥”！VIC哥凌晨豪刷俊雅！

吃仇恨票？小天天甩脸，秒挂舞帝！阿哲太权威了，仙洋KS喊话！白冰0人抢福袋遭群嘲！

微凉回应签约哲领！赶超YY，大佛爆抖音公会流水！刘一手KS出镜直播！

讲座预告 | 杨松：数据跨境流动的国际法问题

智谱上线视频生成模型：30秒生成6秒时长，免费不限次！B 站也有研发功劳？

今日荐文

您可能也对以下帖子感兴趣

故意按摩让女生“产生欲望”后发生关系，算性侵吗？

炸大瓜！君子固穷豪刷阿哲，锤“姓氏哥”！VIC哥凌晨豪刷俊雅！

吃仇恨票？小天天甩脸，秒挂舞帝！阿哲太权威了，仙洋KS喊话！白冰0人抢福袋遭群嘲！

微凉回应签约哲领！赶超YY，大佛爆抖音公会流水！刘一手KS出镜直播！

讲座预告 | 杨松：数据跨境流动的国际法问题

生成图片，分享到微信朋友圈

智谱上线视频生成模型：30秒生成6秒时长，免费不限次！B 站也有研发功劳？

今日荐文

您可能也对以下帖子感兴趣