6小时视频,一键转成PPT,赵晓卉们再也不用发疯了
AI「硬控」PPT。
昨天,脱口秀演员赵晓卉的淘汰感言,逮着 PPT 嘎嘎一顿乱杀,并喜提微博热搜。
「但凡上过班的人,都不会想做 PPT」;
「我现在对 PPT 已经 PPTSD 了」;
「我一眼就看出来了,那个标题,都没有居中」;
「昨天赢不了 PPT,今天交不出 PPT,PPT 是什么高贵的东西,怎么随便在什么地方都可以支配我」
……
妈耶,几句简单吐槽就把打工人们整破防了。
天下苦 PPT 久矣。
就在今天,阿里通义上线了最新 PPT 产品,主打的就是一键生成 PPT。
目前,通义 PPT 仅在 PC 端上线,免费的哦。
体验链接:https://tongyi.aliyun.com/aippt/
-1-
啥,音视频都能转 PPT 了?
一个月前,我们测评了 Kimi 的 PPT 助手。(查看详情,请移步:一键生成 PPT!Kimi:让「PPT 民工」先浪起来)
它不仅能一句话生成 PPT,还能上传文档一键转换成 PPT。
而阿里这次推出的通义 PPT,还整出了个音视频一键转 PPT 的功能。
这意味着,以后吗喽们再也不用吭哧吭哧整理会议纪要了,直接手机录音,上传给通义,它反手就甩出一个精美 PPT。
我们上手体验了一把。
先上传一段视频,我们就拿脱口秀演员「鸭绒」吐槽相亲像共享单车这个视频为例。
上传一段 2 分半钟的视频,需要一分钟左右,然后它就根据视频内容自动生成大纲,我们也可以点击编辑大纲。
通义 PPT 的模板相对较少,只有简约、科技、欧美风等 24 种,要知道,Kimi 的 PPT 助手的模板可是多到数不过来。
PPT 生成后,我们可以在线演示、保存、下载,如果不满意还可以更换模版。
上效果:
虽然通义 PPT 的模板较少,但它能把 6 小时的音视频一键转成 PPT,这效率,还要啥自行车。
它生成的大纲和内容信息密度较高,与上传的视频关联性更强。
此外,它还有一大亮点,就是能够自动生成配图。
-2-
Kimi 和通义,谁是 PPT 小能手?
除了音视频转 PPT 这一绝技,通义还推出了「一句话生成 PPT」、「上传文档生成 PPT」的功能,这与 Kimi 的 PPT 助手不谋而合。
接下来,我们就对比下这两款 PPT 生成器。
Round 1: 一句话生成 PPT
我们输入提示词:生成一份刚刚结束的 2024 年巴黎奥运会的 PPT。
这是通义生成的 PPT:
通义 PPT 围绕奥运会开幕式亮点、赛事概览与明星运动员以及闭幕式与奥林匹克精神三个方面进行介绍,整体排版简洁清晰,不过在某些细节方面,通义还是会胡说八道。
例如,通义称,2024 年巴黎奥运会上中国体操队与美国队在团体全能项目中展开激烈角逐,最终中国队以微弱优势夺冠,但这种说法并不准确。
这次奥运会上,中国队在艺术体操团体全能项目中打败以色列,夺得金牌,而在男子竞技体操团体决赛中,中国队并未夺冠,而是日本队在最后时刻反超。
通义还表示,在田径赛场上,肯尼亚选手埃利乌德・基普乔格再次打破男子马拉松世界纪录,以 2 小时 01 分 09 秒的成绩夺冠。
事实上,基普乔格在比赛进行到 30 公里处时选择了退赛,而此次男子马拉松比赛的冠军是埃塞俄比亚选手塔米拉特・托拉,他以 2 小时 06 分 26 秒的成绩赢得了金牌。
美国游泳名将凯蒂・莱德基确实在女子 800 米自由泳比赛中,以 8 分 11 秒 04 的成绩赢得比赛,但她并未刷新世界纪录,该项目现有的世界纪录是她在 2016 年里约奥运会上创造的 8 分 04 秒 79。
此外,新西兰运动员洛根・福布斯也并未在帆板和冲浪两个项目中都获得金牌。
能够自动生成配图是通义 PPT 的一大亮点。
基于通义万相视觉大模型,PPT 创作可以支持文生图、图片素材库中搜索匹配。然而,生成的图片还是有 bug,比如面部扭曲,手指缺失等。
以下是 Kimi 生成的 PPT:
从生成的大纲来看,除了通义 PPT 那三部分外,Kimi 还增加了科技创新在奥运会的应用以及奥运会对巴黎的影响等内容。
相比于通义,Kimi 生成的内容较为笼统。
例如在介绍奥运赛事亮点时,Kimi 用「万金油」话术介绍了下百米赛跑、跳高和跳远以及马拉松赛事,并没有体现出实质性的亮点。
此外,它还整出了「张冠李戴」,把跳高跳远项目和马拉松项目搞混了。
Round 2:上传文档生成 PPT
通义和 Kimi 均可上传文档生成 PPT,其中通义最多可上传 1000 万字文档。
我们将之前的稿件《川普又出歪点子!发 AI 照片「碰瓷」霉霉,忽悠粉丝为他打 call》投喂给它俩。
这是通义生成的 PPT:
这是 Kimi 生成的 PPT:
在这一轮的 PK 中,通义似乎占据上风。
别看通义的 PPT 模板只有 24 种,但它们的设计排版都挺高级。
再从内容准确性上来看,通义 PPT 的遣词造句基本与原文相差不大,但是 Kimi 在某些语言上过分延伸,改变了原文的意思。
比如说,原文的表述是「SwiftiesForTrump 还成了一个话题登上 X 平台」,但在 Kimi 的理解里,泰勒・斯威夫特的粉丝群体名叫 SwiftiesForTrump,这显然与原文相悖。
整体而言,无论是通义还是 Kimi,它们均实现了一句话生成 PPT 或者上传文档生成 PPT。
其中通义还打出了差异化,不仅可以自动生成 PPT 配图,还推出了音视频转 PPT 功能,极大地提高了工作效率,解决了打工人们的一大烦恼。
不过,相比于 Kimi,通义的 PPT 模板较少,生成速度慢了一丢丢。
当然,它们仍有瑕疵,例如,生成的内容仍会胡说八道、张冠李戴,配图也会出现扭曲、变形等问题。
因此,我们在使用 AI 时,要更警惕它们的幻觉,不能完全依赖它们,而是把它们当成一种启发灵感、提高效率的工具。
工具链接——
通义PPT链接:
https://tongyi.aliyun.com/aippt/
Kimi链接:
https://kimi.moonshot.cn/