查看原文
其他

《中国新说唱》背后的 AI 工程师:我负责计算吴亦凡的笑|故事FM

故事FM 故事FM 2020-11-08


如果要说在过去五年的时间里,中国互联网界最火的词,那一定是人工智能,也就是—— AI 。


这个词火得一塌糊涂,以至于你只要抬头看看铺天盖地的手机广告,就会有一种不明觉厉的感觉。


事实上,人工智能这个概念诞生已有半个世纪之久了,虽然我们距离电影中完全模拟人行动和思考能力的机器人还有些距离,但 AI 在实际生活中的应用可能远比你我想象得更广泛和成熟。除了阿尔法狗( AlphaGo )和 SIRI ,它还存在于很多我们每天都在使用的服务中。


现在的 AI 技术有多成熟?前两天我去了一趟爱奇艺,中国最大的视频网站之一。我去见了一个我的朋友,路香菊。她是爱奇艺 AI 人脸识别的算法负责人,我和她坐下来聊了聊。



故事FM  第 156 期

/讲述者/ @路香菊  /主播/ @寇爱哲

/制作人/ @寇爱哲

/声音设计/ @故事FM彭寒


/BGM List/

01. High Five - 彭寒(片头曲)

02. Orbit Chaos - 彭寒(机场的小明星)

03. Process - V.A(人脸识别技术的未来)

04. Orbit Our Past - 彭寒(片尾曲)


/更多收听平台/

苹果播客 / 网易云音乐 / 蜻蜓 FM

QQ 音乐 / 豆瓣播客 / 懒人听书



—下面是本期故事的文字版—

请配合上方音频食用



1. 锁定吴亦凡的笑


今年非常火爆的综艺节目《中国新说唱》,就有路香菊的团队提供人工智能剪辑的技术支持。


路香菊(路):我们公司明星特别多嘛,像「明星排行榜」、「只看 TA 」,还有「爱创媒资系统」,这些都是基于明星的。


现在为什么需要这项技术呢?


其实是非常必要的,比如我们看 1 小时左右的视频节目,往往拍摄素材要拍 1000 多小时。想要从中找某个人的镜头或者特定的表情,是非常耗时的一件事情。所以我们开发的 AI 主要就是配合后期制作提高剪辑效率。


比如吴亦凡,我们要找一个他在拍摄节目时笑了的镜头,因为他比较酷嘛,很少笑,从海量的素材里人工查找就非常难。



又比如邓紫棋,经常笑吧?想找邓紫棋比较郁闷的镜头,就算我有大量邓紫棋的素材,在其中找比较愁眉苦脸的镜头的话也是非常困难的,但这个算法就可以帮助后期制作们。



我觉得,论剪辑, AI 可能真的不比人工差。我倒不是说人失业或者不失业,只是觉得可以解放人力,人们可以去做更有创造力的事情。


前阵子,「漫威爷爷」去世之后,我们市场部就说能不能做一个漫威的剪辑,我们就拿他的剧跑了一下。斯坦 · 李在漫威里都是客串嘛,所有片段加起来也就一分钟左右。在这种情况下,如果让人去剪辑他的画面其实是挺耗时耗力的,但 AI 就可以快速地把他的片段拼接出来。我们看了以后觉得太单一、不够好看,又加了一些主角钢铁侠、蜘蛛侠的画面,再配上音乐,出来的效果就比较震撼了。


 ■ 2018 年 11 月 12 日,有「漫威之父」之称的美国漫画界元老级人物斯坦·李( Stan Lee)于当地时间 12 日在好莱坞一家医疗中心去世,享年 95 岁。1961 年,斯坦·李和杰克·柯比一起创办了漫威影业。其代表作品有《蜘蛛侠》《黑豹》《绿巨人》《X战警》《钢铁侠 》。



2. 猜猜我是谁?


路:有个比较好玩的关于技术的故事。


有一次上海的同事来北京开会,他们在机场遇到一个小帅哥,粉丝拿着类似书的东西围着让他签名,同事以为他是个网络作家,但不知道具体是谁。因为我是做人脸识别的嘛,同事在群里就调侃我,说用我的模型来跑一跑。然后我试了一下,识别出来是一个演员,叫朱戬。


发过去之后他们说「你识别错了吧,这个是作家,大家拿着书让他签名呢」。我把朱戬网上的一些资料还有照片发过去,让他们 Check 一下,看到底对不对。结果果然是,粉丝手里拿着的是他演过的电视剧的碟。


AI 识别的范围会越来越大,识别能力也会越来越强,现在我们的人物库中明星的数量已经有 10 万了,演员其实很多。但生活中常用的、热度比较高的明星,也就几千人。


爱哲:我很理解那些明星都戴口罩、戴墨镜,就是想防住这种识别他们的人。


路:除了明星,我想普通人很快也会这样。现在机场安检、住宾馆、银行办事都是人证合一。我觉得,安防介入人脸识别的过程会比我们想象得还快。




3. 我的颜值可以打几分?


路:其实我可以给你报一个数字,你知道身份证假证率是多少吗?

是 10% 。


以前办假身份证相对容易,但是有了人脸识别以后,除非你做特别严重的美容,否则别想逃得过。事实上这也一定程度保障了大家的公共安全。


除此之外,人脸的属性也是可以识别的,比如是否戴眼镜,头发的长短,颜值是否漂亮等等。


爱哲:颜值这个你们也能分析?


路:对。


爱哲:怎么分析?


路:其实原理很简单,你告诉机器什么样是漂亮的,什么样是不漂亮的,你做了这个模型之后,来一张脸,就会给她打一个分。在 0 到 100 之间,会有一个分值来表示你的漂亮程度。


现在短视频比较火,用户上传短视频的量是非常大的,就应运而生这个需求,让视频里面的内容可以被识别。#美女#、#萌宠#、#游戏#等,这些都是高频出现的词。


 ■ 喵星人捕获人类的芳心



4. 我的眼里只有 TA


爱哲:技术的发展,一定是顺应市场需求的。除了 AI 剪辑和颜值打分,互联网粉丝经济还催生了另一项,至少在我看来很神奇的服务,「只看 TA 」。


也就是说,在一部影视作品中,只看含有某一个或几个明星的镜头,而不是把整个剧全部看完。一集 45 分钟的电视剧,瞬间变成了 X 分钟。


路:没错,比如今年大热的宫斗剧《延禧攻略》,你可以使用这个功能选择只看魏璎珞跟皇上的对手戏片段,或者只看皇上,只看某些演员。



很多科幻电影里还有一个经典的讨论,就是技术人员、科学家怎么去看待自己做的事情,是有些争议的。


比如资讯类客户端,看你喜欢看哪方面内容,就不停地给你推这一块的信息。有争议就说,那是不是会让人更局限在自己的小世界里面,让人更不包容?


爱哲:您觉得技术应该解决的问题是什么?


路:一方面,现在资讯爆炸,信息实在太多了,如果没有推荐的话,其实也是挺恐怖的。可能我花两个小时都找不到自己喜欢的东西。但另一方面,如果推荐的东西都是特别狭窄的,就可能导致我越来越闭塞。但我们其实也有设计冷启动或者边缘推荐一类的机制,以保证用户可以得到多元的信息。


爱哲:大家都说《延禧攻略》是一部「爽剧」,能洞悉人的兴奋点、荷尔蒙的分泌之类的。那是不是有了这些数据之后就更容易去生产新的剧,知道怎么去刺激观众对这个剧的观感?


路:可能大家都说《延禧攻略》像打游戏似的,从最开始的小宫女,然后一级一级地到皇上那里去了,比较符合人性。但感受、内容理解这两点,单从画面上是分析不出来的。


爱哲:我是觉得应该可以无限地接近人类。


路:嗯,我觉得永远都不可能无限的接近人类。因为 AI 它是符合某种规则或者某种逻辑的。但是就像别人说两口子吵架,它是没有任何逻辑和道理可言的。


AI 是讲理的,但我们人是不讲理的。



* 本期头图 | 视觉中国



感谢分享故事到朋友圈

文字 | 幸倍  运营 | 刘军



/往期故事/

口述:我叫葛宇路|故事 FM

1993 年,我开了中国第一家性用品店|故事 FM

我是刘大可,我小学就知道如何用砒霜治梅毒|故事 FM


「故事 FM」

 用你的声音,讲述你的故事 


更多收听平台

苹果播客 | 网易云音乐

蜻蜓 FM | QQ 音乐 | 豆瓣播客 | 懒人听书

▼ 点击「阅读原文」,讲出你的故事

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存