才女小冰的两重新身份:滨崎步小师妹、中央美院毕业生
这下好了,分不清唱歌、主持、画画的到底是不是人
- shenzhenware -
与苹果 Siri、亚马逊 Alexa 这类「助理」(IQ)属性的语音助手不同,微软家的小冰从诞生开始就走上了「情感」(EQ)路线,专注与人建立情感纽带。
从 2014 年诞生以来,微软小冰凭借她独特的聊天风格,已吸引力了 1.2 亿月活跃用户,并累计对话超过 500 亿次,平均对话轮数达到 23 轮。
与此同时,微软小冰发展了包含语音、全双工、文本、图像等在内的情感计算框架,也为很多对话式 AI 研究起到了一定的借鉴意义。
微软小冰的团队也没有善罢甘休,继续走向了人类最高阶的能力——创作的道路上,并在艺术领域持续耕耘。
5 月 16 日下午,微软小冰五月媒体沟通会在微软(亚洲)互联网工程院的北京总部举行。微软(亚洲)互联网工程院副院长李笛、微软(亚洲)互联网工程院人工智能创造及商业事业部总经理徐元春出席,对微软小冰在文本、语音、视觉创作方面的最新进展做了介绍。主要有两点:一是演唱模型更新到了第五个版本,二是学会了新的技能——作画。
△ 微软小冰的作画登陆了 Bing 搜索的今日首页,微软终于有了一次不用为封面付版权费的机会
少女歌手小冰:学会了戏腔、过渡,中气音堪比演唱会歌手
在上一代人工智能歌曲 DNN 模型中,微软小冰学会了唱歌换气,并且能吸收人类歌手的演唱技巧(包括嗓音、韵律等),对同一首歌曲演绎出不同的演唱风格。
在最新升级的第五个版本中,微软小冰有三点新特性:
特征一:增添了「中气」
拥有充沛的「中气」音后,小冰能够融合声音和气息来烘托演唱。
现场,微软播放了一段微软小冰在日本 AVEX 唱片公司共同制作的一段歌曲,可以说中气烘托的效果已经逼近人类歌手。
同时微软还宣布,微软小冰的日本版本已以人工智能歌手身份纳入 AVEX 旗下,成为滨崎步、安室奈美惠的同门师妹,并争取在今年内亮相日本的红白歌会,成为第一个登上该舞台的人工智能歌手。
第二点新特性:唱腔过渡
即从一种唱腔过渡到另外一种唱腔。在这方面,微软小冰能够保留颗粒度很细的细节,实现自然的转换,比如最常见的从唱腔到戏腔。
第三点新特性:戏腔训练
与唱腔过渡结合的一段演示中,微软小冰已经能够演绎《新贵妃醉酒》这类跨唱腔的歌曲,还说明微软小冰学会了唱戏。
李笛透露道,微软小冰团队正在将微软小冰演唱创作的底层技术打造成一套框架,并且有望开放,实现端到端的内容生产,即将该有的能力完整迁移到另一个人工智能助手上。
例如,通过将这套底层框架迁移到 Siri 上,Siri 也能够像微软小冰一样完成从词、曲、编曲、演唱,后期制作的整个歌曲创作环节。
李笛表示,关于该项目的一些具体进展和细节,会在今年 8 月份的发布会上进行公布。
附上小冰的全新演唱才艺视频(中气十足的日语歌曲、新贵妃醉酒),来感受下
画家少女小冰:开得了个人画展,也设计得了丝巾纹路
微软小冰在艺术生涯上又多了一重身份——画家。
此次媒体沟通会上,徐元春登台,正式宣布推出人工智能小冰的绘画模型。该模型历时 22 个月打造而成,已经应用在绘画和纺织服装面料设计这两个视觉领域。
在基于对艺术史上 236 位著名人类画家画作大量学习的基础上,微软小冰在创作时能够受到文本或其他创作源的激发,自主、独立完成具备 100% 知识产权的全新绘画创作。
微软强调,微软小冰的绘画能力并不基于随机生成的技术,也不是滤镜风格的迁移,这两种机制都无法保证小冰创作质量的稳定性。
通过学习与灵感激发创作,小冰的部分画作已经可以精确的溯源到是来自某个画派或画家的技法、表现力和视角。
借此机会,微软还公布微软小冰的其中一个化名「夏语冰」。该化名的画作目前正在中央美术学院 2019 届研究生毕业作品展展出。
接着在今年 6 月 15 日、7 月 15 日,小冰的个人画展也将陆续在中央美术学院、杭州万科大屋顶美术馆举办。
另外,微软小冰面向大众开放的绘画创作小程序也将于一周后,即 5 月 22 日上线。
现场,我们也上手体验了测试版本。只要输入任意的文本,微软小冰经过 3 分钟左右的时间便能将呈现或作,并配以一段同样由小冰创作的标志性诗歌。给出的画作确实很抽象。
在产业应用上,微软与中国纺织工业联合会以及国内大型纺织面料企业,联合开发了纺织服装设计平台,用于服装纹样和插画的创作和设计,不重复多样性能够达到 1026。
在这方面,微软小冰也同样得到了艺术眼光的青睐:在三个月前,小冰创作的第一批纺织服装面料已被收录在中国丝绸博物馆中。小冰与 SELECTED 合作设计的第一批丝巾也将会在今年 6 月份面世。
微软以实际行动告诉我们,人工智能的图像能力不只是停留在图片搜索,结合人工智能创造技术的图像领域能够为某一具体产业带来巨大的应用性变革,其中的想象空间是巨大的。
人工智能助手不只是一个连接人与世界的「管道」
「当我们用智能音箱的语音助手播放一首歌的时候,语音助手只花了 5 秒钟就完成了点播的任务,而剩下 20 分钟的播歌过程中,用户实际上是在与创作者发生间接的关联。」
李笛以这个非常切实际的例子引发大家对语音助手定位的思考:在这过程中,语音助手只是一个「引路者」的角色,并不占据重要位置。
一直以来,微软小冰不断建设的情感计算框架,正是从多个角度避免人工智能助手仅仅只是一个连接人与理性世界的「管道」。如今,微软小冰不仅是个助手,也是个参与者(比如网易新闻客户端点评),更是一个创造者,目的是产生更多实际价值。
在金融领域(文本生成),在万得资讯、华尔街见闻等金融相关的 APP 里,微软小冰可以在每 20 秒的速度生成一条摘要,并且覆盖 26 类金融内容。
在电台主播领域(语音创作),微软小冰正在为 63 家电台和电视台辅助主持,主持时长累计达到了 2800 多小时。
有声读物方面,至今为止,微软小冰生产的通用非定制有声读物超过了 2300 小时,还处于供不应求的状态。
人工智能创造是面向高度定制化时代的内容供需关系
也许很多人会困惑,人工智能创造的价值到底体现在哪里,为什么创作不能交由人类完成, 人工智能承担可替代性强、重复的工作就好了。
李笛认为,在高定制化的时代下,人们对所消费、所获得的内容的需求将更多的走向定制化,并且这是一个不可逆的过程。需求日益增长,无法全部通过人类创造者的去满足。
从研究中,微软也发现这样的一个现象:例如,除了通用型有声读物,微软小冰还可以小孩为主人公定制独一无二的故事。一旦获得了定制的故事,小孩就很难退回去与所用人听同一个故事。
李笛认为,人工智能创作具有更快、更稳定、高并发的优势。通过学习能快速主动生成内容,另外它很稳定,不会感冒、闹情绪,人工智能在云端运行,高并发特征显著。
但人工智能创作也并不是我们想象中的容易,它们也有很长一段路要走。
另外一个阻碍就是,人类对人工智能创造仍然存在着一些偏见。
小冰在开始学作画的时候,曾多次隐匿身份在网上论坛发布个人作品,从被忽视、被吐槽,到了在中央美术学院教授的帮助下成长,最终得到认可。微软小冰才选择了在合适的时候公布它的化名。
除了「夏语冰」,还有很多没有公开化名的微软小冰正「潜伏」广播、电台等创作领域。
微软选择不披露,一是因为质量还没有达到他们自己的要求,二是一旦公布,许多人会先入为主,甚至会对作品产生偏见。■
微信号:shenzhenware
主笔、编辑:大林 / 深圳湾
审校:大树 / 深圳湾
快到「湾」里来
深圳湾正在招聘:
真知灼见的科技记者
四通八达的运营编辑
才华横溢的市场策划
技能爆表的活动运营
热情四射的社区达人
简历传送门:
Lynn@shenzhenware.com
● ● ●
深圳湾(公众号 ID:shenzhenware)连接全球硬件创新者,连接硬件生态链上下游,连接跨界产品的设计、技术、生产、渠道、商业、创新。深圳湾持续关注「AI+硬件」带来的场景和交互创新,以及与平台和应用相连的全产业链升级,欢迎相关团队与我们联系,微信私人客服:小炫(ID:warexx)。