查看原文
其他

AI顶级大牛吵翻天?三个男人,数度“厮杀”……

木易 机器人文明 2020-01-17

关注我们,思考像钟摆,永不停歇


阅读关键词:AI大牛、AI公园、英特尔


本期“AI七日谈”将为您呈上的一周大事件包括:互怼的AI科学家、机器人致死案定论、带你游逛AI公园、揭秘人工智能背后的贡献者、机器学习成造假“杀器”,以及巨头们发布新款AI芯片和英特尔最新人工智能动态。

 

深度学习顶级大牛Yoshua Bengio上周来中国演讲了,这是他首次接受邀请。

 

在“二十一世纪的计算”国际学术研讨会上,Bengio的演讲主题是“Challenges for Deep Learning towards Human-Level AI(深度学习通往人类水平 AI 的挑战)”,一如既往讲深度学习。

 

演讲中,他再次强调了他去年发布的论文“有意识先验”主旨,并且重申了与Yann Lecun十年前提出的解纠缠观念:“我们应该以“关键要素需要彼此解纠缠”为约束,学习用于描述整个世界的高维表征、用于推理的低维特征,以及从高维到低维的注意力机制——这正是深度学习通往人类水平AI的挑战。”


Yoshua Bengio(右)、Yann Lecun(左)

 

尽管承认具有挑战,但Bengio,以及与他一样的深度学习专家仍然认为深度学习是通向未来AI无可替代的路径。

 

但这个观点,一直被纽约大学教授Gary Marcus强烈质疑。

 

今年年初,Marcus再吹响了对深度学习的批判号角。

 

 Gary Marcus

 

他以长文为刀刃,直指深度学习所面临局限性的要害,得出结论:我们必须走出深度学习,这样才能迎来真正的通用人工智能。

 

长文地址:https://arxiv.org/ftp/arxiv/papers/1801/1801.00631.pdf

文章一共27页,真的很长

 

概括来说,Marcus的主要质疑是:

 

深度学习需要更多数据加持

不能处理层级结构

无法进行开放式推理

不够透明

不能与先验知识集成

不能区分因果关系和相关关系

深度学习工程化很困难

存在着过度炒作的潜在风险

……

 

然而,Marcus笔迹未干,Yann Lecun便马上回怼,打响2018自卫反击战第一枪。

 

“Thoughtful, perhaps. But mostly wrong nevertheless.”

有想法,可能吧,但是,大部分都错了。

 

 

在Yann Lecun看来,Gary混淆了“深度学习”和“监督学习”这两个不同的概念,所以当然“mostly wrong”。

 

事实上,两人的互怼由来已久,还保持着公开辩论两个小时的记录。

 

 

但很显然,这场辩论并没让两大牛人达成和解,以至于年初Marcus依旧“愤而执笔”。

 

究竟是什么样的信念,让 Marcus对深度学习怼怼怼不停?他的观点是:深度学习必须通过一些借鉴自经典符号系统的操作得到增强,也就是说需要充分利用经典人工智能技术(允许显式地表示层次结构和抽象规则)的混合模型,并将其同深度学习的优势相结合。

 

但深度学习怎能放弃自己阵营,吃已经“败北”的符号系统那一套?(关于深度学习和符号系统的分解请参考:一文看懂AI算法)所以,双方就这样僵持着。

 

“偃旗息鼓”十个月后,Marcus在上月底开启了对深度学习的新一轮攻击,这次被他抓住的“把柄”是Bengio最近发布的论文中的一段描述:

 

“我们提出了强有力的证据,证明了当前的深度学习方法在学习一门合成性语言时,样本效率存在不足。”

 

在Marcus看来,这是“让他很高兴”的Bengio和他长期以来对此的观点一致。结果,这个欣喜很快又被怼回去了。

 

一周之后,Bengio在公开采访中表示:

 

“我们目前的工作的确展现出了深度学习的局限性。但事实上,这些局限性并不是新的限制。几十年前,我们在图像数据上训练机器时,就知道它们不会理解世界的全部复杂性,只会理解它们接受过训练的某些特定内容。Gary一直在说的事情,包括提出一些关于符号的先验知识等,我同意我们需要这样做,但我不认为这是什么新的说辞。我不喜欢他说得好像这些都是新局限、新方案一样”

 

不仅不同意Marcus的深度学习必须回归符号系统理论,还对他总是老调重弹表示出言语的不满。

 

看来,这次互怼以Marcus“挖墙脚”失败而告终。事实也证明,“好基友”真的是一辈子。

 


 

机器人致死案定论

终是人为

 

三年前的一起机器人心脏手术致死案曾震惊世人。

 

2015年2月,英国首例机器人心瓣修复手术进行,但本来被寄予厚望的机器人,不但把患者的心脏缝错了位置,还戳穿大动脉,尽管重新进行了人工手术,还是错过了最佳抢救时机,导致患者在一周后去世。

 

最近,负责手术的主刀医生、麻醉师等多人进行了听证,事故的原因也有了定论。

 

 

经还原当时的事故现场,在手术过程中,机器人控制台传输信号声音非常小,而且质量不佳,主刀医生Sukumaran Nair和助理医生之间的交流非常困难。在手术进行过程中,因为血溅到了手术机器人的摄像头上,使得Nair看不清病人心脏创口缝合的具体情况,以致于在助理医生发现机器人操作的病人心脏的缝合位置和方式都不对时,不得不重新缝合,而这时患者的心脏已非常“衰弱”。

 

听证会上,Nair承认手术之前自己就已经犯了两个大错误:

 

其一,没有完全掌握如何操作机器。他承认,在手术之前并没有完成操作的培训课程,就好比“在学会走路之前就想要跑”。

 

其次,没有告知患者是英国国内首次机器人修复二尖瓣手术,手术存在较高风险,采用传统手术方法存活率会更高。

 

而除了主治医生的失误外,原本应该全程在场的两位机器指导人员的提前离场,也是造成这次事故的重要原因。

 

所以,机器杀人,终是人为。


AI公园首周秀

有惊喜,有失望


百度大会一周过去,AI公园喜迎首周秀。

 

原本被颐和园、圆明园包围,关注度排行垫底的海淀公园,突然的刷了一把存在感。

 

不少人为来看看什么是AI公园,特地驱车一个小时前来。那么,它究竟有哪些AI特技呢?

 

 

首先,是智能跑道,在扫码注册页上传图片之后可以自动填写运动者的身高、体重、性别、年龄,这些都是通过AI自动识别的。其次,最具新奇属性的是百度阿波龙无人车。需要体验的游客可以在车站扫码预约,但明显的缺陷是无人车运力有限,每次只能承载7名乘客,完全供不应求。

 

除了跑道和无人车,还有可以自娱自乐的智能凉亭,这里主要搭载了百度智能语音助手“小度”,闲了、累了都可以和它唠唠嗑。

 

还有AI太极,但是因为机器太少而不能让每个人都体验。

 

还有可以解读情绪的脑波读取,开心就是绿树蓝天,不开心就烟雨蒙蒙。

 

还有一些游戏项目,比如通过演示自己的表情DIY历史名人表情包,人工智能猜拳器等等。

 

想要感受这些AI神器有什么神奇,还是亲自去体验下吧。


人工智能傻缺无敌

数据标注与贫民窟


海淀公园坐着无人车的游客很开心,但他们肯定想象不到这些聪明的视觉系统是如何识别出诸如道路、树木,或者车辆行人的。事实上,表面看起来非常智能的系统,实际并非机器自主识别,而是靠大量的人工辅助。

 

近日,BBC撰文讲述了人工智能背后不为人知的贡献者,他们生长在肯尼亚贫民窟,在非盈利组织Samasource的帮助下,为硅谷大型科技公司的人工智能研究提供数据标注服务。

 

 

什么是数据标注?就是在每张图片上标识出环境中的所有存在物,包括人、车辆、路牌、车道,以及天空,这些工作的最终目标是为了“告诉”机器学习和视觉系统有哪些需要“看到”的东西。

 

虽然六年前谷歌大脑团队就训练机器认出“猫”,但这个识别过程需要消耗巨量资源,当时总共使用了14000个超级CPU。所以,在智能驾驶势不可挡的趋势下,数据标注仍然是个大问题。

 

而最可行和经济的解决方案是,雇佣亚非拉低劳动成本地区劳动力进行这一工作,虽然有被认为“血汗工厂”之嫌,但从实际情况来看,这一工作不仅可以解决这些地区底层民众的就业问题,还可以改善他们的生活。比如,非洲贫民窟一天的劳动报酬可能低于2美元,但如果进入数据标注公司,便可拿到9美元的“高薪酬”。


人工智能聪颖无比

成论文造假“必杀器”


在一些方面,人工智能还是人工智障,但在另一些方面,人工智能却是无所不能。比如用机器学习和大数据对论文查重,能够查出数千造假论文,还可以挽回十亿美元的研发成本。

 

今年6月,斯坦福大学微生物学家分析了2009-2016年发表在分子与细胞生物学(MCB)上的960篇论文,发现其中59篇(6.1%)含有“不适当的”重复图像,约有2%值得再去进行图像证伪。

 

虽然打假精神可贵,但这样做不仅效率低,也浪费科学家的脑力资源。如果让AI介入,论文中的可疑图像被发现的概率大大提升,时间大大缩短,一个显著的成果是:在生物医学领域的论文中,AI已经搜索出9%的图像是高度重复的,0.59%的论文被认为存在欺诈嫌疑。

 

 

这项用AI打击论文图像造假的算法由纽约雪城大学机器学习研究员开发,算法检测图像区域重用,同时对旋转、裁剪、调整大小和对比度变化具有鲁棒性,最终得出造假论文所占比例和数量。


AMD又下一城

首款7纳米CPU问世


日前,AMD正式发布了全球首款7纳米数据中心CPU Rome,这是AMD在抢先发布全球首款7纳米GPU后的又下一城。

 

苏姿丰在会上展示AMD Room原型

 

CPU Rome的部分参数规格如下:

 

·包括多个7nm的用于运算的x86 chiplet,比Zen 1“Naples”EPYC性能大幅提升

 

·另外,还有一个14纳米的I/O芯片

 

·DDR4,Infinity Fabric,PCIe和其他I/O都在I/O芯片上

 

·支持第四代PCIe

 

·能够连接GPU,并在I/O芯片上通过Infinity Fabric协议进行GPU间通信。因此,对于同一CPU,则不同需要再使用PCIe或NVLink的交换芯片

 

·每个Socket有64核,128线程


英特尔AI新动态

至强家族喜迎新成员&人工智能大会


 近来的AI“芯”事真不少。

 

日前,英特尔宣布英特尔®至强®处理器产品家族迎来两位新成员:Cascade Lake-AP(预计2019年上半年发布)和面向入门级服务器的英特尔®至强®E-2100处理器(已正式发布)。

 

据了解,Cascade Lake-AP代表了一种全新类型的英特尔®至强®可扩展处理器,专为要求苛刻的高性能计算(HPC)、人工智能(AI)和基础架构即服务(IaaS)工作负载而设计。该处理器采用性能优化的多芯片封装,每颗CPU最多可提供48个内核,每个插槽可提供12个DDR4内存通道。

 

 

具体性能预测包括:

 

• Linpack测试性能达到英特尔至强可扩展8180处理器的1.21倍,达到AMD* EPYC* 7601的3.4倍

 

• Stream Triad测试性能达到英特尔可扩展8180处理器的1.83倍,达到AMD* EPYC* 7601的1.3倍

 

• 产品发布时人工智能/深度学习推理测试显示,每秒处理的图像张数(2)是英特尔®至强®铂金处理器的17倍。

 

此外,至强®E-2100处理器面向中小型企业和云服务提供商。该处理器不仅支持入门级服务器的工作负载,也适用于需要针对敏感工作负载提供更强数据保护的多种计算领域。

 

近年来,英特尔也是铆足了劲进军人工智能领域。两天后,11月14日-15日,英特尔将在北京举办“2018英特尔®人工智能大会”。据了解,本次世界级的人工智能盛会不仅将分享英特尔人工智能产品的重要进展和创新成果,以及全方位展示英特尔人工智能全栈式解决方案,还将汇聚国内外最具影响力的专家学者、行业领袖与技术大咖,展示人工智能领域的最新解决方案、产品及技术应用。

 

届时,<机器人文明>公众号将为您带来会议精彩报道,敬请关注!

 

以上是本周“AI七日谈”,下周见~


本文由“机器人文明”出品

转载请注明出处


可以撩撩群主~拉你入群

长此以往,我们就是朋友了!


往 期 精 选 


五年十大收购案,谷歌的”AI野心“
从未发现,AI竟然还可以这样玩!(附直通玩耍链接)
一文看懂AI算法(附:2018世界人工智能产业蓝皮书)
最尬榜单!中国计算机专业“反超”美国?
最新财报披露,AI五大应用现状!



我是广告:欢迎给“机器人文明”投稿~

好文请投:tougao@gsi24.com

— 完 —

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存