查看原文
其他

机器学习是不是炒作过头了?

2016-07-21 云头条

目前机器学习是不是炒作过头了?这个问题最初出现在知识共享网站Quora上。在这个网站上,许多见解独到的人回答了引人注目的问题。


以下是麻省理工学院(MIT)的理论计算机科学家斯科特·阿伦森(Scott Aaronson)在Quora上的回答:


有些话题是很少人谈论,也很少人应该谈论的,比如脚趾甲的思想意义。


有些话题是很少人谈论,但许多人应该谈论的,比如半指数函数。


有些话题是许多人在谈论,但很少人应该谈论的,比如放气丑闻(Deflategate)、大爷式占座或在奥斯卡颁奖典礼上的着装。


还有些话题是许多人谈论,可能许多人应该谈论的,比如二次大战全球变暖、黑洞或机器学习。


总是很难判断第四类的话题是不是“炒作过头”:想必这需要汇总有关这个话题的所有炒作,然后汇总有关于该话题真正有趣或重要的事实,那样才能看清前者是否压倒后者(但即便炒作压倒事实,那到底有多重要呢?)。


眼下,机器学习不仅引出了发人深省的科学问题(比如,为什么深度学习会有如此完美的表现?),还给人类文明带来了明显而越来越大的影响(即便我们忽略了其他所有方面,单单从即将改用自动驾驶汽车足见其影响之大)。要不是搞量子计算,我本人忍不住会从事机器学习。事实上,我在改行量子计算之前最早接触的正是人工智能和机器学习,先是在康奈尔大学攻读本科生,师从计算机学教授巴特·塞尔曼(Bart Selman),后来在伯克利分校攻读研究生,师从麦克·约旦教授(Mike Jordan),后来我觉得在量子计算这个领域,自己有更大的“相对优势”。


机器学习在过去十年中的进展让我觉得是实实在在,又令人震惊的,这种进展带来了IBM Watson和阿尔法围棋(AlphaGo)之类的科技成果。不过至少根据我认识的机器学习研究人员声称,最近的进展并不涉及任何重大的新颖的概念突破:它更像是进一步完善早在上世纪七八十年代就已经存在的算法,当然,只不过将那些算法实施在速度快出几个数量级的计算机上,并利用数量多出几个数量级的数据对它们进行训练。


一方面,几十年前就有的想法(比如反向传播及其变种)已经证明了纵向扩展之后拥有的这类强大功能,这个事实当然有理由让人乐观地认为:如果尝试同样的技术或方法,辅以更快速的计算机、更庞大的数据集,我们很快就会在人工智能方面获得更让人叹为观止的成绩。


可是另一方面,它又提醒我们:如果我们想知道几十年后什么将很重要,我们可能需要事先看一看今天如同七八十年代反向传播的技术――也就是,看看几个少数学术怪才在钻研的想法,这些想法太新颖、太古怪了,而且未经证实,因而无法吸引大量的风险投资,也无法吸引杂志长篇累牍的报道,许多人对此不屑一顾。


最后我认为,在我看来,关注机器学习炒作的绝对数量不如关注实际内容来得有意思。这就像,上世纪50年代几乎所有人都知道计算机会很重要,当然他们是对的,但是他们常常完全搞错了计算机很重要的原因(比如说,大大低估了仿人机器人的难度,又没有预见到PC或互联网)。毫无疑问,在我看来,30年过后,人们会认同我们的这个观点:机器学习至关重要,但是他们会因我们忽视机器学习的哪些方面而对我们发火,或者会因我们不该迷恋、但迷恋哪些方面而对我们嘲笑?我不知道那些问题的答案,但是我知道那些是我想要知道的问题。


欢迎加入交流,群主微信:aclood


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存