查看原文
其他

【大数据专栏】大数据终极目标就是广义互联网大脑

2014-05-19 大数据邦 科技杂谈
科技杂谈keji_zatan

新谈友,请点击题目下蓝字关注我

中国通信行业影响力最大的自媒体


本文由大数据邦(微信公号bigdatabang)翻译、编辑整理


  昨天晚间有坊间消息爆料称GoogleBrain项目创始人AndrewNg(吴恩达)将加盟百度负责BaiduBrain计划。这将成为中国互联网公司迄今为止引进的最重量级专家之一。AndrewNg除了是谷歌大脑的项目创始人之外,还是国际最著名的人工智能和机器学习领域权威学者之一,斯坦福大学人工智能实验室主任,互联网在线教育龙头创业企业Coursera联合创始人。


  “人类的思维是由成千上万个单元共同协作产生,当这些单元组成一个整体时,他们就会产生无限复杂的,我们称之为思想和感情的东西。”——这就是人工智能概念创立之初,由MIT麻省理工学院人工智能实验室创始人MarvinMinsky提出的“SocietyofMind”理论。


  “OneAlgorithm”假设是与“SocietyofMind”相对应的人工智能理论。该假设认为人脑中得单元好似通用处理器,并非有明确的单一分工,而是一块领域具有多元化功能,处理听觉的部分也可以处理视觉,通过调整大脑可以处理不同类型的任务。


  在“SocietyofMind”理论之下人工智能学难度极高,这促使AndrewNg在大学时放弃了“建造一个具有人类思维的机器人“的儿时梦想,甚至当他成为斯坦福大学教授之后也劝解学生去探险这条极高难度的不归路。因为按照MarvinMinsky的思路去组建人工智能,需要建立并组合成千上万甚至无法计数的分别发挥不同作用的独立计算功能模块,然后通过复杂算法将这些功能模块全部连接起来去模拟大脑来产生思维。


  当AndrewNg接触了“OneAlgorithm”之后,儿时的梦想又重新起航。也正是这样的思想引发了深度学习(DeepLearning)理论和技术的兴起与发展。在深度学习理论的指引之下,AndrewNg于2011年加入Google的XLab深度学习项目实验室,组织研发了由1000台计算机、16000个芯片和十亿个神经元连接组成的虚拟大脑,在不预先知道“猫”的概念的情况下,通过分析了1000万帧Youtube上的无标签视频剪辑图片,通过10天时间终于领悟了什么是“猫”,并且在新的20000张图片中成功找出猫德照片的“猫脸识别”系统。


  Google使用该技术应用到多个领域的产品,包括语音识别、图片搜索,甚至无人驾驶汽车和Google眼镜。不久之后Google的图片搜索将不再依赖于文本的标签就能够识别出图像上面的物体。


  相比于人脑而言,GoogleBrain目前完成的工作还非常有限,还无法完成人脑的推理功能。


  百度也在最近发布了大数据计划,该计划由三部分组成,分别是:百度大脑、数据工厂、开放云。百度大脑是整个大数据计划的重中之重,因此,必须要招募到学术和产业界的领军人物。在2010年之时,百度的机器学习能力并不高,只拥有几百台服务器和十万特征向量。两年之后的2012年,服务器集群规模迅速扩大,特征向量也由10万增加到200亿。而此时,百度的机器学习能力达到了瓶颈,即使特征向量增加到300亿甚至500亿,对于机器学习的成果改善也效果不大。而此时,百度也开始了再“深度学习”的方向的布局和发展,产生了今日如李彦宏所说的具有3岁儿童智力水平的人工智能大脑——BaiduBrain。


  什么是深度学习呢?简单解释,深度学习构建了能够模仿人脑行为的多层次的神经网络。该神经网络可以收集信息,并且逐渐对事物的外形、声音等进行感知和理解。比如机器视觉领域,研究人员先建立第一层人工智能的神经元,来探知物体的边缘形状等基本信息;建立第二层神经元将第一层探知的结果拼接起来识别较大块的物体的形状;依次类推,有更多层次的神经元对物体进行感知和理解。最关键的是,系统能够自动进行这一切。而传统的人工智能需要研究人员预先输入物体的视觉或声音信息,由机器学习算法根据预先输入来处理信息。在深度学习算法中,我们可以给系统很多的数据,使其“自己识别出世界上的一些概念”。


  奥巴马政府宣布筹建一项跨学科的科研项目“基于神经科学技术创新的人脑研究”——“BrainResearchThroughAdvancingInnovativeNeurotechnologiesInitiative”,项目名称简写为BRAIN。美国政府对于BRAIN项目的一亿美元拨款中,一半来自于美国国防部高级项目研究局,超过了美国国立卫生研究院。


  如果我们把广义互联网(包括互联网、移动互联网、工业互联网、传感网络和物联网)看成人类世界一个巨大的知识库,搜索引擎的爬虫、移动设备传感器和物联网传感器看成触觉、听觉、视觉味觉,各种知觉的收集就组成了大数据,对大数据的收集、存储、处理造就了这一次大数据时代变革的众多机遇和创业公司,对于大数据的应用需要计算能力超级强大、更自主、更智能的虚拟大脑进行事物的识别、决策的判断和行动的执行。因此,大数据的终极目标就是虚拟数字世界的广义互联网大脑!


  梦想照耀现实!各国政府和各个科技巨头意识到,如果能够解决这些问题,人工智能将在众多领域创造巨大的机遇。


  欢迎大家加入科技杂谈菁英汇,交流思想、分享信息。仅限行业商端人士参与。参与方式:添加微信号:sophie0306,并注明“申请入群”+所在单位+职务+真实姓名+联系方式(微信号码+手机号码),科技杂谈通过审核后,会添加入群。



本文仅代表作者观点,科技杂谈授权刊登。

转载必须注明作者与科技杂谈,侵权必究。

科技杂谈文章,均同步发布于犀牛财经网。

已入驻搜狐新闻客户端,网易阅读客户端。

点击下方“阅读原文”直达犀牛财经网



您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存