查看原文
其他

【大数据专栏】大数据的未来:机器人的世界,还是人类的机器世界?

2014-11-10 科技杂谈
科技杂谈keji_zatan

新谈友,请点击题目下蓝字关注我

中国通信行业影响力最大的自媒体


本文来源于福布斯中国


  人类从未对自己的认知能力满意过。也正因为此,过目不忘,一目十行,上知天文下知地理,一直被看做是人类进阶版本的一个典范。


  计算机早就做到了这一点。


  最近,在阿里巴巴的数据开放日中,我会面了数位数据科学家。当他们描述大数据未来能力的时候,我就会想到人类的局限。认知科学的未来,必然是计算机与人类的完美结合。但是,这个结合,应该是什么样的?


  数据越来越多,而人类的解读能力是固定的,人会累,会无法完全理性。但是计算机不会。计算机可以帮助人类找到自己的盲点。IBMWatson实验室的首席工程师BowenZhou告诉我,在Watson的医疗项目中,人类要阅读十年的论文,计算机只需要30分钟就可以读完。曾任职Axciom的徐玲告诉我,在非常早期的时候,美国两个很大的图书馆,以及梵蒂冈图书馆的数据化已经完成了。


  这两件事都指向一个结论:当我们找到的科技能力,正好能弥补人类的缺点,这之间隐藏着巨大的价值。实现的关键在于数据化。数据化让计算机和人类得以沟通和结合。


  记忆力一直不是人类最关键的东西,甚至说,是最薄弱的一环。逻辑,才是人类的认知关键,逻辑的产生源于经验的积累和推演。如果计算机能够帮助人类获取更多的经验,将有助于更强大逻辑的产生。


  我曾经非常喜欢Evernote这个应用软件。它可以记录我所有片段的思考,同时收藏资料和文章。如果有一天,这个软件可以通过“机器学习”我的记录文档,向我推荐值得阅读的资料,帮助我瞬间搜索信息,提炼观点,是否将会改变人类的认知习惯?


  未来有可能实现么?至少眼下,我们已经看到了一些进展,数据正在帮助我们看到盲点。我总结了数据开放日中各路英雄的核心观点,希望能够对你有所启发。


  NO1 认知科学可能是未来很关键的能力


  未来数据的价值不在于多少,而在于你是否有提炼的能力。Watson正在推进的健康项目中,计算机能够做到通过大数据来判断未来治疗的癌症方向,并且就此判断更为精准的治疗方法。


  以往我们是怎么做的呢?我们成千上万的医疗专家,通过阅读和研究大量的文献、实验和试错,推演出可能的方向。这需要消耗十年,甚至更长的时间。而计算机只需要三十分钟就可以阅读完所有的相关文献,迅速判断有用信息。这是用认知科学来节省人类在医疗方面的时间和精力。


  NO2 红酒与寿司:整合“实时数据”与“历史数据”


  将“实时数据”与“历史数据”整合已经成为了业界共识。徐玲这样比喻说,“历史数据”如同红酒,越陈越好。“实时数据”如同寿司,越新鲜越好,两者搭配,乃是绝妙。


  而今我们对数据的处理上,也需要面对“实时数据”和“历史数据”结合的问题。举个例子,如果你在淘宝搜索茶叶,推荐系统应该从历史数据中推荐各式茶叶,还是应该结合当前你的购物车数据,推荐更适合你的偏好品牌?


  数据的结合并不容易,不仅要求不同数据的格式和标准统一化,更要求对于历史数据与新数据结合后所产生对当下的理解和认知。


  “就像是开飞机,我们通过历史数据来判断航道,但当时的风和气候都很重要对驾驶有影响。实时数据越对你敏感,就价值越高。最终你通过设定预期轨迹和实时调整,获得了最安全高效省钱的结果。实时和历史数据的结合意味着更好的计划和更快的反应。”


  NO3 大数据也需要人的互补


  AaronLing是Ancestry公司的总工程师,他在论坛上画了一个巨大的家族谱系图。这就是他正在做的项目,用大数据来清晰美国的家族图谱。人们通过网站查阅相关的家族谱系,然后通过UGC的方式给出修改或者添加数据。这个模式将可能会对未来的医疗以及社会研究产生巨大的影响。


  这个项目证明了大数据推演出的结果有时候也需要人的互补。因为经过人的信息互动,才有可能产生超出于人类的东西。人的互动可以让大数据变得更灵活,更实在。


  在实际操作中,我们可能会遇到这样的情况:尽管你拥有很多数据,但是你还是无法获得某个人的完整网络行为信息。所以我们需要用一些算法把这个“数据漏洞”填住。来自Samsung的演讲嘉宾JunlinHu这样形容这种困惑:“如果我们把人看做一个个的列,你会发现每个人其实没买多少东西,大部分商品和人之间的连接是空白的。”


  也因此,当我们在使用数据的时候,会发现大数据中有很多的漏洞,数据多而稀决。


  在这种情况下,我们只能用算法解决,或者用“人为操作”的方式解决。


  NO4 到底未来是AI世界,还是IA世界


  IBM沃森实验室的技术负责人BowenZhou在会议中提到了一个概念,从AI到IA的转移。一直以来,IBM致力于创造能够媲美人类智力的机器人,比如“深蓝”,比如“沃森”。而现在,他们认为以人类为中心,强大辅助功能的计算机可能更有市场。


  AI与IA的区别在于,前者以计算为中心,后者以人类为中心。就是说未来是“机器人的世界”,还是“人类的机器世界”?占据主导地位的是会思考的机器人,还是辅助人类的机器?


  未来的谷歌眼镜,可能可以让我们看到很远,立即回馈三百公里以外的信息,但是他不是机器人。


  又或者人可以拥有强大的机械手,很厉害的汽车、飞机。但是他们以人类而不是以机器为中心。这两者的区别,是值得思考的。


  或者,我们可以这样问自己一个问题:我们追求的是自动化还是智能化?


  本次文章的观点总结者是:


  车品觉:中国信息协会大数据分会副会长


  文章内涉及的几位专家,依次为


  BowenZhou:IBMWatson实验室的首席工程师,在统计机器翻译(StatisticalMachineTranslation,SMT)领域有深厚积淀;


  徐玲(ElizabethXu):曾任职Acxiom集团副总裁,是经验丰富的成熟的管理者;


  AaronLing:Ancestry公司总工程师(SeniorDirectorofEngineering);


  JunlinHu:Samsung公司的数据总监(directorofdatamining)。


  欢迎大家加入科技杂谈菁英汇,交流思想、分享信息。仅限行业商端人士参与。参与方式:点击左下方“阅读原文”填写您的加入信息,科技杂谈通过审核后,会添加入群。


本文仅代表作者观点,科技杂谈授权刊登。

转载必须注明作者与科技杂谈,侵权必究。

科技杂谈文章,均同步发布于犀牛财经网。

已入驻搜狐新闻客户端,网易阅读客户端。


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存