【大数据专栏】大数据的未来：机器人的世界，还是人类的机器世界？

查看原文

其他

【大数据专栏】大数据的未来：机器人的世界，还是人类的机器世界？

2014-11-10 科技杂谈

科技杂谈keji_zatan

新谈友，请点击题目下蓝字关注我

中国通信行业影响力最大的自媒体

本文来源于福布斯中国

　　人类从未对自己的认知能力满意过。也正因为此，过目不忘，一目十行，上知天文下知地理，一直被看做是人类进阶版本的一个典范。

　　计算机早就做到了这一点。

　　最近，在阿里巴巴的数据开放日中，我会面了数位数据科学家。当他们描述大数据未来能力的时候，我就会想到人类的局限。认知科学的未来，必然是计算机与人类的完美结合。但是，这个结合，应该是什么样的？

　　数据越来越多，而人类的解读能力是固定的，人会累，会无法完全理性。但是计算机不会。计算机可以帮助人类找到自己的盲点。IBMWatson实验室的首席工程师BowenZhou告诉我，在Watson的医疗项目中，人类要阅读十年的论文，计算机只需要30分钟就可以读完。曾任职Axciom的徐玲告诉我，在非常早期的时候，美国两个很大的图书馆，以及梵蒂冈图书馆的数据化已经完成了。

　　这两件事都指向一个结论：当我们找到的科技能力，正好能弥补人类的缺点，这之间隐藏着巨大的价值。实现的关键在于数据化。数据化让计算机和人类得以沟通和结合。

　　记忆力一直不是人类最关键的东西，甚至说，是最薄弱的一环。逻辑，才是人类的认知关键，逻辑的产生源于经验的积累和推演。如果计算机能够帮助人类获取更多的经验，将有助于更强大逻辑的产生。

　　我曾经非常喜欢Evernote这个应用软件。它可以记录我所有片段的思考，同时收藏资料和文章。如果有一天，这个软件可以通过“机器学习”我的记录文档，向我推荐值得阅读的资料，帮助我瞬间搜索信息，提炼观点，是否将会改变人类的认知习惯？

　　未来有可能实现么？至少眼下，我们已经看到了一些进展，数据正在帮助我们看到盲点。我总结了数据开放日中各路英雄的核心观点，希望能够对你有所启发。

　　NO1 认知科学可能是未来很关键的能力

　　未来数据的价值不在于多少，而在于你是否有提炼的能力。Watson正在推进的健康项目中，计算机能够做到通过大数据来判断未来治疗的癌症方向，并且就此判断更为精准的治疗方法。

　　以往我们是怎么做的呢？我们成千上万的医疗专家，通过阅读和研究大量的文献、实验和试错，推演出可能的方向。这需要消耗十年，甚至更长的时间。而计算机只需要三十分钟就可以阅读完所有的相关文献，迅速判断有用信息。这是用认知科学来节省人类在医疗方面的时间和精力。

　　NO2 红酒与寿司：整合“实时数据”与“历史数据”

　　将“实时数据”与“历史数据”整合已经成为了业界共识。徐玲这样比喻说，“历史数据”如同红酒，越陈越好。“实时数据”如同寿司，越新鲜越好，两者搭配，乃是绝妙。

　　而今我们对数据的处理上，也需要面对“实时数据”和“历史数据”结合的问题。举个例子，如果你在淘宝搜索茶叶，推荐系统应该从历史数据中推荐各式茶叶，还是应该结合当前你的购物车数据，推荐更适合你的偏好品牌？

　　数据的结合并不容易，不仅要求不同数据的格式和标准统一化，更要求对于历史数据与新数据结合后所产生对当下的理解和认知。

　　“就像是开飞机，我们通过历史数据来判断航道，但当时的风和气候都很重要对驾驶有影响。实时数据越对你敏感，就价值越高。最终你通过设定预期轨迹和实时调整，获得了最安全高效省钱的结果。实时和历史数据的结合意味着更好的计划和更快的反应。”

　　NO3 大数据也需要人的互补

　　AaronLing是Ancestry公司的总工程师，他在论坛上画了一个巨大的家族谱系图。这就是他正在做的项目，用大数据来清晰美国的家族图谱。人们通过网站查阅相关的家族谱系，然后通过UGC的方式给出修改或者添加数据。这个模式将可能会对未来的医疗以及社会研究产生巨大的影响。

　　这个项目证明了大数据推演出的结果有时候也需要人的互补。因为经过人的信息互动，才有可能产生超出于人类的东西。人的互动可以让大数据变得更灵活，更实在。

　　在实际操作中，我们可能会遇到这样的情况：尽管你拥有很多数据，但是你还是无法获得某个人的完整网络行为信息。所以我们需要用一些算法把这个“数据漏洞”填住。来自Samsung的演讲嘉宾JunlinHu这样形容这种困惑：“如果我们把人看做一个个的列，你会发现每个人其实没买多少东西，大部分商品和人之间的连接是空白的。”

　　也因此，当我们在使用数据的时候，会发现大数据中有很多的漏洞，数据多而稀决。

　　在这种情况下，我们只能用算法解决，或者用“人为操作”的方式解决。

　　NO4 到底未来是AI世界，还是IA世界

　　IBM沃森实验室的技术负责人BowenZhou在会议中提到了一个概念，从AI到IA的转移。一直以来，IBM致力于创造能够媲美人类智力的机器人，比如“深蓝”，比如“沃森”。而现在，他们认为以人类为中心，强大辅助功能的计算机可能更有市场。

　　AI与IA的区别在于，前者以计算为中心，后者以人类为中心。就是说未来是“机器人的世界”，还是“人类的机器世界”？占据主导地位的是会思考的机器人，还是辅助人类的机器？

　　未来的谷歌眼镜，可能可以让我们看到很远，立即回馈三百公里以外的信息，但是他不是机器人。

　　又或者人可以拥有强大的机械手，很厉害的汽车、飞机。但是他们以人类而不是以机器为中心。这两者的区别，是值得思考的。

　　或者，我们可以这样问自己一个问题：我们追求的是自动化还是智能化？

　　本次文章的观点总结者是：

　　车品觉：中国信息协会大数据分会副会长

　　文章内涉及的几位专家，依次为

　　BowenZhou：IBMWatson实验室的首席工程师，在统计机器翻译（StatisticalMachineTranslation,SMT）领域有深厚积淀；

　　徐玲（ElizabethXu）：曾任职Acxiom集团副总裁，是经验丰富的成熟的管理者；

　　AaronLing：Ancestry公司总工程师（SeniorDirectorofEngineering）；

　　JunlinHu：Samsung公司的数据总监（directorofdatamining）。

　　欢迎大家加入科技杂谈菁英汇，交流思想、分享信息。仅限行业商端人士参与。参与方式：点击左下方“阅读原文”填写您的加入信息，科技杂谈通过审核后，会添加入群。

本文仅代表作者观点，科技杂谈授权刊登。

转载必须注明作者与科技杂谈，侵权必究。

科技杂谈文章，均同步发布于犀牛财经网。

已入驻搜狐新闻客户端，网易阅读客户端。

”FAN某”的离婚财产分割判决书（全文）

”FAN某”的离婚财产分割判决书（全文）

公益慈善｜“翼行天下一生守护”慈善项目捐赠仪式圆满举行！

何炅突然高调官宣喜讯，网友恭喜：30年了，终于等到这一天！

哈里斯女粉搞4B运动、毒杀丈夫，回旋镖能否让美国“血流成河”