查看原文
其他

阿里巴巴王坚:数据沉淀将产生无穷价值

2016-08-19 中国科普博览
“互联网的意义,可以说相当于人类对火的使用,”在SELF讲坛上,来自阿里巴巴技术委员会主席的王坚博士认为,互联网的作用不只是给大家打打游戏上上网,实际上互联网的出现已经给世界带来了两次颠覆性的变革,作为一种基础设施,它将超过人类历史发展上的任何基础设施,给人类带来更加深远的影响。而互联网时代沉淀下来的庞大数据则需要计算来实现它的价值。


https://v.qq.com/txp/iframe/player.html?vid=s0322vfvvjj&width=500&height=375&auto=0

▲ SELF讲坛:王坚 《互联网、数据、计算》


互联网的出现媲美“火”的使用

大家对互联网比较熟悉。对中学生而言,讲到互联网首先联想到游戏、聊天之类的事情,很少能与科学连系在一起。
这是一个值得重新思考很多事情的时代,所以我想这种探索如果要用我自己的亲身经历去谈,大概可以从前段时间我跟几个朋友在看一张从哈勃望远镜那里拍的宇宙的照片的感受来表述一下。
当哈勃拍到这张照片的时候,光已经走了差不多上百亿光年,意味着地球还没有存在的时候,它就朝这里飞奔而来。转念一想,这种探索更是永无穷尽的,当哈勃拍到这个照片的时候,那也是在一百亿光年以后,这个发光的星球存在与否,也是个未知数。
哈勃望远镜所拍摄的宇宙照片
互联网也是。大概十年以前,跟几个朋友讨论到互联网是什么的时候,我觉得唯一能够与之相提并论的,就是人类对火的使用。
人类对火的使用,不但改变了人类对黑暗的恐惧,而且当我们能吃熟食时,对于我们大脑的进化也起到了潜移默化的作用。时至今日火对人类的作用,依然留下了非常大的想象空间,所以我觉得互联网的作用,不只是给大家打打游戏、上上网。大家可以认真思考一下,它对人类的发展到底起了什么作用。
也许有人会说是在二三十年以前,第一次把全世界所有的个人电脑连在一起,就发生了一次翻天覆地的变化。而最近几年,又发生了一次非常大的变化,当互联网把全世界的手机连在一起的时候,世界又发生了一个巨大变化,就是今天你们所正在经历的。
至少在我能想见的一件事情,是我也不知道哪天能把互联网想象成一台全世界最大的计算机的,让全世界人的大脑连在一起。所以我想互联网可能在下面五十年甚至一百年的漫长过程当中,需要完成的一件事情就是让所有人的大脑都在互联网上,这个变化将比之前所有发生过的事情更令人震撼。
这件事情的意义究竟有多大?让我来做一个比喻。大家都知道爱迪生,第一个联想到的是他发明出灯泡。可是实际上站在我的角度来看,爱迪生对人类社会最大的贡献不是跟灯泡有关系。爱迪生在人类历史上第一次告诉大家,当建一个城市的时候是要铺电的。今天可能大家都觉得,每个城市都有电,电能够到达每家每户,这是一件天经地义的事情。但是我想告诉大家,一百多年前世界不是这样的。爱迪生发明出灯泡,说明电应该作为一个基础设施。当建一个城市的时候是需要铺电缆,所以这个世界才会被改变。
同样的,互联网三十年来最大的发展,就是变成了整个世界社会经济发展的基础设施,所以我才会说它将来的意义会跟火一样。这是互联网给大家带来的最直接的利益,而这个基础设施的作用跟价值,会超过人类历史发展上任何基础设施,超过公路、铁路、航空甚至电本身。
我印象非常深的是十几年前,我去新疆跟西藏旅行,因为那时候自己喜欢到处乱走。大家知道去新疆,新疆的北边跟瑞士一样有森林,往南有沙漠。
库车河谷景观

我在库车上看到它整个地貌都是褐色的石头,就跟火星上一样,但是你在这么一片只有褐色的石头、看不到任何人工建筑的地方,唯一可以看到的人工建筑就是电线杆!就是这些电线杆给我非常大的震撼,哪儿铺了电,人才能到那儿去。这是电给这个社会带来的巨大的变化。
但在我之后去西藏的时候,我想法再一次发生了变化。我开车走得很远,在路上突然看到有块牌子,上面写的是说你再开五公里,就可以有手机信号了。也就是在那个地方你就连上互联网了,但是那个地方是没有传统意义上的国家电网的!它所有的电都是靠太阳能。所以那时候我的一个感触就是,将来在没有电的地方也是可以上互联网的。所以互联网的基础设施意义对人类的影响,会远远超过其他一切的基础设施。
所以希望大家能够意识到,互联网不止是用来上网、打游戏的,它的价值、它的意义就跟当年爱迪生第一次告诉大家,建一个城市需要建电网是一样的。同时它的渗透性超过所有的东西。
数据简化了人类的生活


而第二件能改变这个世界的就是数据。
大家会在有些书上看到,其实数据是很低级的,信息再高级一点就是知识,再高级一点就是智慧。数据也跟互联网有关系,其实今天讲的数据跟一百年前的数据完全不是一件事情,它会颠覆非常多的东西,甚至颠覆统计学。
大家设想一下看,过去美国人怎么知道下一届总统是谁?就是靠信息的方法。设计个问卷,让调查员到街上去拦个一千人,或者是电话调查一万个人,再把这些所谓的问卷的结果用统计学的方法去算一算,大概也知道谁是美国总统,而且八九不离十,很准。可是到现在,如果你想知道下一届美国总统是谁,不需要这样做了。 在美国就像今天在中国的新浪微博那个东西一样,它叫twitter,你只要把所有的人在这上面聊天的记录去处理一遍,你大概也能知道,谁会当选美国总统,八九不离十,跟刚才的调查一样准。

如果有一天你还想知道谁是流行的歌星,不需要再去做一次调查,还是把同样的数据拿来处理一遍,你就知道谁是流行的歌星。
如果有一天你想知道美国会发生什么流行病,不需要去什么疾病病毒中心去调查,也不需要到医院去问,还是把大家聊天的数据处理一遍,就可以知道会流行什么疾病。
在今天这个时候,数据意味着着当数据被沉淀下来的时候,无法预知它是什么用处。但是却能发现它的价值是超过人的想象的,而当你去收集一个东西的时候,是带着目的去收集那个信息,但反过来约束了你对这个东西的使用价值。
所以今天的世界因为有互联网这个基础设施,人类以过去没有过的速度把大量的数据被沉淀下来,今天你不知道是干什么,但是可能十年以后,你会发现,这个数据是可以创造很多的价值。就像十亿年前的树倒在了地上,大家不会意识到,到今天会变成石油。
今天我们是从信息到数据的时代,我们今天沉淀了大量的资源,这些资源是靠人类的自身活动产生的,所以我想这个世界发生了那么大的变化的源头是在互联网,是互联网让数据的沉淀以历史上前所未有的速度沉淀了下来。
计算能力的渴望开启新的探索

设想一下,历史上最基本的基础设施是道路,它沉淀了你所有的脚印,但是这些脚印今天都没有产生价值,只有公安破案的时候会用一下。但是现在互联网上,这些留下的脚印是会被人产生价值的,所以有一天你开车的时候,你开车所沉淀的数据可以来改变你开车的习惯,让你开车更省油。
同样的,你今天心跳的数据,其实是没有人知道的,但当有一天,你心脏跳动的数据作为你个人的财富被留下来的时候,那你就会知道,吃过一个心脏药的时候心脏如何反应,跟你父母吵架的时候心脏是怎么反应的,这些都会来改善人类的健康,也可以改善我们的药物发明。
所以有一天我们离开数据几乎是做不成任何事情,今天是人类历史上最好的时候,人类历史上,要发展都是要消耗地球的自然资源,从我们的挖煤、找石油、砍伐森林开始,这都是自然留给我们的自然资源,当你自己的心跳变成社会的自然资源的时候,其实人类本身的活动在产生一个取之不尽的自然资源,所以这是一个非常非常伟大的时代。
数据加上互联网,形成了计算。你的心跳怎么来产生价值?如果没有足够的计算能力是产生不了价值的,你也没法来计算你的心脏对吃了这个药之后的反应,所以落到最核心的方面就是计算。计算是人类不再可以分割的一部分。
就如同大家把手机当成一台计算机,再把机字去掉,当成计算,像今天这么一台手机大概有几亿个晶体管,计算如果拿晶体管作为计算最小的单元来看的话,人每年消耗掉的大米的粒数,是远远少于你每年消耗掉的晶体管的个数,也就是说你每天吃着晶体管活下去的,不是吃着稻米活下去的,其实大家对计算的依赖是超出大家的想象的。
因为这样,大家面临一个非常重要的科学的问题,就是人类到今天为止,再没有真正科学意义上的突破,你就会发现,再过几年就没有晶体管可以吃了。也就是说,用今天大家在电子层面上的知识来了解的物理的话,再也造不出一台计算机可以快到要满足我们对计算的需求。

人们现在渴望拥有的计算机,其计算能力能力可能是平时所用机器的一千倍甚至一万倍,但是很难达成这个目标。这个计算能力上不去,有两个非常重要的因素,一个是电,今天全世界大概有5%的电是被计算机吃掉的。另一个是水,它一天消耗掉的水也不是可以忽略不计的,所以计算如果在科学上没有一次大的飞跃的话,实际上将不能满足这个社会下面50年、100年的需求,科学上的突破才有可能实现。
今天大家用的计算机是享受了物理学一百多年的成就,再过二三十年计算机,则要享受今天的物理学的成就。互联网不是一个离科学很远的事情,数据也不是一个在纸张上画画的事情。
光速约束了计算机的发展,电子的直径约束了计算机的发展,存储也约束了计算机的发展,所以才会有人说我们不再应该把数据存在磁盘上,也不应该把数据存在CD上,应该要把数据存在像DNA这样的结构上,一个火柴盒大小的DNA的结构能能装下比一堆磁盘装下的数据多的多。
当人类出现的时候计算就出现了,只不过那时的计算是在纸和笔上完成的。下面三十年、五十年,可能计算也将不是在今天看到的计算机上完成的,有可能发展成为我们今后计算机的计算原型,科学需要我们来解决这些疑难和挑战。

“互联网+数据+计算”的未来


SELF格致论道是中国科学院计算机网络信息中心和中国科学院科学传播局联合主办的公益讲坛,每月一期。SELF是 Science, Education, Life, Future的缩写,提倡以"格物致知"的精神探讨科技、教育、生活、未来的发展,尝试打破过去纯粹以“知识传播”为主的科普形式,专注于思想的传播,力图从思想的源头上促进公众参与科学的积极性,打造具有中国科学院特色的、融合创新、科学与人文关怀并存的公益演讲品牌。更多信息请访问官网http://self.org.cn。


※作品未经授权,禁止转载,转载及合作请联系self@cnic.cn。※




▼▼▼

SELF讲坛往期精选


✔点击左下角“阅读原文”登录SELF官网查看更多演讲视频。


扫描科普博览二维码

关注更多精彩

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存