著名大数据专家涂子沛:数据智能的前景、挑战和阴影
点击图片上方蓝色字体“慧天地”即可订阅
(更多精彩请留意文末推荐)
8月13日,在北京大学创业训练营“大云智信”大数据与人工智能发展论坛上,著名大数据专家涂子沛发表了 《数据智能的前景、挑战和阴影》的主题演讲,深刻揭示了大数据与人工智能的未来发展路径以及存在的问题。
涂子沛:大家好,我和大家有一个共同点:喜欢苏州。苏州的创新是有历史渊源的,苏州在这方面做了很多的工作,给海外的学人留下了非常深刻的印象。大概6、7年前,我来到苏州就感受到了苏州的热情、对人才的渴望、对时代浪潮的拥抱。
这次来,我有一个很深的感受:这是一个宜居的城市。宜居是怎么判断的?我有一个标准分享给大家:我觉得高楼太多的地方不宜居。苏州不是那么高,相对来说,你去看杭州的创新小镇,包括梦想小镇、人工智能小镇,他们盖的房子都是4-5层楼高,一栋一栋的,有很多绿化区,这就很像美国。美国的很多产业园绝对不是我们想的,一栋高楼树起来的那种产业园,首先是生活,把生活融进工作。前段时间我一直在想一个话题,一个城市生态环境、生活环境是怎么样的才最促进创新?我想,一个田园型的城市可能是一个最促进创新的环境。
这次春天到底会是什么样子的呢?在几十年前人工智能的春天就来了,刚才我们提到的AlphaGo,这是围棋,实际上在九十年代的时候深蓝就击败了人类象棋冠军,早就击败了。人工智能战胜人一直不是一个新闻,60年代的时候,下跳棋人工智能战胜了人类,90年代下象棋击败了人类,围棋是什么情况?围棋是东亚这边很小的一个棋种,人家不玩,人家玩早就把它灭了。
大概在2015年的一次中山大学论坛上,我和一个围棋高手发生了冲突。那时还没有AlphaGo,我说要是人家玩围棋早就把这个灭了,当时在上千校友面前发生了争论,我们赌了1500万,没想到就几个月之后AlphaGo出来了。当时记者采访我,我说这没什么悬念。
我们的人工智能究竟表现在什么地方?按照人类智能来的这条主线其实我们科学家一直在研究,但是今天一个巨大的不同是数据量极其庞大。
比如微粒贷。微粒贷就在你的微信上,它根据你的数据判断究竟能不能给你贷款,利率是多少。为什么说它是人工智能?它要处理大量的数据,最智能的是,有些人的手机上有,有些人的手机上没有,它能够判断识别你需不需要贷款。
第二个我想举的例子就是阿里巴巴。现在80%的销售都是在手机上面。手机屏幕是非常小的,它可能只能展示10件商品。但是阿里巴巴做了一件事情,4.3亿用户每个用户打开来看到不同的商品。为什么?这是个性化。
我们说软件可以说是个产品,但是阿里把这个产品发给4.3亿人,每个人都不一样,这是智能吗?如果说这不是智能,还有什么是人工智能。
人工智能从字面上看,我们说是模拟的、人造的智能,但是我告诉你,人的智能是达不到的。为什么达不到?你想一下4.3亿用户,你要在他打开软件的一刹那计算完,还要给出一个个性化的界面,甚至这一秒打开的和10分钟以后打开的都不一样,人是没办法做到的,阿里请多少工程师都没办法做到。
阿里把这件事交给机器,这件事有什么帮助?帮助太大了。怎么大?你看到个性化的界面,意味着你看到的东西是你可能买或者想买的东西,跟看到一个4.3亿人统一的界面购买的可能性完全不同,我们做过一个研究,5倍。这就是数据智能。
我们最早的智能在厨房里也能看到,电饭煲,选择煲汤还是煮饭,设定一下你就不用再跟进了,好这就是我们今天基于大数据的智能。这种智能来源于哪里已经很清楚了,来源于数据。
数据是智能的母体,我们能看到数据智能的社会在往前奔跑的时候,是以大数据为基础的。我们今天怎么描绘这个经济,说它是新经济、网络经济、知识经济,怎么说都好,但事实上,是数据经济。我们今天这个提法还不是那么普及,但是时代再往前走,所谓的新经济,其实就是以数据为基础的经济。
阿里巴巴的个性化,每个人打开的界面不一样,微信的微粒贷,判断你需不需要贷款,需要才推给你。个性化还在延伸,比如延伸到制造业。
获得个人数据之后,我们在工业时代,大规模的生产导致的结果是什么?大家都穿一样的鞋,39码、40码,但是有几个人的脚真的是39码,真的是40码?绝大部分人的脚是39.66码、39.54码……落在正好这两个点上的很少。这是工业化的原罪,它把我们标准化了,我们没有办法穿到真正适合自己脚的鞋子。现在来了,获取个人数据,然后定制。人类个性化的需求被压抑了几百年,接下来我们要看到一个个性化的爆发。
大家可能都听过“红领”——定制化的西服。我在去年定制了一套,我定制了以后,我觉得真合身啊,没穿过这么合身的,穿了以后可能就不想再去穿大路货了。电影里经常会有穿衣服的时候有人来帮忙,你认为这是明星在耍大牌,事实上不是,定制的衣服真的需要有人帮忙穿,因为每个部位都是卡死的,但它又真的是合身的。每个人的身体事实上是不一样的。
红领集团在做的就是获取你全身20多处的数据,现在要做一个魔幻大巴,这个大巴里有8个摄像头,你换身紧身衣站进去,30秒全部数据取下来,然后它会把衣服邮寄给你。红领要在全国投放5000辆,在人流最密集的巡回。有意识的创新吧各位?当我听到这个想法时,他们在和浙江的一家公司在合资,技术正在突破。
大家想一想,如果它的东西直接就到取完你的数据然后寄给你,还要淘宝吗?这就是未来我们说的,从工厂到消费者到家庭。因为我获得了你的数据,我给你生产的东西是你最想要的个性化的,然后还可以直接快递给你,那淘宝就没有了,颠覆还在继续。
比如淘宝,它要做好这件事就要收集你点击的数据、浏览的数据、消费的数据,除了这些数据之外,它还想收集你更多的数据,因为收集得越多它判断得越准。微粒贷,一样的,它要判断一个人的信用要不要更多数据?它要判断一个人的经济状况,要判断一个人究竟是屌丝还是白领还是公务员,它才能更好的信用服务,所以它要汇集数据。 但是问题来了,我们今天数据汇集的前提完全没有经过我们消费者自己的同意,就被汇集走了,这就是问题。
无数商家在背后汇集我们的数据,但是最应该说同意的那个人,那就是消费者,从来没有表过任何态。怎么办?国家最近在出台政策,打击非法数据采集链,有几家新三板的公司都受到了重创,最新的财经正本专题都在讲数据产业怎么办。
好,我们再讲一个例子。现在的个性化保险所带来的问题是什么?个性化的保险需要汇集多少数据。原来的保险就是A计划、B计划、C计划,一谈,大家买的保险都差不多。现在,因为我能收集到你大量的数据,所以我能给你量身定做一个个性化的保险方案。好,这就有问题了,什么问题? 大数据收集全的公司、算法好的公司把那些优质的客户都吸走了,他一看,你的信用不好,你出事的几率高,他就不卖给你。谁的大数据做得好,谁就能把优质客户收割掉,但是最应该买保险的恰恰是哪些容易出事的人。
因为有大数据、人工智能,最应该买反而买不到。所有保险公司都会说no,我想卖给不出事的优质客户。好,这就是一个社会问题,数据带来了很多歧视,他收集了大量的数据,甚至有些可能是错的,他急于错误的数据选择给我们贷款、选择提供各种各样的商品。比如说,你是一个未婚妈妈,你去买保险,他知道你是未婚妈妈和他不知道你是未婚妈妈是完全不同的。甚至你喜欢红车,它的算法就会给你减一分,为什么?数据自有理由。
再接下去说,淘宝。我们觉得这种个性化真的好,非常好啊。我们第一页就能看到我们想看的商品,但是这种个性化也在产生问题。因为个性化,显示的同一件商品的价钱不一样。为什么?因为我的大数据计算得出,一个人很喜欢这件商品,标价100块都想要,另一个人可能标价80都不要,这就是价格歧视,这是商家梦寐以求的价格歧视。实体经济时代,在百货商场标一个价格所有人都看到了,有人愿意出101你也只能卖100。但是今天,每人一个屏幕,同一件商品,可能有不同的价格。
怎么发生的?我举一个例子——机票。机票有很大的掩饰性,因为机票是动态的,一个小时前和现在的价格并不一样,它有一个很好的理由:动态定价。但事实上,每个人看到的机票价格都不一样。
滴滴,有人就感觉,我上次加了价,现在不加价就打不到车了,本来3秒就把这个情况反馈给你,现在是3.5秒、4秒,让你等不及就加价,我们不知道滴滴的算法是怎么回事。
我们要审查,我们经信委要成立专门的部门,对人工智能政策进行审查。不审查,这样下去我们不知道会发生什么。我们今天的数据是怎么回事?他们用了我们的数据,但是这个数据是错的,我们也不能进行修改,在错的数据上不断的做决策,怎么办?这就是我们今天所面对的问题。
所有的商家都在汇聚数据,那么这个数据能不能买,能不能有个数据淘宝,在上面自由地交易?我的结论是,数据不是石油,不能一桶一桶的卖,这样肯定是不行的。
我们说数据共享,其实数据共享是个伪命题,因为数据极其容易复制,一共享就复制了,复制了还要共享吗?就自己玩自己的了。
那些电话推销的人、卖数据的人,也在做大数据研究,一看你的公司有数据两个字就打电话过来:我们这边有个某某省社保的数据,10万块钱你要不要,说不要,再过半个月,5万要不要,再过几天1万。为什么?因为他花10万买了这个数据,卖5万,只要多卖两个人就赚回来了,所以价格越来越低,越来越低,最后到1万,但是这些数据真正的所有者应该是我们的公民、我们的市民,他们没有说任何话,在整个过程中。
数据智能会产生这么多的问题。我们看到我们的商业在奔向一个浪潮——个性化,个性化的未来十分清晰,因为商家掌握了你的数据,能够给你一个最想要的东西,另一个大潮是—— 智能化。这两个大潮是我们今天看到的商业浩浩荡荡的两个大潮。但是在这其中,还有很多问题。
来源:数据观(版权归原作者及刊载媒体所有)
荐读
点击下文标题即可阅读
编辑:盛兆阳
审核:朱林烨
指导:万剑华教授(微信号wjh18266613129)