观点记@袁岳:我们今天依然没有大数据,只有大的数据孤岛!
我们知道任何一个数据源都是不完美的,而大数据的时代则告诉我们很重要的东西,就是我们趋于完美的方法不是有一个完美的数据源,是我们有更多不完美的数据源。
零点有数董事长、飞马旅联合创始人袁岳
上周六,袁岳登上“第四届荣耀金鸡湖年度盛典暨2017苏州工业园区人工智能产业年会”舞台。作为荣耀演说家之一,他以大数据与人工智能为题发表了精彩的演讲。
(以下为现场演讲整理,有删减,小标题为编辑添加)
- ①贴标签式追风口 -
创新创业真能做成实事吗?难道你们今天都会做人工智能吗?难道两年以后你们还会做人工智能吗?在可穿戴那一波有几个人做出来了?在AR、VR的时候有谁做出来了?这一波人工智能谁会做出来?
西安有一个大学叫西安交大,在今年中国科技进步奖项中间排名第二。它提出了一个什么问题,难道行业的创造也跟时尚一样,说一个口号,换一个标签,就能实现吗?难道一个创业者能够用这样的方法做你的项目吗?没错,今天你讲区块链,过去一周中间,只要有区块链概念的上市公司都涨价了。现在这个时候讲一个概念就能挣钱的是那些已经做出成绩的公司,但是讲一个概念却不至于你能够起步。
之所以我提出这个问题是因为我今天要跟大家分享的话题是大数据,也许听起来没有那么性感。但是我告诉大家,没有大数据和数据的发展,人工智能是不可能的。因为它就像这个大楼一样,你们每个人可能觉得这个演播室很棒,但是如果没有地基,这个演播室就不存在了,如果没有大数据和大数据智能,人工智能将不存在。如果现在回头来看,大数据要不要干?
我想告诉大家说,没错,将来我们甚至每个行业,甚至连普通的服务行业都会有人工智能+,都会带人工智能+的元素,但是路径是什么?前面《创赢未来》的节目说,你能说说看现在这个创业的特点是什么?我说创业就是两种,有一种人,我就是有一个非干不可的事。还有一种人,觉得是非追不可的时髦。一个是追风口的,一个是做自己想做的事,追风口的人我从来没看到他追到过。
- ②多维度数据与生活的数据化 -
广大群众一致认为,一个群众都不要问,就写“一致认为”,为什么?没数的,但同样那样写。所以那时候我就觉得说,不可以这样吧,我们怎么也要问问吧,所以在1992年开始做了一个问老百姓的公司叫零点调查。
当然任何一个获得数据的方式都是不完善的,所以这么多年来,我们做了好多研究都会受人质疑,但是也有一点很好,比如说数字。我们知道任何一个数据源都是不完美的,而大数据的时代则告诉我们很重要的东西,就是我们趋于完美的方法不是有一个完美的数据源,是我们要有更多不完美的数据源。
你知道了阿里巴巴的数据,大概知道上网卖便宜货的状况,但是你不知道关于很多不便宜货的状况,所以换句话说阿里巴巴平台上告诉了你一点,关于交易便宜货的信息,但是用它的数据能知道国民经济的状况吗?不能。今天苏宁上面有很多交易家电的信息,他能告诉你一部分,但是苏宁家电的交易量远远不如京东,所以也只能算是一个数据。
每一个角度的数据源,中国有多少人?我们有三个统计口径,这三个口径完全不同。一个统计口径是来自于统计学,挨家挨户问出来的。一个统计口径来源于卫计委,生一个孩子有一个出生证。第三个统计口径是身份登记和户口登记,这三个放在一起,你说差多少人?上亿。这就告诉我们说,看起来每一个很靠谱的数据源也说不到一起去。
差不多五十年以前有人说,对待人类的现象和社会现象的描述,因为它具有不确定性,因此最佳的描述是多决策点,意思是说有不同角度的信息和判断,来帮助我们趋近于真实。
我们看一个城市会不会成为大数据,是看这个城市有没有更多的数据源被开放出来。今天即使有了BAT公司,其实他们也是不够开放的,你们能用到阿里巴巴的数据吗?你能用到百度的数据吗?百度能用到腾讯的数据吗?腾讯能用京东的数据吗?不能。
每一个人抱着他的数据,实际上还是一个数据孤岛,只是说今天孤岛比以前大了。我们今天依然没有大数据,我们只有大的数据孤岛。
当我们今天看到数据源的开放度和数据源的加工能力和数据源的交换水平都还不够的时候,那么我们今天讲人工智能,吹牛逼的成分超过40%。
当我们有8个以上大数据源的时候,一个城市中间95%以上的问题,我能用很快的速度给它处理。最近华北地区煤改气,煤改气的结果发现河北很多群众挨冻了,但是北京没有,为什么?因为过去5-6年中间,北京把所有群众涉及到气水电的人,每家每户,在电子地图上分布在什么地方非常清楚,谁会挨冻都知道,但是河北不知道,所以河北挨冻了。
表面上它是数据,实际上这个数据才连着每一个人做的行为和每一件事情,所以有没有数据的本质是一个地方是不是数据化了。
- ③大数据背后的区块链逻辑 -
不管你是多小的公司,多大的公司,你的数据要能够加工成可交换的状态,也就是说,这个数据能够拿出来跟其他公司交换。因为你只有一个数据库,而你可交换状态的时候,就可以跟很多人交换,一个数据可以延伸五千个数据或者五万个数据,你就会掌握大数据了,因为只有可交换才是获得大数据中间最低成本的方法。
还有很重要,数据可能造假,所以我需要使用区块链技术,所以大数据再各地中间产生模式跟今天区块链技术有很重要的关系,这就是我们今天看起来一个个好像零星的东西,实际上本质上都是数据技术。
美国是1979年以后才称之为大数据的元年,为什么?因为那一年美国政府通过了阳光下的政府法,政府部门的信息必须公开,公开的时候这个数据源就丰富了,那个时候才称之为大数据元年。我们站在这个角度,当我们懂得公开,懂得把数据处理成为可交换,可分享的数据产品的时候,这样我们产生了很多数据,而数据放到融合中间加以处理,这个融合我用了很形象的四个英文单词(OEPA)。
O,是告诉你说,我把数据融合在一起的时候,我们把一个问题描述的特别清楚,如果描述一个人,能够清晰的描述他的生活方式。如果描述一个企业,我就能够精确的描述他的运营方式。如果我们要做一个城市,我们就要了解这个城市的夜行方式。
E,可以跟谁互动呢?到今天为止,大部分公司,包括我们觉得很棒很棒的BAT公司,其实他们能做到的大数据就是O和E。今天你在京东的平台上,他能告诉你说,在买所有的电冰箱中间,谁的电冰箱卖得最好,这个可以告诉你。现在问题在于,假如我的电冰箱怎么卖得更好?他会说,对不起,这不是我的事,我只能告诉你谁来买,他怎么卖,卖得多好。
P,前沿技术在哪里?怎么样做才更有机会?怎么样做才会更好?
A,怎么样做才是最棒的和具体怎么做?
- ③大数据应用模拟 -
我下面给大家做一个模拟,我们针对95后怎么理解。你们知道吗?00后和75后最相近,00后既不像80后,也不像90后,为什么他们的特性差别很大,很有意思,这里面有些很重要的原因,00后是70后生出来的。
从数据里面分析就自然可以看得出来,针对里面的矛盾,比如说旅游,这个点完之后就知道在95后中间,他们去旅游的时候会去什么样的地方,他买什么东西会买什么样的东西,一看就非常清晰的展现出来了。
那我要做95后的生意,怎么样把袜子卖给他们更好?或者卖家具更好?所以下面我们要把跟95后相关的数据进一步来做更深入的分析,我们把95后分成两部分人,一群分是游戏玩得好的,一群是考试考得好的。
你们不要以为打游戏的孩子傻,打游戏的孩子的节奏、美学、能力、反应,完全不是考试考得好的孩子能跟得上的,因为游戏没有标准答案,考上考得好的有标准答案。你们搞创新创业,请告诉我,有标准答案吗?
我们在这里面把这个人分成两群,总体来说,打游戏的还是会越来越多,当然更重要的是,大家没有把打游戏归结成那么坏的事了,打游戏的孩子目前占95后的85%。这些孩子分两个大的类别,一个是萌系,一个是英雄系。
萌系的概念就是“装孙子”,萌萌哒!所以00后看不上90后的就是,都老大不小了,还整天装成小孩。我们跟你不一样,我都长大了,我都17岁了,这是00后和90后不一样的地方。
很重要的是,95后能在市场上找到萌的产品和服务。一般来说是有动漫画,部分是游戏化带动的,核心力量是动漫。但是另外一些叫做英雄系,现在打得火的游戏都是打仗的,不是机器人打仗,就是武士打仗。《王者荣耀》基本上就是统统打仗,不管哪个朝代的人混到一起打仗。武士,统统都是武士的样子,这些就是英雄系。英雄系是影响中国95后最大的一个系,可惜在产品和服务表现中间是最弱的,换句话话说这是一个空白。
你们看到我穿的这个大衣吗,这就是游戏战装系的,这个衣服就比普通的大衣好卖。为什么呢?有某种熟悉感。他打游戏天天是被洗脑啊,他的美学是由这个塑造的,他的美不美是由游戏里面的人塑造的,这个美学观念完全不同。当他喜欢这一套东西的时候,他用这个去看世界,他要寻找这些东西。
考试好的孩子,那些认真学习的孩子,他的价值观跟前一个价值观是很不一样的,他核心价值观是这个部分组成的,未来感,开脑洞,智慧,他们也不只是认真考试,其实他们也知道未来我要学好知识,我现在要学人工智能,我要学数据化,我现在要学应用数学,这些孩子成为智能化产品很重要的消费者,这是一个核心的事。
另外还要考虑初心。年轻人有年轻人的情怀。请问95后的初心和65后的,55后的初心有什么不一样?你说95后小时候都没有吃不饱的事,天天吃的都不想吃,他的初心是啥啊?如果我是65后,我小时候初心是啥?初心就是天天吃大闸蟹,其实初心是很不一样的。
当然还有很重要的事情就是娱乐至死。哭、笑、忘记、放松,这就叫娱乐。大家在某一个专业工作上好累,我们希望不要再来一个“累”的产品、分享和服务,除了专业之外其他东西都要放松,都要娱乐,这就是娱乐化的事情。
认真学习的孩子最需要娱乐,如果不提供娱乐,他就崩溃,他就忧郁,他就跳楼。所以那些希望自己孩子特别好好学习的父母,特别要记得,如果不打游戏,就让孩子好好放松,否则你们家养一个很容易崩溃的孩子,这是我们从价值观中间已经看到有的东西。
- ④大数据与城市配置 -
现在换一个视角,说一个城市。一个城市跟人一样,有城市自己的生活方式,每一个城市都有自己的配置。像苏州因为有了我们园区,其实苏州这个城市的配置跟其他很不一样,因为园区当初是中国和新加坡之间合作的工业园区,所以它也代表两个国家,把世界上非常棒的很多东西整合在一起的特点,城市配置就很不一样。而这些城市配置类似我前面说的,用同样的数据可以展现一个跟生活相关的东西。
有很多城市,大部分的供应者都是来自体制内,而另外一个城市只有15%的供应者来自于体制内,城市支撑者是谁就很不一样。支撑者跟城市服务效率之间有着非常密切的关系。通常,核心支撑者肯定是国有的,而运作和内容的应该是民间社会,这是一种最佳的方法,深圳就是这样的方式。
下面这是智能模块。假定我用了这个东西,我觉得这个东西非常棒,我希望两年到三年左右的时候,应该把它换一套。如果十年中间,给我换三次,如果有一个服务商你创新了一个家装方式,每三年再给我30%的钱就给你换一套,而且换的时候又不会造成太大的问题,所以你要考虑到这两者之间的对接,这就是完全新型的家具思路和家装模式,这样的东西就是把周期化和对产品要素的需要,用数据演算的方法就能够计算出来,怎么样能够做这样的事情。这不仅仅对于一个企业可以这样来做,对一个城市也是这样。
我到这里跟大家讲的OEPA,我们在座每一位,不是只听人家人工智能成就的故事,我们每个人都是一个数据源,我们很多时候要过滤隐私,但是从另外一方面,如何在技术意义上使得哪怕一个个人也要成为大数据的一个源头。我觉得数据不管大,还是小,都是可以跟人家交换的,而且我的数据在交换过程中间可以交换到更多数据的,在此过程中间不仅有大的数据,公司也要建立自己小的数据融合,以至于我用数据处理关联的很多事务,但这意味着我们将来会用更多的智能模块来面对我们所面临的业务,或者我们用很多智能的工具来去处理生活中间遇到的问题。
今天我们的人工智能带有神秘化的色彩,在去年我参加乌镇互联网大会的时候,我觉得库克先生说的这个话非常好,他说苹果的下一代,我们致力于做得是什么?我们要致力于成为最强大的人工智能平台,而让普通的人借助于手上的移动终端就可以用上人工智能技术,来解决我们很多的问题。就如同今天电商的平台,已经很方便的可以开网店。就像今天作为手机终端,可以很容易的使用APP。
站在这样一个角度来说,当一个概念从空中落地的时候,既需要很基础的工作,又需要我们被自己的业务在多大意义上,跟这个大潮流的发展,在什么时间建立这样的连接,我们怎么样推动和促使更好的条件,使得我们成为最早的探索者。
一般来说,我把数据和人工智能关系分成这样四个级别,第一个级别是数据源的建设,衡量一个地方,衡量一个公司的能力,衡量我们行业的能力。第二个级别是数据智能化程度的水平,第三个级别智能化平台跟我们之间的关联。第四个级别是垂直方向上的应用。
我们刚才应用很多方向领域中间,其实它的前提在于数据的开放达到相应的程度,很多的数据,智能的模式和它的方法才能更好的加以应用的。我也同样希望,在数字经济的时代,我们在数据源的开放建设,数据智能的支持和投入,人工智能平台的引入和合作,和垂直化应用中间积极的探索,当这四个层次的工作都并行不悖,往前推动的时候,我们才有可能形成一个丰满、强大、富有潜力的智能化经济形态。
谢谢大家!
推荐阅读(点击下方蓝字)
创事记:宋阳 | 余凤华 | 江洪涛 | 朱奇峰 | 吕涛 | 姚霆 | 卢虎臣 | 王树基 | 徐洪江 | 赵悦 | 陶承睿 | 乐文城 | 张超 | 范兆尹 | 朱君 | 马一清 | 程鹏 | 高始兴 | 李晓军 | 季鹏 | 刘彪 | 黄健 | 李可佳 | 陈泉 | 李文建 | 朱啸虎 | 何鹏 | 魏敦山 | 刘炽伟 | 李益明 | 鞠金友 | 罗子浩 | 马义和 | 陆海英 | 于亚楠 | 戴湧 | 夏旸 | 雷明 | 李源 | 桂曙光 | 费建江 | 张海龙 | 孙绍瑞 | 曾佳欣 | 陶闯 | 罗钥 | 施佳樑 | 夏仲璞 | 高洪偲 | 靳毅 | 刘轶 | Travis Kalanick | 王甲佳 | 林亮 | 刘彪 | 孙绍瑞 | 张泉灵 | 杨岩 | 黄俊 | 周鸿祎 | 刘川郁 | 顾刘成 | 陈刚 | 林玉峰 | 邓亚萍 | 周玉黍 | 唐元华 | 徐井宏 | 安盟 | 刘超 | 吴媛 | 余钢 | 张祥伟 | 季鹏 | 周志颖 | 黄君贤 | 王挺 | 潘伟 | 陈宇宁 | 魏晨 | 顾问 | 陈华根 | 孙绍瑞 | 毛勇 | 黄昕 | 陈琦 | 王阳 | 刘映婷 | 冯翼 | 张世民 | 江涛 | 陈正 | 孙加腾 | 吴晓梅 | 姚哲 | 周连生 | 黄丹青 | 李康 | 魏松林 | 李伟超 | 张明
活动报道:吴文俊人工智能科学技术奖 | 百度人工智能嘉年华 | 第34期云彩路演 | 小样一周年 | 第33期云彩路演 | 金鸡湖金融科技安全与发展论坛 | 第六届东沙湖杯千人计划大赛 | 第32期云彩路演 | BOE创客工坊开业 | CCF人工智能与类脑论坛 | 第31期云彩路演会 | INSPACE开业 | 星苏岛开业 | 苹果企业解决方案中心开业 | 第30期云彩路演 | 国际精英周 | 第29期云彩路演会 |创业邦开业 | 中新国际科技交流与创新大会| 江苏发展大会 | 电博会 | 28期云彩路演 | 同程众创开业 | 人工智能产业协会成立 | 国匠众创开业 | 针头众创开业 | 苏州黑马路演中心开业 | 比由开业 | 机器人大讲堂 | 百度云智峰会 | 第20期众创空间沙龙 | 通付盾年会 | 武汉大学苏州创客中心启动