涂子沛:洞见2019,关于大数据的10个预测丨城市数据派荐读
The following article comes from 涂子沛频道 Author 涂子沛
即将告别的2018,互联网世界并不太平。一年间,币圈凉、P2P爆、共享单车黄,最近几天ofo还扔了一颗重镑炸弹,一千万人排队挤兑押金,为年底平添了几分风雨飘摇之感。国外也不平静,Facebook、Google、万豪酒店数据泄露,史上最严的GDPR可能将深刻改写世界互联网的格局。
这个即将阔别的2018,有一点湿冷。正在到来的2019年,大数据加持之下的政府、技术和商业,又会有哪些新的趋势和风口,财富流向哪里,热点在何处汇集,今年我在我的新书《数文明》中勾画了未来社会的一幅大图景,现在我再作十个具体的细部预测:
数据合规成为企业新心病
2018年5月25日,欧盟出台了《通用数据保护条例》(简称GDPR),被称为“最严数据法”。利刃寒光,国际互联网企业个个自危。
2018年9月10日,《十三届全国人大常委会立法规划》将《个人信息保护法(草案)》列入了第一类项目,这意味着个人信息保护将迎来专门立法。
此前,互联网大数据的第一波红利已被各互联网企业瓜分殆尽,即将到来的数据合规浪潮,将成为商业大数据发展的拐点,例如,商业广告的个性化推荐将会在不同国家受到不同程度的限制,预计明年起大众对个人数据保护意识会大大增强,开始关注、并向互联网企业索要数据的可遗忘权、可移植权等等。目前,已有部分嗅觉敏锐的企业开始着手审查内部数据合规,当然,更多的企业将心存侥幸、继续观望,数据营销的企业会沿着灰黑的道路继续野蛮奔跑,但数据合规会成为它们新的心病。
数据交易市场停滞不前
大数据交易所一度是各地的一颗新星。随着大数据、人工智能的产业发展,国内纷纷建立起数据交易平台,如2014年成立的贵州大数据交易所、2015年成立的东湖大数据交易中心、2016年成立的上海数据交易中心……我估计,2019年数据交易中心在数量上可能还会略有增加,但我预测整个数据交易市场将会停滞不前,投资巨大的交易中心有极高的触礁风险。为什么呢?因为当前数据交易的主要模式是错的——数据不可能是一次性的买卖,未来的数据交易,需要法律、市场机制和技术的进一步完善和发展,在新一轮爆发之前,具有可操作性的一个可能的突破点是基于数据服务的交易,即交易的标的是使用权、而不是所有权,这样能有效的规避风险并实现数据增值。
数据治理市场扩容
尤其是政府项目增多
政府有很多数据,政府的数据却是孤岛,但我预计政府会成为整个社会最大的互联网组织。政府的数据会比商业界的联接得更快。目前,各地政府都在推进社会治理精细化,广东、浙江等地率先进行数字政府建设。我预计将会有越来越多的政府官员意识到“数治”的重要性,一如我强调的,数字政府就是数据维度上的整体性政府,数治将关系到国家治理现代化的进程,探索以数据全生命周期为基础的“数治”新模式,推动政府数据资源的共享、联通和开放,2019年有关政府数据治理的招标项目会越来越多,这其中商机巨大。
反腐工作将被大数据统治
视频摄像头将曝出更多负面新闻
过去舆论一直强调大数据在广告、金融两大领域当中的应用,忽视了其在反腐工作中的威力。因为大数据技术的普及,各地纪委过去几年的工作效率都有提升。我认为,这一趋势将继续加强,反腐工作的90%将是大数据分析的工作,大数据将助力反腐运动入深水区。互联网就是沉淀数据的基础设施,也是一个开源的情报系统,“大”而“开放”的数据,将进一步驱动快节奏、多源证据、众包式的全民反腐,让政府和官员的行为更加透明。将有更多的大数据分析师进反腐队伍,也有更多的官员害怕各种各样的记录设备,他们最终因为大数据跌倒。
2018年花总用摄像头一口气曝光了14家品牌酒店的“肮脏”视频。这只是一个开始。中国是摄像头最多的国家,我在《数文明》一书当中估算:天网有三体,各类摄像头有三亿。随着政府大力推进“雪亮工程”,各个城市逐渐整合学校、医院、加油站、银行、景区、社区等“最后一公里”视频摄像头,群众的公共安全满意度将进一步提升,各类案件的发案总数将明显下降,但同时,这些密布大街小巷、数量过亿的摄像头却存在巨大的安全隐患,可能被不当使用,在设备安全、个人隐私等方面将曝出更多的、波及面更大的社会新闻。“天网”、“数据”,这两个关键词将会出现在更多的电影、小说、诗歌等文艺作品当中。
自然语言处理(NLP)出现新风口
人类需要跨越国家、文明和语言的无障碍交流,这一点正在实现。自然语言处理(NLP)将赶超计算机视觉(CV)成为下一个新的时代风口。NLP的进步将会推动人工智能整体领域的整体进展。现在,自然语言处理技术已经实现了简单的人机对话、语言翻译和语言分析的应用,例如小米智能音箱、微软的小冰小娜等。
随着算法、语料库和设备的进步,对话平台(CaaP)将是下一代智能人机交互的主要方式。我们会看到机器翻译系统能够更好地融合语境,更自然地将外语翻译成我们更好理解的母语形式;智能语音管家将会更好地服务于老年人和小孩子;网上课堂可以更多地用机器语音……我预见2019年NLP将明显改变人类的生活方式。
oneID萌芽
“云”中的另一个我呼之欲出
各种互联网应用都需要认证,重复认证已经成为个人数据生活的一个负担。活体认证、基于AI的自然人身份识别,这些新的方式也在出现,随着这些技术的进步与成熟,使用统一的ID打通多个系统/平台的数据,实现个人数据的one ID,即统一认证,我认为会成为可能。
oneID(跨领域的自然人身份统一认证)的产业化应用将推动个人云的出现。当我们用微信或微博账号登录各种APP和网站的时候,当政务系统或商务平台通过身份证号、手机号等来关联不同系统或平台的ID以构建更大更全的“个人库”的时候,在互联网世界中就会出现另一个“自己”,“oneID”就像混沌中的一抹闪光,成为催生个人云的那道闪电。个人数据可以先在逻辑上汇集形成个人云的雏形,物理汇聚还可以等一等,这是一个崭新领域,2019年会萌芽。
工业大数据仍然徘徊
健康大数据会有突破
工业大数据喊了不短时间了,其数据量级惊人,但直到目前为止,缺乏杀手级的平台和应用,客观原因是一千条流水线有一千种需求,主观原因是投入产出的账面不好看,即回报率存疑,加上制造业的利润本来就不高,制造业的老板们难下决心。相比之下,健康大数据将会有重大突破,基因检测、医疗图像识别、老年人健康追踪、医院和病人之间的数据共享……这些方面都会有一定进步。
算法审查被提上议事日程
人工智能通常被认为是公平的,是无歧视无差别化服务,但是随着商旅平台动态加价、大数据杀熟的增多,2019年消费者将会逐渐认识到,在所谓的中立算法驱动的智能应用里,普遍存在着千人千面、千人千价的“阳谋”。目前各大公司的算法都是黑箱,消费者对其运行逻辑一无所知,但随着信息安全保护制度体系不断趋向完善,人们会期待“算法公平审查局”这样的机构成立,有专业的人员和机构来审查算法的逻辑。
网贷深入平常生活
数据信用成就更广阔的消费金融市场
与传统银行“先有需求,再有数据”的模式相反,互联网金融大多是“先有数据,再有需求”,例如阿里的借呗花呗可以根据你在淘宝、支付宝上的海量消费数据,通过算法了解你的信用情况,无需抵押在网上快捷地把钱借给你。
和发达国家相比,消费金融是中国的短板,其中一个重要原因,就是消费金融发放的贷款是无担保、无抵押的贷款,风险高,但由于大数据的出现,消费金融将迎来蓬勃发展,各类产品将会大量出现,例如汽车公司可能为你的加油提供贷款,旅游公司为你的出行、甚至购票提供贷款,总之越来越多的东西都可以分期付款。未来的网贷行业,不再会是“庞氏骗局”的滋生地,而是一个由海量数据支撑驱动的数据信用市场。
智慧家庭成为互联网公司新角力中心
目前,各种智慧家庭应用正在普及:小区门口不再需要用锁匙,而是直接用手机、甚至人脸识别开门;冰箱里的食品会主动提醒主妇下单补充;空气净化器会因为空气质量变化自动启动,还有智慧音箱等等。但现实的另一面却又极不方便,它们都有不同的APP分别管理。这个产业市场巨大,2019年,随着互联网巨头的进入,多间公司、多个平台、多个APP的情况将会得到改善,我们的智慧家庭将迎来大统一,互联网巨头将在这个市场角力。