天云大数据雷涛:基础设施国产化势在必行,AI亦如此 | 华映portfolio
危机中看到机遇,不止心态,也是眼界。
这对创业者来说尤为重要。大势不确定性变强的今天,对本土科技企业而言,或许正是抄底时刻:技术国产化,正朝底层核心应用及基础设施方向吹响号角。
作为其中的前排冲锋者,天云大数据定位“服务AI的AI”,为AI应用企业提供AI基础设施服务,“对西方核心组件的替代,尤其是软件的替代,天云有两个主要目标,一个是Oracle,一个是SAS”。
近日,天云大数据创始人雷涛接受亿欧金融专访,讲述天云的选择与坚持。
来源 | 亿欧网
作者 | 杜晓彤
山雨欲来,基础设施国产化蔚然成风。
2018年4月16日晚,一纸封杀令逼得中兴狼狈不堪,将国内的无“芯”之痛暴露得一干二净。近日,中美贸易硝烟再起,这次主角换成了华为,海思从幕后被推到台前,国产“备胎”大队看起来正以一副跃跃欲试姿态进入人们的视野。
事实上,早在2016年阿里巴巴已经决定将基础设施“国产化”,也就是如今大家所熟知的“去IOE”运动。I指的IBM提供的服务器,O指的是Oracle提供的数据库软件,E指的是EMC提供的存储设备,这三家来自美国的巨头构成的数据库系统几乎占领了全球大部分商用数据库系统市场份额,其中也包括中国的金融业。
核心技术不掌握在自己手里,导致银行长期受制于这些企业(IOE),不仅要承担高成本,信息网络安全有时也难以保证。从阿里巴巴‘去IOE’的成功经验来看,目前I和E有很大机会替换,但Oracle的替换还较为困难,以银行为例,要同时保证数据并发处理的效率和准确性,分毫之差都会造成巨大的经济损失。
“人们不知道Oracle、不知道SAS,是因为它们都隐在底层”,所有的人工智能应用都是在它们的土壤里生长出来的。天云大数据创始人雷涛在接受亿欧金融采访时表示。
把握住了底层技术,就像是扼住了产业的咽喉,过去我们的脖子都被交到了美国的手里。然而,随着云平台、人工智能的到来给国内基础软件行业带来了在新赛道中实现超车的希望,诸多新兴科创企业涌入这个赛道,朝底层核心应用及基础设施吹响了进攻的号角。天云大数据作为其中一员,雷涛表示,“对西方核心组件的替代,尤其是软件的替代”,天云大数据有两个主要目标,“一个是Oracle,一个是SAS”。
围绕中美贸易战背景下人工智能企业的机遇与挑战、人工智能平台在银行数字化转型中所能发挥的作用,及未来的发展方向等主题,亿欧金融与雷涛进行了交流。
以下为问答实录(在不改变受访者原意的前提下,进行了部分调整):
亿欧金融:天云大数据的定位是什么?
雷涛:为AI应用企业提供AI基础设施服务,也就是服务AI的AI。
亿欧金融:如何通俗的理解“服务AI的AI”?
雷涛:类似于AI的Android系统,天云希望提供的是AI平台,也在尝试引入应用层构建解决方案的第三方机构进行合作,在平台上进行建模。所以短期来看,天云的一些AI副产品,比如反欺诈,和市场上一些作反欺诈的企业好像是竞争关系,但是未来还是希望往合作关系发展。
亿欧金融:像天云这样的新兴科创企业,在中美争端大背景下,在产业深度调整期可能会有哪些机遇和挑战?
雷涛:短期来看,确实存在着巨大的机遇。过去,传统的核心基础软件层都掌握在西方,比如最典型的Oracle,人工智能领域的SAS,国内的企业都是在这些软件的基础上进行行业应用的开发。所以在基础设施上,大家还是习惯于采购Oracle和SAS,对于天云大数据这类提供替代服务的厂商接受度不高。
但这次中美贸易战的发生,引发像Oracle把研发中心撤出中国等一系列事件,必然留给我们科创企业一定的市场空缺,短期内是利好的。
长期来看,可能遇到的一大挑战在于人才,现在学术圈有消息透露,美国已经开始要求SAS等企业不允许为国内的一些高校培养人才,SAS是人工智能领域必学的课程,如果高校不被允许在授课中使用SAS软件,很可能未来国内的人工智能人才会出现断层,这是需要未雨绸缪的事情。
亿欧金融:Oracle这样传统的IT基础设施,和天云所提供的DT基础设施之间的区别是什么?
雷涛:传统IT厂商所作的工作主要是通过把行业经验梳理成代码来建立模型,这种实现路径的特点在于非常依赖于行业经验的积累,跨行业的壁垒非常高。
天云所开发的AI产品在金融领域得到应用和验证后,能够快速地把其模型能力拓展到石油、军工、医药等不同领域里,这是传统IT厂商不可能做到的,核心的区别就在于生产资料的变化。
天云大数据通过AI建模,全景展现药物靶点蛋白数据,帮助药物适应症和副作用预测
传统IT厂商是依靠专家的行业经验和大量的程序员编写代码来进行模型生产,而现在从BI走到AI,企业靠算力和算法驱动模型的生产,生产资料从人转变为数据,开发模型的人不需要知道各种专业的行业数据,机器会从数据里发现和输出行业知识和应用模型,这种成本和效率都是传统IT厂商不可比拟的。
亿欧金融:目前,关于替代Oracle和SAS的尝试有哪些?
雷涛:AI对大型企业的流程化再造可以分成两步,第一步,就是把复杂商业流程用算法进行重构。一方面是用数据算法将流程进行扁平化升级,过去要把数据拿到SAS平台进行分析,需要一层一层地把数据提出来。现在通过分布式技术,把这个流程扁平化,实现毫秒级的服务响应。
另一方面是服务一些传统业务范畴外的边缘业务,通过AI快速规模化的能力生产更多的模型,来支持更多边缘业务的开展,比如飞单的识别、POS贷的额度个性化设置等等。
第二步就是如何把企业庞大的数据资产盘活。传统的处理方法中,数据在交易结束后就静默了,要继续使用这个数据,就需要把它复制到数据仓库,有一些非线性的隐含价值无法在数据仓库表达出来,所以需要复制到SAS中进行挖掘和分析处理,数据在不同数仓和平台进行迁移的过程中又会出现大量的冗余和逻辑不一致的问题。
所以一个数据治理项目是需要从上自下、从财务、ERP等不同角度来考虑,整个过程大概需要付出三十个人工,一年的周期,千万级别的成本。但现在通过AI的解决方案,可以在两周之内,整理八千多张报表 ,完成一个数据图谱。这些尝试目前主要还是集中在金融行业。
例如,天云大数据自主研发HTAP国产分布式数据库,成功PK基于传统IOE架构的oracle一体机(Exadata)解决方案,上线了某大型股份制银行的全量数据在线实时交易系统,面向柜面系统提供7*8小时A类实时核心交易,面向手机网银系统提供7*24小时A类实时核心交易。
成功实现了多个业务分户及交易明细的全量线下数据线上化,提供实时服务应用。目前400亿条交易数据,500ms交易服务响应的A类核心系统支撑要求,每天在线交易量超过200万,占整个银行核心交易量的10%。
亿欧金融:以风控为例,人工智能的引入和银行原有的传统风控手段会存在冲突吗?
雷涛:在风控这个领域的结合,其实是在银行原有的风控手段基础上进行改善。银行传统的风控系统是专家决策树,例如当一个客户申请贷款,他的资料就进入了一个决策树,第一个分叉“有没有其他行的借记卡记录”,然后进入下一个分叉“年龄结构是什么”,这是一个固定的规则。
但是缺点在于无法反应外界的变化,比如不同地域的客户特征的不同、年龄分布的变化等等,所以AI在每一个清晰的规则节点,运用随机森林等技术,把外界的数据变化反应在原有的规则当中。
亿欧金融:这个行业的核心壁垒是技术吗?
雷涛:技术是阶段性的,对于刚成立的科创企业来说,当然要依靠产品来赢得市场的认可。但其实,现在最前沿、最先进的技术都在论文里,我们都知道SCI搜索引擎里面的论文被引用的次数越多,就越有价值,所以这也就决定了全球范围内的知识都是快速流动的,很难建立起像关贸、商贸、进出口管制这样的壁垒。
从长期来看,这个技术的壁垒会体现在人才流动上。但从商业模式来看,行业的核心壁垒更主要的还是在于核心数据资源的积累。在积累核心数据的过程中,模型应用边际成本是不断下降,企业会拥有快速进入任何一个行业、快速解决某一个问题的能力。
比如知名的信用评分机构FICO,运用美国大量征信数据训练出一个精准的评分模型,然后把这个模型拿到中国来销售,其中的边际成本几乎为零。
亿欧金融:AI行业未来的商机可能在什么地方?
雷涛:未来AI的一大商机在于,有机会参与到企业的主营业务,比如石油行业的液面高度预测,可以做到企业点击一次进行预测,就收取一次服务费用,收流量的钱。
所以,从2015年到2018年,天云都是在建立灯塔客户,接下来就会往泛行业化的方向发展。判断是否需要跨行业,是基于我们判断AI平台的发展,因为数据资源而壁垒化,因为行业价值而横向化。
敏锐观察环境的水温,在不确定性中中稳扎脚步,甚至逆势看到机会,也是华映一直坚持的“理性浪漫主义”。
6月14-15日,华映资本 x 36 氪 WE 来大会,一起发现趋势,寻找关于未来的预测与预案。
永远不缺这样的底气:乾坤未定,你我皆是黑马。