【金猿人物展】九章云极联合创始人兼CEO方磊:2020年,数据科学平台将迎来新一轮爆发
金猿人物展
大数据产业创新服务媒体
——聚焦数据 · 改变商业
2012年,数据科学家作为新兴职业出现;2017年,Gartner首先为数据科学平台给出定义;2019年,数据科学平台在中国开始从小众走向大众。这种服务数据科学家及团队的建模平台工具在中国市场的表现,从晦涩到主流,从定义不明到自立山头,仅用了一年时间,再一次体现了中国速度。
2020年,我们能看到数据科学平台将迎来新一轮市场爆发。
市场利好+政策利好双重助力
自动化决策需求成就数据科学平台“高光时刻”
2019年仍然是数字经济竞争激烈的一年,社会整体对数据价值的认知提升到新的阶段。“数据科学家”,这个赋予数据更多价值的职业在任何国家都供不应求,在中国表现更甚。目前中国的数据科学家仅有2-3万名,但市场上的人才缺口高达数百万。教育部每年批准开设“数据科学与大数据技术专业”的高校越来越多,2015年首次批示仅3所,到2018年,共有488所高校获批。数据科学人才正在加紧培育,但能够高质量地填补人才缺口,还需要时间。
商业市场则走地更快,以数据、资源、需求等各方面都相对完备的金融行业为例,在人才有限的情况下已经获得了高可用、可复制的数据科学实践真知,从2019年8月央行下发的《金融科技(FinTech)发展规划(2019-2021年)》可见一斑。这个针对金融科技的第一个顶层规划中指出,要运用数据科学的相关技术(机器学习、数据洞察、数据挖掘、建模分析、算法模型等)解决各类金融场景难题。人才不够,工具来凑,这也是近年来数据科学平台在金融行业被成功运用的利好结果。
权威的第三方机构眼光就更加客观和长远,在今年8月和10月份,IDC和Gartner分别针对数据科学平台在中国及亚太市场的表现相继发布研报;在相关大数据产业地图中,数据科学平台也开始作为独立赛道进入公众视野,九章云极的DataCanvas数据科学平台均有幸入围。
一项技术得以获得教育、政策、市场等多方面的综合肯定和支持,背后一定具备强大的需求驱动。目前,市场上对数据分析的需求上升到了“自动化决策”,如果说用图表展示已有数据的BI是数据分析1.0,那么预测未来、可以自动做出决策的AI就是数据分析2.0。
数据科学平台就是实现数据分析2.0的载体,数据科学的核心能力就是机器学习的能力、实时的能力、企业AI落地的能力,通过一个个数据模型,让企业庞杂分散的数据变成高价值的决策,能够真正地指导企业运营和业务决策。这正是当今企业数字化转型、AI落地亟需的能力。
2019年,数据科学平台在大数据行业中成功自立山头,这是数据科学平台在行业地位中的第一个“高光时刻”。
数据科学精细化发展
自动化成为时代宠儿
从国际视野来看,近年来数据科学受关注热度有增无减,并趋向专业细分化。
Gartner每年都会预测次年的十大技术趋势,从2016年开始,数据分析相关的技术开始出现在每年的趋势报告中。在2017技术趋势中,数据分析还没有独立出来,而是作为“数字技术平台”这个技术的一部分,2018技术趋势中出现了“智能应用与分析”,2019技术趋势中出现了“增强分析”,刚刚发布的2020技术趋势进一步把数据分析细化了,叫做“超自动化”——指的是多种用于交付工作成果的机器学习(ML)、软件工具包以及自动化工具的总和。
九章云极一直超前把握和实践技术的发展趋势,DataCanvas数据科学平台就是将数据建模的各个环节自动化的强大工具,并部署到企业业务中,从而实现企业“自动化决策”的需求。
具体到实际操作中,数据科学平台的使用者还是数据科学家们,但随着建模壁垒一再降低,尤其是借助自动机器学习实现的自动建模出现,数据科学家的边界变大、变模糊了。除了使用编码建模的专业数据科学家,使用拖拽式建模的IT工程师和使用自动建模的业务人员也被统称为平民数据科学家。
此外,得益于企业自动化决策需求的不断推进,数据科学平台工具的自动化功能将会愈加先进和完善,在未来甚至可以成为一种更低门槛、可广泛培训的软件技能。
技术壁垒逐渐弱化
“知识融合”将成行业新壁垒
经过2019年的实践,我们发现头部企业对技术开放和技术传承的要求也越来越高。拥有更多高端技术人员和更强技术实力的头部公司,将自有的技术能力、模型资产转化为企业软资产的同时,也在思考如何将软实力更好地管理和传承下去。人员和团队更替、各部门间协同难的情况都可能会产生技术能力的遗失和断层。
其次,从市场反馈来看,头部客户同时也更青睐开源、开放的平台架构,通过在开放平台上进行自主建设,来降低锁定供应商的可能性和对供应商的依赖程度,这也是市面上“白盒”算法、开源框架备受欢迎的原因之一。
更低的技术门槛、更开放的平台架构,同时意味着更低的壁垒。当一个壁垒降低到一定程度,就不再是主要矛盾,届时新的矛盾会出现,新的壁垒也就应激产生。
落到数据科学平台行业来说,我们预测在2020年,“知识融合”将作为新的行业壁垒。
数据科学的发展本身就是由市场需求推动形成的,其核心目的就是提供更高的商业价值,也就是说,BI图表展示、AI分析、自动化决策等等都是需求升级的产物。我们能看到,下一阶段的升级将会是利用数据指导业务、指导企业运营的需求。
这就需要更多非数据、跨行业、多学科交叉的“知识”与技术相结合,最终被运用到业务场景中提升业务价值。让知识与技术相结合的载体,实现的途径之一依然是“人”,并且是即懂业务又懂技术复合型人才;途径之二,还是工具。九章云极的数据科学家们已经致力于此,建立“四库”,这是业内首个关于“知识融合”解决方案,我们相信它能够直击企业下一阶段痛点。
当然,“知识融合”问题也已受到各方机构关注,在央行下发的金融科技发展规划中多次提及多学科交叉融合、造就即懂金融又懂科技的专业人才;国家双创示范基地和大型企业在各类实验项目和业务中,也正在实践细分业务的知识融合。“知识融合”难题的解决,将成为数据科学赋能商业价值的新高光。
深耕耘+广播种
数据科学平台增量市场可观
数据科学平台在2019年的飞速发展可以从深度和广度两方面来概括。
金融行业作为数据资源最完备、技术实践最领先的行业,仍是数据科学平台的主要阵地。银行、保险、基金、证券等各大领域本身涉及万千业务场景,随着Bank 4.0时代的到来,随用户需求调整业务成为金融行业未来发展的主流方向,这将对数据预测分析提出更多变、更智能的要求,数据科学平台在金融行业的发展依然大有可期。
同时,以金融行业为典范,中国各行各业的数据生态建设也正在体现中国速度。政府、医疗、交通、IoT、航空、汽车、地产、零售……这些行业在数据积累的同时,企业数字化转型、业务数字化运营等需求也从金融行业延伸过来,建设自有的数据科学家团队的企业不在少数,知识融合更将加速其AI落地。
随着各行各业的深耕广播,数据科学平台在中国市场的年增速已经达到70%-80%,未来几年,数据科学平台的市场容量将持续成倍增长、更加可观。
对于九章云极来说,从成立之处就已明确服务数据科学家的核心定位,“模型”就是我们的边界。2020年,市场上新一轮数据科学平台需求将会爆发,如何让“四库”更好解决知识融合问题、如何让模型实现更多业务价值,是我们下一年发力的重点,脚踏实地、把聚焦的事情做到极致,依然是九章云极的目标。我们相信,2020年也将是数据科学平台又一个收获之年。
作者简介
方磊博士,九章云极联合创始人兼CEO,原微软必应(Bing)搜索部门数据科学家,并作为早期团队成员参与开发微软云计算平台:Windows Azure。拥有近二十年大数据分析管理经验,是大数据、机器学习前沿技术掌舵者。在分布式系统、设计验证、算法等领域发表论文16余篇,引用超过400次。在大数据、人工智能、数据科学等领域中多次受聘为智库专家、理事、常务理事等职位。
——END——