查看原文
其他

中国会出现Databricks吗?这个被Gartner评选为全球AutoML关键供应商的公司给出了答案

赵家云 小饭桌 2022-04-21




“与Databricks 的殊途同归,是相似的愿景、目标、战略,以及市场需求驱动的结果。”


▌作者 赵家云

▌编辑 王艳


距上一轮10亿美元G轮融资仅7个月,美国的一家数据科学公司Databricks 再次宣布获得新一轮16亿美元的融资,这一轮由摩根士丹利的 Counterpoint Global 领投,亚马逊网络服务、CapitalG 和微软也纷纷抢注。其后,Databricks 的估值一跃来到380亿美元。

 

作为一家于2013年成立的创业公司,即便在国外人工智能发展限制诸多的情况下,Databricks 的成长依然非常迅速,2020年底就已成长为一家服务数千个数据团队的独角兽,除了Databricks自身的独特优势外,这也显示出市场对数据科学的需求巨大且增速较快。

 

在国内,数据科学领域因迎来架构升级的窗口期,同样进入到大规模应用落地的阶段。产业升级的大背景下,企业数智化升级如火如荼,数据的价值挖掘成为企业当下的重要战略;与此同时,企业要从流程自动化迈进决策自动化,原有的IT基础架构显然已不足以支撑,向AI基础架构升级迫在眉睫。

 

如此炙手可热的市场,自然逃不过资本的灵敏嗅觉。在寻找与Databricks 相似优势的企业时,九章云极DataCanvas进入了他们的视野,其在一年内便完成两轮融资,投资方中不乏一线机构的身影。九章云极DataCanvas有何过人之处?会是国内的“Databricks”吗?

 

九章云极DataCanvas创立于2013年,专注于数据科学平台的建设。公司开发了机器学习平台DataCanvas APS与实时数据仓库DingoDB,通过“算法+数据平台”的模式,为金融、电信、制造、政府、交通等多个行业提供数据管理、数据分析、机器学习等AI基础架构软件。



至今,“算法”和“数据”是AI基础架构的两大基石已成为行业共识。在“算法”方面,九章云极DataCanvas已经实现了突破,其自动机器学习平台DataCanvas APS囊括了算子仓库、模型训练、数据处理、自动机器学习等,在性能等指标上赶超国外同类产品。在“数据”方面,通过4年的打磨,九章云极DataCanvas推出了升级后功能和性能更为完善、支持高并发的实时数仓产品——DingoDB。

 

同时九章云极DataCanvas基于云生态上的开源AI基础架构定位也更符合主流市场的需求,因而获得各行业头部客户的青睐。九章云极DataCanvas的开源项目在GitHub上的自然流量下载已近7万人次,目前已服务包含金融领域头部企业和世界五百强企业在内的百余家企业,业务覆盖金融、电信、制造、政府、交通等多个数智化转型关键行业领域,复购率达到85%以上。

 

不约而同进入数据科学领域

 

2013年初,数据科学还没有被定义,市场还处于流程数字化时代。美国的云计算已相对成熟,即将迎来爆发,而国内云计算才刚开始走向应用。

 

此时Databricks创立,由于创始团队出自Apache Spark初始成员,一出生就自带明星光环,不过Databricks最初的想法也只是更便捷地进行流数据处理;一洋之隔,九章云极DataCanvas几乎同时创立,在云计算、大数据领域耕耘近10年的方磊看到了国内数据科学家的缺乏,希望以工具降低应用难度来弥补人才的缺乏,因此决定研发开源自动机器学习平台。


2017年,全球知名权威IT研究与顾问咨询公司Gartner给出数据科学的定义,并将其定义为独立的魔力象限,这极大的加速了行业对数据科学的认知。九章云极DataCanvas也是此时作为国内数据科学领域的标志性企业被行业关注。直至2019年,随着AI浪潮的兴起,数据科学平台才开始大众化,其在整个产业链中扮演的角色也逐渐清晰。在这期间,九章云极DataCanvas和Databricks已经在各自专长细分领域颇有建树,并开始补足完善框架,迎来快速发展。因此尽管二者起步的切入点不同,却在发展中日渐相似,而且成长飞快。

 

九章云极DataCanvas在升级完善开源架构机器学习平台DataCanvas APS的同时,又研发了DingoDB实时数仓作为数据底座,构建数据实时计算分析闭环。Databricks也在Spark基础上,通过自研、并购,推出了Delta Lake、Delta Engine等,补足了机器学习、数据测试与管理、数据解释和建模等分析层面的能力,以提高Lakehouse架构的功能和性能的“完整性”。


“中国的Databricks”

 

谈及九章云极DataCanvas和Databricks的“殊途同归”,方磊表示“这主要源于相似的愿景、目标、战略和市场需求的驱动。我们的目标都是为企业提供AI基础架构来支撑AI应用,而市场告诉我们想要更好地支撑,就要具备数据和分析两个层面。”


经过多年研发和落地,至今数据科学在AI产业中已经成为一个明确的概念和较为标准的产品,即AI基础架构。许多传统集成商、技术或者软件开发厂商被证明并不具备提供AI基础架构的能力,一些创业公司被淘汰,而真正符合市场要求且具优势的数据科学平台也被筛选出来。

 


2020年2月,Gartner发布的数据科学和机器学习(DSML)平台魔力象限报告中,Databricks首次挺进了领导者象限,并在其后一直保持领先地位。

 

同年3月,在Gartner发布的《2020年十大战略技术趋势:民主化》报告(Top 10 Strategic Technology Trends for 2020: Democratization)中,国内企业中九章云极DataCanvas和第四范式入选报告,并进入全球AutoML关键供应商行列。

 

“由于国内的信息化、智能化发展相对国外起步较晚,所以国内的数据生态发展较国外还是存在一定的滞后。因此虽然我们与Databricks同时起步,技术发展上并没有太大差距,甚至在某些领域我们更胜一筹,但受限于国内数据生态的发展阶段,公司的体量仍存在一定差距。作为Gartner全球AutoML关键供应商,我们的方案和产品未来将主要建立在客户云化的生态中,这将更符合中国千行百业的AI生态发展趋势。”

 

今年,Gartner研究总监孙鑫曾在一场公开研讨会上呈现的数据,也证明了这一趋势在未来的主流性。他表示目前海外的私有部署和云部署的数据科学平台比例差不多,不过云部署增长速度较快。

 

Databricks毫无疑问早已成为数据科学象限里名副其实的领头羊,与其相似的能力建设和商业模式愿景,让资本对九章云极DataCanvas的发展前景充满信心,因此常称之为“中国的Databricks”。


“云中云”战略加速增长

 

“早期的市场教育阶段已经过去,不再需要跟客户解释升级AI基础架构的价值,更多的是当客户有明确的AI基础架构建设和升级的需求时,我们只要证明有能力帮助他们实现就好。

 

核心产品和团队已经相对成熟,市场也进入大规模落地期。对于九章云极DataCanvas而言,未来的战略就是快速增长,伴随着行业云化生态的演进,将其AI基础架构能力普及到千行百业。“国内云计算情况复杂,云的碎片化较为严重。因此接下来我们的客户群体将主要围绕刚需更迫切、资金和技术能力更强的各行业头部企业。我们将通过‘进入-深入-嵌入’三步走,在客户云化的过程中,迅速地成为客户的AI平台底座,实现我们的‘云中云’战略。”

 

据方磊介绍,“进入-深入-嵌入”是攻克主阵地行业客户过程中逐步形成的一套有效策略,已经受过最佳实践的检验。主要就是争取在客户前期产生AI基础构架相关需求时,就建立合作关系先为其提供中小型解决方案,这是“进入”阶段。在证明自身能力后不断加深合作,由点及面,为行业客户系统性的提供AI基础架构的支撑能力,这是“深入”阶段;伴随着行业云化能力和生态的演进,最终达成将完整的AI基础架构和相关能力嵌入行业云、区域云、企业云、联盟云等千朵云中,将九章云极DataCanvas的AI能力随云输出。


当整个市场意识到升级AI架构是AI落地的重要前提,企业可以因此掌握AI应用开发的自主权时,数据科学将迎来新的加速发展阶段。九章云极DataCanvas将继续深化在开源数据科学领域的造诣,为AI应用落地打造更普适的工具平台;在远景规划上,打造千朵云生态的AI基础软件则为其打开了更广阔的商业空间和更有想象力的创造空间。“在数智化浪潮中,且让我们心怀期待,蓄力前行。”

 

- END -

欢迎转发、在看并在留言区讨论,我们将从被赞超过10个的留言中选出3条优质留言(统计周期为7天,名额可空缺),各送出腾讯视频VIP季卡1张~





今日头条/腾讯新闻/凤凰新闻/百家号/搜狐新闻/一点资讯/新浪财经等30多家媒体入驻账号


©本文版权归“小饭桌”所有



您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存