查看原文
其他

基础设施国产化势在必行,天云数据的崛起之路|映见·特写

坚持洞见的 华映资本 2022-06-24

创业是一场孤独的旅程,人们很容易看到台前的光鲜,但领导者的真正工作,往往隐匿在聚光灯背后。在无数个转辗反侧不为人知的日夜,那些决定咬牙坚持的瞬间,那些独自做出的成千上万个决策,才让他们翻越重重困难,走向心中的应许之地。


因此,我们推出「映见」特写栏目。在这里,我们关注创业者背后的故事,关注他们走过的关键时刻,以及梦想背后的驱动力。我们相信,创业者精神就是持续去做自己相信的事情,华映资本愿意陪伴并见证伟大的诞生,向创新者致敬,与坚持者同行。


引      子


1865年,儒勒凡尔纳( Jules Verne)在书中预测了100多年后将宇航员送往月球的详细情况,但他没有预测到,登月后的50年内,Google、Facebook、Apple、Amazon等公司让我们可以和另一个大陆的伙伴充分交流,熟稔程度甚至超过了隔壁邻居。

过去,人类所有的能力都是在空间维度展开,最重要的核心生产资料是土地+石化能源;而现在,科技竞争成为主旋律,文明之间的角逐工具是云端的巨大算力。算力是无形的,不如土地和能源容易占有,但却是能够粘合时间空间的力量。

瓦特发明了蒸汽机,最后真正对产业结构造成根本性变化的是轮船业,因为蒸汽机的出现改变了航运的效率和规模。国内分布式数据库和AI PaaS产品研发商「天云数据」创始人雷涛认为,伴随着云计算和开源软件技术应用成熟,大数据时代IT开始向DT转型,分布式计算也将带来整个行业生态的重新洗牌。数据资源的爆发,不仅带来低代码等下一次软件开发效率的技术革新,更是一次对传统产业升级、商业流程重构的创新革命。

近日,「天云数据」刚完成数亿元D轮融资,由多家国家队基金共同投资,华映资本是天云数据B轮融资的联合投资方,一直坚定看好天云数据的未来发展。我们今天的主角就是它的创始人兼CEO雷涛——一个总在和前沿技术打交道,却把目光放在技术之上的人。

“让技术自己生产技术”

“我们变化很大。刚开始起步的时候,为了让市场更容易理解自己在做什么,所以概念都很阳春白雪。等上了赛道,再到现在,我们已经飞奔,认知却停滞不前。”雷涛一语道破了天云在做的事情与市场认知间的巨大差异。

天云数据在干什么?当人们看到公司名字的时候,能想到的无非是大数据、AI、云计算……

再进一步,AI是什么?是机器人或者科幻的电影画面?而雷涛说,他们在AI平台上制作AI模型,是让技术自己生产技术,而不是通过专家经验或逻辑思维产生技术模型。 

传统概念里,AI更像是一个加法,在不同的产业中进行渗透,加点高科技,感觉很神奇,其本质上还是单纯的技术。但是现在,AI已经不仅仅意味着科学技术的进步,更是可以替代传统的经验、规则、流程,重构商业实践。

在雷涛看来,当下AI要从更多的角度去解读,需要跳脱出传统的固定思维,不能让人成为技术的附庸,而要让技术更好地服务于人,而且这种服务是主动的,更加贴合用户要求。

为了让大家更好理解这个概念,雷涛举了个例子。他说,今日头条运行的其实就是一种内容生产流水线,消费端结合了一种个性化推荐机制,而这一切都是基于数据挖掘。“机器在生产和消费数据,我们做数据的供给和消费组件,这两个组件凝炼成的两大产品线是我们公司的核心产品。”

类似的还有自动驾驶,它是汽车 AI 化后提供的智能服务。天云做的就是诸如此类背后看不到的核心组件。

从勇士到蒙古军团


为了方便理解,雷涛将数据供给的发展历程梳理为几个阶段并给出了形象的比喻。

——第一个阶段,是以oracle、MySQL等为代表的传统数据厂商,它就像一个非常厉害的勇士,自己能解决所有数据库的问题;

——第二个阶段是GP等分布式数据,相当于从一个人变成了一个圣骑士团,其中每个骑士都是全能的,但骑士之间的协同效率和协同成本是巨大的挑战;

——第三个阶段即混布数据库,这时候数据库的形态就不是简单的骑士了,而是一个蒙古军团,军团中的每个人各司其职,类比到数据库,就是将存储、计算、调度、逻辑计划全部进行拆解,这样做的好处是系统更加稳定、扩展性更强。

目前,国内能走到这个阶段的只有寥寥几家,我们是其中之一。”雷涛信心十足。基于对数据库底层能力的掌控,在实践项目中,天云的Hubble数据库可以支撑万亿条多表关联数据,秒级响应。


现在的天云正在逐步向3.5阶段跨进,Hubble数据库从在SQL这一单一逻辑计划的基础上做数据可视化,发展到将树状结构、Graph机器学习等一系列逻辑计划做融合,它带来的是使用能力和服务场景的变化。

这一阶段的特点,就是AI 能力和数据库的合流,将两条生产线进行合并。Hubble将通过逻辑计划融合SQL、Graph、ML 等实现AI-Native 数据库。

要培养强大的算法能力,需要很庞大和昂贵的数据科学家团队,天云始终定位在盈利,并依靠近十年的项目落地能力,将数据处理、清洗、特征提取等模块化,依靠工程化的能力满足B端AI落地的需求。

随着AI应用场景中实时分析的需求逐渐提升,对于底层数据库也提出了相应的需求,借助公司混布数据库的能力,进一步提升了天云面向场景的整体解决方案的竞争力。
可以说,从冷兵器时代迈入热武器时代,天云一直走在行业的前端。人工智能原生数据库即AI-Native数据库将更好地放大一切商业模式,成为各行各业的基础设施。

不想取代Java的程序员不是好的AI公司

“我们淘汰的是谁?是Java程序员!”雷涛直言不讳。
以前,数据消费只是数据可视化,干的事情就是做给领导看的报表。现在,天云做的是将报表让位于算法,做消费数据。“天云数据就是生产 AI 模型的 AI 平台。我们依赖的不是人的能力,而是大量的算力和自动化机器学习。”
举例来说,以往中小企业在获取、理解政府惠民政策存在信息鸿沟问题,20个程序员做一年,才能开发出能够解读一座城市的惠民政策软件,而天云近期在某银行普惠补贴政策解读开发项目中,利用AI模型平台替代了程序员,一个月时间即可查看上百家城市的政策,智能极简完成匹配政府针对企业的扶持。
在雷涛看来,一个时代的迭代一定是更新式的发展,而不是简单地对于技术的应用。“这是目前我们在干的事情,相对晦涩、专业性太强,赛道也在飞速变化,很多‘以为’的想法都在变。专注面向B端用户的要求,会让我们在行业上有更多的穿透性。”
科技公司的运转,也要遵循基础的商业逻辑,在用户方面,雷涛谈到,公司一类是早期客户,比如金融行业。基于其中的信息不对称性,AI能够实现数据整合,成为代替人反复劳动的重要方式;另一类就是能源、石油、电力等重工业行业。他们本身有着大规模数据生产的基础,再加上天云的数据模型,后期的边际成本会大大降低。
华映资本在2018年参与了天云数据1亿元的B轮融资,华映资本主管合伙人章高男强调,人工智能不是风口,而是刚需。未来人工智能将成为几乎每个企业的刚需,原因在于:一方面,目前企业拥有的数据量和数据维度相比过去有了指数级增长,传统的BI方式无法满足其需要。另一方面,现在的企业普遍拥有大量的语音、图像、文字、视频等非结构化数据,这些数据的处理也只能通过机器学习的方法进行处理。
同时,章高男也强调,目前人工智能商业化的技术条件已经大规模成熟。这一领域的商业化需要两大技术支撑,首先是海量数据,移动互联网和物联网为其提供了源源不断的原材料,其次是算法和算力的工程化。而天云数据在这两方面的成就也正好契合资本的期待。
融资之后,天云在各个领域都有更快的发展。经过几次平台迭代,天云平台已能实现模型的智能化生产,真正实现一系列的自动化,成功减少了对数据科学家的依赖,降低了AI在企业市场的应用门槛。
数据显示,目前我国数据库软件市场90%以上份额被甲骨文oracle、IBM、微软等国外厂商垄断。随着核心技术竞争力逐渐被提到国家战略的层面上,可以看到,底层数据库软件在发展上仍然受限,国产化替代需求强烈。
随着《数据安全法》的落地,使用自主可控的数据库管理系统在政府、金融机构、能源、军工等领域尤为迫切。数据统计显示,政府机关、事业单位和国有企业的整体需求分别为204亿、290亿、288亿,假设至2024年完成替换,按100%替换计算,则合计市场增量为626亿,若按50%替换计算,则新增空间235亿。
在数据库市场在国产替换的机遇面前,底层数据库软件国产化的市场前景非常广阔。随着数字化技术的日新月异,对于天云数据在国内的不可替代性,不论是资本还是用户,都给予了很大的期待。

Meridian

互动送好礼

看完天云数据和雷涛的创业故事,您有什么感触?对于人工智能、国产数据库的崛起等话题有怎样的洞见?欢迎您在评论区留言,我们将从中抽取3位优质留言的幸运读者,送出华映大礼包一份。

活动时间:3月24日-3月28日24:00获奖用户请收到通知后24小时内回复邮寄信息,未收到通知或未及时回复则视为“谢谢参与”。


天云数据完成数亿元D轮融资,重新定义数据基础设施 | 华映portfolio

华映资本荣获母基金周刊、企名片消费领域投资机构TOP20奖项|华映捷报

饮料江湖下,新品牌如何突围破圈?|消费研究所


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存