1月16日下午,在第一新声举办的“数字中国-2021年高科技高成长年度峰会”期间,义柏资本创始合伙人侯杰超、耀途资本创始合伙人杨光、云启资本合伙人陈昱、焱融科技合伙人兼副总裁黎俊鸿、Jina AI CEO肖涵,共同围绕“云原生的底层技术与应用”进行了探讨与交流,
主要内容有:整个Cloud Native赛道,最大的两个细分领域是数据库和软件定义存储,一定要布局;目前中国在AI领域的发展不落后于国外,未来在中国最大的机会不是完全模仿海外的厂商,而是在满足创新应用上长出来的底层科技,先在国内把模式跑通再走向海外;未来1-3年内,中国大量的传统企业上云过程中,会出现很多云原生基础技术的应用机会。
以下为圆桌精彩观点分享:
Q1、义柏资本创始合伙人侯杰超:请各位嘉宾介绍一下公司和业务。Jina AI CEO肖 涵:Jina AI致力于打造新一代神经搜索框架,核心业务基于深度学习和云原生两大技术,所有产品目前已在 GitHub 开源。
Jina AI的核心项目Jina,使得开发者仅用几十行代码,就可以从 0 到 1,搭建一个 SOTA 云原生搜索解决方案。此外在非结构化数据和复杂流处理上,我们的产品也具有强大优势。焱融科技合伙人兼副总裁黎俊鸿:焱融科技是一家企业级存储服务商,专注于软件定义存储,产品主要用于大规模的非结构化数据存储及高性能访问。分布式存储的软件可以高性能处理海量非结构化数据的文件,支持容器化应用,且持久化存储,基于这些差异化的特点,焱融科技陆续服务了科大讯飞、图森未来、元戎启行、移动云、百度云、字节跳动的火山引擎等知名客户。云启资本合伙人陈昱:云启资本是于2014年成立的双币基金,目前管理了约15亿美元的资产,投资科技赛道,其中AI、大数据、云计算是重点。例如在云原生领域,投资了Jina AI、TigerGraph、PingCAP、Zilliz、Singularity Data等公司。耀途资本创始合伙人杨光:耀途资本于2015年底成立,是专注于新一代信息技术领域的早中期投资机构,管理资产规模超过45亿人民币。重点投资信息科技的基础设施,硬件主要聚焦半导体芯片,软件聚焦基础软件及技术驱动型行业应用软件,例如投资了焱融科技、端点科技、MemVerge、雾帜智能、MagicBI、速石科技等;此外也在投资开源的云原生软件,如格物钛Graviti、开放智能Open AI Lab等。Q2、义柏资本创始合伙人侯杰超:请问焱融科技和Jina AI分享你们在解决各自场景问题的时候,有哪些独特的优势?在云原生这样的背景下,各自的杀手锏是什么?焱融科技合伙人兼副总裁黎俊鸿:焱融科技做的分布式存储是专注以文件为接口的分布式存储,而文件存储本身因为接口应用非常广泛,被大量的人工智能、自动驾驶等企业使用,以文件为接口的存储形态来对接他们的上层的PyTorch、TensorFlow的架构。这些架构在使用大量的底层数据时,通常会面临访问性能以及海量数据的处理瓶颈。
同时,他们由于大量的训练等业务已经进行了云原生的改造,如何将自己的数据对接到上层云原生以后的应用,这是他们面临的痛点,我们整个存储面向这种场景,尤其是自动驾驶领域,处理视频回放以及仿真,然后再到训练过程里,如何能够更高效的去访问数据,我们做了大量的工作,比如如何提升GPU在读取数据的效率,通过深度的基于行业和应用的改造, 使得GPU利用率得到提升。目前,从存储的性能以及对业务的帮助来看,我们在存储的细分赛道里,不管是市场的占有率、存储产品的使用效率等,在国内处于领先地位。Jina AI CEO肖涵:原来的搜索场景主要面向文字,是因为文本数据占据主流、数量最多。近几年随着短视频、图片、声音等服务的高速增长,我们发现由多模态甚至混合模态组成的数据比重得到了显著增加。传统搜索并不能有效地搜索、规划这些非结构化数据。Jina 利用深度学习(迁移学习和表征学习)将非结构化数据(图片、声音、视频、3D 模型等)表征为可以被搜索和有效索引的数据结构。它不仅提供了表征、存储、计算各个单元,还能通过云原生,把复杂的流式处理,以简单的方式提供给用户,这也是 Jina 最大的优势,即易用性。CNCF 2020年发布的报告中提到,阻止企业上云、采用云原生解决方案面临的两大痛点,第一个是太复杂,因为这会涉及到非常多的容器化、版本、编排系统,给企业增加很大的心理负担;第二个痛点就是企业文化不允许做云原生。Jina 的整个框架,从设计、API接口的角度,将复杂的云原生以非常轻量级的方式,帮用户快速切入到云原生的场景中,这是 Jina 的一大亮点。Q3、义柏资本创始合伙人侯杰超:请两位投资人从投资的视角谈一谈,当时投资这两家公司主要的原因是什么?看中背后的哪些技术?
耀途资本创始合伙人杨光:整个Cloud Native赛道,最大的两个细分领域是数据库和软件定义存储,这是一定要布局的。软件定义存储赛道虽然有很多大的玩家,包括传统厂商和云厂商,但还是会有一些机会。文件存储赛道,国外有Weka.io等公司做的很好,国内的焱融科技也不错,他们的团队技术背景、理念、技术资源等与我们的目标非常符合,目前我们另外两家自动驾驶领域被投项目新石器、元戎启行等都是焱融的客户,非常看好他们的发展。云启资本合伙人陈昱:云启资本想布局未来10年的技术,而不是投资已有的东西。传统的搜索无论是谷歌还是我们熟知的Elastic Search,都是基于文字的搜索,但是随着深度学习的发展,我们也在思考搜索能不能有技术上的变革,搜索更多种类的数据,例如图片、声音、以及其他非结构化的数据。Jina尝试解决这个问题,它的创新是加分项。第二点产品或者技术有真实的需求和应用场景。比如我们经常用到的智能客服、以图搜图,是神经网络很好的应用;企业实现这些功能需要投入大量的AI工程师,但是有了Jina的搜索框架,只需要少量代码即可使用,大大降低了开发门槛。第三点是国际化,云原生在国外的接受度远高于国内,国外公有云的渗透率较高,有成熟的商业模式,这些因素决定了项目如要获取较大的市场,就必须走向国际化。Q4、义柏资本创始合伙人侯杰超:请两位投资人分享,你们在看国内的云原生、数据库、存储、开源等项目时,与国外项目对标时看重哪些地方?中国和美国的差异在哪里?也请焱融科技和Jina AI分别介绍在创业过程中,是否对标国外已经行之有效的公司?
耀途资本创始合伙人杨光:焱融科技所在存储赛道,在海外有成熟的对标企业,比如公有云厂商的存储产品,以及创业公司Weka.IO、Elastifile(已被Google收购),Portworx(已被Pure Storage收购)。行业都在加注这个赛道,当然传统的像Ceph,GlusterFS本身已经有很高的popularity。从应用角度上来讲,我认为中国并没有落后,例如目前在容器存储、数据库、AI和自动驾驶等场景里,图森、科大讯飞等均是行业里领军的企业,大家面向的场景与海外是一样的。中国在下游的应用创新上并不落后于美国,甚至和美国在同一个起跑线上,特别是与AI、 HPC相关的,比较领先的创新场景像是自动驾驶倒逼出来对底层计算和存储技术的新需求。通过满足这种需求,中国的公司可以找到非常好的发展路径。像Jina所做的搜索领域,也是领先于全球的项目。目前,中国在AI领域的发展完全不落后于国外,未来在中国最大的机会不是完全模仿海外的厂商,而是在一些满足创新应用上长出来的的底层科技,先在国内把模式跑通再走向海外,这是成熟的路径。云启资本合伙人陈昱:第一,中国AI不落后于美国,例如AI顶级会议的论文,有一半是华人写的。第二,国内对AI的态度比美国等国家开放,有利也有弊。因为 AI依赖于数据,要让AI更好的被应用起来,需要牺牲部分个人隐私,但与此同时,也换取了AI在中国的蓬勃发展。第三,中国场景的丰富度和复杂度高于国外。所以只要产品扛得住中国的场景,那到海外基本是降维打击。目前有很多项目在中国的场景下测试,打磨成熟以后去海外做商业变现。这是中国很多基础软件正在走的一条路。焱融科技合伙人兼副总裁黎俊鸿:去benchmark、对标也好,像杨总提到Weka.IO,被 Pure Storage 收购的 Portworx、被Google收购的Elastifile,与这些公司相对比,国内企业具有天然优势。因为全球AI、自动驾驶的主战场在中国,对于这些行业来说,数据是根本,而中国拥有庞大的数据来源。在焱融科技服务的客户里,比如科大讯飞,我们处理他们几十个集群,几十Pb的海量数据,无论是在国内还是国外,都属于大规模的。在国外很难找到这样的体量、这样的客户,去服务真实的业务场景。我们如何扛住几千块高性能的GPU卡在并访问海量文件的压力?我们是有实际的线上服务经验和产品服务场景的能力。如何提升海量文件场景下访问性能?如何对接冷热数据的分层存储,怎样服务自动驾驶的客户从边缘到数据中心,然后再到云的应用场景里。面对这些问题,我们逐步积累了很多的产品解决方案,在这些领域综合起来,不管是对标国内还是对标国外,我们都具有核心优势。未来,我们会借助公有云平台,搭建 SaaS 服务,逐步出海。现在已经开始布局,未来将会有很大的提升空间。Jina AI CEO肖涵:Jina AI创立于2020年2月份,当时国外并没有对于 Neural Search及Deep Learning for Search对标的企业,Neural Search就是我们公司提出来的。
目前再重新看整个行业,国内、国外增加了非常多布局Neural Search的企业,Jina AI 作为能够在AI技术、深度学习与云原生上引领整个世界的趋势,是非常值得骄傲的事情。Hugging Face 给了我们非常大的启发。它是一家纽约的公司,专注于深度学习,最早是在NLP领域的深度学习 API package开源软件。Hugging Face 早期社区非常流行,在GitHub上有几十万 Star,用户遍布世界,一旦涉及到深度学习的文本问题,都会推荐用 Hugging Face,它把易用性做到了极致。这一点我认为对于很多的国内初创企业非常有借鉴意义。Q5、义柏资本创始合伙人侯杰超:近两年中国出现了一批有影响力的开源公司,开源理论上也是非常有效的获客手段,但这件事情到底该不该做,什么时候做,以及怎么做?
云启资本合伙人陈昱:开源最大的好处就是运营上的杠杆,利用社区的力量发展壮大所做的事情。开源,大家会把代码上传到Github上,所有的开发者都可以下载并使用,这里面有研发、测试和商业化的杠杆。测试是开发一个很重要的环节。第一,只有当用户实际使用时,你的代码和产品设计问题才会充分的暴露,产品能够更快的修正及发展。第二,对于某些关键的应用,例如核心交易系统的数据库,它对可靠性的要求特别高。一个闭源软件没有5-10年的可靠性的验证,大家是不敢用的;但是在开源的环境下,利用社区的力量,验证周期得到极大的缩短。商业化方面,传统的软件企业进行销售时,要搭建销售团队,从各种渠道、人脉网络获得客户的销售线索,然后逐个转化,效率比较低。但开源软件可以通过社区找到活跃用户,这样得到的线索比较精准,销售人员可以重点去转化这批用户,提高销售转换率。当然,开源不是必然的选择,但如果一款产品通过社区获得杠杆带来的好处,那么就可以考虑这个模式。耀途资本创始合伙人杨光:首先开源是趋势,目前整个基础软件都在开源化。其次,国内面临的商业环境与国外的商业化场景不同,国外的公有云渗透率高,国内是更加复杂的私有云和混合多云的模式,国内创业公司还要根据市场情况灵活应变。同时他们还面临着如何平衡开源和云厂商关系的挑战。而如果确定开源的话,该公司应该面向全球化市场,所谓开源无国界。开源项目在立足中国时,还应当放眼全世界。若只做国内市场,开源就没有太多优势,很难做出一家伟大的开源公司。Jina AI CEO肖涵:开源已经被国内外一流科技公司认可。对于开源软件上云和云厂商竞争,大家普遍的认知更偏向于合作双赢,而不是相互厮杀、两败俱伤。从这个角度来讲,和云厂商能否进行有效合作,使用户能在多云系统下使用,将用户体验搬移到云上,让用户在云上产生更大价值,这是所有开源软件需要思考的问题。另一方面,和云厂商进行有效合作,在adoption方面能够有一个非常有效强力的放大,如何借助公有云资源,帮助你去实现运营和销售的目标,这也是一个非常重要的问题。焱融科技合伙人兼副总裁黎俊鸿:对于基础数据层面的基础架构软件,我们服务的客户对于核心资产如何得到存储和保护非常关注。用户一定会选择安全可靠的产品来使用。对于我们这种初创型厂商来说,如何说服用户是需要重视和考虑的问题。
我们要打造用户对企业产生信任的最核心环节,首先是产品与现有的产品一定是要有核心的差异化。在发挥差异化的特点,陆续获得标杆客户的认可和使用之后再去借助杠杆,我们获得百度、字节等大客户之后,再发挥市场的作用,去提升整体的知名度,来解决企业使用存储里最核心的信任问题。企业只有信任才能够去使用我们的存储,首先建立差异化,找到种子客户,再去复制,逐步的建立市场上对我们的信任,最终完成我们对传统存储厂商的替代过程。Q6、义柏资本创始合伙人侯杰超:未来云原生的趋势有哪些新方向,大家怎么看待?
云启资本合伙人陈昱:云原生的基础技术在应用场景的创新是未来重点。原来云启资本集中在数据库、搜索等底层的云原生应用。未来一年,重心会放在元宇宙、Web3。这些领域的应用也需要云原生底座的支撑。例如元宇宙应用需要把部分渲染工作放到云端,需要云端数字大脑实现更好的用户交互。耀途资本创始合伙人杨光:耀途资本目前主要看两条线。第一条是大型企业的数字化转型,未来1-3年内,中国大量的传统企业上云过程中,会出现很多云原生基础技术的应用机会。例如提供端到端的解决方案、大型的商业化底座等,这是我们关注的趋势。我们所投资的端点科技就是此类企业代表,它是一家做企业数字化转型的商业软件公司。第二条关注 AI和代表未来的应用,特别是与新场景相关的云原生的底层技术。最近也有投资分布式云的技术,支持低延时和实时计算等边缘计算场景。Jina AI CEO肖 涵:从技术角度来讲,下一个云原生技术热点可能是遥测 (Telemetry)。CNCF社区中最活跃的项目第一个是 Kubernetes,第二个就是Telemetry。Telemetry 涉及到监控、链路追踪及日志三方面,一旦企业进入到云原生深水区,这些是保障企业快速迭代服务、进化软件的重要技术。焱融科技合伙人兼副总裁黎俊鸿:现在国内越来越多用户在上云,其实整个云的趋势还是落后国外1~2年。从国内的情况来看,未来大趋势是混合云的形态,一定会有越来越多的得到应用。例如自动驾驶的企业客户,很多的数据采集是在边缘、港口、机场等,这些数据最终会汇集回来,但之后一定要去进行训练、仿真,又会发生在各个不同的云上,哪个云上的资源更便宜,企业可能就会把部分的计算放在相应的云里,如何去应对不同混合云的架构,让计算发生在希望发生的地方,同时数据又能够跟随着在计算发生的地方很顺畅的访问到,以及在复杂的混合云场景下,如何进行管理和编排,都是未来云原生和下一步整个企业更大规模去应用这种技术的一个很大的趋势。
转载、采访报道:请联系正 宇(微信:beijingzhengyu);
榜单、市场合作:请联系孟小新(微信:dyxsmxx)
商务合作:程雪薇(微信:sherry_199909)。
更多内容
【数字中国】
【投资中国】
【消费中国】
👇关注「第一新声」并设置星标,第一时间GET行业信息👇