公司调研 | 星环科技:专注基础平台研发,做大数据时代Oracle
2009年,英特尔亚太研发有限公司数据中心软件部CTO孙元浩开始带领团队研究Hadoop,于2011年发布了英特尔Hadoop发行版。随着大数据概念的兴起,越来越多的人知道了Hadoop这款专门处理大数据的软件。
孙元浩与英特尔亚太研发有限公司数据中心软件部总监范磊、英特尔(中国)有限公司OEM/渠道业务总经理佘晖共同实施了Hadoop在中国的落地案例,建立了合作关系。
因英特尔减少了这方面的研发投入,三人决定离开英特尔,谋求创业。他们带着原Hadoop发行版的核心团队,于2013年创立星环科技。
2014年4月,英特尔以7.4亿美元价格收购Cloudera 18%的股份,并终止Hadoop研发。星环科技和Cloudera的业务模式相似,均为大数据基础平台的开发。
专注基础平台研发
星环科技定位于大数据基础平台,他们的技术主要是基于Hadoop和Spark实现的。
大数据时代,企业需要存储的数据量非常庞大,按照传统方式,数据量的存储和处理将耗费大量的时间和硬件成本。Hadoop解决的就是数据存储问题,将数据分为几个节点进行存储。Spark解决的是数据处理问题,就是如何快速找到想要的数据。
举个简单例子,原先我们是用一个大箱子来放衣服。现在衣服越来越多,原来的箱子放不下了。一种方法是换一个更大的箱子,这样做一方面放衣服速度慢,找起来也麻烦,另一方面买一个大箱子很贵。
Hadoop和Spark提供的是另一种方法,买几个小箱子,编号,将同类衣服放在一个小箱子里,而且存取衣服的过程可以找很多人同时来做(每个人面对一个小箱子)。这样一来,不论是放衣服还是找衣服都很快,而且成本低廉。
星环的产品Transwarp Data Hub(TDH)是一站式Hadoop大数据平台,可以实现内存计算、高效索引、执行优化和高度容错等技术,一个平台即可处理10GB到100PB的数据。
技术优势:兼容度和处理速度
Hadoop和Spark都是开源技术,国内很多公司都基于这两项技术开发了自己的基础平台。星环科技在基础平台这一领域有较深的技术积累,主要体现在高兼容度和处理速度。
国内很多大型企业都是通过数据库存储数据,用SQL语句来实现数据的调用。Hadoop作为一种开源技术,对于SQL语句的支持不足,企业又不可能将原先的代码全部修改。星环对Hadoop进行调整,提高其对SQL语句的兼容性,目前兼容度达到了98%。通俗来说,这项工作就是将旧技术和新技术对接起来。
在处理速度方面,星环基于Hadoop和Spark进行了调整,提高了对大数据的处理速度,使得大数据查询、输出等可以在极短的时间完成,TDH的性能比主流MPP数据库快1.5到5倍。
服务大型客户,立足金融、电信等领域
星环科技主要解决的是海量数据的存储、处理问题,目标客户群是拥有极大数据量的公司,主要集中在金融、电信、交通、电力、政府等领域,目前服务的客户有三大运营商、国家电网、民生银行等公司。
销售方式有直销和业务合作。目前销售人员占比不到20%,整个销售团队有五六十人。因为星环只做底层技术平台开发,会与做大数据应用的公司进行合作,共同为客户提供解决方案。截至目前,星环已经与普元信息、神州信息等大数据解决方案厂商达成战略合作关系。
业务可复制性
目前来看,国内大数据公司,人力投入较大,业务可复制性存疑。星环科技也面临同样的问题,每个项目都需要派遣工程师现场调试、安装。
但与其他大数据应用公司相比,底层基础平台开发更具通用性,与行业特性关系不大,客户需求差异化相对较小。这方面可类比Oracle等数据库厂商,其未来业务可复制性较强。
星环科技目前在国内处于技术领先地位,是Gartner认可的全球六家Hadoop发行版软件代表厂商之一,国内唯一入选的公司。同时还是Gartner数据仓库和数据解决方案魔力象限中最具有前瞻性的公司,研发团队实力、产品更新迭代等方面都是国内领先水平。如果可以保持现在的发展速度,会在国内大数据基础平台占据一定市场份额,而且这一领域用户黏性相对较大,客户流失率相对较低。
目前数据源正处于逐步开放的进程中,随着海量数据的逐步开放,企业对数据处理能力的要求会不断提升,基础平台市场会进入爆发期。
行业竞争趋于激烈
基础平台是大数据领域技术含量最高、竞争激烈的细分领域。国外Hadoop巨头公司Cloudera已经进驻中国,成立分公司,开拓中国市场。未来这一行业的竞争必然愈发激烈。
相比国外巨头公司,星环是纯内资背景,更容易获得与政府、国有大型企业合作的机会。相比明略数据、百分点等国内涉足大数据基础平台的公司,星环科技的TDH在产品性能、SQL支持完整程度等方面均处于领先地位。
对标Cloudera,给予11-13.5亿元估值
国外专注做大数据基础平台有三家公司,分别是Cloudera、Hortonworks以及MapR。综合产品竞争力、市场占比等因素,我们选择Cloudera作为星环科技的对标公司。
Manhattan Venture Partners表示,Cloudera 在2015年的营业收入约2亿美元,较2014年营业收入实现了100%增长,预计未来一年可实现80-100%的增长。2015年Cloudera的估值为50亿美元,其PS倍数在25-30之间。
考虑到2016年中国大数据行业的快速发展、星环科技在大数据基础平台这一细分领域的技术相对领先优势,以及星环科技公司的体量相对较小,爱分析预计星环科技在2016年营收实现100%增长,即2016年总营业收入为8,000万至1亿之间。
考虑到中美市场差异、产品标准化程度、市场占比等因素,在2016年100%的预计增速下,爱分析给予星环科技12-15倍的PS倍数,估值11-13.5亿。
星环科技COO余晖
近期爱分析与星环科技COO余晖进行了调研访谈,现将部分内容分享如下:
Q:星环成立三年以来, 现在的主要业务是做基础软件开发,有没有做一些上层工作?
A:我们现在的业务在往上走,但还是基础软件开发这一层面。Hadoop是最底层,再往上还有很多工作,开源软件是无法做好这部分内容,特别是针对企业级服务市场。Hadoop起源于互联网公司,存在很多优点:处理数据量很大,支持非结构化数据,海量存储而且成本很低。
但对于服务企业级市场,开源软件在应用上存在很多不足。举个例子,银行的数据分析有三十几个模块,这些模块的都是基于Oracle或者是IBM的数据库,可能涉及几十万行代码,将这些都改成与Hadoop接口相适应的程序是不现实的。而且开源的Hadoop最开始都没有一个图形化的界面,都是以命令行来操作的。
上述这些都制约了Hadoop在企业级市场的发展,但是企业级客户又很看好这种软件的未来。
于是我们这种企业就应运而生了,我们的主要工作是基于Hadoop将用户接口做得比较易用,同时要能兼容之前的数据库,很容易迁移到Hadoop,最终将原有数据库完全替代掉。
因此,我们的定位是大数据领域的数据库软件,将之前传统的数据库都替换掉。
Q:基于公司定位,在实现过程中会碰到哪些挑战?
A:主要是分两个层面的挑战:技术层面和商务层面。
技术层面是客户使用的数据库厂商不同,导致SQL语句有所差别,原有的Hadoop软件对于SQL的兼容度只有40%-50%,所以我们花了很长时间帮客户解决这个问题,现在的兼容度达到了98%。
在解决这一问题中,除了要把运行器做成类似翻译器之外,还需要解决并行运算的问题,因为Hadoop本身是一个分布式运行软件。我们在技术方面的发展方向是将Hadoop发展成数据库,除了发挥其固有的处理快、架构优势,还要发展出容易操作、兼容性强的优势。
商务层面的挑战主要是用户都在观望,询问的多,购买的少。因为国内这个领域早期没有什么案例,新东西接受起来都比较慢,有个市场培育过程。
不过,这种情况从去年开始有了很大的转变,大家都认为这是一个主流的方向,先行的公司已经开始使用。
Q:服务的客户大概有多少?合作方式是什么?
A:我们合作过的客户有两三百家,有的已经做完了。2013年只有7家,2014年大概有30家,去年达到150家左右。
合作方式是项目制的。例如,银行要做一个历史数据查询系统,痛点是原有系统查询很慢,花费时间长。银行觉得Hadoop技术是一个新东西,先尝试一下。那么先用一部分数据来尝试,购买几个服务器。这是一期工程。使用之后觉得效果很好,银行会购买更多的服务器,处理更多数据,这就是二期工程。
还有另一种形式,银行觉得这套软件在查询系统应用的很好,那么可能会将软件应用于其他系统,如反欺诈、经营系统等。因此,我们与客户的合作是逐步加深的。
Q:星环是只做基础软件么?会去做定制化服务么?
A:在中国软件公司中,星环算是比较另类的。我们的定位是基础软件公司,数据库服务商,只做和基础软件、数据库相关的服务。
上层的应用、各行各业的开发我们是不做的。因为我们如果做了这些业务,会慢慢地失去技术的领先性。这些业务的确提高了公司的收入,但是对技术水平的提高是没有帮助的。公司的精力会受影响,路线图也会受到影响。
我们还是希望能做成一个产品型的公司,这个产品是跨行业、跨地域甚至跨国界的。因此,我们公司本质上还是个技术产品公司,有点像甲骨文、Oracle这类的。我们想做的是技术产品领先,不断地进行产品迭代,让竞争对手跟不上脚步。
Q:每个项目的周期大概多长时间?需要派遣工程师上门服务么?
A:项目实施过程很短,就是安装软件,一般来说一两天的时间。前期谈判研发的时间比较长。客户希望是先提供一些数据,用我们的软件运行一段时间,看看效果。我们的目标是做成一个类似的盒子的产品,但目前来看还是需要人员现场提供支持服务。
Q:项目后期维护费用大概占比是多少?会不会有年费?
A:国内的软件产品目前都是买断式的,项目完成之后,厂商会提供一个维护服务,费用占整个项目的20%,客户可以自主选择是否支付这部分费用。我们的产品会不断更新迭代,如果客户不购买这个服务,就享受不到产品更新的成果。
Q:销售模式是什么样的?
A:我们现在直销和业务合作都有。我们不做应用,所以肯定会和一些做应用的公司进行合作,一起做项目。比如我们和一些专门为农商行做票据系统的公司合作,一起服务农商行。
我们的合作伙伴还有像浪潮、IBM的大集成商、外包服务公司等。大集成商会选择将我们的软件嵌入到他们的系统中,然后一并卖给客户。这里面不存在分成,只是产品卖出后他们会支付我们产品的相关费用。
Q:第一批的大客户是如何获得的?这些大客户相对会更看重安全性和稳定性,星环最开始是如何切入的?
A:中国toB公司早期做项目,关系是很重要的。我们比较特别,没有什么关系,主要靠技术能力来胜出。
中国早期做Hadoop的客户主要是运营商,他们对技术比较了解,他们的痛点很明确,例如给手机用户看的账单系统,最早是Oracle做的,但是随着数据类型增加,这套系统已不能满足需求了。这种情况下,关系不是第一位的,能解决问题才是第一位的,所以,小的创业公司才有机会。
客户首先是POC,有时也招标,招标分为技术标和商务标。我们的目标是技术标第一名,早期的名气是这样出来的。到商务谈判的时候,我们是比较吃亏的。不光是价格,客户对于我们公司的存续就有质疑。只不过客户的要求只有我们能实现,因此他最后会冒一些风险与我们签约。
Q:和普元信息、神州信息这样公司的合作方式是什么样的?
A:国内的客户对Hadoop都很喜欢,有些客户对技术是有一定了解的。他们先会找到合作伙伴来聊,聊完之后就让其推荐好的公司,而不是简单的开源技术产品,最后这些公司会找到我们,因为目前国内有一两百人做Hadoop技术开发的公司很少。
像普元、神州这样的公司和我们合作的好处是,他们自己可以省掉这部分人员、技术开发成本,我们和他们的业务也不冲突。
Q:现在星环整个团队有多少人?技术研发人员占比?
A:目前星环有不到三百人,其中70-80%是研发人员,剩下的基本是销售人员。研发人员里面不包括售前工程师,这里面做POC和实施团队相对少数。大部分的研发人员是不出去跑业务的,他们就是保证路线图,做好产品研发。
Q:产品现在多少时间会进行一次迭代?
A:一般每三个月就会进行一次更新,这种迭代不仅仅是数据库的更新,过一段时间就会有一个全新的类别出现。例如,最早我们是做Hadoop数据库存储,后来加入了流处理技术,适用于所有物联网大数据应用,现在的做Docker容器类产品。
Q:现在业务有出海的打算么?
A:年初Gartner评选世界六大Hadoop发行厂商中,星环是唯一上榜的中国公司。在这之后,有很多海外公司谋求合作,不过我们目前国内的项目还做不过来,暂时没有出海的打算。我们想把自己的产品做得应用性更好,对各种应用场景、数据库都能适应的时候,再考虑向国外发展。
Q:2015年营收大概是什么规模?
A:2015年营收在5,000万左右。
Q:未来公司在战略层面有什么考虑?
A:战略上,我们考虑未来可以把国外几个基础软件公司的产品替代掉,主要是甲骨文等公司,利用大数据时代软件升级的机会,把他们替换掉。把产品做得再好一点后,考虑向海外市场发展。
目前来看,最先被替换的是做外包服务的,之后是做应用软件的,最后是做基础软件的。对我们来说,最艰难的时期已经过去了。抓住技术更新换代的机会,再加上政策支持以及我们自身的努力,未来是很有机会发生颠覆性的改变。
爱分析是一家专注于创新企业研究和评价的互联网投研平台。爱分析以企业价值为研究内核,以独特的产品形态,对创新领域和标杆企业长期跟踪调研,服务于企业决策者、从业者及投资者用户群体。关注爱分析公众号ifenxicom,及时获取重要信息。
读完文章,您有没有什么想聊聊?
或者您也是大数据领域的创业者,希望我们报道?
您可以发邮件至lizhe@ifenxi.com
请加微信号aiyangyudejiji联系作者。
微众银行 | 蚂蚁金服 | 人人友信 | 拍拍贷 | 微贷网
金电联行 | 淘当铺 | 宜信财富 | 中天嘉华 | 牛股王
乐视云 | UCloud | LeanCloud | 有云 | 青云
金山云 | 红圈营销 | 纷享逍客 | 今目标 | 个推 | 快塑网
云知声 | Testin | 北森 | 理才网 | 斗米兼职 | 猎上网