智囊团李华:OpenStack创业分享
智囊团分享人:李华,海云捷迅联合创始人,曾在红帽工作6年多,具有丰富的开源行业经验。
大家好,我是海云捷迅(awcloud)的李华。
海云捷迅(awcloud)主要为国内的企业客户提供基于OpenStack的私有云方案、咨询和培训等服务。很高兴今天能有机会和大家一起分享我们在开源和OpenStack创业方面的一些想法。
为什么选择OpenStack?
过去几年,开源社区涌现了很多优秀的IaaS云管理平台,包括Eucalyptus、CloudStack、OpenStack、OpenNeubla等。到目前为止, Eucalyptus被HP收购,参与的人越来越少。另外三个社区相比较,OpenStack社区应该获得了更多的认可,整个社区的发展已经遥遥领先其他的几个项目。
当初选择OpenStack项目作为切入点的主要原因:
社区的开放性;开源社区的开放性非常重要。2009年左右,大家基本上都是基于Eucalyptus来做IaaS管理平台,但是Eucalyptus社区基于商业化的考虑,在后续的发展中越来越封闭,社区其它成员无法参与到整个社区的发展,最终直接导致了新的开放平台OpenStack的诞生。
技术的前瞻性:OpenStack社区最初的一拨人基本都是来自Eucalyptus社区,借鉴了Eucalyptus的很多优点,同时解决了当时Eucalyptus架构设计的一些老问题。
后续几年OpenStack社区的快速发展是超出我们预期的,尤其是OpenStack基金会的成立,对整个社区的推动和发展,起到非常重要的作用。 对于社区推广,值得推荐。但是,在国内搞NGO,困难重重,一般都要挂到某个政府部门的名下。国内OpenStack联盟已经启动了,希望对未来国内openstack的发展起到更多的推动作用。
私有云和公有云市场的选择
对于搞IaaS的团队,曾经是一个绕不过去的话题。 搞公有云显得高大上,市场前景广阔,也更加容易吸引投资商。搞私有云好像没有什么新意。
最初我们是希望通过联合运营的模式切入公有云市场,我们提供软件平台和技术支撑,数据中心提供硬件资源、销售和服务团队,双方优势互补,采用销售分成模式来进行利益分享。
经过一年多的发展,联合运营平台运行虚拟机的数量增长迅速,最多时一天开1000多台虚拟机,很快运行的VM就超过万台,那段时间是我们团队技术成长最快的一段时间,基于OpenStack的E版本,遇到各种坑。
但是经过一段时间的运营,发现总体运营利润并不高,资源成本、销售、带宽和客服成本较高,还有价格竞争。另外,公有云的运维也会比较复杂,涉及的面比较广,计算、存储、网络、数据库、中间件等,八班武艺都得会,对人员要求比较高。
公有云对外提供服务,网络攻击基本上是常态,内部攻击和外部攻击天天都有。对于小的云服务商,处理这些问题是很头疼的。带宽不够,稍微大点的DDOS就挂了。内部攻击防不胜防。很多客户经常把虚拟机的密码设置成很简单的、容易被猜到的数字、单词等,最后都变成肉鸡。
通过联合运营获得的经验来看,公有云平台建设需要持续的大规模各种资源的投入,对基础设施和运维能力要求很高,对于初创公司来说,没有足够的资源很难做好公有云服务。所以后期我们转向专注为企业客户提供私有云方案和服务。OpenStack的设计架构更偏向于提供公有云服务,为了给企业客户提供私有云的服务,我们需要做出一些调整。例如企业客户期望的流程审批、报表、权限管理、HA特性等都没有。
私有云和公有云的生意模式还是很不一样的。 对售前、销售和营销模式的要求都不一样。尤其是销售流程,私有云的项目需要一个一个去打,单个项目周期3-6月的时间很正常,大的项目跟踪一年也很正常,整个销售流程需要经过前期方案沟通、PoC测试、招投标、项目实施、项目初次验收、项目终验等一系列过程,需要经验丰富的销售、架构师和服务支持人员全程跟踪。
而且,项目付款基本按照项目实施的情况进行支付,对创业公司来说,资金压力会比较大。虽然企业客户的获取难度较大,但是开始合作后,企业客户一般不会轻易更换服务商,会给服务商带来持续稳定的现金流和适当的利润。尽管私有云的营收增速可能没有公有云那么快,但是利润有保障。28原则依然有效,20%的客户贡献80%的利润。
商务模式选择;卖订阅服务还是卖授权。
开源的标准商务模式基本上就是红帽的订阅和服务模式。所谓订阅服务,即客户按年支付订阅费用后,可以获得软件安装包、升级包、补丁包、文档、技术支持等。可以一次性购买1年或3年的服务。另外,还有专家上门服务,按照人天进行计费。国内大部分客户已经习惯了License加服务的模式,即一次性购买了软件的授权,可以列入固定资产,外加一些技术支持服务。
虽然红帽的订阅模式在国内也推了快10年了,除了一些大客户接受外。大部分的客户依然偏向于传统的软件授权模式。如果产品是基于开源项目,在不违反开源协议的情况下,建议在国内销售时,还是采用软件产品授权模式更靠谱。
OpenStack踩的坑
存储支持; OpenStack对传统企业级存储FC-SAN/IP-SAN支持的不够。早期是缺少驱动,后期虽然不少厂商提供了驱动,但是只支持新的存储。对于客户利旧的存储基本不支持。即使有驱动了,里面bug也不少,坑很多。 虽然现在分布式存储很热,但是企业级市场里面,客户信任的依然是传统存储。所以我们花了大量的时间针对EMC/NetApp/HP/HDS等存储厂商做驱动对接。针对没有驱动的老存储,通过通用的LVM驱动来解决问题。要想做好企业级项目,存储支持很关键,也很费时间。
网络的问题;网络的问题大家吐槽的比较多,我们也遇到不少问题,有些已经解决,有些依然存在,例如: 路由器QoS(双向流量控制)、负载均衡服务不稳定,状态报告不准确,添加子网冲突等,路由器实时监控、路由器端口转发、大规模环境下,agent-notification并发量太大导致neutron-server无法响应,Neutron Scheduler无法协同调度某一类资源,会产生资源竞争导致API失败等。
小规模的企业环境,我们一般推荐客户直接采用VLAN隔离。如果客户希望使用VxLAN,我们推荐的方案是VxLAN+Bridge模式,比较稳定可靠。更大规模的环境,建议可以考虑Midonet或其它厂商方案。
HA的问题。现有的版本对物理服务器和虚拟机HA的设计并不完善。很多企业客户很看重这块的技术。从技术上来看,社区是建议客户多从应用的角度考虑高可用的问题,例如负载均衡、自动扩展、多区域等。但是很多企业客户认为单机Hypervisor的HA、VM HA需要底层平台来进行解决。所以需要加强这块的架构设计。
安装部署、升级。 社区半年一个版本的发布节奏太快,企业客户不能跟着社区每半年升级一次。但是如果不跟上社区的节奏,可能多个版本后,跨版本升级的时候就会遇到困难。
目前在易用性方面虽然有所提升,但是如果客户希望把OpenStack使用好,还是需要有经验的团队做支撑,要么自己组建团队来做,要么寻求第三方的支持。
今天就分享到这,谢谢大家。 有问题我们可以交流。
问答环节:
Q:今天发了一篇 《BT嫌弃OpenStack的文章》(点击查看),涉及那些挑战:连接虚拟网络功能(VNF)、服务链修改、可扩展性、所谓的“启动风暴”(start-up storm)、OpenStack在互联网上的安全性以及向后兼容性。华哥您怎么看?
A:前面几个都是网络的问题,尤其是电信级的网络问题,很现实的问题。需要专业的解决方案,靠社区很难解决。
兼容性的问题,确实是一个老大难问题了。在快速发展和向后兼容方面,社区需要找到平衡点。至于安全性问题,任何软件都会遇到安全漏洞,对于开源项目而言,使用的越多,问题越容易暴露出来,可以得到快速解决。
Q:感觉目前金融行业用openstack 谁用谁被坑,不知道华哥怎么看啊?
A:还好吧,在用之前,和OpenStack的公司多交流一下,各种坑先了解了解,尽量避免。每个项目都会有一些最佳实践。因为每个项目的网络架构、存储架构都会不一样,在架构设计的时候,一定要先考虑充分。
Q:请教一下,openstack本身是为公有云设计的,现在大家来做私有云,和openneubla相比,感觉后者更适合私有云,你怎么看?
A:首先是社区的参与度,目前openstack社区人气最旺,参与的公司和开发者最多。Openneubla社区的参与度一直没有什么起色,会逐步变的小众化。如果参与的人和公司减少,可能会导致项目无人维护了,这个是一个风险。OpenStack架构很灵活,初期设计的时候确实是更偏向公有云的服务架构。目前也有HP、金山等采用OpenStack来做公有云。 在把OpenStack推向企业私有云的时候,需要针对企业客户关注的技术做增值服务和改进。
Q:第二个问题,你在redhat很多年的经验,觉得openstack在国内能否有机会在服务模式上成功?那个licence模式,从开源上讲不通。当然打擦边球例外。
A:服务模式,个人认为很难。
关于“智囊团”云计算领域讨论群,周一至周五晚8点按照入群顺序,分享行业干货,进行讨论。入群需实名制。有兴趣可以加微信:aclood