云计算产品的罪与罚
本文是《中国云计算现状》系列文章的第二篇——产品篇,上篇我们讲了成本问题(参见:做好云计算,要花多少钱?)即什么样企业能做云计算。
今天我想从一个老用户的角度,谈谈每种云计算产品该如何使用,哪些产品改进是刚需,哪些产品有内因就是改不了。本文主要谈云产品的使用,而涉及云产品采购的细节,后续再讨论。
现在是2017年,云计算服务是物理硬件的优质替代方案,客户很认可云计算的采购和交付成本优势。这时候我们谨防被企宣PPT洗脑,不要追求华而不实的远景,这些PR文章的受众是风险投资、客户决策层和创业者。我们应该摸清楚的是,云方案和传统“卖盒子”方案相比有什么特点和局限,明白了特点,用起来才会得心应手,了解了局限性,才会早作风险预案、未雨绸缪。
1
IaaS
云主机、云硬盘、网络和安全组
IaaS平台的本质是,产品以硬件资源的虚拟化为本,业务上承接物理硬件替代需求,优势是最快速度最低成本交付,客户为预占的物理资源付费。IaaS产品是最经典的云计算服务,核心组件是云主机,如虚拟网络、云硬盘和安全组都是为支撑云主机业务而服务的。
IaaS产品的优势是快速低成本交付,但是太多的用户会盲目的追求云主机高可用。物理机要求硬件稳定永不死机,而云主机适合批量创建、快速释放,不太关心单台云主机的可靠性,这要求应用层服务支持高可用。
即使云平台不承诺主机的无限高可用,其故障恢复速度也远快于物理机。新生的云计算不敢明确挑战物理机时代的用户观念,现在是时候纠正这个误区了:成熟的云计算平台不强调单机高可用。基于同样理念,用户追求超高配置的云主机是架构能力缺课、硬件来凑的临时手段,正途是将业务拆散到多台中低配主机上。
当前虚拟网络的性能短板并不是速率,主流云平台内网互通速率是1Gb,一个物理万兆网卡正好负载20-30台虚拟机,这是性价比均衡的选择。虚拟网络的性能短板是包量(通常用PPS来衡量),服务器CPU不是交换机ASIC,它的配置再好也只能处理20万左右包量,所以一台低配虚拟机被抓做SYNFlood肉鸡,也能瘫痪一个物理节点,各云平台正在逐步推进虚拟网卡的包量限制,但还有大片的漏网之鱼。
虚拟网络对用户行为的改变是抑制ARP广播,各种旧有IP漂移技术都离我们而去了。最初这种鸡肋设定是vxlan发育不全做的权宜之计,但这逐渐变成一种新的权限分配的契机。
OpenStack API可以将网卡在主机之间插拔管理,网卡从主机附属设备变成了独立资源,内网IP的分配职责从系统工程师变成了网络工程师,无数被安全组恶心过的用户,也逐渐放弃了本机防火墙。这些改变是从网络层面践行云计算的设计哲学,单机(IP/防火墙)不重要,云主机就是生生不息的群狼,组织群狼的网络更加重要了。
2
PaaS
云数据库、CDN、对象存储、Serverless
相比同质化竞争、主打价格牌的IaaS云,PaaS产品才是云计算的未来。用好PaaS产品可以更省人力、更快交付,按用量付费可能会比按资源付费更便宜(也可能更贵),而PaaS平台的恼人和诱人之处均在于:①产品形态很模糊;②服务质量很难评估;③很难独立运营;④没有领头羊企业和事实标准。
PaaS云平台和IaaS云资源的区别就在于,PaaS需要理解客户的动作和状态。对象存储和CDN是最典型的PaaS服务,云平台按照数据容量、访问流量、访问次数和方法收费;Mysql RDS只能按照内存和日志空间上限计费,但仍然可以替客户做数据库状态展示、分析和备份,这是过渡性的PaaS。
最常见的PaaS服务是数据库,最重要的PaaS服务是对象存储,最成熟的PaaS服务是CDN,最有魅力的PaaS服务是Serverless,我们重点看这四个服务。
一个经典PaaS服务应该只是一个进程,进程是无法长期存储数据的,小量结构化数据依赖数据库存储,海量数据依赖对象存储。
云数据库(如RDS)很重要但想象空间有限,因为企业里已经有数据库和DBA了,DBA并不信任云端未知架构数据库的性能、稳定性和数据安全性,而且企业仍然需要DBA承担设计维护工作。
对象存储服务是新兴需求,企业里本来就没大规模对象存储搭建能力,而且对象存储对应用程序友好,上手简单,客户对它是积极拥抱甚至业务依赖。一旦用户在对象存储平台堆积了上TB的数据,大数据和AI分析应用自然就部署上来了。广域网传输稳定性不够成本又过高,只能是计算组件跟着存储就近部署,PaaS云创业公司从对象存储入手才更有客户粘性和横向扩展空间。
大数据类PaaS类似于云数据库,用户要自带海量数据过来,MapReduce过程和结果又都要用户负责,最终客户觉得云平台什么都没做,大数据PaaS服务都用成IaaS定制模板虚拟机了。而AI类PaaS类似于对象存储,用户本来要靠人肉识图,那些非结构数据本来是不存储的,程序员很乐意去调AI和存储接口,砸碎人肉识图团队的饭碗才能成全自己的业绩。云替代方案会被客户技术人员苛责,而技术人员会对云上新出的方案很宽容。
CDN是最早出现也是最成熟的云计算PaaS服务,它有下列迷人的特点,给云计算行业的未来立下标杆:
1、客户没有学习成本,肯付费、懂IT常识就能接入,所有客户都认同使用CDN能节省成本、提高质量。
2、客户没有对接成本,可以随时更换其他云厂商,或默认即使用多个云厂商,普通项目不需要高级售前、解决方案和实质性定制开发。
3、客户只关注价格和质量两个维度,不用承担太多选型责任,大不了切走就行,甚至有专门的中立CDN监测的平台。
4、虽然业内对CDN生意评价不高,认为这就是卖资源,但每个云平台都将CDN收入列为重要单项,成熟的模式催熟了巨大蛋糕。
关于Serverless的介绍,我建议大家可以阅读下ZStack张鑫的文章(Serverless,后端小程序的未来)。Serverless的务实之处在于要求程序为自己进行改造,其他强调按需付费的计算服务只是快速释放资源的小把戏,Serverless才是真正的计算能力集装箱,未来计算场景下的CDN。
3
SaaS
比云计算本身还要古老的云产品
其实SaaS产品和狭义的云计算没一毛钱关系,广义的云计算连设备租赁和人员外包都能算进去吹水框架,自然也给SaaS云预留了位置。
SaaS产品已经出现并流行了十几二十年了, OA/ERP/CRM/邮箱/模板建站等等SaaS服务都是比各位读者从业年龄还长的老古董,最新流行的各种在线办公、协作、通话、众测等SaaS产品也不依赖云服务器,这些应用上云走公网服务和之前走内网服务区别并不大,用物理机和虚拟机区别也不大。
狭义的云计算是企业服务,目标用户的是企业IT技术人员,而SaaS云的目标用户和IT人员只在Helpdesk时有关联。
从这一点来看,这些SaaS服务只是云平台的普通用户,和游戏、网站、APP、没有区别。只要SaaS云服务没自建IaaS和PaaS的技术能力和意图,那他们就是客户而非友商。
4
物理机-混合云-云管平台
为什么物理机不会被淘汰?
云主机是物理机的最好替代方案,但也有各种物理机无法被替代的场景需要继续用物理机。
1、某些云主机的超卖比过高,性能太差,又因为各种原因不更换云厂商,那只能基于性能原因用物理机。
2、某些硬件特性虚拟机还没模拟出来,或者你模拟了我也不信,比如说Oracle RAC就偏爱硬件存储。
3、某些非TCP/IP资源必须接专用板卡,比如说接电话网络的服务器,接专用器材的服务器,接加密狗的服务器。
4、非技术因素必须用物理机,比如说某软件查不出问题来怪虚拟机,为了避免麻烦给它们特地安排了物理机。
5、为了利旧等原因接着用物理机,有些单位的电费是行政部负担的。
既然要用物理机,要和虚拟机联动就要用混合云。混合云就是用专线打通两朵云,或者让物理机和虚拟机内网互通。肯定有读者怪我认识浅薄,但是云内资源调度都做不好的用户,怎么能做好跨云的资源调度。
既然谈到了混合云,肯定就要谈云管平台,云管平台不是伪需求而是新需求。当客户的非CDN云资源采购金额过500万以后,其子项目之间没有内网互通的需求,这时候该做一个跨厂商的云端资源管理方案了。现在虚拟机不能像CDN一样随意迁移,但未来Serverless服务崛起,计算能力也会在多厂商之间漂移的。客户提前把云管平台从计费和权限层面做好,至少在项目级别可以和多个厂商侃价,还能模糊计费相关业务数据。对云管平台的详细描述,可以参见我的另一篇文章《设计中立公有云云管平台》。
5
企业IT咨询和实施服务
叫好不叫座与叫座不叫好
前面的云计算服务都免不了卖资源或者卖软件,搞IT咨询和实施服务可以让公司增加企业服务的融资概念和收入构成。中小型云厂商都尝试转型做这类工作,避开成本搏杀,大厂商嘴上说不要眼神也很诚实。但具体参与过程中,这类工作很少有成功案例,我做成功过这类项目感慨也很深,本段落重点解释这些现象并给出建议。
先说IT咨询,过去云计算平台吸引到的都是成本敏感的游戏客户,或者技术优先的创业客户,这两类客户都不会为一小时一千元的咨询服务付费。现在高净值客户放出来的云计算咨询标了却没人投标,因为小型云计算企业由于资质、高层合作、客户关系等原因没有投标的机会。
我们经常遇到咨询标,但我们也不想投这个标。咨询标的交付物就是各种文档和报表,互联网公司的技术积淀都在技术部,技术人员最烦的就是写文档,而且技术人员匮乏的想象力和沟通能力并不适合做咨询标,让售前承担技术文档书写也扛不住。
传统IT外企做云服务IT咨询流程上没问题,但技术水平太差,也不被政策扶持。此外还有个哈哈哈哈的大杀器让我们不能投咨询标:投了咨询标就不能投实施标,实施标的金额要比咨询标大很多。所以大家宁愿去抢实施标了。
到了实施阶段,其实矛盾和咨询标差不多,既要干活又要写文档,而且验收者并不专业,实施工作有传统厂商会抢着压价,还会有各种意外拖进度、抢进度,各互联网企业的实施团队根本支撑不下来。传统厂商虽然压价抢标,但他们要是真有能实施云计算项目的人才,互联网公司加价三倍挖走谢谢。
所以,现在云计算的实施标常常是两种情况,或者是打着云计算的招牌做虚拟机群集的超简化云计算,或者中标了但只有市场部发了下PR稿,别说施工结束时间了,施工开始时间都没定下来。
要解决这种窘境困局,需要时机和努力。传统IT公司张开翅膀等风起,云计算技术已经越来越成熟了;今天看沙克的朋友圈,kolla的健壮可运维性已经超出想象,他很担心专业云计算运维会失业。
互联网公司总有明白人会踏实做事,云计算软件也是软件,一个难以描述、难以使用、难以维护的软件是必然被淘汰的,带头淘汰同行才是生存之道。
本文作者:曹亚孟,云计算老兵,拥有10+年运维工作经验,对主流运维技术都有所涉猎,先后就职于UStack、七牛云和百度。
点击阅读原文,围观曹亚孟的订阅号“云算计”