查看原文
其他

高端存储过时了 ?

云头条 2021-04-27

在系列连载《智能时代下的高端存储》首期文章里《高端存储30年,谁主沉浮?》,回顾了高端存储自诞生以来风起云涌的三十年里脱颖而出的各大厂商的发展。围绕高端存储的话题热度居高不下,也引发不少业界朋友关于分布式存储、超融合、软件定义存储、云存储、中端存储的讨论。

细品如今分布式架构和云存储发展迅猛的趋势,以及高端存储特性下移、中端存储与高端存储界限模糊,对比过去风起云涌的三十年纷争,一向“能抗能打”的高端存储显然经受住了历史考验。

而在日新月异的当下,涌出了很多质疑声:智能时代,是否还有高端存储的概念?对这个问题,高端存储有自己的“追求”和“坚持”。

“自定义”时代,看争议中前行的高端存储


是否需要区分“高端存储”这一概念,对于权威的分析师机构、企业用户、存储产业发展和各大厂商而言,始终是一个颇具争议的热门话题,他们也持有不同的观点。
 
Gartner在2019年发布的混合阵列的关键能力报告中已不再区分高端存储和中端存储。

Gartner曾用四个关键词定义高端存储:

  • 高可靠(容忍单点失效,性能损失<25%);

  • 高稳定(维护不停业务,性能损失<50%);

  • 高效率(动态负载均衡和远程复制能力);

  • 高价值(销售价格在250,000USD以上)。


基于高端存储部分特性下移,且两者市场上有部分交叉的状况,Gartner认为高端与中端界限已经模糊。
 
相较于Gartner从特性出发的定义,IDC则依然站在销售价格角度对高端存储做了区分。

高端存储作为承载核心业务系统的不二之选,其售价与其保存的数据价值理应成正比。存储按售价被分为由1至9,9个Price band(价格幅度)。从全球看,IDC将$250,000作为高端存储的基准(平均售价>25万美金/套);而中国区高端存储或许由于售价无法做到特别高,所以适当拓宽了范围,将Price band 7-9的价格幅度作为标准(平均售价>15万美金/套)。
 
在企业级用户心中,对高端存储的“信任”始终是无法替代的。

在存储更多元化的时代,新兴存储蓬勃发展,高端存储确实在人们心中已不再那么高高在上、遥不可及。但是,是否拥有强大的技术自研实力、市场和品牌的长期积累、经受住大量企业级客户的反复实践验证,这几项指标将综合实力不同的存储厂商区分开。定义高端存储不再简单地从产品分类出发,能否担得起“高端”之名则还是要看能否经受得住各行各业不同应用的关键业务场景长时间考验。“高端”二字更是体现了厂商对于保障用户核心系统可靠的一份责任,也是能否引领产业发展的技术标尺。
 
从存储产业发展史上看,中端存储、云存储、分布式存储、软件定义存储等更适用于互联网时代的新兴存储确实自诞生起就分走了市场的一杯羹,但他们更多是适用于互联网、云计算、大数据等场景,高端存储传统的核心业务场景似乎并未受到特别大的撼动。

就像先有大型机,再有小型机,最后才出现PC,存储的发展也遵循同样规律:先是有高端存储,然后才有了中端存储。从时间节点看,第一台正式的高端存储诞生自1990年,而第一台中端存储——Data General公司CLARiiON分部发布的FC5000阵列,则是在七年后才诞生。这之后又过了两年,即1999年,Data General被EMC收购,CLARiiON在很长一段时间内都被视作EMC的中端旗舰。


尤其是在1997年后,互联网的爆发产生了大量的低价值数据,而高端存储的价格昂贵,一般又只应用于大企业的核心系统,由此才为中端存储的发展提供了契机。一开始,中端存储紧跟高端存储的发展脚步,继承其部分软件特性,NetAPP公司察觉互联网数据大部分为非结构化数据,将文件共享功能移到中端存储中提高了可靠性,它也就名正言顺地成了中端NAS的鼻祖。同一时期,云计算的出现给企业带来了颠覆性的改变,甚至直接影响了企业的IT架构。互联网巨头的崛起更是极大程度上带动了分布式存储、云存储的高速蓬勃发展。
 
在各主流厂商心中,高端存储依然具备高技术门槛。它们也一直对高端存储技术进行持续改革以更好满足新时代需求。从过去两年里主流高端存储厂商密集发布的新品特性中就能看见端倪:

2018年5月,DELL EMC发布了基于端到端的NVMe和内置的实时机器学习引擎架构的PowerMAX;2019年7月,华为发布了新一代OceanStor Dorado系列高端全闪存,创新SmartMatrix全互联可靠架构实现单系统最多容忍7个控制器同时失效,引入AI管理;同年9月,伴随z15大型机的发布,IBM趁热打铁发布了能与Z大型机和LinuxONE服务器配合的高端存储DS8900F;同年11月,Hitachi Vantara面向中国市场推出其最新一代高端存储VSP5000系列,其可靠性、扩展性都有了很大提升,它也将人工智能引入基础架构管理和运营中。由此可见,NVMe、AI、可靠架构的持续演进等成了各厂商的“共性”,更先进的技术被率先应用到提升高端存储可靠性和性能上。
 
关于“智能时代,是否还有高端存储的概念”这一疑问,从不同角度出发得到的答案不尽相同。究其原因则主要在于随着5G、云计算、人工智能和第四次工业革命的深入发展,产业环境和IT技术均已今非昔比。新时代赋予了高端存储新的定义和使命,智能时代下的高端存储已然与过去的概念不尽相同。
 
那么,当今高端存储的“变”与“不变”是如何体现的?

新时代的高端存储:不变的是原则,改变的是技术


始终保障客户核心系统稳定可靠的原则是高端存储不变的追求,改变的是则是时代发展下技术的不断进步。

高端存储市场门槛一向很高,新的存储厂商很难再踏足这个传统市场了。时至今日,全球公认的高端存储厂商仍屈指可数。在一波三折的三十余年历程中,对高端存储的界定伴随着技术和行业的发展在逐步清晰。


我们以6年前—— DCIG的分析师JEROME M. WENDT于2014年7月18日发表的定义高端存储的文章“10 Characteristics That Help to Define Today’s High End Storage Arrays”为例,一起回顾下定义高端存储的经典10条标准,哪些仍适用于当下,又有哪些“推陈出新”的概念。
 
1、IBM大型机的FICON连接

这条适用于过去的定义如今已不能作为衡量标准。随着大型机下移,通用服务器这些年的快速扩张,当前高端存储阵列在云数据中心大量应用已经远远超过在大型机环境的应用,Gartner的分析师也早放弃了以此标准定义高端存储阵列。
 
2、基于块的Fibre Channel(FC)连接

在过去十几年,FC连接是主流,尤其在SAN块存储情况下,确实可以作为高端存储必备的标准。但技术发展到今天,随着前端NVMe的兴起,NVMe over Fabric已经衍生出FC、RoCE、InfiniBand等多种传输选项,FC不再是定义高端存储的唯一标准。
 
3、多个Active-Active的控制器/刀片/处理器对

文中的解释是:很多中端存储提供双活的控制器,有一对控制器可以同时访问后端同样磁盘的数据。不同的地方是高端阵列可以在同一个物理阵列上提供多对这样的双活控制器,它们都是同样的逻辑阵列配置的部件。

这一条硬件扩展性基本是业界的共识,在业务大集中、新技术快速发展的今天也尤其重要,DELL EMC、Hitachi、华为、IBM等高端存储厂家均可以满足,但奇怪的是HPE最新的Primera存储只能做到单引擎4控,不知是否是研发计划在不久的将来补齐。
 
4、高级别的缓存和容量

尽管不少中端阵列也在提高缓存和容量,但高端存储阵列还是比大多数的中端阵列支持更多的缓存和更高的容量。

当前主流的厂家基本都具备更高的缓存和容量,多控制器必然多内存,这些都是高端存储必备要素。

5、大量的多核处理器

高端存储的多控架构提供更高的可用性和性能。这在包含顺序读、顺序写和随机访问、小块交易的混合负载场景下至关重要。现在控制器核数也经常作为高端存储招标的关键要求。
 
6、Scale-out和scale-up配置

scale-out和scale-up是每一个高端阵列配置必须支持的能力。

在智能时代,扩展性也逐渐变成了高端存储需要兼顾的重要特性之一,现在的高端存储一般都有不错的表现,像华为新一代的OceanStor Dorado 可扩展至32控,最大支持9600块NVMe盘;DELL EMC的PowerMax支持最大16控、288块盘/阵列;Hitachi的VSP 5500最大扩展12控,支持288块NVMe硬盘。不得不说在NVMe软硬件配合上华为做的还是不错的,在后端应用NVMe over RoCE,大幅增加了NVMe的扩展性。
 
7、详细的系统分析,性能监控和故障排除

高端存储阵列给予组织无以伦比的弹性来收集和分析系统数据。这个用来快速准确查明性能瓶颈和硬件故障。很多中端存储没有提供这个级别的诊断和解决性能和系统问题的能力。

这一点现在也依然得到各大厂家的重视,它们推出的新品在基于AI、机器学习智能运维管理上都下了很多功夫。
 
8、测试过、认证过的配置

更高的可信度来自高端存储在各行各业各种部署环境、各应用下的规模应用和反复验证。
 
9、售价25万美金或更多

在“贵”这一点上同IDC的定义相似。   

10、跨越两个或更多数据中心的非破坏运营(Non-disruptive operations)

这一条可以通俗理解为基于容灾的方案和技术,实现存储运维运营过程对业务无影响,以及出现异常情况能快速恢复业务。核心业务系统的灾备一直很重要,数据不丢失、业务不中断是根本。保障业务的连续性以及运维运营操作的稳定性也是一直以来的关键。

去年,戴尔科技集团联合IDC发布的《第五代存储助力企业数字化转型》报告中也正式提出了第五代存储概念,用以保证数字化和业务场景的全面融合,包含“敏捷高速”、“有效容量”、“无缝接云”、“数据护航”、“AI赋能”五点。有关它的诸多热议在此不逐一赘述。
 
不论时代如何滚滚向前,高端存储最核心的标志无非还是围绕着高可靠、高性能和高扩展这三方面。所谓万变不离其宗,高端存储的“不变”就体现在如下两方面:

  • 其一,从技术角度说,始终追求极致可靠性和性能的诉求、同时兼顾扩展性的就是高端存储;

  • 其二,从场景角度说,用在核心业务(相对互联网没有巨大数据量、通常不会突发数据爆发状况、数据价值相对较高)等场景的就是高端存储。无论企业如何转型,其核心业务场景只要不消失,那么高端存储将始终拥有立足之地。


存储底层技术大致可分为介质、网络、架构和管理四个方面。

当前从数据的采集、处理、存储、分析、管理等不同阶段、不同场景,都对存储设施提出了不同要求。在多元化的时代,满足各场景需求的存储,应该是不同的底层技术的不同组合形成的最优解。例如,在当下区分满足核心业务的存储和满足高性能计算场景的存储,可能更大容量的介质、更快的网络是共同的追求,而根据场景的不同,他们在架构的选择上又各有侧重。存储四大底层技术的演进也一直在推动着产业的发展变革,存储一直在“合久必分、分久必合”之间演进转换。发展到智能时代,各种新应用让人应接不暇,新兴技术的发展速度远超出我们的想象。复杂程度已无法让我们简单做“分”或“合”的区别了。


事实上,我们早已告别“非此即彼”的单一选择时代了。从用户角度看,不同底层技术组合的产品能相互结合实现优势互补,在各自独特的应用场景下发光发热。混合部署或许才是当下的合适选择。

结尾


在这个更智能、更多元的时代,存储的选择在很大程度上是从满足用户场景需求出发的。伴随我们对高端存储理解的逐步加深以对它发展规律的洞察,可以预见的是,高端存储的未来发展空间依旧将会一片广阔。    
 

这期我们从技术和场景层面一同探讨了新时代高端存储的定义。下期,我们将带领大家一同从高端存储适用的应用场景去看它是如何赋能行业,用独一无二的特性普惠智能时代。



有奖互动:你心目中的高端存储在智能时代是如何赋能行业的?评论区留言发表你的观点,截至11月30日24时,点赞前三名分别赢取价值300元,200元,100元京东卡奖品!

 

同时恭喜上期有奖互动环节获奖的三位同学,工作人员已取得联系发放奖品。


300元京东卡:用户150xxxxxxx0

200元京东卡:用户135xxxxxxx8

100元京东卡:用户158xxxxxxx1


最终解释权归“云头条”所有


相关阅读:
高端存储30年,谁主沉浮?
下一代芯片问世:将逻辑运算和数据存储组合到单单一个架构中,为更高效的设备铺平了道路(论文已发表在《自然》杂志)
Gartner 2020 年分布式文件系统和对象存储魔力象限
2020 年文件存储行业生态图
Gartner 十大战略性预测:传统技术一败涂地、DNA存储成为现实、CIO成为COO
中国存储市场份额:华为猛增 8.9%、新华三增 2.1%、浪潮增 1.2%、海康威视减 0.8%、戴尔猛降 3.8%
一块玻璃存储 360 TB 的数据(附论文)
“存储器瓶颈”问题有望被解决(论文发布《自然》杂志)
Fred Moore:畅谈存储行业前景(3万字)

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存