查看原文
其他

企业数据成倍增长,如何降低管理成本?

微软科技 2020-02-13

(本文阅读时间:6分钟)

互联网高速发展的今天,企业每天都会产生各类数据:财务,生产,销售,市场,人力资源数据等等…数据帮助企业优化生产、创新,同时数据的大量产生,也给企业带来不小的管理成本和困扰。今天,我们邀请微软数字化转型顾问,结合医疗行业场景和大家一起探讨,微软云如何有效优化并管理企业海量数据。

随着企业业务发展,会产生越来越多数据。一般来说,企业数据完整生命周期遵循:产生,使用,保存,销毁等过程。其中,数据的使用和保存阶段尤为重要。

企业产生的数据在不同阶段会有不同的访问需求:

  • 数据产生初期:频繁访问使用

  • 数据保存期:非频繁使用,但需要随时可访问

  • 数据归档期:偶尔访问,以读为主,容许一定的数据调用时间

当企业数据量越来越大时,数据的保存方式、保存成本逐步成为企业的难题。而基于公有云的存储为企业提供了海量数据的廉价保存途径。在云端,针对不同的访问需求可以提供不同的数据保存层,满足企业降低运营成本的考虑。

三层存储结构

以微软云服务Azure为例,Blob存储提供了热、冷、归档三层,对应不同的数据保存成本及访问成本。简单来说,数据保存成本从热到冷再到归档,越来越便宜;而对数据访问,冷层比热层高,归档层数据不能直接访问,需要先恢复到冷层或者热层。

例如医院的PACS系统,病人刚做完检查的前几天,PACS的图像资料需要经常查看,应放入热层;几天后(例如一周),有时需要做对比检查,但不会频繁访问,图像资料可以转为冷层;一个月后,病人就诊完成,按照法律规定,PACS资料需要存放7年,但只是在极少数情况(如医疗纠纷、法规性抽查等)需要访问,没有实时要求,这时候就应该下降到归档层。这样数据通过在不同存储层间的流转,既满足了保存要求,又实现了较高的性价比。


存储层的数据转移

如何能让数据按需在不同存储层间转移?通常的做法是,写一段小程序,放到vm或者docker上,每天对保存的数据进行扫描,满足条件(保存到一定时间)的数据自动转移到下一层。当然,也可以通过Function等无服务器计算等方式来实现。但是这些方式要依赖于外部的计算环境,如果vm或docker出现问题,体系较为复杂,可靠性和客观理性都不够完善。

而Azure现在提供了基于Azure Blob本身的数据生命周期管理功能,不用基于外部计算环境即可实现按策略的数据自动分层转移。现在就来看看数据生命周期如何配置管理。

创建一个存储账户(数据生命周期管理支持Blob和V2两种存储账户),创建完成后在Blob服务里可以看到生命周期管理的选项:

点击该选项进入,起初状态是空的,可以通过添加规则的方式来制定策略。规则的添加有两种方式:列表视图和代码视图:

先按照列表视图添加规则:

可以看到在一个规则里,可以执行的操作有:

  • 将Blob移入冷存储

  • 将Blob移入归档存储

  • 删除Blob

  • 删除快照

以医院PACS存储需求为例,可以制定如下规则:

此外,还可以看到一页筛选器集:

在这个页面,可以指定策略该策略对哪些数据生效,规则为Container/文件前缀(Blob的虚拟文件夹可以看到做文件名前缀),例如如下规则指定了该策略对容器container01下test01开头的文件或文件夹下所有的文件生效:

添加完规则回到列表视图,可以看到该规则:

新添加的规则默认启用。
切换到代码视图,可以看到规则其实是一段json文件:
可以通过修改其中的值直接修改规则。例如把“Enabled”从“true”修改为“false”,保存后回到列表视图:

该规则已经变为禁用状态,修改生效了。
可以看到,基于Blob自身的生命周期管理,可以很方便的实现数据随时间自动迁移到对应层级甚至删除的目的。结合之前谈到的数据WORM保护,可以对数据整体生命周期做完善管理,简化我们的数据存储管理流程,降低数据保存成本。

注意事项

对于数据生命周期管理,使用的时候需要注意如下几点:

  • 只能实现数据向下迁移,向上迁移(如冷到热)需要手工操作

  • 在没有筛选器集时,规则对整个存储账户生效

  • 当出现规则冲突时(例如在同一时间,对数据同时有热到冷、热到归档),优先执行低成本的策略,即按照删除——转移到归档——转移到冷存储的优先级执行

  • 数据生命周期管理不产生额外的费用,但是会有列出Blob(用作枚举所有Blob的产生时间)和设置Blob层(Blob在不同存储层间转移)的费用

点击文末阅读原文,访问Azure Blob存储更多详情



2019年8月29-31日世界人工智能大会将在上海拉开帷幕,本次大会以“智联世界 无限可能”为主题,以“端化、国际化、专业化、市场化、智能化”为特色,围绕智能领域的技术前沿、产业趋势和热点问题发表演讲和进行高端对话,打造世界顶尖的智能合作交流平台,是具有国际水平和影响力的行业盛会。

微软作为本次世界人工智能大会的重量级“伙伴企业”,将携全球顶尖人工智能技术及解决方案亮相。本次会议极具国际性、权威性和专业性,现场将汇集多种亮眼人工智能展品,届时还会有多位行业资深专家到场。


立即扫描二维码,免费参加活动,感受现代顶尖科技风采。



活动时间8月29日-31日



活动地点上海世博中心(上海市浦东新区世博大道1500号)


推荐阅读

GitHub上最火的项目到底是什么

叮咚!一封来自世界人工智能大会的邀请函

出海下半场,企业如何才能少交学费?

最新活动

玩转微软市场资讯?用这个就够了!

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存