区块链储存行业研究报告
在过去20年,互联网技术的崛起使得信息传播、交流互动有了飞跃式的发展变革,人们对于互联网的普遍评价是“方便快捷”;而在最近10年,“唯快不破”的招法逐渐被更基础、更本质的“大”数据所取代。数据与每个人的生活息息相关,但在没有管理和分析之前,数据犹如空气般,必不可少但无法想象。
在数据行业里,存储和数据库技术是基础中的基础,集中式存储以及分布式存储技术一直占据着主要地位。随着近年来区块链技术的兴起,区块链(去中心化分布式)存储模式成为了传统模式之外的新选择。
目录
一、全球数据存储市场概述
二、集中式存储与分布式存储
1.集中式存储
2.分布式存储
三、去中心化分布式存储
四、去中心化分布式存储项目案例
1.IPFS-Filecoin
五、去中心化存储的发展趋势
一、全球数据存储市场概述
随着大数据和云计算技术的兴起和发展,全球每年产生的数据以爆发的态势急速增长。在数据横行的时代,掌握和处理数据的能力成为了各大商业巨头的“军备竞赛”。其中,数据存储是基础且关键的一项技术,往下可作为信息留存的基础设施,往上可构建商业模式、形成具体产品的核心资产。
根据国际数据公司IDC的研究报告显示,2016年全球存储总量为16.1ZB(1ZB=1024(3次方)TB),且保持40%左右的年均复合增长率,到2025年数据总量预计可达163ZB约等于1750亿TB。
根据科智咨询的相关数据,以全球IDC(Internet Data Centre)市场规模来看,2017年整体市场份额达到534.7亿美元,较上一年增长18.3%。整体行业依然呈现持续增长的趋势。
在更细分的相关领域中,行业解决方案以34.3%的市场份额排名靠前,而存储服务和数据库服务分别占比13。9%和7.8%。若以实际应用场景,存储服务和数据库服务通常会相互依存,所以两者相加的市场份额21.7%仅次于行业解决方案的市场规模,可见商业社会对存储和数据库服务的需求量之大。
二、集中式存储与分布式存储
以物理存储形态区别,存储方式可分为集中式传统阵列与分布式存储(云存储)。传统阵列是以本地硬件定义的存储方式,而分布式存储则以软件定义为主的存储方式。
1.集中式存储
在IT行业的发展历史中,集中式传统阵列一直是主要的存储方式。其可靠性高、稳定性好及数据一致性强等特点成为企业和政府机构值得信赖的IT基础设施。众多机构为了满足自身的业务需求以及潜在的对外提供数据存储服务,建立了规模化的IDC。2010年以来,全球IDC数量稳步增长,直至2017年,随着大型化、集约化的模式改进,IDG数量出现缩减,但机架数量依然处于上升趋势,意味着业务量并未减少。
2.分布式存储
传统阵列存在的缺点,例如扩展性弱、弹性差等问题,很难满足互联网时代企业的信息处理需求,因此分布式存储架构应运而生。分布式存储之所以由软件定义,是因为其将数据分散存储于网络中的各个独立存储设备中,通过运行相关存储软件进行统筹管理,系统作为一个整体对外提供存储服务。
针对不同的存储数据类型,分布式存储系统可以分为分布式文件系统、分布式键值系统、分布式表格系统和分布式数据库。
虽然分布式存储具备灵活、弹性的特点,针对特定业务效率高,但其在可靠性、数据一致性及普适性上有较大的牺牲和妥协。与此同时,现阶段中心化运营的分布式存储架构本身依然存在诸多风险隐患,比如隐私泄露问题、中心化服务提供商终止运营问题、黑客攻击问题以及投入产出性价比问题等。
附集中式存储与分布式存储的特点比较:
三、去中心化分布式存储
由于区块链的底层账本技术带有存储功能,且在组网方式上采用的又是网状拓扑结构,因此区块链天生就是分布式存储的衍生物。区块链方式与传统存储方式最本质的差异性在于治理模式,同时区块链在匿名、密码学技术等方面均作了创新和结合,所有节点的对等和平权,使区块链存储网络在共识机制和激励模型下自治管理,促成商业生态的自循环。因此,在该报告中以“去中心化存储”指代区块链存储方式。
去中心化存储能够弥补分布式存储自身存在的一些问题:
避免中心化风险:中心化存储的集中式管理可能因运营风险或黑客攻击而全盘瘫痪。
经济激励:通过区块链的 token经济模型激励节点自发地参与分布式存储网络。
隐私保护:用户的身份和存储的数据/文件内容通过哈希加密标识,在系统內部也能较好地避免隐私泄露。
边缘存储资源利用问题:由于激励机制的存在,边缘的存储资源也将有机会和动力参与到网络中,提高整体的存储效率。
在现阶段技术背景出现的去中心化存储项目中,完整的存储/检索过程通常包含以下步骤(但不局限于以下顺序)
(市场上出现存储需求方和供应方)
a) 供需双方通过订单系统匹配需求
b) 需求方将数据/文件上传(对应费用支出)
c) 将数据/文件分片,并根据分片不同和对应存储地址不同添加身份识别
d) 将众多分片建立逻辑顺序之后分散存储于各节点
e) 供应方在提供自己的信誉证明之后(通过抵押 token等方式)接收到经过分 片、加密的数据/文件
f) 若需要重新下载获得数据/文件,将通过检索寻址功能实现
四、去中心化存储项目案例
目前市场上已发行多个去中心化存储概念项目,如 MaidSafe、 Storj、Sia和IPFS等项目,还包括众多初创项目。本报告通过仍在测试的IPFS案例来说明去中心化存储项目实际的运行状况和存在的问题,以及对去中心化存储细分领域的发展路线作出思考和判断。
IPFS-Filecoin
IPFS(InterPlanetary File System)是一种分布式、点对点的文件系统,挑战传统互联网HTTP协议,是采用Merkle DAG 数据结构的内容寻址模型及自带激励机制的分布式存储、传输协议。
Filecoin是一个去中心化的存储网络。同时 Filecoin(FIL)是原生 token,起到激励作用,因此它让云存储变成了算法市场,矿工和客户围绕存储和FIL激励产生业务往来。 Filecoin中也存在矿工概念,但与比特币矿工不同,Filecoin的挖矿功率与有效存储成正比,即直接向客户提供有效服务。
首先需明确IPFS和 Filecoin的关系。IPFS是底层文件系统和传输协议,作为基础设施,所有基于IPFS的数据/文件都将遵循统一的规则进行传输、存储、检索等。 Filecoin是IPFS之上的激励层,作为去中心化数据的基础平台,对构建和运行DAPP以及执行智能合约起到关键推动作用。
通过 IPFS WebUI 主页面可以看到例如连接节点数、节点分布、网络流量和带宽变化图。(测试网期间,连接节点通常在300-850间浮动)
IPFS的技术特点:
身份:使用S/ KademIia DHT(分布式哈希表)的静态加密难题创建公钥的密码哈希,用 NodeID 标识节点。提供高效查询,抵抗女巫攻击,确保诚实节点的互相链接。虽然支持相同用户新建身份,但会失去前期积累的利益,因此是个鼓励长寿节点的方案。
网络:IPFS的网络传输架构在应用层,可搭载使用任何传输协议。并通过分别使用uTP/SCTP、 ICE NAT、哈希校验和HMAC来保证可靠性、可连接性、完整性以及可验证性。
路由:IPFS使用基于S/ Kademlia和 Coral的IPFS DHT。 IPFS DHT根据存储值大小进行区分,值≤1KB的直接存储于DHT,更大的值DHT仅存储值的索引(对等节点的 NodeID)。
块交换: BitSwap协议下,数据的分发通过对等节点间交换数据块进行,这与 BitTor rent类似。但与BT协议不同的是, BitSwap不局限于某个。 tor rent中的数据块,而是定义了一个永久的市场(类似于去中心化交易所的概念)。此时, Filecoin就是 BitSwap协议下各节点得以进行块交换的实施凭证。
Merkle DAG:对象之间的链接经由哈希加密之后嵌入在源目标中,形成 Merkle DAG数据结构。该数据结构为IPFS提供诸如内容可寻址、防止篡改和重复数据删除的重要属性。
文件:在 Merkle dag基础上为模型化版本文件系统定义了一组与版本控制系统Git相似的对象模型,分别为: block(数据块)、list(数据块和链表的集合)、tree(数据块、链表和 Merkle树的集合)和 commit( Merkle 树在版本历史中的快照)。该模型的重要属性之一是以分布式友好和低消耗的方式对文件版本做出同步更新。
IPNS(命名空间):为了正确获取变换了索引的相同的数据块,IPFS设计了如下方案以完成真实性验证:
a) 节点身份标识: NodeID=hash(node.Pubkey)
b) 给每个用户分配一个可变的命名空间,在此路径下:/ipns/
c) 用户在此路径下发布了一个用私钥签名的对象,例如:
/ipns/QmUTgm9hfu88zQDkcHw888EueLAfaFkzVxQX1 go9xD1q11
d) 当其他用户获取对象时,可以检测签名是否与公钥和 Node ID匹
配,以验证对象内容的真实性
此处可以做个简单总结,如下图所示,以上各技术的应用在|PFS的
技术架构中分别处于如图的位置,这是一个更直观的展示。
五、去中心化存储的发展趋势
显而易见地,去中心化存储为传统存储市场提供了一种新的行而有效的业务模式。但不可否认,不管与传统的集中式存储方式还是分布式存储方式相比,去中心化存储依然在性能、隐性成本、数据一致性方面处于劣势。除了继续进行技术研发的创新和改进,在业务模式的方向选择上,去中心化存储也可以参考集中式与分布式的特点:
a)去中心化存储项目作为服务提供方,在存储网络高度自治的区块链网络中,能提供高度自定义的服务,尽量满足存储供需双方的需求。
b)去中心化存储项目作为产品提供方,以模块化、标准化的产品为其他区块链项目提供去中心化存储解决方案。数据传输、数据结构、存储及检索等功能可以按需适配于其他项目。(类似IPFS与Filecoin的关系)
与此同时,借由区块链的密码学、匿名技术特性和经济激励的特性,去中心化存储项目与特定场景的商业模式结合也是未来发展的方向之一。
为便于研究人员查找相关行业研究报告,特将2018年各期文章汇总。欢迎点击下面红色字体查阅!
文琳编辑
今日导读:点击下面链接可查阅
公众号 :文琳行业研究
文琳行研报告,为各机构提供专业的信息、数据、研究和咨询服务。欢迎关注【文琳行业研究】