查看原文
其他

【全面分析】在Sia、Storj、Filecoin和Arweave上运行的节点是AWS、谷歌云管理的数据中心的总和的114倍以上


数据决定人性:去中心化云存储的探索


数据决定人性。社会对技术创新和人类生活数字化的追求对数据存储和检索产生了爆炸性的需求。从农业革命、医疗保健发现和政治档案,到自动驾驶汽车、蛋白质折叠和神经网络,数据是帮助我们发现实现目标的新解决方案的主要促进剂。它是限制和迫使我们采取行动的能力的基本工具,以及允许访问并赋予我们数字和物理生活意义的不可减少的输入。数据决定人性:我们必须非常关心我们的数据是如何存储、管理和拥有的。


全球数据圈


今天,超过63% 的全球人口,或超过 5 亿人使用互联网,而且这个数字将继续以每年 10% 以上的速度增长。但云存储市场的增长速度更快。从 2015 年到 2025 年,全球数据领域(全球创建、捕获、复制和使用的数据量)预计将以58% 的复合年增长率增长,到 2025 年将创建、存储和复制超过 180ZB 的数据。如果您如果要堆叠足够的 10 TB 硬盘驱动器,到 2025 年满足世界的数据需求,那么堆叠将真正到达月球。


图 1. 按年份划分的全球数据圈规模。资料来源:Uygun 和 Döngül,2021 年。


从经济角度来看,2021 年云存储市场的价值约为76B 美元;到 2028 年,它将达到 $390B(复合年增长率为 26.2%)。尽管经济增长如此迅猛,但云存储提供商之间的市场份额仍在继续巩固。截至 22 年第 1 季度,3 大云提供商——亚马逊网络服务 (AWS)、微软 Azure 和谷歌云平台(我将亲切地称之为“三巨头”) ——占据了云计算市场 65% 的份额(1)。集中式云存储提供商所拥有的权力加剧了他们的网络效应、声誉、技术基础设施和资产负债表,以至于新的竞争对手根本无法竞争。


存储解决方案的类型

  1. 本地

  2. 集中式云存储 (CCS)

  3. 分散式云存储 (DCS)


本地存储和 CCS 供应商——三大巨头(亚马逊、Azure、谷歌)以及阿里云、Box、iCloud 等——的特点是其以位置为中心的存储方法。这意味着信息在单个位置(或少数几个位置)中存储和维护,在单个数据库中管理,并由单个实体操作。内部部署和 CCS 解决方案都存在单点故障风险。


CCS 解决方案的普及需要对本地数据存储的经济性进行历史回顾。起初,用户将数据存储在自己的硬件上。这意味着数据被存储和维护在希望存储它的实体的相同物理位置(例如公司的现场数据服务器)。我将此称为第一阶段。



图 2. 数据存储采用的三个阶段。资料来源:亨特兰普森。


由于云存储的网络效应实现了更便宜(而且通常更安全)(2)的存储功能,消费者和公司转向集中式云(第二阶段)。CCS 解决方案开发了云计算、API 和其他 SaaS 产品,客户也随之增长。尽管集中式解决方案是市场上最简单、最便宜和最有效的选择,但它们的基本限制仍然相同:一个容器负责 100% 的实体数据。CCS 解决方案是对本地解决方案的改进,但曾经经济上最优的方案变得昂贵且令人望而却步。今天,DCS 供应商是市场上最便宜、最安全的存储解决方案。


CCS 解决方案的主要弱点


  1. 缺乏数据所有权

    当用户将数据上传到 CCS 提供商时,他们不再拥有自己的数据。苹果有争议的决定(后来被撤销)扫描 iCloud 用户的照片就是一个很好的例子。当数据在给定硬件产品(iPhone、Mac 等)上本地(内部)存储时,Apple 拥有严格的隐私保护政策。但是,重要的是,当用户将单个字节的数据上传到 iCloud 时,Apple 认为该数据在他们的域中——不再在用户的域中。这个先例意味着存储在本地的数据属于用户,而存储在云中的数据属于存储提供商。


  2. 容易发生数据泄露和中断

    无需多想就能在 CCS 提供商中发现大量数据泄露事件。鉴于其单点故障结构,亚马逊、Azure和谷歌都遭受了这种痛苦。

    这些供应商的集中式建设允许他们建造大墙并提供相对于本地解决方案更高级别的安全性。同时,数据库变得越大、越集中,攻击者就越梦寐以求。数据中断在 CCS 解决方案中也很常见。可以在这里看到示例:Amazon、Azure、Google。


  3. 容易受到审查

    CCS 提供商不仅无法控制地丢失数据,而且还故意将其删除。就在几周前,流行的 YouTube 频道Bankless被终止,没有任何警告、通知或理由。谷歌在其云服务上拥有并存储 YouTube 内容,幸好恢复了该频道,但谷歌和其他 CCS 提供商必须终止某些数据存在的能力对社会有害。


  4. 高成本

    也许 CCS 解决方案最关键的缺点是费用高。尽管在过去 50 年中,存储数据的成本平均每年下降30.5%,但 CCS价格在过去约 7 年中一直持平。这是由于 CCS 提供商产生的网络效应。由于这些网络效应,三巨头已经开始主导云计算领域。随着它们的集体市场份额继续增长,三大巨头作为寡头垄断企业,具有操纵价格和排斥新进入者的能力。


图 3. 一段时间内的数据存储成本。资料来源:Arweave 黄皮书。



图 4. AWS、Azure、Google 上一段时间内的数据存储成本。资料来源:AWS、Azure、谷歌、Hunter Lampson。


存储价格与存储成本之间存在差异的主要原因是 CCS 供应商目前保持的市场主导地位。DCS 解决方案走的是一条不同的道路。


DCS 解决方案


基于 CCS 的弱点,分散式云存储 (DCS) 已被证明是数据存储领域的范式转变(第三阶段)。DCS 解决方案通过匹配存储空间的供需,可以跨地理分布的节点集利用空闲硬盘空间。这将创建一个更高效的市场,从而降低成本并消除在本地和 CCS 解决方案中持续存在的单点故障风险。DCS 解决方案还将数据所有权归还给用户。



图 5. 按平台每年存储 1 GB 的累积成本。资料来源:AWS、Azure、谷歌、Storj、SiaStats、Arweave Fees、File.app、Hunter Lampson。


尽管数据中心和存储节点的地理分布并不是决定网络分散/集中程度的唯一因素,但它是一个有用的试金石。跨空间的节点分布也是确定数据可以复制、检索和保护的级别的重要因素。一般来说,网络中的节点越多,检索的速度就越快,就越能抵御自然灾害(我们什么时候将存储节点放在月球上?!)。因此,将节点去中心化理解为有效云存储的先决条件非常重要。


与 CCS 解决方案相比,DCS 解决方案具有革命性的原因在于它们的去中心化程度。在 Sia、Storj、Filecoin 和 Arweave 上运行的活动节点数量是 AWS、Azure 和 Google Cloud 管理的数据中心的总和的 114 倍以上。



图 6. 按服务划分的活动节点总数。资料来源:Filscan、Viewblock、Storj、SiaStats、Peterson 2015、Baxtel、谷歌、Sam Williams、Hunter Lampson。


*Arweave 的节点数很难量化,因为Viewblock 提供的统计数据将每个存储池视为单个存储节点。在一次离线对话中,Arweave 的创始人Sam Williams告诉我,当前的 59 个存储池(根据 Viewblock)可以有数百甚至数千个节点支持它们。因此,Viewblock 将实际节点数低估了约 10-100 倍。出于这个原因,为了保守起见,我使用了“500+”作为节点数。同样重要的是要注意,活动节点数是去中心化的不完美度量标准。节点的绝对数量并不能告诉我们谁在操作节点(以及每个实体操作了多少节点)。


借用Spencer Applebaum和Tushar Jain的话说,DCS 服务之间的一个重要区别是基于合同的存储解决方案和永久存储解决方案之间的区别。简而言之:当今市场上的所有 DCS 服务都是基于合同的模型,Arweave 除外。


基于合约与永久存储模型


Filecoin、Sia 和 Storj 使用基于合同的定价模型——与当今 CCS 现有企业部署的模型相同。基于合同的定价意味着用户需要付费才能持续存储他们的数据,这类似于用户为订阅付费的方式。尽管存在细微差别,但 Filecoin、Sia 和 Storj 直接与现有的 CCS 提供商竞争。


另一方面,Arweave 提供了一个永久存储模型。这意味着用户只需支付一笔预付费用,作为回报,他们的数据将被永久存储。与其他 DCS 和 CCS 提供商相比,Arweave 常常显得懒散且不精确。将 Arweave 与竞争对手定义的基本特征是数据持久性。


图 7. CCS 和 DCS 解决方案的概念图。资料来源:亨特兰普森。


仔细研究 Filecoin、Sia 和 Storj 有助于我们更好地了解它们与 CCS 提供商和 Arweave 相比的异同。


图 8. DCS 解决方案的主要特征。资料来源:Filecoin、Storj、Sia、Arweave、CoinMarketCap、Crunchbase。


Filecoin

Filecoin 于 2020 年 10 月推出其主网,是当今市场上采用最广泛且资金充足的 DCS 项目。截至 2022 年 7 月 12 日,Filecoin 的完全稀释市值约为 1.19B 美元,创历史新高 12.3B 美元。Juan Benet是Protocol Labs的创始人兼首席执行官,该公司是 Filecoin 及其底层技术星际文件系统(IPFS) 背后的公司。迄今为止,Filecoin 已经筹集了 2.582 亿美元的资金,其中大部分来自 2017 年底的首次代币发行 (ICO)。


要了解 Filecoin,我们必须了解 IPFS,一种用于存储和检索数据的点对点 (P2P) 分布式系统。IPFS 旨在解决基于 HTTP 的互联网的缺点,使用内容寻址对数据进行分类,这意味着信息的请求和传递是基于其内容,而不是其位置. 这是通过向每条数据发布内容标识符 (CID) 来实现的,该内容标识符是通过散列每个文件的内容生成的,使其不可变。


为了定位所请求的信息(由唯一的 CID 表示),IPFS 使用分布式哈希表 (DHT),其中包含已存储与 CID 有关的内容的节点的网络位置。当用户从 IPFS 节点请求信息时,该节点将检查自己的哈希表,看它是否可以定位(然后检索)请求的文件。如果节点不包含请求的信息,它可以从对等节点下载内容并将其交付给用户。在此模型中,信息在许多节点之间复制,而不是在 HTTP 模型中存在的单个集中位置。这消除了单点故障风险,同时提高了检索速度,


IPFS 是存储和传输数据的通信网络,Filecoin 是建立在其上的经济系统. 单独的 IPFS 不会激励用户存储他人的数据:Filecoin 可以。这是通过两种独特的证明机制实现的:复制证明 (PoRep) 和时空证明 (PoSt)。PoRep 运行一次以验证存储矿工是否拥有他们所说的内容。对于每个链上 PoRep,都包含 10 个 SNARK(简洁的非交互式知识论证),它们证明合同完成。


另一方面,PoSt 连续运行以证明存储矿工随着时间的推移将存储空间专用于相同的数据。验证此过程所需的链上交互是数据密集型的,因此 Filecoin 使用 zk-SNARK(零知识简洁非交互式知识论证)来生成这些证明,并将它们压缩高达 10 倍。


Sia


在讨论的四个 DCS 协议中,Sia 是第一个推出的,并于 2015 年 6 月推出。Sia 由HackMIT 的David Vorick和Luke Champine于 2013 年创立,拥有强大的用户吸引力,拥有约 1.9 亿美元的完全稀释市值,创历史新高 $2.97B。

Sia 由成立于 2014 年的 Nebulous Labs发起。Sia 与 Filecoin 类似,将上传的数据分成复合部分(在本例中为片段),并将它们分散到全球的分布式主机。与 Filecoin 不同,Sia 通过不同的存储证明 (PoS) 机制实现了这一点。该证明要求主机随着时间的推移共享一小部分随机选择的数据。该证明经过验证并存储在 Sia 区块链上,主机获得 Siacoin 奖励。


Storj


与 Filecoin 和 Sia 一样,Storj 自 2018 年 10 月推出以来获得了巨大的吸引力。Storj 与 Filecoin 和 Sia 的区别在于它不依赖区块链共识来存储数据。相反,Storj 完全依赖纠删码和卫星节点来存储数据,以增加数据冗余并减少带宽使用。Storj 对纠删码的独家使用意味着数据的持久性——数据在发生故障时仍然可用的概率——与扩展因子——可靠存储数据所需的额外成本——并没有线性关系。因此,在 Storj 上,更高的持久性不需要成比例地增加带宽. 考虑到节点流失——节点离线(或离开网络)的速率——从长远来看,擦除编码可能被证明是有价值的,因为它需要更少的磁盘空间和更少的带宽来存储和修复,尽管它增加了 CPU运行。


Storj 也通过其网络架构和定价机制偏离了 Filecoin 和 Sia。在 Storj 上,定价由中间存储用户(包括应用程序)和存储节点的卫星节点决定。卫星节点负责协商定价和带宽利用率。因此,Storj 的定价模式并非完全依赖自由市场活动,而是受制于中心化力量,因为卫星运营商代表了节点和最终用户之间潜在的中心化中介。

Storj 还与Amazon S3原生集成,这意味着现有的 Amazon S3 用户能够迁移到 Storj并使用基本功能,而无需更改其大部分代码库。这可能会减少与离开 Amazon S3 生态系统相关的摩擦。


Arweave


与 Filecoin、Sia 和 Storj 相比,Arweave 提供永久数据存储。Arweave 由首席执行官Sam Williams和William Jones于 2018 年 6 月推出,截至 2022 年 7 月 12 日,其完全摊薄后的市值已达到 7.26 亿美元,市值为 2.88B 美元,创下历史新高。


Arweave 寻求以去中心化的方式提供永久数据存储,并收取一次性费用。这是通过 Arweave 的捐赠机制实现的。鉴于过去 50 年来数据存储成本每年下降 30.5%,Arweave 假设今天 1 美元/GB 的存储购买力比未来 1 美元/GB 的成本更高。这个三角洲启用了 Arweave 的捐赠池。“本金”是用户支付的前期费用,“利息”是购买力随着时间的推移而增加的以今天的货币计价的费用。Arweave 的保守假设是每年存储价格下降 0.5%,这使得捐赠池的长期生存能力成为可能。


Arweave 目前约 3.85 美元/GB 的成本反映了数据存储的终端价值。在短期内,Sia 和 Filecoin(甚至是 Big 3)更便宜。但从长远来看,Arweave 成为更明智的选择。即使在短期内,用户也会为其他人无法提供的东西支付溢价:数据持久性。对于某些人来说,永久存储的成本相对缺乏弹性,因为某些文件(例如 NFT)需要它。


Arweave 由 blockweave 提供支持,这是一种类似于区块链的数据结构,其中每个块都链接到前一个块和召回块。召回区块是除最近开采的区块之外的任何先前开采的区块。因此,Arweave 的结构不仅仅是将连续区块连接在一起的链——它是将当前区块与先前开采的区块和另一个随机区块(召回区块)联系起来的编织。


为了挖掘新区块并获得挖矿奖励,矿工必须证明他们可以访问召回区块。Arweave 的访问证明 (PoA) 机制保证,对于每个新挖掘的块,还包括来自召回块的数据。这意味着要存储新数据,矿工必须同时存储现有数据。PoA 还激励矿工在节点之间平等地复制所有数据。When less-well-replicated blocks are chosen as the recall block, miners with access to it compete among a fewer pool of miners for the same reward. Ceteris paribus,存储复制较少的区块的矿工将随着时间的推移获得更大的奖励。


建立在块状编织之上的是 permaweb——类似于今天的万维网,但是是永久性的。Arweave 的 bockweave 是为 permaweb 提供动力的基础层;permaweb 是用户与之交互的层。鉴于 Arweave 是基于 HTTP 构建的,传统浏览器可以访问存储在网络上的所有数据,从而实现无缝互操作性。


牵引力


尽管 DCS 解决方案在理论上可能在原则上优于 CCS 解决方案,但应根据其在实践中的实用性来评估它们。我们可以通过检查以下内容来衡量每个项目的牵引力:


  1. 存储的数据

  2. 节点分布

  3. 搜索兴趣

  4. 生态系统实力

  5. 需求侧收入


1. 数据存储

需求是通过检查一段时间内的数据存储量来直接衡量的,被认为是 DCS 提供商的主要 KPI。仅凭这个指标,Filecoin 就占主导地位;截至发稿时,Filecoin 存储了超过 90% 的 DCS 数据圈,高于 90 天前的 82.8%。



图 9. 存储的 DCS 数据范围的比例。资料来源:Storj Stats、SiaStats、Viewblock、File.app、Hunter Lampson。


Filecoin 不仅存储的数据最多:它的增长速度也是最快的。在过去的 90 天里,Filecoin 存储在平台上的数据增长了 112%。



图 10. 数据存储增长(过去 90 天)。资料来源:Storj Stats、SiaStats、Viewblock、File.app、Hunter Lampson。


鉴于这些是存储协议,存储的数据量是一个重要的指标,尽管它有严重的局限性。数据存储量没有告诉我们协议收入和数据本身(它有多大价值,它的功能是什么,它将存储多长时间等)。在 DCS 和 CCS 提供商中,关于如何描述存储数据的特征一直存在争议,因为并非所有数据都受到同等重视(和对待)。有些数据比其他数据更重要。用户可能会根据该指标对他们的存储提供商进行分叉,因此存储的庞大数据量仅描绘了部分画面。


数据存储量也缺乏关于数据将如何为协议的需求方收入做出贡献的背景。在考虑 Filecoin 时,这尤其成问题。Filecoin 是唯一本质上免费提供存储的DCS 服务。出于这个原因,用户可以使用 Filecoin 存储数据,因为它目前的定价(稍后会详细介绍……)。尽管我一直很难找到这方面的公开资料(原因很明显),但有趣的是,这个领域的无数建设者和研究人员——我都非常尊重他们——告诉我,Filecoin 倾向于与大型机构合作提供免费存储为了操纵他们的存储量指标. 那么理论上,Filecoin 可以存储比任何其他 DCS 协议无限多的数据,并且仍然产生零需求侧收入。


2.节点分布


尽管数据存储量是存储需求的直接衡量标准,但我们也可以查看间接衡量标准。节点分布很重要,因为它突出了需求方和供应方参与者的地理组成部分。我们可以通过观察 1)存储节点和 2)搜索兴趣的地理分布来评估这一点。


存储节点跨空间分布越分散越好。更高的分散性会导致更大的去中心化(通常)和更短的从节点到最终用户的检索时间。更高的分散性还降低了不可恢复的数据丢失的风险(通常是由于环境因素,如自然灾害)。理想情况下,节点不会随意分散在空间中,而是与空间中的存储需求相关(可能相当于技术饱和乘以人口密度)。鉴于美国、中国和欧洲的存储需求集中度最高,我们预计它们将拥有最高集中度的存储节点。因此,CCS 和 DCS 解决方案中的节点分布都集中在美国、欧洲和中国是有道理的。DCS节点分布类似于CCS存储中心分布,是DCS解决方案已达到重要市场成熟度的一个积极信号。


图 11. DCS 节点的地理分布。资料来源:Filscan、Viewblock、Storj、SiaStats、Sam Williams。



图 12. CCS 节点(数据中心)的地理分布。资料来源:Peterson 2015,Baxtel,谷歌。


3. 搜索兴趣


如果我们将节点分布视为 DCS供应的分布,我们至少可以部分地将搜索兴趣分布视为 DCS需求的分布。(这个假设是基于这样一个事实,即对于 DCS 解决方案的每次搜索,搜索者更有可能是存储空间的用户,而不是供应商。)

根据该指标,与 Storj、Sia 和 Arweave 相比,到目前为止,Filecoin 显然是全球搜索兴趣最高的。因此,人们可能会假设 Filecoin 经历了最高的相对需求。



图 13. 按国家/地区划分的相对搜索兴趣优势。资料来源:谷歌趋势。注意:我使用术语“Sia Coin”而不是“Sia”以避免电子流行音乐/“枝形吊灯”粉丝 :)


这些假设是基于当今的供需指标,但回顾过去,情况类似。自 2021 年年中以来,Filecoin 一直是搜索量最大的 DCS 解决方案。值得注意的是,2021 年 8 月,Arweave 和 2021 年 11 月和 2021 年 12 月的 Storj 几乎使 Filecoin 的搜索兴趣黯然失色。



图 14. 一段时间内的相对搜索兴趣。资料来源:谷歌趋势。


尽管搜索兴趣可能是一个有用的指标,但它有严重的局限性。该指标向我们展示了个人用户如何与 Google 互动以获取有关每个项目的信息。搜索兴趣没有向我们展示任何关于实际协议需求的信息。


可以很容易地提出这样的论点,因为 Filecoin 迄今为止筹集的资金最多,他们可能有最多的钱可以花在营销上。然后,也许仅营销预算就可以解释每个项目之间的搜索兴趣差异。也许搜索兴趣优势比协议需求更能预测收到的资金——谁说呢?此外,Filecoin 对易于理解、关键字繁重的域(例如Web3.Storage和NFT.Storage)的所有权也可能导致数据倾斜。搜索“Web3 Storage”的用户可能会遇到 Filecoin 的服务,仅基于 SEO 和他们拥有的域。


搜索兴趣可变性的另一个限制是它可能与存储需求高度不相关。例如,如果用户打算将数百 TB 的数据移动到 DCS 提供商,他们的搜索参与(一次搜索)将无法反映他们的实际存储需求。外部变量也可能在这里发挥重要作用,例如像 Coinbase 这样的 CEX(集中式交易所)营销这些单个代币的程度。


4. 生态系统


由于 DCS 解决方案存在于基础设施层,因此他们的生态系统通常代表用户需求,因为他们的用户(消费者、公司、开发人员)可以选择使用或构建哪个生态系统。生态系统的力量来自 1)建立在协议之上的项目和 2)他们合作的现有项目。鉴于合作伙伴关系的成熟度和新项目的添加速度,Filecoin 拥有最强大的生态系统。在过去的约 18 个月中,Filecoin 的生态系统已从40 个项目发展到 300 多个。Filecoin 拥有一系列令人印象深刻的合作伙伴关系,其中包括:Chainlink、Polygon和Polygon Studios、The Graph、Near、ConsenSys、Brave、ENS、Flow、Hedera、ChainSafe、Ceramic、Livepeer、Audius、Decrpyt、MoNA和Skiff。




图 15. Filecoin 生态系统。资料来源:梅萨里。


为了帮助发展他们的生态系统,Filecoin 基金会对其生态系统和赠款计划进行了大量投资。Filecoin 背后的团队 Protocol Labs 迄今已进行46 次直接投资,向生态系统项目部署了超过 4.8 亿美元,包括Decrpyt、Syndicate、ConsenSys和Spruce。



图 16. 随着时间的推移,协议实验室的投资。资料来源:Crunchbase。


仅次于 Filecoin 的生态系统是 Arweave 的。Filecoin 有近 300 个合作伙伴,而 Arweave 大约有 60 个。虽然其中许多合作伙伴可以同时从这两个平台中受益——例如,Mirror和Skiff可以向其用户提供 Filecoin 和 Arweave 的服务——但其他项目,如Solana,是不太可能同时使用这两个平台。这意味着许多最关键的 web3 基础设施项目——协议、dApp、NFT 平台——将找到适合产品市场的产品,并在意识形态上与 Filecoin或Arweave 保持一致,具体取决于具体的用例。每个生态系统的实力将对每个平台的长期生存能力发挥至关重要的作用,因此赢得新老建设者的心和思想的能力至关重要。


值得注意的是,与 Filecoin 的生态系统相比,Arweave 的生态系统在平台上构建的净新项目的集中度更高——因为它们依赖于技术来生存——而不是选择性地利用该技术的现有项目。这也可以解释为什么 Filecoin 会与更成熟的项目合作。并不是 Filecoin 的合作伙伴关系发展得更快、更成功,而是 Filecoin 与已经存在更长时间的公司(如Cloudflare和Opera)合作。相比之下,Arweave 通常与在网络上从头开始构建的早期公司合作。Arweave 的一些著名合作伙伴包括Solana、Polkadot、图表、镜子、Bundlr、Glass、KYVE、Decent Land和ArDrive。



图 17. Arweave 生态系统。资料来源:@axo_pas(在 Twitter 上)。


自 2020 年以来,Arweave 已将近 5500 万美元用于 15 个生态系统项目,包括Mask、Fluence和Pianity。通过他们的Open Web Foundry加速器计划,Arweave 帮助开发人员构建 permaweb 应用程序,并且之前通过他们的社区运营的生态系统基金ARCA DAO进行了投资。


Sia 和 Storj 的生态系统较小,分别有大约 30 个和 13 个项目。尽管生态系统较小,但 Sia 和 Storj 拥有出色的合作伙伴关系。Storj 的一些合作伙伴包括CoinMarketCap、Crypto.com、Kraken、Filebase、Render、Akash和Quant,而 Storj 的合作伙伴包括Microsoft Azure、Fastly、Couchbase和Pokt. 重要的是,Storj 的战略是围绕捕获现有的 Amazon S3 用户(包括大型现有公司)而构建的。出于这个原因,Storj 的许多合作伙伴可能会拒绝公开上市。Storj 的合作伙伴可能看不到被列为此类的任何好处。相比之下,例如,在 Arweave 上构建的新的 web3-native 项目可能确实受益于被列为合作伙伴,以表明他们沉浸在生态系统中。不同的宣传激励措施使生态系统比较具有挑战性,因为我们无法访问完整的数据集。


今天,Sia 主要由Filebase使用,这是第一个与 Amazon S3 兼容的 dApp(分散式应用程序),以及Arzen,一个以消费者为中心的分散式存储应用程序。


5. 需求侧收入


数据存储量可能是用户牵引力最直接的衡量标准,但需求侧 收入衡量的是用户牵引力的价值——或项目将用户牵引力货币化的能力。正如Sami和Mihai在他们关于 Filecoin 收入模型的文章中解释的那样,需求侧收入是基础设施项目的一个有用指标,因为它衡量了人们为使用网络而支付的费用(在这种情况下:为存储数据支付的费用)。重要的是,需求方收入不包括支付给矿工的整体奖励。


虽然Web3 Index上的 Arweave、Sia 和 Storj 的需求方收入数据可用,但 Filecoin的需求方收入数据很难找到,如果不是不可能的话(如果有人能找到这些数据,我很乐意看到) )。出于这个原因,我们不能将 Filecoin 包括在需求方收入比较中。


我们对 Filecoin 收入的了解是,尽管存储在其平台上的数据有所增长,但他们的收入却保持平稳。这可能是由于两个原因:首先, HyperDrive更新将存储载入率提高了 10-25 倍,导致对块空间的需求降低(我们稍后会看到,这会损害 Filecoin 的代币价值)。其次,为了存储更多数据而不产生更高的收入信号, Filecoin 本质上是免费存储数据。因此,矿工获得了不可持续的区块奖励——截至撰写本文时,每个区块大约 20.56 FIL——这将随着时间的推移而减少。在不远的将来,Filecoin 将需要提高存储价格以激励矿工参与网络。



图 18. Filecoin 的协议收入仍然与生态系统增长无关。资料来源:梅萨里。


然而,对于 Storj、Sia 和 Arweave,我们可以看到过去 90 天产生的需求侧收入。



图 19. Storj、Sia、Arweave 的需求侧收入(过去 90 天)。资料来源:Web3 索引。


因为 Filecoin、Sia 和 Storj 是基于合同的(临时)解决方案,用户在其中持续付费存储数据,我们可以假设他们的需求侧收入的非零金额是经常性的。相比之下,我们可以假设 Arweave 100% 的需求侧收入是非经常性的,因为用户只需支付一次费用就可以永久存储数据。这意味着Arweave 产生需求侧收入的唯一方法是存储净新数据。这对 Arweave 提出了重大挑战,并提醒我们将 Arweave 与其 DCS 同行进行比较是不够的。


可能被证明是护城河或竞争劣势的是 DCS 平台之间需求侧收入效率(大致等于价格)的差异。我将需求方的“收入效率”定义为存储的每字节数据产生的需求方收入。在过去 90 天里,Storj 和 Sia 分别为每 TB 上传产生了 96.50 美元和 89.90 美元的需求侧收入,而 Arweave 每上传 TB 产生了约 10,200 美元。这种定价模式是 Arweave 与其 DCS 竞争对手之间的另一个根本区别:Arweave 对功能不同的服务收取溢价。这也意味着Arweave 可以存储多达约 113 倍的数据,并且仍然产生与其 DCS 竞争对手相同的需求侧收入. 这表明不应期望 Arweave 存储与其他解决方案相同数量的数据,因为它的服务和定价机制都无与伦比。


代币估值


方法

Storj、Sia、Arweave 和 Filecoin 最好理解为 1) 实用代币(礼品卡)和 2) 交换媒介(货币)的组合。实用代币的估值基于其预期的未来效用;货币是根据供求关系估价的。实用程序代币的持有者可以兑换它们以换取服务——在这种情况下,是云存储。为指定服务兑换实用代币的能力使其在结构上类似于传统的礼品卡或代金券。但是,与礼品卡和代金券不同的是,实用型代币是通过程序提供和自主的,而礼品卡和货币是商业或政府提供的,并且(几乎)总是以不同的货币发行(通常是法定货币)。程序化供应保证了指定的供应计划,使我们能够精确计算一段时间内的代币供应。(最近9.1% 的 CPI数据向我们展示了程序化货币供应有多么强大。)我们使用这一点,结合传统的货币主义理论,推导出每个代币的内在价值。


需要明确的是:我对使用传统货币理论和贴现现金流分析随着时间的推移评估代币价格感兴趣。我并不是要评估协议本身(即产生的总收入[尽管收入很重要……]),也不是存储矿工或存储供应商的利润。我也认识到这些协议产生的非凡文化价值,尤其是当它们(不可避免地)成为公共物品时。也就是说,每个协议的代币价格可能都没有考虑到这些,所以我也没有。


首先,一个重要的区别:传统的公共证券(即 $AAPL: Apple)和代币(由Protocols发行)代表不同的东西。虽然协议会产生资产流,但它们不会像Apple那样产生现金流*。*因此,代币不应与公共股票混为一谈。代币代表使用/交易的权利;公共股票代表所有权。(代币可以代表的不仅仅是实用/交易权——例如,它们还可以包括治理权。)随着时间的推移评估代币的价格需要包含不同的机制:货币理论和贴现现金流分析。


代币估值模型


*我参考的模型链接在这里:Token Valuation Model - Arweave Example *

我用来评估代币价格随时间推移的主要框架是Chris Burniske 的开创性作品Cryptoasset Valuations中的模型。Chris 认为,与其对传统的 DCF 进行建模,不如保持相同的结构并用交换方程代替现金流,从而使我们能够推导出每个代币的当前效用价值。然后,我们对未来效用价值应用贴现率来推导出今天的内在价值。


替代品——交换方程:MV = PQ——帮助我们整合代币的类似货币的性质。正如克里斯(和无数其他人)所承认的那样,这个模型有其局限性(所有预测模型都有),但它可能是我们所拥有的最好的。鉴于缺乏完美有效的市场以及预测未来固有的广泛误差,该模型最适合用来说明产生代币价值的各种杠杆。

正如Chris所写,“加密资产估值主要包括求解 M,其中 M = PQ / V。M 是支持 PQ 规模的加密经济所需的货币基础规模,速度为V。”


代币估值模型:输入


为了估计M、V、P和Q,我将使用以下内容:

数学推导输入

  1. 最大供应

  2. 漂浮

  3. 浮动复合年增长率

  4. 存储成本 ($/GB/Year) 或 ($/GB)

  5. 存储成本下降/年 (CAGR) (*)

  6. 数据圈大小

  7. 数据圈增长/年 (CAGR)

    (*)这是从过去十年中 3 巨头每年的存储成本平均下降 ($/GB/Year) 得出的,如下图所示(图 20):



图 20. AWS、Azure、Google 的数据存储成本和 CAGR。资料来源:AWS、Azure、谷歌、Hunter Lampson。


主观假设


  1. 持有代币的百分比(未流通的公共供应的百分比)
    我假设到 2021 年,50% 的代币是持有的。这一假设源于这样一个事实:从历史上看,大约一半的 Coinbase 用户将比特币视为严格的投资,而另一半则将其视为交易媒介。


  2. 代币持有量/年的百分比变化
    我假设从 2022 年开始,持有代币的百分比将每年减少 1%。随着市场接近均衡,价值增值的潜力越来越小,因此代币的数量浮动将增加(随着代币持有的百分比减少)。这难以置信地难以估计——再次,最好将其理解为有助于代币估值的杠杆。


  3. 速度
    我假设每个代币的速度是 20。鉴于比特币的速度历来是 ~14,我在这里使用 20 是保守的。


  4. TAM(占全球数据圈的百分比)
    我假设 Arweave 可以解决全球 10% 的数据圈,而 Filecoin、Sia 和 Storj 可以解决另外 90% 的问题。永久数据存储是一个全新的市场,因此很难确定它可以解决的现有数据领域的百分比,所以我在这里使用 10%,希望保守一点。临时数据存储(当今主要的存储解决方案)必然占数据领域的 100%。如果我们假设 10% 的现有数据圈将过渡到 Arweave,那么 Filecoin、Sia 和 Storj 就剩下来处理另外 90% 的问题。


  5. **获得的 TAM
    的最大百分比 **我假设 Arweave、Sia 和 Storj 获得的 TAM 的最大百分比为 1%。因此,我假设 Arweave 捕获了 10% 的全球数据圈的 1%(Arweave 总共占全球数据圈的 0.1%,Sia 和 Storj 各占全球数据圈的 0.9%)。鉴于 Filecoin 的吸引力和成熟度,我假设 Filecoin 捕获了 25% 的可用 TAM(90% 的 25% = 全球数据圈的 18%)。


  6. **拐点
    **我假设 2024 年是每个网络达到其拐点的一年——这一年达到了其获得的 TAM 的最大百分比的10% 。这几乎是无法预测的——另一个说明性的杠杆。


  7. **饱和度/年**我假设Arweave、Sia 和 Storj
    的饱和度/年(网络从其最大获取 TAM百分比的 10% 到 90% 所需的年数)为 10 年, Filecoin 为 4 年。另一个不可能的预测。


  8. **
    贴现率 **我假设贴现率为 40%,这是该风险级别资产的行业标准。

所有固定和可变数学衍生输入和主观假设的简明视图如下:




图 21. 代币估值模型中使用的固定和可变数学衍生输入和主观假设的简明视图。资料来源:CoinMarketCap、Uygun 和 Döngül,2021 年,Chris Burniske,Hunter Lampson。


关于 Filecoin 的不同输入:


  1. 数据存储成本降低 (CAGR) = 0%

  2. 假设存储成本($/GB/年)= $0.002/GB/年



在表中,我将 Filecoin 的数据存储成本降低 (CAGR)和假定存储成本 ($/GB/Year)明确标记为一个非常主观的假设,即使有明确的数据可用。我这样做是因为Filecoin 目前的定价太便宜而无法持续。


首先,让我们从假定的存储成本($/GB/Year)开始。目前,Filecoin 的存储成本约为 0.0000017 美元/GB/年,或存储在 Big 3 提供商的成本的 0.0011%。正如我上面所讨论的,Filecoin 的定价模式是不可持续的,因为它得到了区块奖励的大量补贴。自 2 亿美元以上的初始代币发行以来,Filecoin 已经补贴了其网络上的存储成本。随着他们远离补贴,我们可以预期他们的存储成本将从当前水平增加。Ceteris paribus,存储成本增加,需求固定,使得 $FIL 更有价值(与任何代币一样),但我们可以假设,随着 Filecoin 不可避免地提高价格,其网络上的存储需求可能会减少,从而降低 $FIL 的内在价值。


很难说团队将如何执行提价,即使价格仍然低于三大巨头。如果我们以目前约 0.0000017 美元/GB/年的价格运行此模型,那么 2022 年的内在价值为约 0.00 美元/FIL ,另一个迹象表明今天的定价模式是不可持续的。因此,我估计未来 10 年 Filecoin 的存储成本为 0.002 美元/GB/年(Big 3 价格便宜 100 倍)(假设数据存储成本下降 [CAGR]为 0%)。这保持了 Filecoin 具有竞争力的价格——使其比三大解决方案便宜 100 倍——同时为其代币价格提供了重要价值。将此输入视为 Filecoin 可持续发展的个人期望甚至要求。

代币估值模型:输出



图 22.代币估值模型输出。资料来源:CoinMarketCap、亨特兰普森。


在其他条件不变的情况下,模型的杠杆作用如下:



图 23. 产生代币价值的各种杠杆的图示。资料来源:亨特兰普森。


该表指的是在每个杠杆发生变化的情况下的一般输出,而不是保证当杠杆增加/减少到任意高/低的数字时,输出将始终为真。例如,考虑速度:平均而言,随着速度的增加,代币价格下降。但是任意低的速度水平,例如 0 的速度,意味着代币每年易手 0 次,因此需要 0 货币基础来实现生态系统。也就是说,通过避免尾端,表中引用的一般趋势很有用。


发现


Arweave 的经济学是最有说服力的,这是由于美元 AR 代币的供应相对较低和存储成本相对较高 ($/GB)。这部分基于我之前的结论,即Arweave 是 DCS 产品中需求侧收入效率最高的产品,这意味着它可以存储的数据少 113 倍,并产生与其同行相同的需求侧收入。此外,我对 Arweave 捕获全球数据圈 0.10% 的假设足够保守,是合理的。如果实现这一目标,预计 2032 年的代币价格将比今天的水平上涨 +182.91 倍。虽然 Arweave 较高的相对定价可能会增强其单位经济性,但它可能是扼杀用户采用的致命弱点。用户将最终确定 Arweave 的服务是否物有所值。


即使我们假设用户愿意支付这笔溢价,理论上也必须说服他们在实践中使用该产品。由于 Arweave 的产品与其竞争对手有着根本的不同,转换成本可能太高,而且服务太独特而无法赢得净新用户。尽管 Arweave 有潜在的上行空间,但高成本和对新市场的依赖可能被证明是不可逾越的障碍。如前所述,Arweave 产生需求侧收入的唯一方法是存储净新数据。从表面上看,Arweave 似乎没有每比特数据的经常性需求侧收入的奢侈——所有 CCS 和 DCS 竞争对手都从中受益。相反,我认为Arweave 受益于非自愿的经常性需求方收入。Arweave 不是永久向用户收费,而是预先获得“永久经常性需求方收入”。这可能被证明是 Arweave 最有价值的捐赠机制之一。


目前,由于价格低廉,Filecoin 的经济性是最站不住脚的。给定固定的代币供应,实用程序的成本越低,支持它的货币基础就越小。这种观点将低定价视为代币价值的负面属性,而不是正面属性。Filecoin 的低价可能同样有可能成为采用飞轮的基础。低价也可以作为 Filecoin 的关键差异化因素,它可以作为必要的护城河。


然而,让我担心的是定价权将在决定 Filecoin 的未来方面发挥的重要作用。正如Tushar和Spencer 所说,Filecoin(以及 Sia 和 Storj)在临时存储市场上与三大巨头直接竞争。与三巨头展开价格战可能是灾难性的。如果 Filecoin 能够在没有不可持续的补贴的情况下保持低定价,它的成熟度、生态系统实力和全行业的影响力可能会将其定位为三大巨头最有能力的挑战者。如果归结为价格战——这可能是不可避免的——事情可能会变得丑陋。


根据该模型,基于当前定价与 2032 年价格预测之间的差异, Sia 的代币经济学使其价值比 Storj 高约 4.5 倍。通常,Sia 和 Storj 被混为一谈(就像我现在正在做的那样……)作为 Filecoin 的弟弟代币。鉴于它们的生态系统不太强大,很难想象在不久的将来 Sia 和/或 Storj 会取代 Filecoin 在该领域的主导地位。尽管如此,Sia 和 Storj 的代币经济比 Filecoin 的代币经济更具吸引力。定价权现在并将继续成为代币估值和每个项目的长期生存能力不可或缺的一部分。


未来研究的局限性和思考


  1. 云存储≠云计算。正如Christine Deakers所指出的,许多云存储用户同时对他们存储的数据使用云计算。DCS 解决方案必须解决这个问题。Filecoin 已经开始构建它的虚拟机——其他 DCS 解决方案可能会效仿。


  2. DCS 解决方案需要更多集成。正如Mark Gritte所指出的,大多数物联网应用不仅需要分布式存储,还需要分布式数据库。如果 DCS 解决方案不能与传统的时间序列数据库本地集成,这可能是采用的主要障碍。


  3. DCS 解决方案应该允许位置选择性。Mark Gritter提到的一个例子是自动驾驶汽车。自动驾驶汽车收集的传感器数据流必须以分布式方式存储,以实现尽可能低的延迟。如果数据上传者(汽车和汽车公司)无法选择附近的位置来存储他们的数据,DCS 解决方案可能无法很好地解决这个用例。


笔记

(1)虽然云计算不同于云存储,但我们可以合理地做出一组假设:首先,提供云计算服务的公司(如三巨头)倾向于在他们存储的数据上提供这种服务。换一种说法:客户通常在一个平台上同时使用计算和存储服务。第二:我们可以假设,随着云计算公司获得更多的市场份额,它们会以越来越快的速度从更好的单位经济中受益。公司越大,它在谈判硬件定价方面就越有效,这会降低客户的成本,并吸引更多的用户,从而进一步增强其谈判能力。所以,当我提到三巨头占据云计算市场 65% 的份额时,


(2) 在整篇文章中,我使用“安全”和“安全”这两个术语来描述在一组分布式节点上高度复制的数据,这会导致更高的数据冗余、更一致的正常运行时间以及降低两种审查的可能性和单点故障风险。


关于我


Hunter Lampson是高盛的一名分析师,对资本部署和数字资产感兴趣。在晚上和周末,他在 ** Writers Club ** 提出尖锐的问题,并在 Serif鼓励 LGBTQ+ 加密货币的领导者和创作者 ,他是Serif的创始成员。要了解他的更多想法,您可以在 Twitter 上与他联系@HunterLampson或订阅他的Substack或Mirror。


如果您发现这篇文章内容丰富(尤其是如果您不同意!),请在 Twitter @HunterLampson上与我联系。要开创云存储的未来,还有很多工作要做,我很高兴能与之合作。


我非常感谢许多帮助我思考并提供他们对这篇文章的看法的人。感谢@0xPhillan、Sam Williams、Mark Gritter、Sami Kassab、Alana Levin、Christine Deakers和Jay Drain Jr.慷慨帮助我完善这项工作。您的想法和反馈非常宝贵。


还要感谢那些为我(希望)奠定意识形态基础的人。感谢Chris Burniske、Tushar Jain、Spencer Applebaum、@0xPhillan、Sami Kassab、Mihai Grigore和其他 web3 基础设施爱好者。

///

Jacob van Loon的封面艺术背景。

这篇文章发表在Mirror上,因此永久存储在 Arweave 上。

这篇文章中的想法反映了他的个人想法,并不代表他所属的任何组织。此内容仅供参考,不应被视为投资建议。

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存