其他
万亿级对象存储的元数据系统架构设计和实践
在规模上,单桶要支持万亿对象; 在性能指标上,单桶要支持百万 QPS,所有 API put、get、list 都实现毫秒级延迟; 在运维场景上,对运维友好,数据均衡分布,扩缩容简单方便; 同时具备一些数据库特性,比如事务的支持,二级索引,备份和 CDC 机制。
更小的数据管理粒度。分片作为最小的数据管理单元,而不是上一代系统的 DataNode,分片控制在 4GB 以下,能更好的实现数据的搬迁和均衡; 分片之间使用 Raft 实现数据复制和选主,实现高可靠、高可用; 引入 Master 管理分片的数据分布,并支持 Range 分区,可以更好的实现全局有序的特性; 支持事务机制,通过 MVCC 的方式支持快照级别隔离,object rename 的实现更加高效; 支持完善的数据备份机制,流式存量数据导出和实时增量同步,可支持天级导出千亿级数据。