查看原文
其他

吐槽PG表空间搞得跟"玩具"一样,全靠ZFS来凑

digoal PostgreSQL码农集散地 2024-07-08

文中参考文档点击阅读原文打开, 同时推荐2个学习环境: 

1、懒人Docker镜像, 已打包200+插件:《最好的PostgreSQL学习镜像

2、有web浏览器就能用的云起实验室: 《免费体验PolarDB开源数据库

3、PolarDB开源数据库内核、最佳实践等学习图谱:  https://www.aliyun.com/database/openpolardb/activity 

关注公众号, 持续发布PostgreSQL、PolarDB、DuckDB等相关文章. 


第29期吐槽:PG 表空间容易达到文件系统天花板

1、产品的问题点

  • PG 表空间容易达到文件系统天花板

2、问题点背后涉及的技术原理

  • PG的表空间创建在文件系统之上, 每个表空间对应1个目录. 表空间的大小取决于文件系统的大小.

  • 数据库中占用空间较大的table、index存放在表空间内, 最小粒度为分区粒度.

3、这个问题将影响哪些行业以及业务场景

  • 通用

4、会导致什么问题?

  • 表空间使用率监控比较复杂, 需要监控表空间目录占用空间, 同时需要监控文件系统剩余空间.

    • 比较难做计划, 因为文件系统可能被表空间以外的其他文件占用.

  • 文件系统使用率达到上限后, 这个表空间也将达到上限, 需要通过挪动表、索引(move tablespace)或者扩展底层文件系统来增加剩余空间.

  • 如果服务器的存储由很多块盘组成, 要利用所有的存储空间, 需要为每块盘创建一个文件系统, 对应1个表空间.

  • 扩展底层文件系统涉及到增加块设备, 文件系统的resize. 管理比较复杂

  • 大表可能超过文件系统的大小, 只能通过分区+多个文件系统(多个表空间)解决.

5、业务上应该如何避免这个坑

  • 在块设备和文件系统之间加一层卷管理系统, 例如 lvm , zfs(zpool)。其实zfs除了可以屏蔽底层块设备,还有很多好处:ssd与磁盘混合存储可以使用l2arc和zil技术利用ssd来提升zfs读写性能。支持快照备份,克隆等技术,实现高速实例级别的备份和闪回。压缩技术实现存储成本的降低。通过快照传输技术实现高速数据库传送。zfs对于PG这种存储管理不是很好的数据库非常的棒。

  • 每个盘对应一个表空间, 提前规划好表空间的使用

6、业务上避免这个坑牺牲了什么, 会引入什么新的问题

  • 每个盘对应1个表空间, 意味着1个表只能存储在1个盘上, 没有充分利用多个块设备的并行带宽.

  • 使用lvm或zfs增加了管理复杂度, 在线扩展受限于块设备、卷管理、文件系统是否支持online resize/extend.

  • 使用lvm或zfs可以采用条带形式组织多个块设备, 但是增加了一个管理层, 增加了复杂度, 而且并行的带宽会有一定的损耗.

7、数据库未来产品迭代如何修复这个坑

  • 在表空间和文件系统之间, 增加一层数据文件, 在数据文件内重新组织数据和表(索引)的映射关系.

    • 类似于Oracle, 但是这个方法也有问题, 例如数据文件的水位问题, 会导致空间浪费, 对于一个机器跑多个实例会造成较大的磁盘浪费. 适合比较固定的业务.

  • 其他方法.


本期彩蛋-招商中,有需要的小伙伴可联系嵌入...


文章中的参考文档请点击阅读原文获得. 


欢迎关注我的github (https://github.com/digoal/blog) , 学习数据库不迷路.  

近期正在写公开课材料, 未来将通过视频号推出, 欢迎关注视频号:


继续滑动看下一个
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存