云原生知识宇宙

其他

打造云原生大型分布式监控系统(二): Thanos 架构详解

这个组件应运而生,它读取对象存储的数据,对其进行压缩以及降采样再上传到对象存储,这样在查询大时间范围数据时就可以只读取压缩和降采样后的数据,极大地减少了查询的数据量,从而加速查询。
2020年4月6日
其他

打造云原生大型分布式监控系统(一): 大规模场景下 Prometheus 的优化手段

本身只支持单机部署,没有自带支持集群部署,也就不支持高可用以及水平扩容,在大规模场景下,最让人关心的问题是它的存储空间也受限于单机磁盘容量,磁盘容量决定了单个
2020年3月27日
其他

Kubernetes 疑难杂症排查分享: 诡异的 No route to host

关键字,但讨论的跟我们这个其实是同一个问题。我也参与了讨论,有兴趣的同学可以看下:https://github.com/kubernetes/kubernetes/issues/81775
2019年12月15日
其他

Kubernetes 网络疑难杂症排查分享

https://github.com/torvalds/linux/commit/4396e46187ca5070219b81773c4e65088dac50cc
2019年8月12日
其他

Kubernetes 最佳实践:处理容器数据磁盘被写满

10.179.80.31定位根因,彻底解决问题定位方法见附录,这里列举根因对应的解决方法:日志输出量大导致磁盘写满:减少日志输出增大磁盘空间减小单机可调度的pod数量可写层量大导致磁盘写满:
2019年6月7日