其他
备战双 11!蚂蚁金服万级规模 K8s 集群管理系统如何设计?
导读:Kubernetes 的出现使得广大开发同学也能运维复杂的分布式系统,它大幅降低了容器化应用部署的门槛,但运维和管理一个生产级的高可用 Kubernetes 集群仍十分困难。本文将分享蚂蚁金服是如何有效可靠地管理大规模 Kubernetes 集群的,并会详细介绍集群管理系统核心组件的设计。
设计模式
架构设计
集群终态保持器
节点终态保持器
节点系统配置、内核补丁管理; docker / kubelet 等组件安装、升级、卸载; 节点终态和可调度状态管理(如关键 DaemonSet 部署完成后才允许开启调度); 节点故障自愈。
节点终态管理
全量 ReadinessGates: 记录节点可调度需要检查的 Condition 列表; Condition ConfigMap: 各节点运维 Operators 终态状态上报 ConfigMap;
外部节点运维 Operators 检测并上报与自己相关的子终态数据至对应的 Condition ConfigMap; Machine-Operator 根据标签获取节点相关的所有子终态 Condition ConfigMap,并同步至 Machine status 的 conditions 中; Machine-Operator 根据全量 ReadinessGates 中记录的 Condition 列表,检查节点是否达到终态,未达到终态的节点不开启调度。
节点故障自愈
风险防范
推荐阅读:
i 智慧 | 深度广度并举,AWS容器服务再推利器! 20个让程序员崩溃的瞬间,你遇到过几个?| IT 巨能唠 率清华团队研发“天机芯”登《Nature》封面,他说类脑计算是发展人工通用智能的基石
成也萧何,败也萧何?加密技术被恶意利用成为2019年最恶劣的攻击软件之一! 拥有自我意识、自我模拟的粒子机器人来了!
美国爆料:量子计算机将如何颠覆一切?