TakinTalks稳定性社区

「社区发起人推荐语」——1.分布式系统无法保障绝对可用，相信大家都碰到过软件系统长时间不可用。面对类似问题，美国经济学家⽶歇尔·渥克提出了灰犀牛理论，用灰犀牛⽐喻⼤概率且影响巨⼤的潜在危机。2.如果你也面临复杂系统稳定性保障的难题，推荐阅读本文，武老师给你讲述B站如何遭遇、盯紧、应对稳定性”灰犀牛“的故事，希望对你有一定启发。——杨德华

TakinTalks稳定性社区 -

2022年7月21日

其他

B站713崩盘、复原、处理、优化全过程实录｜TakinTalks推荐阅读

著名的B站713故障想必大家都记忆犹新吧，本文详细讲述了713故障背后的故事，值得细细品味。此外本周六我们邀请了B站老师来讲讲《B站713后的多活容灾建设》，欢迎大家来直播间交流！至暗时刻2021年7月13日22:52，SRE收到大量服务和域名的接入层不可用报警，客服侧开始收到大量用户反馈B站无法使用，同时内部同学也反馈B站无法打开，甚至APP首页也无法打开。基于报警内容，SRE第一时间怀疑机房、网络、四层LB、七层SLB等基础设施出现问题，紧急发起语音会议，拉各团队相关人员开始紧急处理（为了方便理解，下述事故处理过程做了部分简化）。初因定位22:55

TakinTalks稳定性社区 -

2022年7月15日

bxrf的瓜

失信被执行人的孩子上学受影响吗？最高法明确：受限！

”FAN某”的离婚财产分割判决书（全文）

”FAN某”的离婚财产分割判决书（全文）

公益慈善｜“翼行天下一生守护”慈善项目捐赠仪式圆满举行！

去哪儿的常态化容量保障是怎么做的？

美图是如何搭建压测监控一体化平台的？

美图SRE：一次线上大事故，我悟出了故障治理的3步9招

阿里云弹性计算SRE实践：亿级调用量下的预警治理六要素

监控告警怎么搭建比较合理？B站SRE实践总结了4大关键步骤｜TakinTalks大咖分享

故障复盘后的告警如何加出效果？浙江移动等老司机总结了4条注意事项｜TakinTalks热点话题

10年稳定性保障经验总结，故障复盘要回答哪三大关键问题？｜TakinTalks大咖分享

B站SRE负责人亲述 713事故后的多活容灾建设｜TakinTalks大咖分享

B站713崩盘、复原、处理、优化全过程实录｜TakinTalks推荐阅读

{{{title}}}

bxrf的瓜

失信被执行人的孩子上学受影响吗？最高法明确：受限！

”FAN某”的离婚财产分割判决书（全文）

”FAN某”的离婚财产分割判决书（全文）

公益慈善｜“翼行天下 一生守护”慈善项目捐赠仪式圆满举行！

TakinTalks稳定性社区

公益慈善｜“翼行天下一生守护”慈善项目捐赠仪式圆满举行！