SRE是什么鬼?——来自Google DevOps经验的落地实践
Google SRE负责生产运维,管理着全球上百万台服务器和上面数不清的应用,他们的一举一动都会影响全球千百万用户。
在本次QCon上海2015的演讲中,曾身为Google SRE(2007-2014)一员的孙宇聪和大家分享了以下几点:
Google SRE是怎样一个团队,有哪些特点,和传统运维团队的定义有哪些不同,其中重点讲SRE如何在早期,中期,以及长期为项目提供持续性支持;
在采用Docker等新技术降低传统运维的门槛的同时,运维team在软件生命周期中如何自我定位,实现自我价值;
从Google带来的运维团队建设Best practices;
运维团队如何系统性的推动全公司研发体系观念的转变,从哪方面推动Reliability和Robustness的革新。
https://v.qq.com/txp/iframe/player.html?vid=w0321zt0v29&width=500&height=375&auto=0
孙宇聪,Coding.net 技术负责人。Google Senior Site Reliblity Engineer(2007-2014)就职于Moutain View总部。
主要项目:
Youtube视频转码/存储/直播管理系统(系统吞吐量超过1Peta bytes/月)
Youtube CDN网络管理系统(峰值流量~10Tbps)
Youtube直播系统(2012 Summer Olympics)
Borg/Omega,GCE全球百万台服务器生命周期管理系统及任务管理系统
在公众号后台回复“SRE”,即可下载幻灯片。
▽
延展阅读(点击标题):
看豆瓣如何加固「监控」这条防线
QCon上海2016将于10月20~22日在上海宝华万豪酒店举行,届时将有一大波技术专家带来精彩演讲。
朱攀 德比软件资深架构师
2007年2月加入德比软件,负责数据对接平台的架构和实现;作为德比软件早期员工,从无到有的主导了德比软件数据对接平台的架构设计和实现,完成了数据对接平台多个版本的架构改进和升级,数据对接平台每天处理的API调用从0增长到现在的8亿+;期间设计并实现了很多必要的基础设施和服务,如内部的RPC框架derbysoft-rpc,路由服务 DSwitch,分布式存储服务DStorage,网关服务DGateway等,主要编程语言Golang,Scala,Java。
《德比软件数据对接平台高可用架构实践》
未建立在业务基础上的高可用不是真正的高可用,真正的高可用架构,不能局限于技术层面的高可用,应以业务的需求为出发点,结合技术,通盘考虑架构的设计。
德比软件(DerbySoft)的数据对接平台为全球顶级的酒店集团及其分销渠道提供数据对接服务,接入的用户包括全球前十的酒店集团、Google、Expedia、booking.com、ctrip等,对平台的可用性要求非常高,发生故障会显著的降低酒店价格的准确率,给客户带来损失。
在客户和数据飞速增长过程中,我们如何保证服务稳定、支撑海量访问、并确保各个服务的SLA达标?有哪些方法或手段可以有效的提高服务的可用性?在架构上采用了哪些措施和策略来保障业务层面的可用性?我将在这里和大家分享德比软件数据对接平台的架构实践和经验。
Kinshuk Mishra Spotify广告工程技术总监
Kinshuk的团队负责Spotify的广告基础设施、多平台广告产品和广告优化。Kinshuk擅长构建互联网消费级应用,曾涉足电商、旅游、游戏等不同领域。作为早期加入Spotify的工程师之一,他在推动Spotify工程技术演进方面做了很多工作。
《Spotify广告系统架构演进》
在产品高速成长的公司中,随着技术的改进,系统的持续演进是不可避免的。产品和业务需求也不断演进,规模的变化又会影响运营成本。
近年来,Spotify的广告系统经历了几次大的变化。对Spotify的广告技术栈而言,性能是刚需——要做到大规模、高可用、低延迟。任何宕机或业务中断都会直接影响收入。随着新兴消费平台的兴起,后端和数据基础设施技术也已经成熟,Spotify的产品也有很多改进。广告技术系统的需求也在变化。Kinshuk将在演讲中分享保证日常服务不中断的前提下改进Spotify广告系统的经验。
LinkedIn Kafka组高级软件工程师秦江杰,苏宁云商IT总部执行总裁助理乔新亮,声网CEO赵斌,阿里巴巴无线技术专家隐风,华为软件云平台资深架构师苗彩霞,LinkedIn业务分析经理赵晟等技术专家都将在QCon上海2016做分享,更多信息,可点击“阅读原文”,访问大会网站。现在报名,可享8折优惠。