SRE实践的知识体系梳理分享

作者:中国SRE联盟 时间:2022-10-26
回归 IT 系统动态存在的本源,平衡质量和变化的矛盾。追溯 SRE 的源头,探讨在云计算时代大潮中,我们的业务系统稳定性建设应该何去何从。

 《Google SRE工作手册》第一期SRE实践的知识体系梳理分享


回归 IT 系统动态存在的本源,平衡质量和变化的矛盾。追溯 SRE 的源头,探讨在云计算时代大潮中,我们的业务系统稳定性建设应该何去何从。

一、Google SRE系列丛书  

(1)《Google SRE运维解密》

《Google SRE运维解密》


(2)《Google SRE工作手册》

《Google SRE工作手册》


(3)《Google 系统架构解密》

《Google 系统架构解密》


二、作者对《Google SRE工作手册》的总结

1、致力于设定清晰的、量化的服务承诺;

2、通过有限的监控指标,持续地觉知,进入精确的量化管理;

3、轮值人员随时待命,确保实现所做出的服务目标承诺,同时避免过度的人工干预,谨防自动化形同虚设;


三、作者对 SRE 的核心观点

1、可共用的服务才是有价值的服务,而 SRE 的解决方案量化了这个目标,是做什么工作,和工作的优先级排序有了决策依据。

2、2008 年参加首届 O’Reilly Velocity 大会,和 Patrick Debois 相遇,DevOps 还没有问世。如果那时第一本 SRE 书已经问世了,社区里如果高举“消除琐事”的大旗的话,DevOps 这个术语甚至不会出现 。

3、对 DevOps 的定义:基于人与人之间的协同,用软件优化人的绩效和运维工作的体验。似乎这也是一个很好的对 SRE 的定义。

4、SRE 从理论到实践都是 DevOps最先进的一种实现方式。

5、认为 SRE 是运维之道是管中窥豹的看法;SRE 实践不仅支持着软件开发,也同时改变这架构、安全性、治理方式等。

6、SRE 将对幻灯片和检查单的依赖,对奢望程序总能正常运行的依赖,越来越多第移到了软件工程、现代化架构和安全理念上来。


四、《Google SRE工作手册》编著小组有话说

1、回顾第一本 SRE 书的由来和反馈。 

2、阐述编写第二本 SRE 书的目标: 

2.1. 为第一本书增加更多的实施细节

2.2. 打消“SRE 只能在 Google 规模 或者文化中实现”

3、如何阅读第二本书:

3.1. 和第一本书配套阅读

3.2. 第一本书着重与原理和思想,第二本讨论如何应用原理和思想

3.3. 第二本书里包含了大量的传统企业实施案例

3.4. 第二本书一开篇就补充说明和 SRE 与 DevOps 的关系


五、SRE知识体系脑图  

SRE管理体系脑图


六、《Google SRE 工作手册》系列分享之SRE 实践的知识体系梳理的直播视频回放

《Google SRE工作手册》视频回放


扫码添加小艾老师的微信,获取直播分享资料哦~

艾老师微信