SlideShare a Scribd company logo
《SRE》第 31 章
Cheng Wei Chen @ SRE 讀書會 2018.5.10
導讀
SRE 具備特殊的組織地位
SRE 注重「務實」,
而具備「靈活性」
工作及作業模式
‧ 具有巨大的多樣性
‧ 包含 infra、service、product
‧ 與大小規模不同之產品開發團隊協
同合作
‧ 甚至 SRE 本身即是研發團隊
工作及作業模式
‧ SRE 具備多重能力
‧ 系統工程與架構能力
‧ 軟體工程技術
‧ 專案管理能力
‧ 領導能力、各種產業背景知識
SRE 並非單純僅是「支援」
或「研發」的團隊
而是面向服務,
獨立的支持系統
SRE 的承諾
‧ 專門負責「可靠性」
‧ 擁有產品開發團隊之技能
‧ 以量化的方式持續改善
溝通與協作是 SRE 工作
中非常重要的維度
SRE 的協同合作
‧ 奠基於
‧ 軟體工程技能
‧ 系統工程的專業知識
‧ Production 經驗
‧ 文化、相互尊重
SRE 的協同合作
‧ 奠基於
‧ 軟體工程技能
‧ 系統工程的專業知識
‧ Production 經驗
‧ 文化、相互尊重
最佳
設計與實作
的溫床
Production Meeting
‧ 目標:
‧ 讓參與者針對服務的狀態,達成
一致的共識。
‧ 獲取知識->改善服務
Production Meeting
‧ 頻率與時間:
‧ 每週一次
‧ 30 ~ 60 分鐘
Production Meeting
‧ 會議主席:
‧ 輪流擔任
‧ 由規模較小的團隊中選擇
‧ 有助提升參與感、個人主持能力
Production Meeting
‧ 議程:(舉例)
‧ Upcoming production changes
‧ Metrics
‧ Outages
Production Meeting
‧ 出席人員
‧ SRE 團隊所有成員
‧ 產品負責人
‧ 具合作關係之開發團隊
‧ 利害關係人
SRE 的內部協作
‧ SRE 團隊特性
‧ 需要負責緊急應變與 on-call
‧ 分散式、跨時區團隊
‧ 大小不同規模
‧ 實體及虛擬團隊
SRE 的內部協作
‧ SRE 團隊組成
‧ 系統工程與軟體工程
‧ 組織能力與管理能力
‧ 其他……
SRE 的內部協作
‧ SRE 團隊組成
‧ 為了掌握先進技術
‧ 形成多樣性、專業化的多重組合
‧ 避免認知偏差
SRE 的內部協作
‧ SRE 團隊組成
‧ 技術長 TL,tech lead
‧ SRE 經理
‧ 專案經理 PM、TPM、PGM
SRE 的內部協作
‧ 高效工作的技巧
‧ 基本上市面上常見技巧,也同能
適用於 SRE 團隊
‧ 良好的溝通技巧
‧ 人與人的信賴關係
協作案例:Viceroy
‧ 案例背景
‧ SRE 的組織架構導致經常產出
多種相同目的、類似的專案
‧ 監控儀表板即是其一
協作案例:Viceroy
‧ 案例背景 Borgmon
‧ 舊有的監控系統
‧ 過時、難用、不符合任何標準、
充滿限制、難以測試。
協作案例:Viceroy
‧ 案例背景 Monarch
‧ 多數團隊考慮使用
‧ 但針對複雜的監控儀表板之應用情境擴展能力
不佳。
‧ 不支援過去的模板,提高移轉難度
‧ 當時欠缺可行的部署方案,導致更多產生重複
的專案。
協作案例:Viceroy
‧ 案例分析
‧ 欠缺溝通、跨團隊專案追蹤和協
調能力
‧ 導致閉門造車、重複的勞動
協作案例:Viceroy
‧ 案例背景 Viceory
‧ 跨團隊聯合打造一個所有 SRE
團隊通用的解決方案
‧ 支援複雜、自訂的監控儀表板
‧ 同時支援 Monarch、Borgmon
協作案例:Viceroy
‧ 面臨的挑戰
‧ 跨地域的團隊溝通
‧ 書面和口語表達習慣的隱喻及暗示容
易被誤解
‧ 跨區域成員容易錯過會議前後的即興
討論
協作案例:Viceroy
‧ 面臨的挑戰
‧ 核心團隊之外的貢獻者人員變動快速
‧ 專案新人需要一定的培訓時間
‧ 導致維護者離開後,欠缺維護之相關
功能可能會被丟棄
協作案例:Viceroy
‧ 面臨的挑戰
‧ 專案規模膨脹,導致交付困難
‧ 也導致專案管理,確保專案目標
一致上的困難
協作案例:Viceroy
‧ 建議
‧ 非必要不應進行跨地域專案開發
‧ 因為需要更多溝通成本,導致工
作進度較慢
協作案例:Viceroy
‧ 建議
‧ 但反之,如能克服溝通問題,跨地
域專案開發可以擁有更高的產能
‧ 但反論,其實同地域團隊不代表就
不會產生溝通問題,因此皆需負擔
不同的溝通成本
協作案例:Viceroy
‧ 建議
‧ 慎選專案貢獻者
‧ 確保貢獻者能夠投入的時間
‧ 避免貢獻成果無人維護
協作案例:Viceroy
‧ 建議
‧ 慎選專案負責人
‧ 是否能定睛於專案願景
‧ 確保工作與願景相關
‧ 設定正確的工作優先度
協作案例:Viceroy
‧ 建議
‧ 建立獲得普遍認同的決策方式
‧ 建立認同感、信任感
協作案例:Viceroy
‧ 建議
‧ 針對跨地域專案,應該將專案分
割為許多小項目
‧ 分配給各相同地域之小組開發
‧ 減少溝通成本
協作案例:Viceroy
‧ 建議
‧ 續上
‧ 設定明確的目標與期限
‧ 注意康威定律的影響
協作案例:Viceroy
‧ 建議
‧ 遵守良好的軟體工程實踐
‧ 文件化、標準化
協作案例:Viceroy
‧ 建議
‧ 持續溝通、交流
‧ 保持適度的當面交流
SRE 與其他部門的協作
‧ 建議
‧ 最好在產品設計階段的早期
‧ SRE 適合提供架構及軟體行為
層面的建議
SRE 與其他部門的協作
‧ 協作
‧ 追蹤新的設計
‧ 提出建議
‧ 協助實行建議
‧ 直到正式部署為止
協作案例:移轉DFP
‧ 案例背景 - 將 DFP 移轉至 F1
‧ 既有服務之遷移
‧ Mysql -> F1
協作案例:移轉DFP
‧ 案例背景 - 將 DFP 移轉至 F1
‧ 移轉過程複雜
‧ 技術差異
‧ 資料表結構差異
‧ 必須即時移轉,不能中斷服務
協作案例:移轉DFP
‧ 案例背景 - 將 DFP 移轉至 F1
‧ 開發團隊熟悉軟體之業務邏輯
‧ SRE團隊熟悉 infra
協作案例:移轉DFP
‧ 案例說明
‧ 從一開始就計劃緊密合作
‧ 開發與SRE進行每週例會
協作案例:移轉DFP
‧ 案例說明
‧ 業務邏輯仰賴 infra
‧ 因此專案由 SRE 主導,從新的
infra 設計開始
‧ SRE 撰寫 infra 設計文件
協作案例:移轉DFP
‧ 案例說明
‧ 開發、SRE 共同審查 infra 設計
‧ 配合 infra 設計,調整業務邏輯
‧ 即早定義 infra 與業務邏輯之間
的介面
協作案例:移轉DFP
‧ 案例說明
‧ SRE 建立類正式環境進行測試、驗
證
‧ SRE 建立正式環境,設置所需資源、
監控規則、培訓on-call工程師、基
本的發行流程
小結
‧ 有效溝通
‧ 建立解決問題的通用方法
‧ 集結眾人之力解決更困難的問題
Thanks
Cheng Wei Chen @ SRE 讀書會 2018.5.10

More Related Content

PDF
SRE 讀書會 - 導讀:第一章
PPTX
DevOps的神鬼奇航
PDF
DevOps核心理念和實踐
PDF
Dev ops 簡介
PPTX
Frontend devops-v1.0
PPTX
[ Study4TW Visual Studio Everywhere ] Vsts + microsoft teams 建構企業的Devops
PDF
摩登開發團隊的DevOps之道 (@DevOpsTaiwan)
PDF
過來人經驗 - 在企業中推行 DevOps 前該具備的認知與工具箱
SRE 讀書會 - 導讀:第一章
DevOps的神鬼奇航
DevOps核心理念和實踐
Dev ops 簡介
Frontend devops-v1.0
[ Study4TW Visual Studio Everywhere ] Vsts + microsoft teams 建構企業的Devops
摩登開發團隊的DevOps之道 (@DevOpsTaiwan)
過來人經驗 - 在企業中推行 DevOps 前該具備的認知與工具箱

What's hot (20)

PDF
从CI到CD[麻袋理财王天青]v1
PDF
Effective DevOps (Agile Tour HsinChu 2017)
PDF
以自動化先行的 DevOps 實踐經驗分享
PPTX
Agile / Scrum
PDF
困境與轉型:一個小型開發團隊的 DevOps 學習之旅
PPTX
Rancher 快速打造叢集的解決方案
PDF
DevOpsDays Taipei 2017 Farewell
PDF
[Agile Tour Hsinchu 2019] Our practice in the DevOps Process for Manufacture ...
PDF
Continuous Delivery - 敏捷開發的最後一哩路
PDF
微軟 Hololens 混合現實平台開發
PPTX
從研發團隊管理及產品發展的角度看 DevOps
PDF
DevOps to Agile 敏捷轉型經驗  (From DevOps to Agile: Transformation Experience of G...
PPTX
大型製造業實踐DevOps 團隊之路
PDF
GitLab Auto DevOps 大解析—CI/CD 原來可以這樣做
PPTX
[2018 DevOps Days]大型企業如何推行DevOps
PDF
[2021 DevDays]Microsoft Teams 整合 Azure DevOps之實務應用
PDF
01 DevOps and Azure DevOps overview
PPTX
Cloud and-devops
PPTX
Let's look at Compliance, while accelerating (DevOpsDays TPE 2021)
PPTX
[2021 .NET Conf]善用 Azure Monitor 服務打造 DevOps 監控一環
从CI到CD[麻袋理财王天青]v1
Effective DevOps (Agile Tour HsinChu 2017)
以自動化先行的 DevOps 實踐經驗分享
Agile / Scrum
困境與轉型:一個小型開發團隊的 DevOps 學習之旅
Rancher 快速打造叢集的解決方案
DevOpsDays Taipei 2017 Farewell
[Agile Tour Hsinchu 2019] Our practice in the DevOps Process for Manufacture ...
Continuous Delivery - 敏捷開發的最後一哩路
微軟 Hololens 混合現實平台開發
從研發團隊管理及產品發展的角度看 DevOps
DevOps to Agile 敏捷轉型經驗  (From DevOps to Agile: Transformation Experience of G...
大型製造業實踐DevOps 團隊之路
GitLab Auto DevOps 大解析—CI/CD 原來可以這樣做
[2018 DevOps Days]大型企業如何推行DevOps
[2021 DevDays]Microsoft Teams 整合 Azure DevOps之實務應用
01 DevOps and Azure DevOps overview
Cloud and-devops
Let's look at Compliance, while accelerating (DevOpsDays TPE 2021)
[2021 .NET Conf]善用 Azure Monitor 服務打造 DevOps 監控一環
Ad

Similar to SRE 讀書會 - 導讀:第 31 章 (9)

PDF
從緊急事件 談 SRE 應變能力的培養 - DevOpsDays Taipei 2018
PDF
2023 08 - SRE 實踐與開發平台指南 - 書友見面會
PDF
SRE CH33/CH34 - Lessons Learned from Other Industries/Conclusion
PDF
災難演練 @ AWS 實戰分享 (Using AWS for Disaster Recovery)
PDF
SRE Study Notes - Opening, CH1
PPTX
Je pm-comm-chapter3-trustcircle-v1.0
PDF
百人團隊敏捷轉型暨持續性整合與交付實踐
PPT
9501 tm-chapter3
PDF
RSG Taipei 2023 LeSS Design Principles
從緊急事件 談 SRE 應變能力的培養 - DevOpsDays Taipei 2018
2023 08 - SRE 實踐與開發平台指南 - 書友見面會
SRE CH33/CH34 - Lessons Learned from Other Industries/Conclusion
災難演練 @ AWS 實戰分享 (Using AWS for Disaster Recovery)
SRE Study Notes - Opening, CH1
Je pm-comm-chapter3-trustcircle-v1.0
百人團隊敏捷轉型暨持續性整合與交付實踐
9501 tm-chapter3
RSG Taipei 2023 LeSS Design Principles
Ad

More from Chen Cheng-Wei (20)

PDF
GitOps is IaC done right
PDF
From DevOps to GitOps with GitLab
PDF
Become a GitLab Hero
PDF
和艦長一起玩轉 GitLab & GitLab Workflow
PDF
SRE 讀書會:導讀《持續交付》第15章 - 持續交付管理
PDF
DevOpsDays Taiepi 2018 - Farewell 閉幕
PDF
SRE 讀書會 - 導讀:第 30 章
PDF
跟著 geerlingguy 大神
一起測試 Ansible Roles
PDF
iThome Serverless All-Star 開場
PDF
CI/CD、自動化,你還沒準備好(GCPUG.TW Meetup #34)
PDF
Ignite talks
PDF
Ansible & GitLab CI / CD Workshop 101 ( @Agile Tour Taipei 2017)
PDF
CI、CD、Automation你還沒準備好!?(Agile Tour Kaohsiung 2017)
PDF
DevOpsDays Taipei 2017 Opening Talk
PDF
Effective DevOps:一場文化與技術的轉型運動
PDF
Ignite talks - 自動化的關鍵
PDF
提到 DevOps 到底在
談些什麼玩意兒?(@ Agile Tour Taichung 2017)
PDF
提到 DevOps 到底在談些什麼玩意兒?
PDF
PHP Conf Taiwan 2016 自動化與持續整合實作工作坊
PDF
快快樂樂打造自動化開發環境
GitOps is IaC done right
From DevOps to GitOps with GitLab
Become a GitLab Hero
和艦長一起玩轉 GitLab & GitLab Workflow
SRE 讀書會:導讀《持續交付》第15章 - 持續交付管理
DevOpsDays Taiepi 2018 - Farewell 閉幕
SRE 讀書會 - 導讀:第 30 章
跟著 geerlingguy 大神
一起測試 Ansible Roles
iThome Serverless All-Star 開場
CI/CD、自動化,你還沒準備好(GCPUG.TW Meetup #34)
Ignite talks
Ansible & GitLab CI / CD Workshop 101 ( @Agile Tour Taipei 2017)
CI、CD、Automation你還沒準備好!?(Agile Tour Kaohsiung 2017)
DevOpsDays Taipei 2017 Opening Talk
Effective DevOps:一場文化與技術的轉型運動
Ignite talks - 自動化的關鍵
提到 DevOps 到底在
談些什麼玩意兒?(@ Agile Tour Taichung 2017)
提到 DevOps 到底在談些什麼玩意兒?
PHP Conf Taiwan 2016 自動化與持續整合實作工作坊
快快樂樂打造自動化開發環境

SRE 讀書會 - 導讀:第 31 章