Submit Search
20211109 JAWS-UG SRE keynotes
Download as PPTX, PDF
1 like
2,121 views
Amazon Web Services Japan
2021年11月9日 JAWS-UG SRE支部 第1回勉強会 登壇資料 大村幸敬
Software
Read more
1 of 37
Download now
Downloaded 21 times
1
2
3
4
5
6
Most read
7
8
Most read
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
More Related Content
PDF
SaaS テナント毎のコストを把握するための「AWS Application Cost Profiler」のご紹介
Amazon Web Services Japan
PDF
AWS Black Belt Online Seminar 2017 Auto Scaling
Amazon Web Services Japan
PDF
20180704(20190520 Renewed) AWS Black Belt Online Seminar Amazon Elastic File ...
Amazon Web Services Japan
PDF
20200617 AWS Black Belt Online Seminar Amazon Athena
Amazon Web Services Japan
PDF
20180425 AWS Black Belt Online Seminar Amazon Relational Database Service (Am...
Amazon Web Services Japan
PDF
20201028 AWS Black Belt Online Seminar Amazon CloudFront deep dive
Amazon Web Services Japan
PDF
20210330 AWS Black Belt Online Seminar AWS Glue -Glue Studioを使ったデータ変換のベストプラクティス-
Amazon Web Services Japan
PDF
20180509 AWS Black Belt Online Seminar Amazon GuardDuty
Amazon Web Services Japan
SaaS テナント毎のコストを把握するための「AWS Application Cost Profiler」のご紹介
Amazon Web Services Japan
AWS Black Belt Online Seminar 2017 Auto Scaling
Amazon Web Services Japan
20180704(20190520 Renewed) AWS Black Belt Online Seminar Amazon Elastic File ...
Amazon Web Services Japan
20200617 AWS Black Belt Online Seminar Amazon Athena
Amazon Web Services Japan
20180425 AWS Black Belt Online Seminar Amazon Relational Database Service (Am...
Amazon Web Services Japan
20201028 AWS Black Belt Online Seminar Amazon CloudFront deep dive
Amazon Web Services Japan
20210330 AWS Black Belt Online Seminar AWS Glue -Glue Studioを使ったデータ変換のベストプラクティス-
Amazon Web Services Japan
20180509 AWS Black Belt Online Seminar Amazon GuardDuty
Amazon Web Services Japan
What's hot
(20)
PDF
[AWS EXpert Online for JAWS-UG 18] 見せてやるよ、Step Functions の本気ってやつをな
Amazon Web Services Japan
PDF
AWS Black Belt Online Seminar 2017 Amazon ElastiCache
Amazon Web Services Japan
PDF
20190911 AWS Black Belt Online Seminar AWS Batch
Amazon Web Services Japan
PDF
20190206 AWS Black Belt Online Seminar Amazon SageMaker Basic Session
Amazon Web Services Japan
PDF
20190521 AWS Black Belt Online Seminar Amazon Simple Email Service (Amazon SES)
Amazon Web Services Japan
PDF
AWS Black Belt Online Seminar 2017 Amazon S3
Amazon Web Services Japan
PDF
AWS Black Belt Online Seminar AWSで実現するDisaster Recovery
Amazon Web Services Japan
PDF
20200630 AWS Black Belt Online Seminar Amazon Cognito
Amazon Web Services Japan
PDF
20190604 AWS Black Belt Online Seminar Amazon Simple Notification Service (SNS)
Amazon Web Services Japan
PDF
20201118 AWS Black Belt Online Seminar 形で考えるサーバーレス設計 サーバーレスユースケースパターン解説
Amazon Web Services Japan
PDF
20190326 AWS Black Belt Online Seminar Amazon CloudWatch
Amazon Web Services Japan
PDF
機密データとSaaSは共存しうるのか!?セキュリティー重視のユーザー層を取り込む為のネットワーク通信のアプローチ
Amazon Web Services Japan
PDF
20210526 AWS Expert Online マルチアカウント管理の基本
Amazon Web Services Japan
PDF
CloudFormation/SAMのススメ
Eiji KOMINAMI
PDF
20191023 AWS Black Belt Online Seminar Amazon EMR
Amazon Web Services Japan
PDF
20190723 AWS Black Belt Online Seminar AWS CloudHSM
Amazon Web Services Japan
PDF
20200722 AWS Black Belt Online Seminar AWSアカウント シングルサインオンの設計と運用
Amazon Web Services Japan
PDF
20210216 AWS Black Belt Online Seminar AWS Database Migration Service
Amazon Web Services Japan
PDF
20191002 AWS Black Belt Online Seminar Amazon EC2 Auto Scaling and AWS Auto S...
Amazon Web Services Japan
PDF
20190806 AWS Black Belt Online Seminar AWS Glue
Amazon Web Services Japan
[AWS EXpert Online for JAWS-UG 18] 見せてやるよ、Step Functions の本気ってやつをな
Amazon Web Services Japan
AWS Black Belt Online Seminar 2017 Amazon ElastiCache
Amazon Web Services Japan
20190911 AWS Black Belt Online Seminar AWS Batch
Amazon Web Services Japan
20190206 AWS Black Belt Online Seminar Amazon SageMaker Basic Session
Amazon Web Services Japan
20190521 AWS Black Belt Online Seminar Amazon Simple Email Service (Amazon SES)
Amazon Web Services Japan
AWS Black Belt Online Seminar 2017 Amazon S3
Amazon Web Services Japan
AWS Black Belt Online Seminar AWSで実現するDisaster Recovery
Amazon Web Services Japan
20200630 AWS Black Belt Online Seminar Amazon Cognito
Amazon Web Services Japan
20190604 AWS Black Belt Online Seminar Amazon Simple Notification Service (SNS)
Amazon Web Services Japan
20201118 AWS Black Belt Online Seminar 形で考えるサーバーレス設計 サーバーレスユースケースパターン解説
Amazon Web Services Japan
20190326 AWS Black Belt Online Seminar Amazon CloudWatch
Amazon Web Services Japan
機密データとSaaSは共存しうるのか!?セキュリティー重視のユーザー層を取り込む為のネットワーク通信のアプローチ
Amazon Web Services Japan
20210526 AWS Expert Online マルチアカウント管理の基本
Amazon Web Services Japan
CloudFormation/SAMのススメ
Eiji KOMINAMI
20191023 AWS Black Belt Online Seminar Amazon EMR
Amazon Web Services Japan
20190723 AWS Black Belt Online Seminar AWS CloudHSM
Amazon Web Services Japan
20200722 AWS Black Belt Online Seminar AWSアカウント シングルサインオンの設計と運用
Amazon Web Services Japan
20210216 AWS Black Belt Online Seminar AWS Database Migration Service
Amazon Web Services Japan
20191002 AWS Black Belt Online Seminar Amazon EC2 Auto Scaling and AWS Auto S...
Amazon Web Services Japan
20190806 AWS Black Belt Online Seminar AWS Glue
Amazon Web Services Japan
Ad
Similar to 20211109 JAWS-UG SRE keynotes
(20)
PDF
2019年9月18日開催AWS Japan × Atlassianセミナー_セッション2「AmazonカルチャーとDevOps」
アトラシアン株式会社
PDF
FutureStack Tokyo 19 -[パートナー講演]アマゾン ウェブ サービス ジャパン株式会社: New Relicを活用したAWSへのアプリ...
New Relic
PDF
AWS における Microservices Architecture と DevOps を推進する組織と人とツール
Amazon Web Services Japan
PDF
AWS Well-Architected Security とベストプラクティス
Amazon Web Services Japan
PDF
開発者におくるサーバーレスモニタリング
Amazon Web Services Japan
PDF
ハイブリットクラウド環境におけるモダンアプリケーション開発
政雄 金森
PDF
202202 AWS Black Belt Online Seminar AWS SaaS Boost で始めるSaaS開発⼊⾨
Amazon Web Services Japan
PPTX
Reinforce2021 recap session2
Shogo Matsumoto
PDF
パッケージソフトウェアを簡単にSaaS化!?既存の資産を使ったSaaS化手法のご紹介
Amazon Web Services Japan
PDF
Smart store servlerless-20191030-40min
Microsoft Azure Japan
PDF
クラウドを積極活用したサービスの開発のために
Yuichiro Saito
PDF
MicrosoftのOSSへの取り組み
Shinichiro Arai
PDF
[JAWS Days 2020] AWS Well-Architected フレームワークのご紹介
Takanori Ohba
PDF
DOO-004_楽天での DevOps 実践事例と Azure ベスト プラクティス
decode2016
PDF
アマゾンにおけるAWSを用いた社内システム移行事例
SORACOM, INC
PPTX
クラウド移行で改善するガバナンスファーストのWebサービス障害対策について
TakashiTsukamoto4
PDF
20160629 aws well-architected
Takashi Koyanagawa
PDF
20210309 AWS Black Belt Online Seminar AWS Audit Manager
Amazon Web Services Japan
PDF
[CTO Night & Day 2019] CTO のための一歩進んだコンテナ入門 #ctonight
Amazon Web Services Japan
PPTX
いまさら聞けない Amazon EC2
Yasuhiro Matsuo
2019年9月18日開催AWS Japan × Atlassianセミナー_セッション2「AmazonカルチャーとDevOps」
アトラシアン株式会社
FutureStack Tokyo 19 -[パートナー講演]アマゾン ウェブ サービス ジャパン株式会社: New Relicを活用したAWSへのアプリ...
New Relic
AWS における Microservices Architecture と DevOps を推進する組織と人とツール
Amazon Web Services Japan
AWS Well-Architected Security とベストプラクティス
Amazon Web Services Japan
開発者におくるサーバーレスモニタリング
Amazon Web Services Japan
ハイブリットクラウド環境におけるモダンアプリケーション開発
政雄 金森
202202 AWS Black Belt Online Seminar AWS SaaS Boost で始めるSaaS開発⼊⾨
Amazon Web Services Japan
Reinforce2021 recap session2
Shogo Matsumoto
パッケージソフトウェアを簡単にSaaS化!?既存の資産を使ったSaaS化手法のご紹介
Amazon Web Services Japan
Smart store servlerless-20191030-40min
Microsoft Azure Japan
クラウドを積極活用したサービスの開発のために
Yuichiro Saito
MicrosoftのOSSへの取り組み
Shinichiro Arai
[JAWS Days 2020] AWS Well-Architected フレームワークのご紹介
Takanori Ohba
DOO-004_楽天での DevOps 実践事例と Azure ベスト プラクティス
decode2016
アマゾンにおけるAWSを用いた社内システム移行事例
SORACOM, INC
クラウド移行で改善するガバナンスファーストのWebサービス障害対策について
TakashiTsukamoto4
20160629 aws well-architected
Takashi Koyanagawa
20210309 AWS Black Belt Online Seminar AWS Audit Manager
Amazon Web Services Japan
[CTO Night & Day 2019] CTO のための一歩進んだコンテナ入門 #ctonight
Amazon Web Services Japan
いまさら聞けない Amazon EC2
Yasuhiro Matsuo
Ad
More from Amazon Web Services Japan
(20)
PDF
202205 AWS Black Belt Online Seminar Amazon VPC IP Address Manager (IPAM)
Amazon Web Services Japan
PDF
202205 AWS Black Belt Online Seminar Amazon FSx for OpenZFS
Amazon Web Services Japan
PDF
202204 AWS Black Belt Online Seminar AWS IoT Device Defender
Amazon Web Services Japan
PDF
Infrastructure as Code (IaC) 談義 2022
Amazon Web Services Japan
PDF
202204 AWS Black Belt Online Seminar Amazon Connect を活用したオンコール対応の実現
Amazon Web Services Japan
PDF
202204 AWS Black Belt Online Seminar Amazon Connect Salesforce連携(第1回 CTI Adap...
Amazon Web Services Japan
PDF
Amazon Game Tech Night #25 ゲーム業界向け機械学習最新状況アップデート
Amazon Web Services Japan
PPTX
20220409 AWS BLEA 開発にあたって検討したこと
Amazon Web Services Japan
PDF
202202 AWS Black Belt Online Seminar AWS Managed Rules for AWS WAF の活用
Amazon Web Services Japan
PDF
202203 AWS Black Belt Online Seminar Amazon Connect Tasks.pdf
Amazon Web Services Japan
PDF
Amazon QuickSight の組み込み方法をちょっぴりDD
Amazon Web Services Japan
PDF
マルチテナント化で知っておきたいデータベースのこと
Amazon Web Services Japan
PDF
202202 AWS Black Belt Online Seminar Amazon Connect Customer Profiles
Amazon Web Services Japan
PDF
Amazon Game Tech Night #24 KPIダッシュボードを最速で用意するために
Amazon Web Services Japan
PPTX
[20220126] JAWS-UG 2022初頭までに葬ったAWSアンチパターン大紹介
Amazon Web Services Japan
PDF
202111 AWS Black Belt Online Seminar AWSで構築するSmart Mirrorのご紹介
Amazon Web Services Japan
PDF
202201 AWS Black Belt Online Seminar Apache Spark Performnace Tuning for AWS ...
Amazon Web Services Japan
PDF
202112 AWS Black Belt Online Seminar 店内の「今」をお届けする小売業向けリアルタイム配信基盤のレシピ
Amazon Web Services Japan
PDF
20211209 Ops-JAWS Re invent2021re-cap-cloud operations
Amazon Web Services Japan
PDF
20211203 AWS Black Belt Online Seminar AWS re:Invent 2021アップデート速報
Amazon Web Services Japan
202205 AWS Black Belt Online Seminar Amazon VPC IP Address Manager (IPAM)
Amazon Web Services Japan
202205 AWS Black Belt Online Seminar Amazon FSx for OpenZFS
Amazon Web Services Japan
202204 AWS Black Belt Online Seminar AWS IoT Device Defender
Amazon Web Services Japan
Infrastructure as Code (IaC) 談義 2022
Amazon Web Services Japan
202204 AWS Black Belt Online Seminar Amazon Connect を活用したオンコール対応の実現
Amazon Web Services Japan
202204 AWS Black Belt Online Seminar Amazon Connect Salesforce連携(第1回 CTI Adap...
Amazon Web Services Japan
Amazon Game Tech Night #25 ゲーム業界向け機械学習最新状況アップデート
Amazon Web Services Japan
20220409 AWS BLEA 開発にあたって検討したこと
Amazon Web Services Japan
202202 AWS Black Belt Online Seminar AWS Managed Rules for AWS WAF の活用
Amazon Web Services Japan
202203 AWS Black Belt Online Seminar Amazon Connect Tasks.pdf
Amazon Web Services Japan
Amazon QuickSight の組み込み方法をちょっぴりDD
Amazon Web Services Japan
マルチテナント化で知っておきたいデータベースのこと
Amazon Web Services Japan
202202 AWS Black Belt Online Seminar Amazon Connect Customer Profiles
Amazon Web Services Japan
Amazon Game Tech Night #24 KPIダッシュボードを最速で用意するために
Amazon Web Services Japan
[20220126] JAWS-UG 2022初頭までに葬ったAWSアンチパターン大紹介
Amazon Web Services Japan
202111 AWS Black Belt Online Seminar AWSで構築するSmart Mirrorのご紹介
Amazon Web Services Japan
202201 AWS Black Belt Online Seminar Apache Spark Performnace Tuning for AWS ...
Amazon Web Services Japan
202112 AWS Black Belt Online Seminar 店内の「今」をお届けする小売業向けリアルタイム配信基盤のレシピ
Amazon Web Services Japan
20211209 Ops-JAWS Re invent2021re-cap-cloud operations
Amazon Web Services Japan
20211203 AWS Black Belt Online Seminar AWS re:Invent 2021アップデート速報
Amazon Web Services Japan
20211109 JAWS-UG SRE keynotes
1.
© 2021, Amazon
Web Services, Inc. or its Affiliates. All rights reserved. Amazon Web Services Japan Manager, Solutions Architect Yukitaka Ohmura 2021/11/09 Site Reliability Engineering on AWS JAWS-UG SRE支部 第1回
2.
© 2021, Amazon
Web Services, Inc. or its Affiliates. All rights reserved. アジェンダ 1. Site Reliability Engineering (SRE) が実現すること 2. SRE を AWS 上で実現する際の考え方 3. JAWS-UG SRE 支部 設立に寄せて 2
3.
© 2021, Amazon
Web Services, Inc. or its Affiliates. All rights reserved. 大村 幸敬 (おおむら ゆきたか) Manager, Solutions Architect • これからクラウドを使いはじめる エンタープライズ企業をサポート • Specialty: Cloud Operations & DevOps • Baseline Environment on AWS (BLEA) メンテナ https://github.com/aws-samples/baseline-environment-on-aws 好きなAWSのサービス: AWS CLI, AWS CDK, SSM Incident Manager 3 本セッションの内容については AWS SA の Seigo Uchida (@spesnova) にもご協力いただいています Twitter: @yktko
4.
© 2021, Amazon
Web Services, Inc. or its Affiliates. All rights reserved. Site Reliability Engineering が実現すること 4
5.
© 2021, Amazon
Web Services, Inc. or its Affiliates. All rights reserved. Site Reliability Engineering (SRE) 再確認 • ”How Google Runs Production System” • 以下の書籍から情報を得ています • SRE サイト リライアビリティ エンジニアリング • サイトリライアビリティワークブック • SREの探求 • Disclaimer • 正確を期していますが不正確な部分があれば フィードバックをお願いいたします • この資料で記載する内容は特定企業の実態を表したものではありません (Amazonに関するものは除く) • SRE = Site Reliability Engineering SREs = Site Reliability Engineers と表記します 5
6.
© 2021, Amazon
Web Services, Inc. or its Affiliates. All rights reserved. Site Reliability Engineering (SRE) ソフトウェアエンジニアリングと子供を持つこととの間には、次の共通点があ ります。すなわち、誕生の前の労苦も苦痛で大変なものですが、じっさいには 誕生の後の労苦こそが、その努力の大部分を占めるものだということです。ソ フトウェアエンジニアリングについては、誕生後に比べて誕生前についての議 論にはるかに多くの時間を費やすものの、システムのトータルコストの40- 90%は、そのシステムの誕生後に生じるものと推定されます。 …ソフトウェアのライフサイクル全体に焦点を当てる、もう一つの分野が見え るはずです。この分野で使いこなさなければならないスキルは広範囲に及びま すが、他の種類のエンジニアにはない固有の関心事項もあります。今日におけ る私たちの答えは、Googleがサイトリライアビリティエンジニアリングと呼ぶ 分野です。 SRE サイトリライアビリティエンジニアリング ―Googleの信頼性を支えるエンジニアリングチーム https://www.amazon.co.jp/dp/4873117917 6
7.
© 2021, Amazon
Web Services, Inc. or its Affiliates. All rights reserved. SREs の信条 • エンジニアリングへの継続的な注力の保証 • サービスのSLO*を下回ることなく、変更の速度の最大化を追求する • モニタリング • 緊急対応 • 変更管理 • 需要の予測とキャパシティプランニング • プロビジョニング • 効率とパフォーマンス * SLO = Service Level Objective サービスレベル目標 SRE サイトリライアビリティエンジニアリング ―Googleの信頼性を支えるエンジニアリングチーム https://www.amazon.co.jp/dp/4873117917 7
8.
© 2021, Amazon
Web Services, Inc. or its Affiliates. All rights reserved. ところで これは何でしょう? “私たちは、自動化された運用およびビジネスプラクティスを所有する Systems Development Engineer を募集しています。これには、問題の特定と解決、反復的なプロセ スの自動化と改善、開発チームとの緊密な連携が含まれます。運用上の問題の優先順位付けを 推進し、サービスをサポートするための自動化設計とスケーリングの要件を推進します。主な 責任には、トラブルシューティング、運用上の問題の診断と修正、監視ソリューションの開発、 インフラストラクチャのメンテナンスと構成の実行、反復的な手動プロセスの自動化、インフ ラストラクチャ要件に対応するツールの開発、更新、追跡、解決が含まれます。技術的な課題。 また、開発、現在のソフトウェアの更新/強化、サポートプロセスの自動化、およびシステム の文書化に伴う作業も担当します。” Basic Qualification (One of them): • 3+ years of experience in Systems Administration, Network Administration, AWS Cloud App development, DevOps or Site Reliability Engineering 8 https://www.amazon.jobs/jp/jobs/1511937/sr-system-development-engineer
9.
© 2021, Amazon
Web Services, Inc. or its Affiliates. All rights reserved. Answer: 10 https://www.amazon.jobs/jp/jobs/1511937/sr-system-development-engineer AWS の サービスチーム が募集する “Systems Development Engineer (SysDE)”
10.
© 2021, Amazon
Web Services, Inc. or its Affiliates. All rights reserved. SREs at Amazon • Systems Development Engineerという職種が サービスチームの中にある • 開発プロセスや運用上の課題をソフトウェアを使って解決する • 求められているのは「SREの信条」そのもの • 横串でプラットフォームだけを担当するのではない • Amazonの サービスチーム (=Two pizza team) の編成 • Software Development Manager *1 • Software Development Engineer *n (多数) • Systems Development Engineer *m (若干名) • etc. 11
11.
© 2021, Amazon
Web Services, Inc. or its Affiliates. All rights reserved. Site Reliability Engineer を募集しているチームもあるが Responsibilities (責任範囲) • 反復的な手動プロセスを自動化し、インフラストラクチャ要件に対応するツールを開発する • 監視ソリューションの開発、インフラストラクチャの保守と構成の実行 • サービスをサポートするための自動化設計とスケーリングの要件を推進します。 • 問題の特定と解決、反復プロセスの自動化と改善、開発チームとの緊密な連携 • 開発、現在のソフトウェアの更新/強化、サポートプロセスの自動化、およびシステムの文書化に協力する。 • 機能要件と技術要件を詳細なアーキテクチャ、設計、拡張可能なコードに変換する • 複雑なシステムモジュールのコーディングとテスト、フレームワークの開発と活用で効果的かつ効率的になる • アーキテクチャ、設計、コードレビューに参加し、高い開発基準を維持する • 他のエンジニアを指導し、挑戦的な技術文化を定義し、急成長するチームの構築を支援する 12 https://www.amazon.jobs/jp/jobs/1760394/site-reliability-devops-engineer-aws-glue 実態はサービスチームに所属しており 活動内容は Systems Development Engineer と同じ
12.
© 2021, Amazon
Web Services, Inc. or its Affiliates. All rights reserved. Amazonのメカニズム 13
13.
© 2021, Amazon
Web Services, Inc. or its Affiliates. All rights reserved. plan code Test&build release monitor developers team operators team Project life cycle(開発) Maintainance(保守) 一般的な開発の流れ 14
14.
© 2021, Amazon
Web Services, Inc. or its Affiliates. All rights reserved. 伝統的なシステムでは開発と運用の間に壁がある。 そんな壁はぶん投げてしまえ。 忘れてしまってもいい。Amazonでは不要だ。 you build it, you run it 開発者も日々の運用に参加しなさい。 そうすればカスタマーのフィードバックが得られる。 これが、サービスの質を高めるのだ。 -- Werner Vogels in May 2006 / Amazon.com CTO 15
15.
© 2021, Amazon
Web Services, Inc. or its Affiliates. All rights reserved. DevOps によって Project でなく Product にフォーカス Product life cycle 全体を Service Teamが見る service team =Two-pizza team 16
16.
© 2021, Amazon
Web Services, Inc. or its Affiliates. All rights reserved. Two-pizza team • チームはビジネスKPIの責任を負う代わりに サービスに関するすべての権限を持つ • 開発チームがそのまま運用も行うことで 高品質・運用しやすいサービスを 開発するモチベーションになる • ソフトウェア開発チームの人数を増やすと 開発速度は指数関数的に低下する (ブルックスの法則)ため、チームは Two-pizzaでランチを賄える程度のサイズに 維持する 17
17.
© 2021, Amazon
Web Services, Inc. or its Affiliates. All rights reserved. Amazonにおけるサービス運用 • すべてをサービスチームが担当する • 顧客ヒアリング/プロダクトデザイン/サービスKPIの達成 • 要求/設計/開発/テスト/インフラ構築/運用/運用改善/オンコール/採用 • チームのスピードを維持するためのTwo Pizzaサイズ • Software Development Manager *1 • Software Development Engineer *n • Two Pizza Teamで運用するために Self-service tools が必要 • チームメンバはソフトウェアで運用の課題に対処する • 有用なツールはサービス化され社内に提供される ⇨ AWSもそのひとつ • すべては、素早い改善の繰り返しでCustomerに価値を届け続けるため 18
18.
© 2021, Amazon
Web Services, Inc. or its Affiliates. All rights reserved. Amazon S3を開発・運用する方法 - 巨大なマイクロサービスと組織 19 https://resources.awscloud.com/vidyard-all-players/aws-33-aws-summit-online-2020-720p-2 Amazonのサービス開発・運用の詳細については、 Vancouver で Systems Development Engineerとして活躍されている岩永さんの発表をご覧ください
19.
© 2021, Amazon
Web Services, Inc. or its Affiliates. All rights reserved. では Site Reliability Engineering とは? 20
20.
© 2021, Amazon
Web Services, Inc. or its Affiliates. All rights reserved. Site Reliability Engineering は • SREの考え方は、 システムの信頼性や運用効率をエンジニアリングで改善しよう とする一連の活動を解説したもの • 運用を実現するためのよい考え方だが それだけが唯一の正解ではない • 適したやりかたは組織によって違う • 例)Amazon は You build it, you run it に基づき サービスチームが自分たちのKPIのために 運用をソフトウェアで改善するモチベーションを持つ そのためToilの仕組みや組織横断で活動するSREsはいない 21
21.
© 2021, Amazon
Web Services, Inc. or its Affiliates. All rights reserved. 体制による運用エンジニアリングの違い 22 サービスチームが全てのOwnershipを持つスタイル (Amazonのような) サービスチームとSREsで分業して運用するスタイル (考えられる体制の一例) Business KPI Business KPI KPI: Error Budget Service KPI Dev SREs/ SysDE Business KPI Business KPI KPI: Error Budget SREs Self Service Tool APIによる運用機能の提供 オンコール対応や運用改善など業務の提供 Service Team Service Team Service Team Service Team 組織の体制や、重視することによってやり方は無数に存在する
22.
© 2021, Amazon
Web Services, Inc. or its Affiliates. All rights reserved. 温故知新: 他のフレームワークも参考にする 24 ITIL ITサービス運用の実体 Site Rliability Engineering COBIT Well-Architected DevOps ITガバナンス ITマネジメント ITセキュリティ NIST CSF NIST SP800-53 ISO27001 各種フレームワークは、複雑なITサービスの運用を写像して、理解しやすいよう体系化している(重複もある)
23.
© 2021, Amazon
Web Services, Inc. or its Affiliates. All rights reserved. 温故知新: ITIL (IT Infrastructure Library) • ITライフサイクル全体の管理領域の定義が参考になる • 従来の考え方とのすり合わせに使える • クラウド前提の継続的開発・運用とは合わなくなってきた部分もある 25 参考: SmartStage https://smart-stage.jp/topics/itsm_keyword_relate/p2/
24.
© 2021, Amazon
Web Services, Inc. or its Affiliates. All rights reserved. 閑話: Site Reliability Engineers ? • SREs = Site Reliability Enginnering を行う人 • ≠Site Reliability Engineerの仕事をする人 • 信頼性(など)をエンジニアリングで改善することが仕事であって、 やるべき作業が先にあるのではない • ≒ “Don’t just do agile, Be agile” 26
25.
© 2021, Amazon
Web Services, Inc. or its Affiliates. All rights reserved. Site Reliability Engineering を AWS 上で実現する際の考え方 27
26.
© 2021, Amazon
Web Services, Inc. or its Affiliates. All rights reserved. Site Reliability Engineering on AWS • AWS上の信頼性と運用のベストプラクティス • AWS Well-Architected Framework • アーキテクチャによる高信頼性確保のナレッジ • Amazon Builder’s Library • Amazon の開発スタイル(参考として) • マイクロサービスアーキテクチャ • Two-Pizza Team (Ownership & DevOps) • Self service tools • Guardrails 28
27.
© 2021, Amazon
Web Services, Inc. or its Affiliates. All rights reserved. AWS Well-Architected Framework システム設計・運用の”大局的な”考え方とベストプラクティス集 29 https://wa.aws.amazon.com/index.ja.html セキュリティ 信頼性 パフォーマンス 効率 コスト最適化 運用上の優秀性 (Operational Excellence)
28.
© 2021, Amazon
Web Services, Inc. or its Affiliates. All rights reserved. Operational Excellence の原則 30 運用をコードとして実行する ⼩規模かつ可逆的な変更を頻繁に行う 運用手順を定期的に改善する 障害を予想する 運用上のすべての障害から学ぶ https://wa.aws.amazon.com/wat.pillar.operationalExcellence.ja.html
29.
© 2021, Amazon
Web Services, Inc. or its Affiliates. All rights reserved. Operational Excellence の質問 31 https://wa.aws.amazon.com/wat.pillar.operationalExcellence.ja.html 組織 • OPS 1: 優先順位はどのように決定すればよいでしょうか? • OPS 2: ビジネスの成果をサポートするために、組織をどのように構築しますか? • OPS 3: 組織の文化はビジネスの成果をどのようにサポートしますか? 準備 • OPS 4: どのようにワークロードを設計して、その状態を理解できるようにするのですか? • OPS 5: どのように欠陥を減らし、修正を容易にして、本番環境へのフローを改善するのですか? • OPS 6: どのようにデプロイのリスクを軽減しますか? • OPS 7: ワークロードをサポートする準備が整っていることはどうすれば確認できるでしょうか? 運用 • OPS 8: ワークロードの正常性をどのように把握しますか? • OPS 9: オペレーションの正常性をどのように把握しますか? • OP 10: ワークロードと運用イベントはどのように管理しますか? 進化 • OPS 11: オペレーションを進化させる方法
30.
© 2021, Amazon
Web Services, Inc. or its Affiliates. All rights reserved. Operational Excellence ベストプラクティスと実装例 32 https://wa.aws.amazon.com/wat.question.OPS_7.ja.html
31.
© 2021, Amazon
Web Services, Inc. or its Affiliates. All rights reserved. Builder’s Library 可用性 • Cell Architecture • Shuffle Sharding • 静的安定性 デプロイメント • Secure Hands-off Deployment Postmortem • Correction of Errors (COE) 33 https://aws.amazon.com/jp/builders-library/ Amazonのソフトウェアの構築・運用方法を解説したライブラリ
32.
© 2021, Amazon
Web Services, Inc. or its Affiliates. All rights reserved. Builders Library の例: 静的安定性 34 https://aws.amazon.com/jp/blogs/news/jpmne-mediaawsstudymeeting2021-7/
33.
© 2021, Amazon
Web Services, Inc. or its Affiliates. All rights reserved. もっと具体的に(SRE本より) • 6章 Observability - CloudWatch • 7章 Automation - EventBridge/SSM/Lambda • 8章 Release Engineering - Code Series • 11章 OnCall/Incident Management - SSM Incident Manager ここから先は皆さんのアイディアを伺わせてください! 35
34.
© 2021, Amazon
Web Services, Inc. or its Affiliates. All rights reserved. JAWS-UG SRE 支部 設立に寄せて 40
35.
© 2021, Amazon
Web Services, Inc. or its Affiliates. All rights reserved. 言霊は大事…だが • 運用の課題をエンジニアリングで解決することに “SRE”という名前がついた • SRE本によって、これまで必要でありながら、 複雑で注目されていなかった領域にフォーカスが当たった • “SREs” という目標ができて、エンジニアが モチベーションを持って活動できるようになった • 2009年ごろから「インフラエンジニア」という言葉が 現れてきて2011年ウェブオペレーション本が出た時と似てる 41
36.
© 2021, Amazon
Web Services, Inc. or its Affiliates. All rights reserved. …でも言葉に縛られない • 目的はサービスを利用するお客様へ価値を提供すること • Toilにかける時間をルール通り守ることでも 「Site Reliability Engineeringをする」ことでも 「Site Reliability Engineerになる」ことでもない • 組織の数だけ運用がある あなたの組織に合った Site Reliability Engineering を • そして JAWS-UG で Discussion しよう! 42
37.
© 2021, Amazon
Web Services, Inc. or its Affiliates. All rights reserved. Happy Site Reliability Engineering ! ご質問はお気軽にTwitterへどうぞ → @yktko
Download