SlideShare a Scribd company logo
SRE サイトリライアビリティエ
ンジニアリングの翻訳から学
んだこと
2017/10/28
玉川竜司@翻訳者
簡単に自己紹介
• Sky株式会社の開発チーム所属です
• 本業とは別に、オライリージャパンからコンピュータ関係の技術書を翻訳出版しています
• 8月出版の最新刊が「サイトリライアビリティエンジニアリング」
既刊
今年の予定
本日の内容
• The SRE Bookの出版と日本での動き
• Site Reliability Engineerとは?
• 速度と信頼性、そしてデータに基づく業務判断
• 技術の話
• 育成・採用の話
• Google SREと一緒に翻訳をしてみて学んだこと
はじめにご承知おきいただきたいこと
• 本日お話しすることは、ほぼすべて出版される書籍に書かれていることです
• 私自身がSRE的なポジションで実際に働いているわけではないので、お話でおきるこ
とはほぼすべて「伝聞」のようなものです
• とはいえ、SREという役割が生まれた背景や解決しようとする課題は、ソフトウェア
の開発やサービス、運用にかかわる方なら十分理解できる(というか身につまされ
る)ことであり、今日のお話、そしてSRE本からお持ち帰りいただけることもたくさ
んあると考えています
• 質問は随時していただいて結構です
The SRE Bookの出版と
日本での動き
‘The SRE Book’
「Google の社員たちは彼らがたどってきたプロセスを、つまずきも含めて
本書で明らかにしてくれている。Google のサービスが巨大な規模と素晴ら
しい信頼性を共に実現できたのは、このプロセスによるものだ。統合され
たサービス群を生み出し、それらをスケールさせたいと考えている方々に
は、本書を読むことを強くおすすめする。本書は、メンテナンス性の高い
サービスを構築するための、現場の方々に向けたガイドである」
- Rik Farrow, USENIX
「Gmail のような大規模なサービスを書くのは難しいことだ。高い信頼性の
下でそれらを動作させるのはさらに難しいことであり、ましてやそれが
日々変化するのであればなおさらだ。包括的な「レシピ本」である本書は、
Google がそれをどう成し遂げているのかを教えてくれる。
読者の皆さんは、自分で間違いを犯すよりも、私たちの間違いから学ぶ方
が負担が少ないことに気づくだろう」
- Urs Hölzle, SVP テクニカルインフラストラクチャ、Google
日本でも続々誕生
• メルカリ
http://tech.mercari.com/entry/2015/11/18/153421
• スマートニュース
https://www.slideshare.net/NobutoshiOgata/introducing-inhouse-paas-in-
smartnews
• サイボウズ
http://blog.cybozu.io/entry/2016/09/01/080000
日本語版ではサブタイトルを変更
• 英語版:How Google runs production systems
(Googleはどのようにプロダクションシステムを動作させているか)
• 日本語版:
ぜひ読んでいただきたい「監訳者前書き」
本書はあらゆる規模のサービスの運用にさまざまな形で関わるすべての人に向けて書か
れています。大規模で多数のユーザーがいるサービスの運用者はもちろんのこと、まだ
信頼性が第一のフォーカスでないようなサービスの運用にあたっても手間やコストを下
げてより開発の速度を上げるのに役立つ情報が得られるでしょう。個人でサービスを開
発や運営されている方にも実践できる内容が数多くあります。
また、普段運用に直接は関わる機会の少ない方々にもぜひ読んでいただきたく思ってい
ます。ソフトウェア開発者にも、SRE の視点を得ることで設計や実装に活かせる新しい
発見が数多くあることでしょう。サービスの運用コストはその設計や実装に大きく依存
していますし、サービスの運用と開発の協調もSRE の重要なポイントの1 つです。SRE
チームのマネージャーや、新しくSRE組織を立ち上げたいと考えているCTO にも、SRE の
コアバリューについての理解を深める一助となることでしょう。
見るべきは、技術論よりも組織論
• なぜGoogleは次々と信頼性の高いサービスを投入・運用できるのか?
• Googleのスーパーなインフラがあるからなのか?
• 部分的にはYesだが、それは一部に過ぎない
• 組織としての考え方(SREの原則)と、それに基づく地道な改善が大きい
• 本書に出てくる様々な取り組みから学び、それぞれの現場で活用できる
ことはたくさんある
目次
1. イントロダクション
2. SRE の観点から見たGoogle のプロダクション環境
3. リスクの受容
4. サービスレベル目標
5. トイルの撲滅
6. 分散システムのモニタリング
7. Google における自動化の進化
8. リリースエンジニアリング
9. 単純さ
10. 時系列データからの実践的なアラート
11. オンコール対応
12. 効果的なトラブルシューティング
13. 緊急対応
14. インシデント管理
15. ポストモーテムの文化:失敗からの学び
16. サービス障害の追跡
17. 信頼性のためのテスト
18. SRE におけるソフトウェアエンジニアリング
19. フロントエンドにおけるロードバランシング
20. データセンターでのロードバランシング
21. 過負荷への対応
22. カスケード障害への対応
23. クリティカルな状態の管理: 信頼性のための分散合意
24. cron による分散定期スケジューリング
25. データ処理のパイプライン
26. データの完全性
27. 大規模なプロダクトのローンチにおける信頼性
28. SRE の成長を加速する方法
29. 割り込みへの対処
30. SRE の投入による運用過負荷からのリカバリ
31. SRE におけるコミュニケーションとコラボレーション
32. 進化するSRE のエンゲージメントモデル
33. 他の業界からの教訓
34. まとめ
Site Reliability Engineerとは?
本から抜粋
SRE とは、ソフトウェアエンジニアに運用チームの設計を依頼したと
きにできあがるものです。私が2003 年にGoogle に入社し、7 人のエン
ジニアで構成される"Production Team" を受け持ったとき、私はそれま
での人生のすべてをソフトウェアエンジニアとして過ごしてきました。
そのため、私はそのグループを自分自身がSRE として働くと仮定した
場合の理想の形に設計し、管理したのです。それ以来、グループは成
熟し、今日のGoogle のSRE チームとなりました。そしてチームは依然
として、生涯にわたるソフトウェアエンジニアだった私が思い描いた、
その出発点に忠実であり続けています。
Site Reliability Engineerという職種/チーム
• 基本的には運用サイド(Ops)の職種
• スキルとして、インフラに加えてプログラミングが必須
• Googleの開発職に要求されるプログラミングスキルの8~9割が必要
• 仕事は大きく分けて運用の業務(オンコールなど)と「改善」のためのエンジニアリング
(Googleのインフラストラクチャ)
(サービスごとに担当はあるものの、SRE自体は全社横断的な組織)
開発チーム 開発チーム 開発チーム
SREチーム SREチーム SREチーム
サービスA サービスB サービスC
SREの原則
• 信頼性にフォーカスを置く
• ソフトウェアエンジニアリングによって運用を自動化し、スケールできる
ようにする
• 手作業 → 自動化 → 自律化
• SREチームの規模はサービスの規模に比例してはならない(サービスの複雑さには影
響を受ける)
• 「トイル」の撲滅
• 英雄的な献身に頼るのではなく、組織としての仕組みづくりを重視する
トイルってなんだ
• トイルとは、プロダクションサービスを動作させることに関係する作業で、手作業で繰り返し行われ、自動化することが可
能であり、戦術的で長期的な価値を持たず、作業量がサービスの成長に比例するといった傾向を持つもの」
• 手作業であること
• これは例えば、何らかのタスクを自動化するためのスクリプトを、手作業で実行するような作業が含まれます。
• 繰り返されること
• ある作業をするのが初めてであったり、あるいは2 回目程度なのであれば、その作業はトイルではありません。トイルとは、繰り返し何度
も何度も行われるものです。
• 自動化できること
• マシンが人間同様に行えるタスクや、そのタスクの必要性がなくなる仕組みが作れることであれば、その仕事はトイルです。そのタスク
に人間の判断が欠かせないのであれば、それはトイルとは言いがたいでしょう。
• 長期的な価値を持たないこと
• あるタスクを終えた後でも、サービスが同じ状態のままなのであれば、そのタスクはおそらくトイルです。例えば仮に、古いコードや設
定に踏み込んで整理するといった、つまらない作業が含まれていたとしても、そのタスクによってサービスに恒久的な改善が加えられた
ら、それはトイルではありません。
• サービスの成長に対してO(n) であること
• その作業に、サービスのサイズ、トラフィックの量、ユーザー数などに比例してスケールするようなタスクが含まれているなら、そのタ
スクはおそらくトイルです。
トイルの撲滅
• たとえばサーバーの稼働状況のモニタリング
• メトリクスの生成、収集、集計といったことは徹底して自動化する
• その自動化のための「開発」作業は(50%ルールに守られて)積極的に行う
• Googleの場合、サーバーにはすべて同じメトリクス収集(CPU負荷とかトラフィックとか
リクエスト数とか)の仕組みが組み込まれている(HTTPで値をとれる)
• その仕組みの上でモニタリングやアラートの仕組みを(SREが)作っている
• 最初から完成度の高い仕組みを作ったりはできない。これはGoogleでも同じ。継
続的にこういったソフトウェアエンジニアリングを行える組織体制・ルールを
つくり、着実に改善を積み重ねている
速度と信頼性、
そしてデータに基づく業務判断
重要視していること:速度と信頼性
• ここでの「速度」は新しい機能やサービスを投入するペースのこと
• 「信頼性」は(主に)SLO(Service Level Objective)のこと
• 開発者(Devs)は速度を、運用者(Ops)は信頼性を重視する傾向
がある
開発チーム 運用チーム
新機能を
リリースしたい
動いているものは
変更したくない
緊張関係
計測されたデータに基づく業務判断
• エラーバジェット
• 50%ルール
以下はGoogleでの例ですが、あくまでこれは「Googleでは」こういう実施方法を取ってい
るということであって、肝心なのは
・品質を示すデータの定義
・定義されたデータの計測
・計測されたデータに基づいて業務判断をしていくこと
だと思います。
SLI / SLO / SLA
• SLI(サービスレベル指標):計測するデータの定義
• SLO(サービスレベル目標):SLIに対して設定された社内的な目標値
• Googleの場合は「完全に落ちる」ことはほぼないので、
成功したリクエスト数 / リクエスト数
などを指標としている
• SLA(サービスレベルアグリーメント):お客様との契約として守ること
を宣言した値
• 守れなかった場合にお客様との間で金銭のやりとりが生じるのがSLA
SLOとエラーバジェット
• エラーバジェット = 1 – SLO
• (Googleでは通常四半期単位でデータを計測)
• エラーバジェットが残っている限り新機能をリリースできる(業務判断)
• エラーバジェットがなくなった場合、リセットがかかるまで(緊急のセ
キュリティ対応などを除き)新機能のリリースは禁止
データに基づいて業務判断を行うことをルール化することによって、
開発チームとSREチームが同じ方向を向いて業務に当たれるようにする
100%は目指さない
• たとえばコンシューマ向けのサービスであれば、99.99%の可用性と
99.999%の可用性の違いはユーザーにはほぼ分からない(デバイスの
故障、回線の問題など、他の要因で事実上マスクされる)
• この場合、0.009%の可用性向上のためのコストは無駄
• サービスの性格に応じたSLOの定義が非常に重要
• 「航空機やペースメーカーの信頼性の話はまったく異なる」
50%ルール
• SREはその作業時間(計測データの定義と計測)の50%以上をエンジニア
リング業務に当てなければならない
• SREが運用業務(含む障害対応)に当てる時間が50%を超えた場合、50%以
下に戻るまでは開発チームがSREの支援に時間を当てる(業務判断)
データに基づいて業務判断を行うことをルール化することによって、
開発チームとSREチームが同じ方向を向いて業務に当たれるようにする
技術の話
「魔法」の話はあまり出てきません
• 本書に出てくるのはある意味で「地味」な話です
• Googleのインフラがなければ意味のない話なのか?→そんなこ
とはありません
• ソフトウェアでコントロールできる範囲の話であれば、学べる
ことはたくさんあります
計測と改善の仕組み作り
• 必要なメトリクスを得るための仕組みをインフラに作り込む
• 収集したメトリクスをモニタリングするための仕組みを作り込む
• 基本的なメトリクスの取得の仕組みがすべてのマシンに共通して組み込ま
れている
• たとえばPythonあたりでスクリプトが書けるなら、自分たちの環境でもで
きることは多いはず
徹底した自動化志向
• 自動化のメリットは「複利」
• 手動 (トイル)→ 自動化 → 自律化
• マクロに見るとすごい(たとえばMySQLのマイグレーションの
自律化)ことも、ミクロに見れば当たり前の技術(シェル芸と
か)の積み重ね
採用・育成の話
SREの採用はたいへん
• Googleの開発エンジニアに求められるスキルの80-90%
• 加えてインフラ周りの知識が必要
• 基本的に需要に対して供給不足
(Googleのインフラストラクチャ)
(サービスごとに担当はあるものの、SRE自体は全社横断的な組織)
開発チーム
SREが開発したライブラリ
サービス
SREという「人」ではなくSRE
のノウハウを詰め込んだライ
ブラリを使ってもらう
教育とオンコール
• オンコール対応になることはキャリアの1つのマイルストーン
• そこに至るまでの教育システムもきちんと整備する
• 「千尋の谷に突き落とす」ようなやり方はしない
• P.412 表28-1 「SREの教育の方法」
• ドキュメント→ポストモーテム→シャドウ→オンコール
障害対応とトレーニング
• 年に一度、全社的な障害対応のトレーニング
• 「たまにしかやらないことは身につかない」ことを受け入れる
• 障害対応時の手順を日常業務に組み込んでおく
• SLOを超えて「動いてしまう」システムをときどきあえて止めることで、
障害があってもあわてなくて済むようにした話
• できないことを精神論でかたづけない。徹底して理詰め
Google SREと一緒に翻訳をして
みて学んだこと
SREの皆さんの仕事っぷり
• Google Docsのヘビーな活用
• 必要なドキュメントを非常に手早く、しかも適切な集計/自動化
を施して作成
• いわゆるOffice系ツールの活用能力もとても大事
(なお、最終の校正はdropboxでした…)
• どうしても生ずる泥臭い作業も、適切なツールで効率よくこなす
• こういったことも「SREの原則」の1つの表れだと感じました
翻訳のやり方が変わりました
• オンラインアプリケーション(Google Docs、dropbox)の進化
を実感
• 監訳者、編集者の方々との共同作業のやりかたが変化
• なんといっても500ページ超の本の監訳対応をすべてオンライ
ンアプリでやったという経験と自信
• スマートフォンも十分に役立ちます
(余談)三人称単数の’They’
• Theyが単数形として使われている(動詞が三単現のs付き)文が
ある
• 誤植かと思いきや…
• Gender neutralな表現として、性別を持たない「人」を表す代名
詞としてtheyが使われるようになっているとのこと
質問をどうぞ!

More Related Content

PDF
Challenge for statup's cto from big company nagaaki hoshi
PPTX
hbstudy 74 Site Reliability Engineering
PPTX
越境ネイティブの育てかた
PDF
[Observability conference 2022/3/11] NewsPicks のプロダクト開発エンジニアが実践するスキルとしての SRE
PDF
スタートアップで培ったアーキテクチャ設計ノウハウ
PDF
NuxtJS + SSRで作ったGREE Tech Conference 2020
PDF
最速で価値を提供する
PDF
トラブルシューティングで僕が大事にしてること
Challenge for statup's cto from big company nagaaki hoshi
hbstudy 74 Site Reliability Engineering
越境ネイティブの育てかた
[Observability conference 2022/3/11] NewsPicks のプロダクト開発エンジニアが実践するスキルとしての SRE
スタートアップで培ったアーキテクチャ設計ノウハウ
NuxtJS + SSRで作ったGREE Tech Conference 2020
最速で価値を提供する
トラブルシューティングで僕が大事にしてること

What's hot (18)

PPTX
現場で役立つシステム設計の原則への感謝
PPTX
「自分でやる」という快感を追い続ける - あるプログラマーの成長戦略 -
PDF
大規模サービスにおける価値開発の“これまで”と“将来”~新たな“じゃらんnet”のチャレンジに関して~
PPTX
プロダクトマネージャーはフレームワークを作れ
PPTX
Saga Smart Center - Excelで完結!マイクロソフト流データサイエンスの極意
PPTX
ゼロから始めるオープンソース生活
PDF
ネイティブゲーム開発におけるこれからの品質保証
PDF
WFSエンジニア組織のデザイン〜コンテンツ開発に集中するために〜
PPTX
Jaws days 2019_pipeline_is_god
PDF
Yii Framework 2.0 いま求められるRAD標準とは #phpkansai
PDF
今週の個人的な 注目ニュース ー5月10日号ー
PDF
競合とは何か -学ぶとところ・学ばないところ-
PPTX
Google Apps Script 活用ミートアップ#4 発表資料
PDF
20190306 sd#3 kitazaki_t0
PDF
NativeGameの障害削減に向けた取り組み
PDF
これから始めるSpringのwebアプリケーション
PDF
モバイルゲーム。移管と運営のエンジニア
PPTX
Jsugプレゼン資料new
現場で役立つシステム設計の原則への感謝
「自分でやる」という快感を追い続ける - あるプログラマーの成長戦略 -
大規模サービスにおける価値開発の“これまで”と“将来”~新たな“じゃらんnet”のチャレンジに関して~
プロダクトマネージャーはフレームワークを作れ
Saga Smart Center - Excelで完結!マイクロソフト流データサイエンスの極意
ゼロから始めるオープンソース生活
ネイティブゲーム開発におけるこれからの品質保証
WFSエンジニア組織のデザイン〜コンテンツ開発に集中するために〜
Jaws days 2019_pipeline_is_god
Yii Framework 2.0 いま求められるRAD標準とは #phpkansai
今週の個人的な 注目ニュース ー5月10日号ー
競合とは何か -学ぶとところ・学ばないところ-
Google Apps Script 活用ミートアップ#4 発表資料
20190306 sd#3 kitazaki_t0
NativeGameの障害削減に向けた取り組み
これから始めるSpringのwebアプリケーション
モバイルゲーム。移管と運営のエンジニア
Jsugプレゼン資料new
Ad

Viewers also liked (20)

PDF
Life of an enginner in rakuten osaka diarmaid lindsay
PDF
AI based language learning tools
PDF
はてなのインフラの歴史、そしてMackerelへ至る道とこれから
PDF
Rakuten Technology Conference 2017 A Distributed SQL Database For Data Analy...
PDF
WannaEat: A computer vision-based, multi-platform restaurant lookup app
PDF
Human-Centric Machine Learning
PDF
COBOL to Apache Spark
PDF
時間がないといって、オペレーション改善を怠るな~オペレーション改善奮闘記~ Emi muroya
PDF
Value Delivery through RakutenBig Data Intelligence Ecosystem and Technology
PDF
Rakutenとsreと私 yanagimoto koichi
PDF
Rakuten app productivity initiative for developers marcus saw
PDF
One Hundred Languages
PDF
トラブルシューティングのあれこれ Yoshihiko kamata
PDF
Don't manage too hard!
PDF
Predictions and Hard Problems With AI
PDF
AI AND FUNDAMENTAL GAME TECHNOLOGIESIN FINAL FANTASY XV
PDF
cloudera Apache Kudu Updatable Analytical Storage for Modern Data Platform
PDF
Java ee7 with apache spark for the world's largest credit card core systems, ...
PDF
Change the engineer life by batch system renewal
PDF
RTC 2017 - The Power of Parallelism
Life of an enginner in rakuten osaka diarmaid lindsay
AI based language learning tools
はてなのインフラの歴史、そしてMackerelへ至る道とこれから
Rakuten Technology Conference 2017 A Distributed SQL Database For Data Analy...
WannaEat: A computer vision-based, multi-platform restaurant lookup app
Human-Centric Machine Learning
COBOL to Apache Spark
時間がないといって、オペレーション改善を怠るな~オペレーション改善奮闘記~ Emi muroya
Value Delivery through RakutenBig Data Intelligence Ecosystem and Technology
Rakutenとsreと私 yanagimoto koichi
Rakuten app productivity initiative for developers marcus saw
One Hundred Languages
トラブルシューティングのあれこれ Yoshihiko kamata
Don't manage too hard!
Predictions and Hard Problems With AI
AI AND FUNDAMENTAL GAME TECHNOLOGIESIN FINAL FANTASY XV
cloudera Apache Kudu Updatable Analytical Storage for Modern Data Platform
Java ee7 with apache spark for the world's largest credit card core systems, ...
Change the engineer life by batch system renewal
RTC 2017 - The Power of Parallelism
Ad

Similar to What i learned from translation of the sre ryuji tamagawa (20)

PDF
足を地に着け落ち着いて考える
PDF
新・ReVIEWパーサについて
PDF
インフラエンジニアが プログラミングで業務改善していく話
PDF
Works of site reliability engineer
PDF
働き方改革を加速させるリモートワークソリューション ~Office 365 + XenAppで実現する安心安全なリモートワーク環境の構築~
PDF
ヘルシープログラマ・翻訳と実践
PDF
NoOpsへの挑戦
PDF
DX Suite & UiPath さっくり読み取りさっくり連携
PDF
社内勉強会で読んだ本とか
PDF
「本を書くプロジェクトマネジメントはWbsかアジャイルか」 XP祭り2015
PDF
辛い開発を色々使って迂回した話
PDF
Well-Architectedな組織を
実現するためのチャレンジ - なぜ、CA W-Aを作ろうと思ったのか - #jawsdays 2019
PDF
Serverless LT 20201202
PPTX
非エンジニアのSQL活用が加速させる事業成長
PDF
開発レビューで心がけていること
PDF
[enPiT筑波大ワークショップ(成果発表会)情報交換会]全部スクラム!~SIerで大切だったこと、サービサーで大切だったこと~
PDF
財務分析勉強会挨拶
PPTX
20190222 osc2019tokyospring
PDF
How to develop a huge Single Page Application
PDF
Googleのインフラ技術から考える理想のDevOps
足を地に着け落ち着いて考える
新・ReVIEWパーサについて
インフラエンジニアが プログラミングで業務改善していく話
Works of site reliability engineer
働き方改革を加速させるリモートワークソリューション ~Office 365 + XenAppで実現する安心安全なリモートワーク環境の構築~
ヘルシープログラマ・翻訳と実践
NoOpsへの挑戦
DX Suite & UiPath さっくり読み取りさっくり連携
社内勉強会で読んだ本とか
「本を書くプロジェクトマネジメントはWbsかアジャイルか」 XP祭り2015
辛い開発を色々使って迂回した話
Well-Architectedな組織を
実現するためのチャレンジ - なぜ、CA W-Aを作ろうと思ったのか - #jawsdays 2019
Serverless LT 20201202
非エンジニアのSQL活用が加速させる事業成長
開発レビューで心がけていること
[enPiT筑波大ワークショップ(成果発表会)情報交換会]全部スクラム!~SIerで大切だったこと、サービサーで大切だったこと~
財務分析勉強会挨拶
20190222 osc2019tokyospring
How to develop a huge Single Page Application
Googleのインフラ技術から考える理想のDevOps

More from Rakuten Group, Inc. (20)

PDF
EPSS (Exploit Prediction Scoring System)モニタリングツールの開発
PPTX
コードレビュー改善のためにJenkinsとIntelliJ IDEAのプラグインを自作してみた話
PDF
楽天における安全な秘匿情報管理への道のり
PDF
What Makes Software Green?
PDF
Simple and Effective Knowledge-Driven Query Expansion for QA-Based Product At...
PDF
DataSkillCultureを浸透させる楽天の取り組み
PDF
大規模なリアルタイム監視の導入と展開
PDF
楽天における大規模データベースの運用
PDF
楽天サービスを支えるネットワークインフラストラクチャー
PDF
楽天の規模とクラウドプラットフォーム統括部の役割
PDF
Rakuten Services and Infrastructure Team.pdf
PDF
The Data Platform Administration Handling the 100 PB.pdf
PDF
Supporting Internal Customers as Technical Account Managers.pdf
PDF
Making Cloud Native CI_CD Services.pdf
PDF
How We Defined Our Own Cloud.pdf
PDF
Travel & Leisure Platform Department's tech info
PDF
Travel & Leisure Platform Department's tech info
PDF
OWASPTop10_Introduction
PDF
Introduction of GORA API Group technology
PDF
100PBを越えるデータプラットフォームの実情
EPSS (Exploit Prediction Scoring System)モニタリングツールの開発
コードレビュー改善のためにJenkinsとIntelliJ IDEAのプラグインを自作してみた話
楽天における安全な秘匿情報管理への道のり
What Makes Software Green?
Simple and Effective Knowledge-Driven Query Expansion for QA-Based Product At...
DataSkillCultureを浸透させる楽天の取り組み
大規模なリアルタイム監視の導入と展開
楽天における大規模データベースの運用
楽天サービスを支えるネットワークインフラストラクチャー
楽天の規模とクラウドプラットフォーム統括部の役割
Rakuten Services and Infrastructure Team.pdf
The Data Platform Administration Handling the 100 PB.pdf
Supporting Internal Customers as Technical Account Managers.pdf
Making Cloud Native CI_CD Services.pdf
How We Defined Our Own Cloud.pdf
Travel & Leisure Platform Department's tech info
Travel & Leisure Platform Department's tech info
OWASPTop10_Introduction
Introduction of GORA API Group technology
100PBを越えるデータプラットフォームの実情

What i learned from translation of the sre ryuji tamagawa