Submit Search
Azure vm の可用性を見直そう
Download as PPTX, PDF
1 like
4,339 views
S
ShuheiUda
Interact x Cloud Samurai 2016 Summer
Technology
Read more
1 of 38
Download now
Downloaded 50 times
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
More Related Content
PDF
【ことはじめ】 はじめてのコンテナ活用をクラウドで
オラクルエンジニア通信
PDF
Oracle Cloud Infrastructure:2022年9月度サービス・アップデート
オラクルエンジニア通信
PDF
20190130 AWS Well-Architectedの活用方法とレビューの進め方をお伝えしていきたい
Amazon Web Services Japan
PPTX
どうやって決める?kubernetesでのシークレット管理方法(Cloud Native Days 2020 発表資料)
NTT DATA Technology & Innovation
PDF
マイクロサービスと Red Hat Integration
Kenta Kosugi
PPTX
え、まって。その並列分散処理、Kafkaのしくみでもできるの? Apache Kafkaの機能を利用した大規模ストリームデータの並列分散処理
NTT DATA Technology & Innovation
PDF
使ってみて気づいた AGPL ライセンスの メリット・デメリット
Fumito Mizuno
PDF
オススメのJavaログ管理手法 ~コンテナ編~(Open Source Conference 2022 Online/Spring 発表資料)
NTT DATA Technology & Innovation
【ことはじめ】 はじめてのコンテナ活用をクラウドで
オラクルエンジニア通信
Oracle Cloud Infrastructure:2022年9月度サービス・アップデート
オラクルエンジニア通信
20190130 AWS Well-Architectedの活用方法とレビューの進め方をお伝えしていきたい
Amazon Web Services Japan
どうやって決める?kubernetesでのシークレット管理方法(Cloud Native Days 2020 発表資料)
NTT DATA Technology & Innovation
マイクロサービスと Red Hat Integration
Kenta Kosugi
え、まって。その並列分散処理、Kafkaのしくみでもできるの? Apache Kafkaの機能を利用した大規模ストリームデータの並列分散処理
NTT DATA Technology & Innovation
使ってみて気づいた AGPL ライセンスの メリット・デメリット
Fumito Mizuno
オススメのJavaログ管理手法 ~コンテナ編~(Open Source Conference 2022 Online/Spring 発表資料)
NTT DATA Technology & Innovation
What's hot
(20)
PDF
2025年現在のNewSQL (最強DB講義 #36 発表資料)
NTT DATA Technology & Innovation
PDF
Aws Dev Day2021 「ドメイン駆動設計のマイクロサービスへの活用とデベロッパーに求められるスキル」参考資料(松岡パート)
Koichiro Matsuoka
PDF
Nested Hyper-v on Azure
Masahiko Ebisuda
PPTX
サポート エンジニアが Azure Networking をじっくりたっぷり語りつくす会
ShuheiUda
PDF
Hadoopの概念と基本的知識
Ken SASAKI
PDF
ユーザーストーリーの分割
Arata Fujimura
PDF
詳説探究!Cloud Native Databaseの現在地点(CloudNative Days Tokyo 2023 発表資料)
NTT DATA Technology & Innovation
PDF
一歩先行く Azure Computing シリーズ(全3回) 第2回 Azure VM どれを選ぶの? Azure VM 集中講座
Minoru Naito
PDF
楽天がHadoopを使う理由
Rakuten Group, Inc.
PDF
[Cloud OnAir] GCP で構築するデータ分析基盤の最新情報をご紹介! 2018年11月15日 放送
Google Cloud Platform - Japan
PDF
At least onceってぶっちゃけ問題の先送りだったよね #kafkajp
Yahoo!デベロッパーネットワーク
PPTX
Azure仮想マシンと仮想ネットワーク
Kuninobu SaSaki
PDF
PFN のオンプレML基盤の取り組み / オンプレML基盤 on Kubernetes 〜PFN、ヤフー〜
Preferred Networks
PPTX
あなたのところに専用線が届くまで
Tomohiro Sakamoto(Onodera)
PDF
Kubernetes 疲れに Azure Container Apps はいかがでしょうか?(江東区合同ライトニングトーク 発表資料)
NTT DATA Technology & Innovation
PDF
20210216 AWS Black Belt Online Seminar AWS Database Migration Service
Amazon Web Services Japan
PPTX
Azure AD とアプリケーションを SAML 連携する際に陥る事例と対処方法について
Shinya Yamaguchi
PDF
Hadoop入門
Preferred Networks
PDF
ストリーム処理を支えるキューイングシステムの選び方
Yoshiyasu SAEKI
PDF
グリー株式会社『私たちが GCP を使い始めた本当の理由』第 9 回 Google Cloud INSIDE Game & Apps
Google Cloud Platform - Japan
2025年現在のNewSQL (最強DB講義 #36 発表資料)
NTT DATA Technology & Innovation
Aws Dev Day2021 「ドメイン駆動設計のマイクロサービスへの活用とデベロッパーに求められるスキル」参考資料(松岡パート)
Koichiro Matsuoka
Nested Hyper-v on Azure
Masahiko Ebisuda
サポート エンジニアが Azure Networking をじっくりたっぷり語りつくす会
ShuheiUda
Hadoopの概念と基本的知識
Ken SASAKI
ユーザーストーリーの分割
Arata Fujimura
詳説探究!Cloud Native Databaseの現在地点(CloudNative Days Tokyo 2023 発表資料)
NTT DATA Technology & Innovation
一歩先行く Azure Computing シリーズ(全3回) 第2回 Azure VM どれを選ぶの? Azure VM 集中講座
Minoru Naito
楽天がHadoopを使う理由
Rakuten Group, Inc.
[Cloud OnAir] GCP で構築するデータ分析基盤の最新情報をご紹介! 2018年11月15日 放送
Google Cloud Platform - Japan
At least onceってぶっちゃけ問題の先送りだったよね #kafkajp
Yahoo!デベロッパーネットワーク
Azure仮想マシンと仮想ネットワーク
Kuninobu SaSaki
PFN のオンプレML基盤の取り組み / オンプレML基盤 on Kubernetes 〜PFN、ヤフー〜
Preferred Networks
あなたのところに専用線が届くまで
Tomohiro Sakamoto(Onodera)
Kubernetes 疲れに Azure Container Apps はいかがでしょうか?(江東区合同ライトニングトーク 発表資料)
NTT DATA Technology & Innovation
20210216 AWS Black Belt Online Seminar AWS Database Migration Service
Amazon Web Services Japan
Azure AD とアプリケーションを SAML 連携する際に陥る事例と対処方法について
Shinya Yamaguchi
Hadoop入門
Preferred Networks
ストリーム処理を支えるキューイングシステムの選び方
Yoshiyasu SAEKI
グリー株式会社『私たちが GCP を使い始めた本当の理由』第 9 回 Google Cloud INSIDE Game & Apps
Google Cloud Platform - Japan
Ad
Similar to Azure vm の可用性を見直そう
(20)
PPTX
サポート エンジニアが語る、Microsoft Azure を支えるインフラの秘密
ShuheiUda
PDF
20180918_ops on azure-main
Jun Misawa
PDF
今こそ知りたい!Microsoft Azureの基礎
Trainocate Japan, Ltd.
PDF
Azure IaaS update (2018年6月~8月 発表版)
Takamasa Maejima
PDF
帰ってきた インフラ野郎 Azureチーム ~Azure データセンターテクノロジー解体新書2018春~ - de:code2018
Toru Makabe
PDF
SAP on Azure Cloud Workshop Material Japanese 20190221
Hitoshi Ikemoto
PPTX
99999999 azure iaas_newportal版
Osamu Takazoe
PDF
Azure overview 2019_feb_v1.02
Toshihiko Sawaki
PPTX
Azure 10 周年の節目に見直したい、azure インフラのちょっと大事な話
ShuheiUda
PPTX
Azure VMware Solution (AVS) 概要 (2019年11月版)
Takamasa Maejima
PPTX
20180224 azure securitycenter
Masakazu Kishima
PDF
【de:code 2020】 Azure 10 周年の節目に見直したい、Azure インフラのちょっと大事な話
日本マイクロソフト株式会社
PDF
今改めて学ぶ Microsoft Azure 基礎知識
Minoru Naito
PPTX
[簡易提案書]Azure overview 2017_april_v1.00
Toshihiko Sawaki
PDF
Azure IaaS update (2018年5月版)
Takamasa Maejima
PPTX
[簡易提案書]Azure overview 2017_sep_v0.9
Toshihiko Sawaki
PDF
Azure IaaS update (2019年1月~2月 発表版)
Takamasa Maejima
PPTX
Azure 仮想マシンにおける運用管理・高可用性設計のベストプラクティス
Yusuke Oi
PPTX
サポート エンジニアが語る、トラブルを未然に防ぐための Azure インフラ設計
ShuheiUda
PDF
Azure reliability v0.1.21.0422
Ayumu Inaba
サポート エンジニアが語る、Microsoft Azure を支えるインフラの秘密
ShuheiUda
20180918_ops on azure-main
Jun Misawa
今こそ知りたい!Microsoft Azureの基礎
Trainocate Japan, Ltd.
Azure IaaS update (2018年6月~8月 発表版)
Takamasa Maejima
帰ってきた インフラ野郎 Azureチーム ~Azure データセンターテクノロジー解体新書2018春~ - de:code2018
Toru Makabe
SAP on Azure Cloud Workshop Material Japanese 20190221
Hitoshi Ikemoto
99999999 azure iaas_newportal版
Osamu Takazoe
Azure overview 2019_feb_v1.02
Toshihiko Sawaki
Azure 10 周年の節目に見直したい、azure インフラのちょっと大事な話
ShuheiUda
Azure VMware Solution (AVS) 概要 (2019年11月版)
Takamasa Maejima
20180224 azure securitycenter
Masakazu Kishima
【de:code 2020】 Azure 10 周年の節目に見直したい、Azure インフラのちょっと大事な話
日本マイクロソフト株式会社
今改めて学ぶ Microsoft Azure 基礎知識
Minoru Naito
[簡易提案書]Azure overview 2017_april_v1.00
Toshihiko Sawaki
Azure IaaS update (2018年5月版)
Takamasa Maejima
[簡易提案書]Azure overview 2017_sep_v0.9
Toshihiko Sawaki
Azure IaaS update (2019年1月~2月 発表版)
Takamasa Maejima
Azure 仮想マシンにおける運用管理・高可用性設計のベストプラクティス
Yusuke Oi
サポート エンジニアが語る、トラブルを未然に防ぐための Azure インフラ設計
ShuheiUda
Azure reliability v0.1.21.0422
Ayumu Inaba
Ad
Azure vm の可用性を見直そう
1.
Azure VM の可用性を見直そう ~今更聞けない障害
/ SLA / メンテナンスの仕組み~ Interact x Cloud Samurai 2016 Summer 2016/06/25
2.
宇田 周平 (うだ しゅうへい)
日本マイクロソフト株式会社 カスタマー サービス&サポート サポート エンジニア Windows (Hyper-V, Remote Desktop, Performance) Azure (IaaS / Network) Twitter: syuheiuda Facebook: syuhei.uda Blog: http://www.syuheiuda.com/ Raspberry Pi 2とWindows 10ではじめる IoTプログラミング (マイナビ出版刊)
3.
余談ですが... プライベート コンテナ
データセンターが 欲しいので、海上コンテナを見てきました
4.
本セッション のゴール Azure のインフラについてご理解いただく
可用性セットやメンテナンスなどの Azure 独自の 概念や仕組みを正しくご理解をいただく “芯” 機能を理解できれば、Azure は怖くない
5.
アジェンダ Azure のサポート契約
サービス レベル (SLA) データセンタの裏側 障害・メンテナンス時の挙動
6.
いつものお願い コミュニティにおけるマイクロソフト社員による 発言やコメントは、マイクロソフトの正式な見解 またはコメントではありません。 本セッションの内容は、本日
(2016/06) 時点での ものであり、今後予告なく変更される場合があり ます。
7.
サポート契約について サービス レベル /
重大度
8.
Azure の サポート契約 https://azure.microsoft.com/ja-jp/support/plans/
9.
中の人からの お願い お問い合わせ時の重大度 A
はサービス ダウンなど の即時対応が必要な場合にのみご利用ください (原則、重大度は B / C でお願いします) 重大度 A の場合… Microsoft 側は 24 時間対応の特別体制となり、一方で お客様側にも 24 時間ご連絡がつく体制をとっていただ きます 復旧が最優先のため、原因追及は緊急度 A の範囲外 (復旧後、営業時間内にて緊急度 B での対応は可能)
10.
Azure の SLA
について SLA を正しくご存知ですか?
11.
SLA とは 機能毎に定められた稼働率の目標
稼働率は月単位で計算されます 99.99 % (約 4 分) 99.95 % (約 21 分) 99.9 % (約 43 分) 99 % (約 7.2 時間)
12.
VM の SLA
インターネットに接続するすべての仮想マ シンに、同じ可用性セットにデプロイした 2 つ以上のインスタンスがある場合、マイ クロソフトは、99.95% 以上の時間にお いて外部接続が確保されることを保証しま す。 https://azure.microsoft.com/ja-jp/support/legal/sla/virtual-machines/v1_1/
13.
Storageの SLA マイクロソフトは、99.99% (クール
アク セス レベルについては 99.9%) 以上の時 間において、読み取りアクセス地理冗長ス トレージ (RA-GRS) アカウントからの データの読み取り要求が正しく処理される ことを保証します。 ただし、プライマリ リージョンからのデー タの読み取りに失敗した場合は、セカンダ リ リージョンで読み取りを再試行します。 https://azure.microsoft.com/ja-jp/support/legal/sla/storage/v1_1/
14.
ExpressRoute / VPN の
SLA マイクロソフトは、ExpressRoute の専用 回線について 99.9% 以上の可用性を保証 します。 マイクロソフトは、各 VPN Gateway につ いて 99.9% の可用性を保証します。 https://azure.microsoft.com/ja-jp/support/legal/sla/expressroute/v1_0/ https://azure.microsoft.com/ja-jp/support/legal/sla/vpn-gateway/v1_0/
15.
ここからが本題
16.
可用性を確保 するには… まずは「可用性セット」を組みましょう (残念ながら、そもそも可用性セットを組んでいない or 正しく使っていただけていないお客様が多いです)
Azure の裏側の仕組みがどうなっているか 正しく理解しましょう クラスタ 更新ドメイン (Update Domain) 障害ドメイン (Fault Domain) 個々のサービス・アプリでの可用性担保に関しては、また別の機会に...
17.
可用性セット とは 仮想マシンを分散配置させるための仕組み (各仮想マシンを異なるラックや物理サーバに配置 するためのパラメータ) 同じ役割を持つサーバ群を可用性セットで グループ化しましょう
Web サーバ (x2 台以上) の可用性セット DB サーバ (x2 台以上) の可用性セット (Web サーバと DB サーバを一緒しないこと)
18.
データセンタの裏側
19.
Azure リージョン 場所 東アジア
香港 東南アジア シンガポール 東日本 東京、埼玉 西日本 大阪 Azure の データセンタ Azure のデータセンタは実は 1 リージョン あたり複数ある https://azure.microsoft.com/ja-jp/regions/
20.
データセンタ の中身 http://www.wired.com/2013/02/boydton/
21.
Azure の クラスタ (≠ MSFC)
先の写真のような、サーバーのグループを クラスタという単位で読んでいます クラスタ内は原則として同一の筐体ですが VM サイズごとにハードは異なります A シリーズ: 様々なサーバー下で稼働可 D シリーズ: ローカル SSD Dv2 シリーズ: Xeon E5-2673 v3 参考: https://channel9.msdn.com/Events/de-code/2016/INF-001
22.
整理すると 東日本 東京 第一クラスタ (A 専用) 約 20
ラック 第二クラスタ (A / D 専用) 約 20 ラック 第三クラスタ (A / D 専用) 約 20 ラック 第四クラスタ (A / Dv2 専用) 約 20 ラック 第五クラスタ (A / DS 専用) 約 20 ラック 埼玉 第一クラスタ (A 専用) 約 20 ラック ※ あくまでもイメージです
23.
障害ドメイン 更新ドメイン
24.
障害ドメイン 更新ドメイン の確認方法
25.
障害ドメイン とは何か… 電源とネットワーク スイッチを共有する仮 想マシンのグループ
要は Azure のインフラにおける障害発生時 の影響範囲 (あるラックが死んでも、隣の ラックは影響を受けない)
26.
VM 配置の イメージ Windows Azure
Internals https://channel9.msdn.com/Events/TechEd/NorthAmerica/2013/WAD-B402
27.
ラック # 1
ラック # 2 ラック # 3 ラック # 4 物理サーバが 故障したら… 可用性セットを組んだ VM 群 Azure VM 故障等で使えない物理サーバー 1. 物理サーバーで何らか ハードウェア障害が発生 2. 障害を検知後、正常な 物理サーバー自動で移動 (Kernel-Power 41) 3. 故障したサーバとして マークし、運用から隔離
28.
ラック # 1
ラック # 2 ラック # 3 ラック # 4ラック # 1 ラック # 2 ラック # 3 ラック # 4 電源障害が 発生すると… 3. 故障したサーバーとしてマーク (これが障害ドメイン) 1. シャーシ全体がダウン 2. それぞれ、空いている 正常な物理サーバに移動 可用性セットを組んだ VM 群 Azure VM 故障等で使えない物理サーバー
29.
更新ドメイン とは何か… メンテナンス時に、作業タイミングが重複 してダウンタイムが発生しないようにする ための仕組み
30.
メンテナンス にも色々ある 計画内メンテナンス 通知のないもの (≒再起動が発生しない)
通知のあるもの (≒再起動が発生する) シングル インスタンス対象 マルチ インスタンス対象 計画外メンテナンス(≒障害) 前述の自動復旧とか
31.
メンテナンス 通知メールは 二種類ある シングル インスタンス (12 時間中
15 分) マルチ インスタンス (3 日間中 15 分、可用性を考 慮)
32.
Demo マルチ インスタンスを対象としたメンテナンスの流れ
33.
最後に まずは正しく可用性セットを組みましょう
34.
Q & A
35.
ご清聴ありがとうございまいた。 個別のご相談もお気軽にどうぞ!
36.
Appendix 可用性関連資料 仮想マシンの可用性管理
Azure での仮想マシンに対する計画的なメンテナンス Azure VM のメンテナンス FAQ Azure での高可用な基幹業務アプリケーションのデプロイ
37.
Appendix その他、目を通していただきたい情報 Azure
仮想マシンにおける不要な NIC を削除する方法 Azure VM のストレージ パフォーマンスに関する留意点と対 処策 VPN ゲートウェイのリセットについて IP アドレス 168.63.129.16 について
38.
Appendix おまけ Azure
Subscription のサマリーを生成するスクリプトを公開 しました Get-SubscriptionDetails
Download