このページは Cloud Translation API によって翻訳されました。

外部アプリケーションロードバランサのリクエストの分散

このドキュメントでは、外部アプリケーションロードバランサが接続を処理し、トラフィックを転送し、セッションアフィニティを維持する方法について詳しく説明します。

接続の仕組み

Google Cloudの外部アプリケーションロードバランサ（グローバルとリージョン）は、分散プロキシ（GFE）または Envoy 管理のサブネットを使用してルーティングを効率化します。構成可能なタイムアウト、TLS 終端、組み込みのセキュリティにより、世界規模またはリージョン規模で、コンプライアンスに準拠したスケーラブルなアプリケーション配信を実現します。

グローバル外部アプリケーションロードバランサの接続

グローバル外部アプリケーションロードバランサは、Google Front End（GFE）と呼ばれる多くのプロキシによって実装されます。プロキシは 1 つではありません。プレミアムティアでは、同じグローバル外部 IP アドレスがさまざまな拠点からアドバタイズされ、クライアントのリクエストは、クライアントの最も近い GFE に送信されます。

クライアントがいる場所に応じて、複数の GFE がバックエンドへの HTTP(S) 接続を開始できます。GFE から送信されたパケットには、ヘルスチェックプローバーが使用するものと同じ範囲（35.191.0.0/16 と 130.211.0.0/22）の送信元 IP アドレスがあります。

バックエンドサービスの構成に応じて、各 GFE がバックエンドに接続するために使用するプロトコルは HTTP、HTTPS、HTTP/2 のいずれかになります。HTTP または HTTPS 接続の場合、使用される HTTP バージョンは HTTP 1.1 です。

HTTP キープアライブは、HTTP 1.1 仕様で指定されているように、デフォルトで有効になっています。HTTP キープアライブは、同じ TCP セッションを効率的に使用しようとしますが、保証はありません。GFE は、クライアント HTTP キープアライブタイムアウト（610 秒）とデフォルトのバックエンドキープアライブタイムアウト値（600 秒）を使用します。クライアント HTTP キープアライブタイムアウトは更新できますが、バックエンドキープアライブタイムアウト値は固定されています。バックエンドサービスのタイムアウトを設定することで、リクエストとレスポンスのタイムアウトを構成できます。HTTP キープアライブと TCP アイドルタイムアウトは密接に関連していますが、同じではありません。詳しくは、タイムアウトと再試行をご覧ください。

トラフィックのロードバランシングを均等に行うために、ロードバランサは、Connection: close ヘッダーを含むレスポンスの完了後に FIN ACK パケットを送信して TCP 接続を完全に閉じるか、レスポンスの完了後に HTTP/2 GOAWAY フレームを発行する場合があります。この動作により、アクティブなリクエストやレスポンスが妨げられることはありません。

HTTP 接続と TCP セッションの数は、GFE の接続数、GFE に接続するクライアントの数、バックエンドへのプロトコル、バックエンドのデプロイ場所によって異なります。

詳細については、ソリューションガイドの外部アプリケーションロードバランサの仕組みでグローバルロードバランシングによるアプリケーション容量の最適化をご覧ください。

リージョン外部アプリケーションロードバランサの接続

リージョン外部アプリケーションロードバランサは、Envoy プロキシに実装されたマネージドサービスです。リージョン外部アプリケーションロードバランサは、プロキシ専用サブネットという共有サブネットを使用して、Google がユーザーに代わって Envoy プロキシを実行する際に使用する一連の IP アドレスをプロビジョニングします。このプロキシ専用サブネットの --purpose フラグは REGIONAL_MANAGED_PROXY に設定されています。特定のネットワークとリージョン内のリージョン Envoy ベースのロードバランサはすべて、このサブネットを共有します。

クライアントは、ロードバランサの IP アドレスとポートを使用してロードバランサに接続します。クライアントリクエストは、クライアントと同じリージョン内のプロキシ専用サブネットに転送されます。ロードバランサは、クライアントリクエストを終了して、プロキシ専用サブネットからバックエンドへの新しい接続を開きます。したがって、ロードバランサから送信されたパケットには、プロキシ専用サブネットからの送信元 IP アドレスがあります。

バックエンドサービスの構成に応じて、Envoy プロキシがバックエンドに接続するために使用するプロトコルは HTTP、HTTPS、HTTP/2 のいずれかになります。HTTP または HTTPS の場合の HTTP バージョンは HTTP 1.1 です。HTTP キープアライブは、HTTP 1.1 仕様で指定されているように、デフォルトで有効になっています。Envoy プロキシは、クライアント HTTP キープアライブタイムアウトとバックエンドキープアライブタイムアウトの両方をデフォルト値の 600 秒に設定します。クライアント HTTP キープアライブタイムアウトは更新できますが、バックエンドキープアライブタイムアウト値は固定されています。バックエンドサービスのタイムアウトを設定することで、リクエスト / レスポンスのタイムアウトを構成できます。詳しくは、タイムアウトと再試行をご覧ください。

ロードバランサとのクライアント通信

クライアントは HTTP 1.1 または HTTP/2 プロトコルを使用してロードバランサと通信できます。
最近のクライアントは、HTTPS を使用するとデフォルトで HTTP/2 になります。この制御は HTTPS ロードバランサではなくクライアント上で行われます。
ロードバランサで構成を変更することで、HTTP/2 を無効にすることはできません。ただし、一部のクライアントは、HTTP/2 ではなく HTTP 1.1 を使用するように構成できます。たとえば、curl では、--http1.1 パラメータを使用します。
外部アプリケーションロードバランサは HTTP/1.1 100 Continue レスポンスをサポートします。

各モードの外部アプリケーションロードバランサ転送ルールでサポートされるプロトコルの完全な一覧については、ロードバランサの機能をご覧ください。

クライアントパケットの送信元 IP アドレス

バックエンドから見たパケットの送信元 IP アドレスは、ロードバランサのGoogle Cloud 外部 IP アドレスではありません。つまり、2 つの TCP 接続があります。

グローバル外部アプリケーションロードバランサの場合:

接続 1: 元のクライアントからロードバランサ（GFE）への接続。
- 送信元 IP アドレス: 元のクライアント（クライアントが NAT ゲートウェイまたは転送プロキシの背後にある場合は外部 IP アドレス）。
- 宛先 IP アドレス: ロードバランサの IP アドレス。
接続 2: ロードバランサ（GFE）からバックエンド VM またはエンドポイントへの接続。
- 送信元 IP アドレス: ファイアウォールルールで指定された範囲の IP アドレス。
- 宛先 IP アドレス: VPC ネットワーク内のバックエンド VM またはコンテナの内部 IP アドレス。

リージョン外部アプリケーションロードバランサの場合:

接続 1: 元のクライアントからロードバランサ（プロキシ専用サブネット）への接続。
- 送信元 IP アドレス: 元のクライアント（クライアントが NAT ゲートウェイまたは転送プロキシの背後にある場合は外部 IP アドレス）。
- 宛先 IP アドレス: ロードバランサの IP アドレス。
接続 2: ロードバランサ（プロキシ専用サブネット）からバックエンド VM またはエンドポイントへの接続。
- 送信元 IP アドレス: ロードバランサと同じリージョン、同じネットワークにデプロイされたすべての Envoy ベースのロードバランサ間で共有されるプロキシ専用サブネットの IP アドレス。
- 宛先 IP アドレス: VPC ネットワーク内のバックエンド VM またはコンテナの内部 IP アドレス。

特別なルーティングパス

Google Cloud は、VPC ネットワークで定義されていない特別なルートを使用して、次のタイプのトラフィックのパケットを転送します。

ヘルスチェックの場合（分散 Envoy ヘルスチェックを除く）。詳細については、ヘルスチェックのパスをご覧ください。

グローバル外部アプリケーションロードバランサおよび従来のアプリケーションロードバランサのバックエンドと GFE との間。詳細については、Google Front End とバックエンド間のパスをご覧ください。

Google Cloud は、プロキシ専用サブネットのサブネットルートを使用して、次の種類のトラフィックのパケットを転送します。

分散 Envoy ヘルスチェックを使用する場合。

リージョン外部アプリケーションロードバランサの場合、 Google Cloud はオープンソースの Envoy プロキシを使用してロードバランサへのクライアントリクエストを終了します。ロードバランサは TCP セッションを終了し、リージョンのプロキシ専用サブネットからバックエンドへの新しい TCP セッションを開きます。VPC ネットワーク内で定義されたルートによって、Envoy プロキシからバックエンドへの通信と、バックエンドから Envoy プロキシへの通信が容易になります。

オープンポート

GFE には、同じアーキテクチャで実行される他の Google サービスをサポートするための複数のオープンポートがあります。ポートスキャンを実行すると、GFE で実行されている他の Google サービスのオープンポートが表示される場合があります。

GFE ベースのロードバランサ（グローバル外部アプリケーションロードバランサと従来のアプリケーションロードバランサ）は、ポート 80 と 443 を常にオープンポートとして表示します（ロードバランサの転送ルールで構成した他のポートも一緒に表示されます）。ただし、ポート 80 またはポート 443 に転送ルールを構成していない場合、これらのポートに送信された接続は拒否されます。逆に、リージョン外部アプリケーションロードバランサは Envoy プロキシを使用して実装されているため、スキャン中に余分なオープンポートは表示されません。

GFE ベースのロードバランサの IP アドレスにポートスキャンを実行することは、次の理由により、監査の観点からは役立ちません。

通常、ポートスキャン（たとえば nmap を使用）では、TCP SYN プローブを実行するときにレスポンスパケットや TCP RST パケットは想定されません。GFE は転送ルールを構成したポートに対してのみ、SYN プローブへのレスポンスとして SYN-ACK パケットを送信します。GFE は、ロードバランサの IP アドレスと、転送ルールで構成されている宛先ポートにパケットが送信された場合にのみ、パケットをバックエンドに送信します。別の IP アドレスまたはポートに送信されたパケットはバックエンドに送信されません。

GFE は、Google Cloud Armor などのセキュリティ機能を実装しています。Cloud Armor Standard を使用すると、GFE は、ボリューム型およびプロトコルベースの DDoS 攻撃と SYN フラッドを常に阻止します。この保護は、Cloud Armor を明示的に構成していない場合でも使用できます。セキュリティポリシーを構成した場合、または Managed Protection Plus に登録した場合のみ、料金が発生します。
ロードバランサの IP アドレスに送信されたパケットには、Google のフリート内の任意の GFE が応答可能ですが、ロードバランサの IP アドレスと宛先ポートの組み合わせをスキャンすると、TCP 接続ごとに 1 つの GFE のみが検査されます。ロードバランサの IP アドレスは、単一のデバイスまたはシステムに割り当てられていません。したがって、GFE ベースのロードバランサの IP アドレスをスキャンしても、Google のフリート内のすべての GFE がスキャンされるわけではありません。

以下では、この点を考慮し、バックエンドインスタンスのセキュリティをより効果的に監査する方法を説明します。

セキュリティ監査担当者は、ロードバランサの構成で転送ルールの構成を検査する必要があります。転送ルールは、ロードバランサがパケットを受け入れてバックエンドに転送する宛先ポートを定義しています。GFE ベースのロードバランサの場合、1 つの外部転送ルールで参照できる宛先 TCP ポートは 1 つだけです。TCP ポート 443 を使用するロードバランサの場合、接続を QUIC（HTTP/3）にアップグレードすると、UDP ポート 443 が使用されます。
セキュリティ監査担当者は、バックエンド VM に適用されるファイアウォールルールの構成を検査する必要があります。ファイアウォールルールの設定では、GFE からバックエンド VM へのトラフィックをブロックしますが、GFE への受信トラフィックはブロックしません。ベストプラクティスについては、ファイアウォールルールのセクションをご覧ください。

TLS 終端

次の表に、外部アプリケーションロードバランサによる TLS 終端の処理方法を示します。

ロードバランサのモード	TLS 終端
グローバル外部アプリケーションロードバランサ	TLS は、世界中のあらゆる場所にある GFE で終端されます。
従来のアプリケーションロードバランサ	TLS は、世界中のあらゆる場所にある GFE で終端されます。
リージョン外部アプリケーションロードバランサ	TLS は、ユーザーが選択したリージョンのプロキシ専用サブネットにある Envoy プロキシで終端されます。TLS を終端するリージョンを地理的に制御する必要がある場合は、このロードバランサモードを使用してください。

タイムアウトと再試行

外部アプリケーションロードバランサは、HTTP または HTTPS トラフィックに対して次の種類のタイムアウトをサポートします。

タイムアウトの種類と説明	デフォルト値	カスタムのタイムアウト値をサポート
タイムアウトの種類と説明	デフォルト値	グローバル	クラシック	リージョン
バックエンドサービスのタイムアウト¹ リクエストとレスポンスのタイムアウトロードバランサがリクエストの最初のバイトをバックエンドに送信してから、バックエンドが HTTP レスポンスの最後のバイトをロードバランサに返すまでの最長時間を表します。バックエンドがこの時間内に HTTP レスポンス全体をロードバランサに返さなかった場合、残りのレスポンスデータは破棄されます。	バックエンドサービスのサーバーレス NEG の場合: 60 分バックエンドサービスの他のバックエンドタイプの場合: 30 秒バックエンドバケットの場合: 24 時間（86,400 秒）
クライアント HTTP キープアライブタイムアウトクライアントとロードバランサのプロキシの間の TCP 接続がアイドル状態である最長時間。（同じ TCP 接続が複数の HTTP リクエストに使用される場合があります）。グローバル外部アプリケーションロードバランサと従来のアプリケーションロードバランサの場合、ロードバランサのプロキシは第 1 レイヤの GFE です。リージョン外部アプリケーションロードバランサの場合、ロードバランサのプロキシは Envoy ソフトウェアです。	610 秒
バックエンド HTTP キープアライブタイムアウトロードバランサのプロキシとバックエンドの間の TCP 接続がアイドル状態である最長時間（同じ TCP 接続が複数の HTTP リクエストに使用される場合があります）。グローバル外部アプリケーションロードバランサと従来のアプリケーションロードバランサの場合、ロードバランサのプロキシは第 2 レイヤの GFE です。リージョン外部アプリケーションロードバランサの場合、ロードバランサのプロキシは Envoy ソフトウェアです。	バックエンドサービスの場合: 10 分（600 秒）バックエンドバケットの場合: 6 分（360 秒）
QUIC セッションのアイドルタイムアウトグローバル外部アプリケーションロードバランサまたは従来のアプリケーションロードバランサの GFE と（ダウンストリーム）クライアントとの間で QUIC セッションがアイドル状態を継続できる最大時間。	グローバル外部アプリケーションロードバランサと従来のアプリケーションロードバランサの場合: QUIC セッションのアイドルタイムアウトは、クライアントのアイドルタイムアウトまたは GFE のアイドルタイムアウト（300 秒）のいずれかの最小値です。 GFE のアイドルタイムアウトは 300 秒に固定されています。クライアントのアイドルタイムアウトは構成できます。

¹ サーバーレス NEG バックエンドでは構成できません。バックエンドバケットでは構成できません。

バックエンドサービスのタイムアウト

構成可能なバックエンドサービスタイムアウトは、バックエンドが HTTP リクエストを処理し、対応する HTTP レスポンスを返すまでロードバランサが待機する最長時間を表します。サーバーレス NEG を除き、バックエンドサービスのタイムアウトのデフォルト値は 30 秒です。

たとえば、500 MB のファイルをダウンロードする場合、バックエンドサービスのタイムアウトの値が 90 秒であれば、ロードバランサはバックエンドが 500 MB ファイル全体を 90 秒以内で配信すると想定します。バックエンドサービスのタイムアウトには、バックエンドが完全な HTTP レスポンスを送信するのに十分でない時間を構成することもできます。この状況では、少なくともロードバランサがバックエンドから HTTP レスポンスヘッダーを受け取った場合、ロードバランサは完全なレスポンスヘッダーと、バックエンドサービスのタイムアウト内で取得できる可能な限り多くのレスポンス本文を返します。

バックエンドサービスのタイムアウトは、HTTP レスポンスを処理するためにバックエンドが待機する必要のある最長時間に設定することをおすすめします。バックエンドで実行されているソフトウェアが HTTP リクエストを処理し、レスポンス全体を返すためにさらに時間が必要な場合は、バックエンドサービスのタイムアウト値を大きくすることをおすすめします。たとえば、jsonPayload.statusDetail client_timed_out エラーを含む HTTP 408 ステータスコードが返された場合は、タイムアウトを長くすることをおすすめします。

バックエンドサービスのタイムアウトは、1～2,147,483,647 秒の値を受け入れます。ただし、あまりに大きい値は実用的な構成オプションではありません。またGoogle Cloud では、バックエンドサービスがタイムアウトになるまで基盤となる TCP 接続が維持されるとは限りません。グローバルアプリケーションロードバランサと従来のアプリケーションロードバランサの場合、GFE はバックエンドサービスの有効な最大タイムアウトを 86,400 秒（1 日）に設定します。クライアントシステムでは、TCP 接続の持続時間に依存するのではなく、再試行ロジックを実装する必要があります。

バックエンドサービスのタイムアウトを構成するには、次のいずれかの方法を使用します。

コンソール

ロードバランサのバックエンドサービスの [タイムアウト] フィールドを変更します。

gcloud

gcloud compute backend-services update コマンドを使用して、バックエンドサービスリソースの --timeout パラメータを変更します。

API

グローバル外部アプリケーションロードバランサまたは従来のアプリケーションロードバランサの場合は、グローバル backendServices リソースの timeoutSec パラメータを変更します。

リージョン外部アプリケーションロードバランサの場合は、regionBackendServices リソースの timeoutSec パラメータを変更します。

WebSocket 接続のタイムアウトは、バックエンドサービスのタイムアウトと同じとは限りません。WebSocket 接続のタイムアウトは、ロードバランサのタイプによって異なります。

ロードバランサのモード	デフォルト値	WebSocket のタイムアウトの説明
グローバル外部アプリケーションロードバランサ	バックエンドサービスのタイムアウト: 30 秒	アクティブな WebSocket 接続は、ロードバランサで構成されたバックエンドサービスのタイムアウトを使用しません。接続は 24 時間（86,400 秒）後に自動的に終了します。この 24 時間の上限は固定されており、24 時間を超えるバックエンドサービスのタイムアウトはオーバーライドされます。アイドル状態の WebSocket 接続は、バックエンドサービスのタイムアウト後に終了します。 Google Cloud は、ソフトウェアの更新やその他の定期的なメンテナンスのために GFE を定期的に再起動します。このため、バックエンドサービスのタイムアウト値を 24 時間（86,400 秒）より大きくすることはおすすめしません。バックエンドサービスのタイムアウト値によってメンテナンスアクティビティが遅延することはありません。バックエンドサービスのタイムアウト値が長くなるほど、 Google Cloudがメンテナンスで TCP 接続を終了する可能性が高くなります。
従来のアプリケーションロードバランサ	バックエンドサービスのタイムアウト: 30 秒	WebSocket 接続は、アイドル状態かアクティブ状態かにかかわらず、バックエンドサービスがタイムアウトすると自動的に終了します。 Google Cloud は、ソフトウェアの更新やその他の定期的なメンテナンスのために GFE を定期的に再起動します。このため、バックエンドサービスのタイムアウト値を 24 時間（86,400 秒）より大きくすることはおすすめしません。バックエンドサービスのタイムアウト値によってメンテナンスアクティビティが遅延することはありません。バックエンドサービスのタイムアウト値が長くなるほど、 Google Cloudがメンテナンスで TCP 接続を終了する可能性が高くなります。
リージョン外部アプリケーションロードバランサ	バックエンドサービスのタイムアウト: 30 秒	アクティブな WebSocket 接続は、ロードバランサのバックエンドサービスのタイムアウトを使用しません。アイドル状態の WebSocket 接続は、バックエンドサービスのタイムアウト後に終了します。 Google Cloud は、サービスを提供する Envoy ソフトウェアタスクの定期的な再起動、またはその数の変更を行います。バックエンドサービスのタイムアウト値が長いほど、Envoy タスクが TCP 接続を再開または終了する可能性が高くなります。

ロードバランサのモード

デフォルト値

WebSocket のタイムアウトの説明

グローバル外部アプリケーションロードバランサ

バックエンドサービスのタイムアウト: 30 秒

アクティブな WebSocket 接続は、ロードバランサで構成されたバックエンドサービスのタイムアウトを使用しません。接続は 24 時間（86,400 秒）後に自動的に終了します。この 24 時間の上限は固定されており、24 時間を超えるバックエンドサービスのタイムアウトはオーバーライドされます。

アイドル状態の WebSocket 接続は、バックエンドサービスのタイムアウト後に終了します。

Google Cloud は、ソフトウェアの更新やその他の定期的なメンテナンスのために GFE を定期的に再起動します。このため、バックエンドサービスのタイムアウト値を 24 時間（86,400 秒）より大きくすることはおすすめしません。バックエンドサービスのタイムアウト値によってメンテナンスアクティビティが遅延することはありません。バックエンドサービスのタイムアウト値が長くなるほど、 Google Cloudがメンテナンスで TCP 接続を終了する可能性が高くなります。

従来のアプリケーションロードバランサ

バックエンドサービスのタイムアウト: 30 秒

WebSocket 接続は、アイドル状態かアクティブ状態かにかかわらず、バックエンドサービスがタイムアウトすると自動的に終了します。

リージョン外部アプリケーションロードバランサ

バックエンドサービスのタイムアウト: 30 秒

アクティブな WebSocket 接続は、ロードバランサのバックエンドサービスのタイムアウトを使用しません。

アイドル状態の WebSocket 接続は、バックエンドサービスのタイムアウト後に終了します。

Google Cloud は、サービスを提供する Envoy ソフトウェアタスクの定期的な再起動、またはその数の変更を行います。バックエンドサービスのタイムアウト値が長いほど、Envoy タスクが TCP 接続を再開または終了する可能性が高くなります。

リージョン外部アプリケーションロードバランサは、URL マップの構成済みの routeActions.timeout パラメータを使用し、バックエンドサービスのタイムアウトを無視します。routeActions.timeout が構成されていない場合、バックエンドサービスのタイムアウト値が使用されます。routeActions.timeout が指定されている場合、バックエンドサービスのタイムアウトは無視され、代わりに、リクエストとレスポンスのタイムアウトとして routeActions.timeout が使用されます。

クライアント HTTP キープアライブタイムアウト

クライアント HTTP キープアライブタイムアウトは、TCP 接続が（ダウンストリーム）クライアントと次のいずれかのタイプのプロキシ間でアイドル状態になる最長時間を表します。

グローバル外部アプリケーションロードバランサまたは従来のアプリケーションロードバランサの場合: 最初のレイヤの Google Front End

リージョン外部アプリケーションロードバランサの場合: Envoy プロキシ

クライアント HTTP キープアライブタイムアウトは、基盤となる TCP 接続の TCP アイドルタイムアウトを表します。クライアント HTTP キープアライブタイムアウトは WebSocket に適用されません。

クライアント HTTP キープアライブタイムアウトのデフォルト値は 610 秒です。グローバル外部アプリケーションロードバランサとリージョン外部アプリケーションロードバランサの場合、クライアント HTTP キープアライブタイムアウトは 5～1,200 秒で構成できます。

クライアントの HTTP キープアライブタイムアウトを構成するには、次のいずれかの方法を使用します。

コンソール

ロードバランサのフロントエンド構成の HTTP キープアライブタイムアウト フィールドを変更します。

gcloud

グローバル外部アプリケーションロードバランサの場合は、gcloud compute target-http-proxies update コマンドまたは gcloud compute target-https-proxies update コマンドを使用して、ターゲット HTTP プロキシまたはターゲット HTTPS プロキシリソースの --http-keep-alive-timeout-sec パラメータを変更します。

リージョン外部アプリケーションロードバランサの場合、リージョンターゲット HTTP(S) プロキシのキープアライブタイムアウトパラメータを直接更新することはできません。リージョンターゲットプロキシのキープアライブタイムアウトパラメータを更新するには、次の操作を行う必要があります。

適切なタイムアウト設定で新しいターゲットプロキシを作成します。
現在のターゲットプロキシの他のすべての設定を新しいプロキシにミラーリングします。ターゲット HTTPS プロキシの場合、SSL 証明書または証明書マップを新しいターゲットプロキシにリンクします。
新しいターゲットプロキシを指すように転送ルールを更新します。
以前のターゲットプロキシを削除します。

API

グローバル外部アプリケーションロードバランサの場合は、targetHttpProxies リソースまたは targetHttpsProxies リソースの httpKeepAliveTimeoutSec パラメータを変更します。

適切なタイムアウト設定で新しいターゲットプロキシを作成します。
現在のターゲットプロキシの他のすべての設定を新しいプロキシにミラーリングします。ターゲット HTTPS プロキシの場合、SSL 証明書または証明書マップを新しいターゲットプロキシにリンクします。
新しいターゲットプロキシを指すように転送ルールを更新します。
以前のターゲットプロキシを削除します。

ロードバランサのクライアント HTTP キープアライブタイムアウトは、ダウンストリームクライアントまたはプロキシで使用される HTTP キープアライブ（TCP アイドル）タイムアウトよりも大きくする必要があります。ダウンストリームクライアントの HTTP キープアライブ（TCP アイドル）タイムアウトがロードバランサのクライアント HTTP キープアライブタイムアウトよりも大きい場合、競合状態が発生する可能性があります。ダウンストリームクライアントから見ると、確立済みの TCP 接続が、ロードバランサで許可されている時間よりも長くアイドル状態になる可能性があります。ロードバランサが TCP 接続が終了したとみなすと、ダウンストリームクライアントはパケットを送信することができます。その場合、ロードバランサは TCP reset（RST）パケットで応答します。

クライアントの HTTP キープアライブタイムアウトが切れると、GFE または Envoy プロキシがクライアントに TCP FIN を送信して、接続を正常に終了します。

バックエンド HTTP キープアライブタイムアウト

外部アプリケーションロードバランサは、少なくとも 2 つの TCP 接続を使用するプロキシです。

グローバル外部アプリケーションロードバランサまたは従来のアプリケーションロードバランサの場合、（ダウンストリームの）クライアントと最初のレイヤの GFE の間に最初の TCP 接続が存在します。最初のレイヤの GFE が 2 番目のレイヤの GFE に接続し、次に 2 番目のレイヤの GFE がバックエンドへの 2 番目の TCP 接続を開きます。

リージョン外部アプリケーションロードバランサの場合、最初の TCP 接続は（ダウンストリーム）クライアントと Envoy プロキシの間に存在します。次に、Envoy プロキシがバックエンドへの 2 番目の TCP 接続を開きます。

ロードバランサの 2 番目の TCP 接続は、リクエストごとに終了せず、複数の HTTP リクエストとレスポンスを処理できるように、開いている状態を維持する場合があります。バックエンド HTTP キープアライブタイムアウトは、ロードバランサとバックエンド間の TCP アイドルタイムアウトを定義します。バックエンド HTTP キープアライブタイムアウトは WebSocket には適用されません。

バックエンドキープアライブタイムアウトは 10 分（600 秒）に固定されており、変更できません。これにより、ロードバランサはアイドル状態の接続を少なくとも 10 分間維持します。この期間が経過すると、ロードバランサはいつでもバックエンドに終了パケットを送信できます。

ロードバランサのバックエンドキープアライブタイムアウトは、バックエンドで実行されているソフトウェアで使用されるキープアライブタイムアウトよりも短くする必要があります。これにより、バックエンドのオペレーティングシステムが TCP reset（RST）で TCP 接続を終了する可能性のある競合状態を回避できます。ロードバランサのバックエンドキープアライブタイムアウトは構成できないため、HTTP キープアライブ（TCP アイドル）タイムアウト値が 600 秒を超えるように、バックエンドソフトウェアを構成する必要があります。

バックエンド HTTP キープアライブタイムアウトが切れると、GFE または Envoy プロキシがバックエンド VM に TCP FIN を送信して、接続を正常に終了します。

次の表は、一般的なウェブサーバーソフトウェアのキープアライブタイムアウト値を変更するために必要な変更を示したものです。

ウェブサーバーソフトウェア	パラメータ	デフォルト設定	推奨される設定
Apache	KeepAliveTimeout	`KeepAliveTimeout 5`	`KeepAliveTimeout 620`
nginx	keepalive_timeout	`keepalive_timeout 75s;`	`keepalive_timeout 620s;`

QUIC セッションのアイドルタイムアウト

QUIC セッションのアイドルタイムアウトは、グローバル外部アプリケーションロードバランサまたは従来のアプリケーションロードバランサの GFE とクライアントとの間で QUIC セッションがアイドル状態を継続できる最大時間を表します。

QUIC セッションのアイドルタイムアウト値は、クライアントのアイドルタイムアウトまたは GFE アイドルタイムアウト（300 秒）のいずれかの最小値として定義されます。GFE のアイドルタイムアウトは 300 秒に固定されています。クライアントのアイドルタイムアウトは構成できます。

再試行数

再試行ロジックのサポートは、外部アプリケーションロードバランサのモードによって異なります。

ロードバランサのモード再試行ロジック

グローバル外部アプリケーションロードバランサ

ロードバランサのモード	再試行ロジック
グローバル外部アプリケーションロードバランサ	URL マップの再試行ポリシーを使用して構成できます。再試行ポリシーを使用して構成できる再試行の最大数（`numRetries`）は 25 です。構成可能な `perTryTimeout` の最大値は 24 時間です。再試行を無効にする場合は、`numRetries` を明示的に 1 に設定する必要があります。再試行ポリシーがない場合、HTTP 本文のないリクエスト（`GET` リクエストなど）が HTTP `502`、`503`、または `504` のレスポンス（`retryConditions=["gateway-error"]`）を返したときに 1 回再試行されます。 HTTP `POST` リクエストは再試行されません。再試行されたリクエストに対して生成されるログエントリは、最終的なレスポンスに対応する 1 件だけです。
従来のアプリケーションロードバランサ	接続の再試行に関する再試行ポリシーは変更できません。 HTTP `POST` リクエストは再試行されません。 80% 以上のバックエンドが正常である限り、HTTP `GET` リクエストは常に 1 回再試行されます。グループ内に存在するバックエンドインスタンスが 1 つだけで、そのバックエンドインスタンスへの接続が失敗した場合、正常でないバックエンドインスタンスの割合が 100% になるため、GFE はリクエストを再試行しません。ロードバランサは、最初のリクエストが失敗した後にバックエンドインスタンスからレスポンスヘッダーを受け取ると、失敗した `GET` リクエストを再試行します。再試行されたリクエストに対して生成されるログエントリは、最終的なレスポンスに対応する 1 件だけです。詳細については、外部アプリケーションロードバランサのロギングとモニタリングをご覧ください。リクエストが失敗すると、ロードバランサは HTTP `502` レスポンスを合成します。
リージョン外部アプリケーションロードバランサ	URL マップの再試行ポリシーを使用して構成できます。デフォルトの再試行回数（`numRetries`）は 1 回です。再試行ポリシーを使用して構成できる再試行の最大数は 25 です。構成可能な `perTryTimeout` の最大値は 24 時間です。再試行ポリシーがない場合、HTTP 本文のないリクエスト（`GET` リクエストなど）が HTTP `502`、`503`、または `504` のレスポンスを返したときに 1 回再試行されます。 HTTP `POST` リクエストは再試行されません。再試行されたリクエストに対して生成されるログエントリは、最終的なレスポンスに対応する 1 件だけです。

URL マップの再試行ポリシーを使用して構成できます。再試行ポリシーを使用して構成できる再試行の最大数（numRetries）は 25 です。構成可能な perTryTimeout の最大値は 24 時間です。

再試行を無効にする場合は、numRetries を明示的に 1 に設定する必要があります。

再試行ポリシーがない場合、HTTP 本文のないリクエスト（GET リクエストなど）が HTTP 502、503、または 504 のレスポンス（retryConditions=["gateway-error"]）を返したときに 1 回再試行されます。

HTTP POST リクエストは再試行されません。

再試行されたリクエストに対して生成されるログエントリは、最終的なレスポンスに対応する 1 件だけです。

従来のアプリケーションロードバランサ

接続の再試行に関する再試行ポリシーは変更できません。

HTTP POST リクエストは再試行されません。

80% 以上のバックエンドが正常である限り、HTTP GET リクエストは常に 1 回再試行されます。グループ内に存在するバックエンドインスタンスが 1 つだけで、そのバックエンドインスタンスへの接続が失敗した場合、正常でないバックエンドインスタンスの割合が 100% になるため、GFE はリクエストを再試行しません。

ロードバランサは、最初のリクエストが失敗した後にバックエンドインスタンスからレスポンスヘッダーを受け取ると、失敗した GET リクエストを再試行します。

再試行されたリクエストに対して生成されるログエントリは、最終的なレスポンスに対応する 1 件だけです。詳細については、外部アプリケーションロードバランサのロギングとモニタリングをご覧ください。

リクエストが失敗すると、ロードバランサは HTTP 502 レスポンスを合成します。

リージョン外部アプリケーションロードバランサ

URL マップの再試行ポリシーを使用して構成できます。デフォルトの再試行回数（numRetries）は 1 回です。再試行ポリシーを使用して構成できる再試行の最大数は 25 です。構成可能な perTryTimeout の最大値は 24 時間です。

再試行ポリシーがない場合、HTTP 本文のないリクエスト（GET リクエストなど）が HTTP 502、503、または 504 のレスポンスを返したときに 1 回再試行されます。

HTTP POST リクエストは再試行されません。

再試行されたリクエストに対して生成されるログエントリは、最終的なレスポンスに対応する 1 件だけです。

WebSocket プロトコルは GKE Ingress でもサポートされています。

不正なリクエストとレスポンスの処理

ロードバランサは、いくつかの理由により、クライアントリクエストとバックエンドレスポンスのいずれについても、相手方のバックエンドまたはクライアントに到達しないようにブロックすることがあります。厳密に HTTP/1.1 を遵守するためという理由もあれば、バックエンド間での予期しないデータのやり取りを避けるという理由もあります。無効にできるチェックはありません。

ロードバランサは、HTTP/1.1 への適合のために以下のリクエストをブロックします。

リクエストの最初の行を解析できない。
ヘッダーにコロン（:）区切り文字がない。
ヘッダーまたは最初の行に無効な文字が含まれている。
コンテンツの長さが有効な数値でない、または、複数のコンテンツ長ヘッダーがある。
複数の転送エンコーディングキーがある、または、認識されない転送エンコーティング値がある。
チャンク化されていない本文があり、コンテンツの長さが指定されていない。
本文のチャンクが解析できない。なんらかのデータがバックエンドに到達するのはこの場合のみです。ロードバランサは、解析不能なチャンクを受信すると、クライアントとバックエンドへの接続を閉じます。

リクエスト処理

次のいずれかが該当する場合、ロードバランサはリクエストをブロックします。

リクエストヘッダーとリクエスト URL の合計サイズが、外部アプリケーションロードバランサのリクエストのヘッダーサイズの上限を超えている。
リクエストメソッドが本文を許可していないにもかかわらず、リクエストに本文がある。
リクエストに Upgrade ヘッダーが含まれており、WebSocket 接続の有効化に Upgrade ヘッダーが使用されない。
HTTP のバージョンが不明。

レスポンス処理

ロードバランサは、次のいずれかに該当する場合、バックエンドからのレスポンスをブロックします。

レスポンスヘッダーの合計サイズが、外部アプリケーションロードバランサの最大レスポンスヘッダーのサイズの上限を超えている。
HTTP のバージョンが不明。

リクエストとレスポンスの両方を処理するときに、ロードバランサは HTTP/1.1 のホップバイホップヘッダーを削除または上書きしてから、目的の宛先に転送することがあります。

トラフィック分散

バックエンドインスタンスグループまたは NEG をバックエンドサービスに追加する場合は、バックエンドの負荷とターゲット容量を測定する方法を定義するバランシングモードを指定します。外部アプリケーションロードバランサは、次の 2 つのバランシングモードをサポートします。

インスタンスグループまたは NEG の場合、RATE は 1 秒あたりのリクエスト（クエリ）の最大数（RPS、QPS）の目標です。すべてのバックエンドが容量を超えると、目標最大 RPS / QPS を超過する場合があります。
UTILIZATION はインスタンスグループ内の VM のバックエンド使用率です。

バックエンド間でのトラフィックの分散方法は、ロードバランサのモードによって異なります。

グローバル外部アプリケーションロードバランサ

Google Front End（GFE）はバックエンドインスタンスにリクエストを送信する前に、どのバックエンドインスタンスがリクエストを受信できるかを推定します。この容量の見積もりは、リクエストの到着と同時に行われるのではなく、事前に行われます。GFE は、利用可能な容量に関する情報を定期的に受け取り、それに応じて受信リクエストを分散します。

容量の意味は、分散モードによって異なります。RATE モードの場合は比較的単純です。GFE は 1 秒あたりに割り当てることができるリクエスト数を正確に決定します。UTILIZATION ベースの負荷分散はより複雑です。ロードバランサはインスタンスの現在の使用率をチェックし、各インスタンスが処理できるクエリ負荷を見積もります。この推定値は、インスタンスの使用率とトラフィックパターンの変化に応じて変化します。

容量の見積もりと事前の割り当ての両方の要素が、インスタンス間の分散に影響します。そのため、Cloud Load Balancing の動作は、2 つのインスタンス間でリクエストを正確に 50:50 に分散する単純なラウンドロビンロードバランサとは異なります。代わりに、 Google Cloud ロードバランシングは、リクエストごとにバックエンドインスタンスの選択を最適化します。

グローバル外部アプリケーションロードバランサの場合、ロードバランシングは 2 層になります。バランシングモードでは、各バックエンド（インスタンスグループまたは NEG）に送信するトラフィックの重みまたは割合を決定します。さらに、ロードバランシングポリシー（LocalityLbPolicy）により、グループ内のインスタンスまたはエンドポイントにトラフィックを分散する方法が決まります。詳細については、ロードバランシングの局所性ポリシー（リージョンバックエンドサービスの API ドキュメント）をご覧ください。

従来のアプリケーションロードバランサの場合、バランシングモードを使用して、最も優先するバックエンド（インスタンスグループまたは NEG）を選択します。トラフィックは、ラウンドロビン方式によりバックエンド内のインスタンスまたはエンドポイント間で分散されます。

リクエストの分散方法

GFE ベースの外部アプリケーションロードバランサは、受信リクエストを分散するために次のプロセスを使用します。

クライアントから第 1 レイヤの GFE へ。エッジルーターは、Google ネットワークの境界にある転送ルールの外部 IP アドレスをアドバタイズします。各アドバタイズは、レイヤ 3 とレイヤ 4 のロードバランシングシステム（Maglev）へのネクストホップの一覧を示します。Maglev システムは、最初のレイヤの Google Front End（GFE）にトラフィックを転送します。
- プレミアムティアを使用する場合、Google は、全世界のあらゆるポイントオブプレゼンスからロードバランサの IP アドレスをアドバタイズします。各ロードバランサの IP アドレスはグローバルエニーキャストです。
- スタンダードティアを使用する場合、Google は転送ルールのリージョンに関連付けられたポイントオブプレゼンスからロードバランサの IP アドレスをアドバタイズします。ロードバランサは、リージョン外部 IP アドレスを使用します。スタンダードティアの転送ルールを使用する場合、インスタンスグループとゾーン NEG バックエンドはロードバランサの転送ルールと同じリージョンに制限されます。
第 1 レイヤの GFE から第 2 レイヤの GFE へ。第 1 レイヤの GFE は、必要に応じて TLS を終端し、以下のプロセスでトラフィックを 2 番目のレイヤの GFE にルーティングします。
- 第 1 レイヤの GFE が URL マップを解析し、バックエンドサービスまたはバックエンドバケットを選択します。
- インターネット NEG を使用するバックエンドサービスの場合、第 1 レイヤの GFE は、第 1 レイヤの GFE と同じ場所に配置された第 2 レイヤの外部転送ゲートウェイを選択します。転送ゲートウェイは、インターネット NEG エンドポイントにリクエストを送信します。これで、インターネット NEG のリクエスト分散プロセスは完了です。
- サーバーレス NEG、Private Service Connect（PSC）NEG、シングルリージョンのバックエンドバケットを使用するバックエンドサービスの場合、第 1 レイヤの GFE は NEG またはバケットと一致するリージョン内にある第 2 レイヤの GFE を選択します。マルチリージョンの Cloud Storage バケットの場合、第 1 レイヤの GFE は、バケットのリージョン内、またはマルチリージョンバケットに可能な限り近いリージョンにある第 2 レイヤの GFE を選択します（ネットワークラウンドトリップ時間により定義されます）。
- インスタンスグループ、GCE_VM_IP_PORT エンドポイントを含むゾーン NEG、ハイブリッド NEG を使用するバックエンドサービスの場合、Google の容量管理システムは、各バックエンドで使用および構成した容量を第 1 レイヤの GFE に通知します。バックエンドに構成された容量は、バランシングモード、バランシングモードのターゲット容量、容量スケーラーにより定義されます。
  - スタンダードティア: 第 1 レイヤの GFE は、バックエンドを含むリージョンにある第 2 レイヤの GFE を選択します。
  - プレミアムティア: 第 1 レイヤの GFE は、該当リージョンのセットから第 2 レイヤの GFE を選択します。該当リージョンは、バックエンドが構成されているすべてのリージョンです。ただし、バックエンド容量がゼロで構成されるリージョンは除きます。第 1 レイヤの GFE は、該当リージョンで最も近い第 2 レイヤの GFE を選択します（ネットワークラウンドトリップ時間により定義されます）。バックエンドが 2 つ以上のリージョンで構成されている場合、第 1 レイヤの GFE は、最初に選択したリージョンがフルになると、他の該当リージョンにリクエストをスピルできます。最初に選択したリージョン内にあるすべてのバックエンドが容量の上限に達した場合、他のリージョンにスピルオーバーできます。
第 2 レイヤの GFE がバックエンドを選択します。第 2 レイヤの GFE はリージョンのゾーンに配置されます。次のプロセスを使用してバックエンドを選択します。
- サーバーレス NEG、Private Service Connect NEG、バックエンドバケットを使用するバックエンドサービスの場合、第 2 レイヤの GFE が Google の本番環境システムにリクエストを転送します。これで、これらのバックエンドのリクエスト分散プロセスは完了です。
- インスタンスグループ、GCE_VM_IP_PORT エンドポイントを含むゾーン NEG、ハイブリッド NEG を使用するバックエンドサービスの場合、Google のヘルスチェックプローブシステムは、バックエンドインスタンスまたはエンドポイントのヘルスチェックステータスを第 2 レイヤの GFE に通知します。
  
  プレミアムティアのみ: 第 2 レイヤの GFE がリージョンに正常なバックエンドインスタンスまたはエンドポイントを持たない場合、バックエンドが構成された別の該当リージョン内にあるもう 1 つの第 2 レイヤの GFE にリクエストを送信することがあります。別のリージョンにある第 2 レイヤの GFE 間におけるスピルオーバーは、リージョン間で可能なすべての組み合わせを使い切るわけではありません。特定のリージョンでバックエンドからトラフィックを転送する必要がある場合は、ヘルスチェックに失敗するようバックエンドを構成するのではなく、バックエンドの容量スケーラーをゼロに設定して、第 1 レイヤの GFE が、前のステップでリージョンを除外するようにします。
第 2 レイヤの GFE は、次のステップで説明するように、リージョン内のゾーンにあるバックエンドインスタンスまたはエンドポイントにリクエストを転送します。
第 2 レイヤの GFE がゾーンを選択します。デフォルトでは、第 2 レイヤの GFE は WATERFALL_BY_REGION アルゴリズムを使用します。第 2 レイヤの各 GFE は、第 2 レイヤの GFE を含むゾーンと同じゾーン内のバックエンドインスタンスまたはエンドポイントを選択します。WATERFALL_BY_REGION ではゾーン間のトラフィックが最小限になるため、リクエスト率が低い場合は第 2 レイヤの各 GFE が第 2 レイヤの GFE と同じゾーンにあるバックエンドにのみリクエストを送信する可能性があります。

グローバル外部アプリケーションロードバランサの場合のみ、serviceLbPolicy を使用して次のいずれかの代替アルゴリズムを使用するように第 2 レイヤの GFE を構成できます。
- SPRAY_TO_REGION: 第 2 レイヤの GFE は、第 2 レイヤの GFE と同じゾーンのバックエンドインスタンスまたはエンドポイントを選択しません。第 2 レイヤの GFE は、リージョン内のすべてのゾーンにある全バックエンドインスタンスまたはエンドポイントにトラフィックを分散しようとします。これにより、ゾーン間のトラフィックが増加すると負荷が均等に分散されます。
- WATERFALL_BY_ZONE: 第 2 レイヤの GFE には、第 2 レイヤの GFE と同じゾーンのバックエンドインスタンスまたはエンドポイントを選択することを強くおすすめします。第 2 レイヤの GFE は、現在のゾーン内のすべてのバックエンドが構成済みの容量に達した後にのみ、別のゾーンのバックエンドにリクエストを転送します。
第 2 レイヤの GFE がゾーン内のインスタンスまたはエンドポイントを選択します。デフォルトでは、第 2 レイヤの GFE はラウンドロビン方式によりバックエンド間でリクエストを分散します。グローバル外部アプリケーションロードバランサの場合のみ、ロードバランシングの局所性ポリシー（localityLbPolicy）を使用してこの設定を変更できます。ロードバランシングの局所性ポリシーは、前の手順で説明した選択済みゾーン内のバックエンドにのみ適用されます。

リージョン外部アプリケーションロードバランサ

リージョン外部アプリケーションロードバランサの場合、トラフィック分散はロードバランシングモードとロードバランシングの局所性ポリシーに基づきます。

バランシングモードでは、各グループ（インスタンスグループまたは NEG）に送信するトラフィックの重みと割合を決定します。ロードバランシングの局所性ポリシー（LocalityLbPolicy）により、グループ内のバックエンドのロードバランシング方法が決まります。

トラフィックを受信すると、バックエンドサービスはバックエンドの分散モードに従ってバックエンド（インスタンスグループまたは NEG）にトラフィックを転送します。バックエンドが選択されると、ロードバランシングの局所性ポリシーに従って、バックエンドグループ内のインスタンスまたはエンドポイント間でトラフィックが分散されます。

詳しくは以下をご覧ください。

セッションアフィニティ

アプリケーションロードバランサのバックエンドサービスで構成されたセッションアフィニティは、正常なバックエンドインスタンスまたはエンドポイントの数が一定であり、以前に選択したバックエンドインスタンスまたはエンドポイントの容量が上限に達していない限り、特定のクライアントからのリクエストを同じバックエンドに送信するためのベストエフォート型の試行を行います。バランシングモードのターゲット容量により、バックエンドの容量が上限に達するタイミングが判断されます。

次の表に、さまざまなアプリケーションロードバランサでサポートされているさまざまなタイプのセッションアフィニティオプションの概要を示します。次のセクションのセッションアフィニティのタイプでは、各セッションアフィニティタイプについて詳しく説明します。

表: サポートされているセッションアフィニティの設定
プロダクト	セッションアフィニティのオプション
グローバル外部アプリケーションロードバランサリージョン外部アプリケーションロードバランサ	なし（`NONE`）クライアント IP（`CLIENT_IP`）生成した Cookie（`GENERATED_COOKIE`）ヘッダーフィールド（`HEADER_FIELD`） HTTP Cookie（`HTTP_COOKIE`）ステートフル Cookie ベースアフィニティ（`STRONG_COOKIE_AFFINITY`）また、次の点にもご注意ください。ロードバランシングの局所性ポリシー（`localityLbPolicy`）の有効なデフォルト値は、セッションアフィニティの設定に応じて変わります。セッションアフィニティが構成されていない場合（セッションアフィニティがデフォルト値の `NONE` のままの場合）、`localityLbPolicy` のデフォルト値は `ROUND_ROBIN` です。セッションアフィニティが `NONE` 以外の値に設定されている場合、`localityLbPolicy` のデフォルト値は `MAGLEV` です。グローバル外部アプリケーションロードバランサの場合、重み付けによるトラフィック分割を使用する場合は、セッションアフィニティを構成しないでください。セッションアフィニティを構成した場合、重み付けトラフィック分割構成が優先されます。
従来のアプリケーションロードバランサ	なし（`NONE`）クライアント IP（`CLIENT_IP`）生成した Cookie（`GENERATED_COOKIE`）

セッションアフィニティを構成する際は、次の点に留意してください。

認証やセキュリティを目的としてセッションアフィニティに依存しないでください。ステートフル Cookie ベースのセッションアフィニティを除き、セッションアフィニティは、サービスの数と正常なバックエンドの数が変わるたびに失われる可能性があります。詳細については、セッションアフィニティの喪失をご覧ください。
--session-affinity フラグと --subsetting-policy フラグのデフォルト値はどちらも NONE です。異なる値を設定できるのは一度に 1 つだけです。

セッションアフィニティのタイプ

外部アプリケーションロードバランサのセッションアフィニティは、次のいずれかのカテゴリに分類できます。

ハッシュベースのセッションアフィニティ（NONE、CLIENT_IP）
HTTP ヘッダーベースのセッションアフィニティ（HEADER_FIELD）
Cookie ベースのセッションアフィニティ（GENERATED_COOKIE、HTTP_COOKIE、STRONG_COOKIE_AFFINITY）

ハッシュベースのセッションアフィニティ

ハッシュベースのセッションアフィニティの場合、ロードバランサはコンシステントハッシュ法のアルゴリズムを使用して、適格なバックエンドを選択します。セッションアフィニティの設定により、ハッシュの計算に使用される IP ヘッダーのフィールドが決まります。

ハッシュベースのセッションアフィニティには、次のタイプがあります。

なし
クライアント IP アフィニティ

なし

セッションアフィニティの設定 NONE は、セッションアフィニティがないことを意味するわけではありません。これは、セッションアフィニティオプションが明示的に構成されていないことを意味します。

ハッシュは、バックエンドを選択するために常に実行されます。セッションアフィニティの設定が NONE の場合、ロードバランサは 5 タプルハッシュを使用してバックエンドを選択します。5 タプルハッシュは、送信元 IP アドレス、送信元ポート、プロトコル、宛先 IP アドレス、宛先ポートで構成されます。

セッションアフィニティのデフォルト値は NONE です。

クライアント IP アフィニティ

「クライアント IP セッションアフィニティ（CLIENT_IP）」は、パケットの送信元 IP アドレスと宛先 IP アドレスから作成された 2 タプルハッシュです。クライアント IP アフィニティは、バックエンドに容量があり、正常な状態を維持している限り、同じクライアント IP アドレスからのすべてのリクエストを同じバックエンドに転送します。

クライアント IP アフィニティを使用する場合は、次の点に留意してください。

パケットがロードバランサに直接送信される場合、パケットの宛先 IP アドレスはロードバランサの転送ルールの IP アドレスと同じになります。
パケットが Google Cloud ロードバランサに配信される前に中間 NAT またはプロキシシステムによって処理されると、パケットの送信元 IP アドレスが元のクライアントに関連付けられた IP アドレスと一致しないことがあります。多くのクライアントが同じ有効な送信元 IP アドレスを共有する場合、一部のバックエンド VM は他の VM よりも多くの接続またはリクエストを受信する可能性があります。

HTTP ヘッダーベースのセッションアフィニティ

ヘッダーフィールドアフィニティ（HEADER_FIELD）では、バックエンドサービスの consistentHash.httpHeaderName フィールドの HTTP ヘッダーの値に基づいて、リクエストがバックエンドにルーティングされます。使用可能なすべてのバックエンドにリクエストを分散するには、各クライアントで異なる HTTP ヘッダー値を使用する必要があります。

ヘッダーフィールドアフィニティは、次の条件を満たす場合にサポートされます。

ロードバランシングの局所性ポリシーが RING_HASH または MAGLEV である。
バックエンドサービスの consistentHash が、HTTP ヘッダーの名前（httpHeaderName）を指定する。

Cookie ベースのセッションアフィニティには次のタイプがあります。

生成された Cookie アフィニティ
HTTP Cookie アフィニティ
ステートフル Cookie ベースセッションアフィニティ

生成された Cookie アフィニティ

生成された Cookie ベースのアフィニティ（GENERATED_COOKIE）を使用する場合、ロードバランサは最初の HTTP リクエストに応答して Set-Cookie ヘッダーに HTTP Cookie を含めます。

生成される Cookie の名前は、ロードバランサのタイプによって異なります。

プロダクト	Cookie 名
グローバル外部アプリケーションロードバランサ	`GCLB`
従来のアプリケーションロードバランサ	`GCLB`
リージョン外部アプリケーションロードバランサ	`GCILB`

生成された Cookie のパス属性は常にスラッシュ（/）になります。他のバックエンドサービスも生成された Cookie アフィニティを使用している場合、同じ URL マップ上のすべてのバックエンドサービスに適用されます。

affinityCookieTtlSec バックエンドサービスパラメータを使用して、Cookie の有効期間（TTL）値を 0～1,209,600 秒の範囲（両端を含む）で構成できます。affinityCookieTtlSec が指定されていない場合、デフォルトの TTL 値は 0 です。

クライアントが、HTTP リクエストの Cookie リクエストヘッダーに生成されたセッションアフィニティ Cookie を含めると、ロードバランサは、セッションアフィニティ Cookie が有効である限り、それらのリクエストを同じバックエンドインスタンスまたはエンドポイントに転送します。これを行うには、Cookie 値を、特定のバックエンドインスタンスまたはエンドポイントを参照するインデックスにマッピングし、生成された Cookie のセッションアフィニティ要件を満たすようにします。

生成された Cookie アフィニティを使用するには、次のバランシングモードと localityLbPolicy 設定を構成します。

バックエンドインスタンスグループの場合は、RATE バランシングモードを使用します。
バックエンドサービスの localityLbPolicy には、RING_HASH または MAGLEV を使用します。localityLbPolicy を明示的に設定しない場合、ロードバランサは暗黙のデフォルトとして MAGLEV を使用します。

詳細については、セッションアフィニティの喪失をご覧ください。

HTTP Cookie アフィニティ

HTTP Cookie ベースのアフィニティ（HTTP_COOKIE）を使用する場合、ロードバランサは最初の HTTP リクエストに応答して Set-Cookie ヘッダーに HTTP Cookie を含めます。Cookie の名前、パス、有効期間（TTL）を指定します。

すべてのアプリケーションロードバランサは、HTTP Cookie ベースのアフィニティをサポートしています。

Cookie の TTL 値は、次のバックエンドサービスパラメータと有効な値を使用して、秒、秒未満（ナノ秒単位）、秒と秒未満（ナノ秒単位）のいずれかで構成できます。

consistentHash.httpCookie.ttl.seconds は、0～315576000000 の値に設定できます（両端を含む）。
consistentHash.httpCookie.ttl.nanos は、0～999999999 の値に設定できます（両端を含む）。単位はナノ秒であるため、999999999 は .999999999 秒を意味します。

consistentHash.httpCookie.ttl.seconds と consistentHash.httpCookie.ttl.nanos の両方が指定されていない場合は、代わりに affinityCookieTtlSec バックエンドサービスパラメータの値が使用されます。affinityCookieTtlSec が指定されていない場合、デフォルトの TTL 値は 0 です。

クライアントが、HTTP リクエストの Cookie リクエストヘッダーに HTTP セッションアフィニティ Cookie を含めると、ロードバランサは、セッションアフィニティ Cookie が有効である限り、それらのリクエストを同じバックエンドインスタンスまたはエンドポイントに転送します。これを行うには、Cookie 値を、特定のバックエンドインスタンスまたはエンドポイントを参照するインデックスにマッピングし、生成された Cookie のセッションアフィニティ要件を満たすようにします。

HTTP Cookie アフィニティを使用するには、次のバランシングモードと localityLbPolicy 設定を構成します。

バックエンドインスタンスグループの場合は、RATE バランシングモードを使用します。
バックエンドサービスの localityLbPolicy には、RING_HASH または MAGLEV を使用します。localityLbPolicy を明示的に設定しない場合、ロードバランサは暗黙のデフォルトとして MAGLEV を使用します。

詳細については、セッションアフィニティの喪失をご覧ください。

ステートフル Cookie ベースセッションアフィニティ

ステートフル Cookie ベースのアフィニティ（STRONG_COOKIE_AFFINITY）を使用する場合、ロードバランサは最初の HTTP リクエストに応答して Set-Cookie ヘッダーに HTTP Cookie を含めます。Cookie の名前、パス、有効期間（TTL）を指定します。

従来のアプリケーションロードバランサを除くすべてのアプリケーションロードバランサは、ステートフル Cookie ベースのアフィニティをサポートしています。

Cookie の TTL 値は、秒、秒未満（ナノ秒単位）、秒と秒未満（ナノ秒単位）のいずれかで構成できます。strongSessionAffinityCookie.ttl で表される期間は、2 週間を超える値（1,209,600 秒）には設定できません。

Cookie の値は、選択したバックエンドインスタンスまたはエンドポイントを値自体にエンコードすることで識別します。Cookie が有効である限り、クライアントが後続の HTTP リクエストの Cookie リクエストヘッダーにセッションアフィニティ Cookie を含めると、ロードバランサは、選択したバックエンドインスタンスまたはエンドポイントにリクエストを転送します。

他のセッションアフィニティ方法とは異なり、

ステートフル Cookie ベースアフィニティには、バランシングモードやロードバランシング局所性ポリシー（localityLbPolicy）に関する特定の要件はありません。
自動スケーリングによってマネージドインスタンスグループに新しいインスタンスが追加されても、ステートフル Cookie ベースアフィニティは影響を受けません。
選択したインスタンスが削除されない限り、自動スケーリングによってマネージドインスタンスグループからインスタンスが削除されても、ステートフル Cookie ベースアフィニティは影響を受けません。
選択したインスタンスが削除されない限り、自動修復によってマネージドインスタンスグループからインスタンスが削除されても、ステートフル Cookie ベースアフィニティは影響を受けません。

詳細については、セッションアフィニティの喪失をご覧ください。

Cookie ベースのアフィニティの TTL がゼロの場合の意味

生成された Cookie アフィニティ、HTTP Cookie アフィニティ、ステートフル Cookie ベースのアフィニティなど、すべての Cookie ベースのセッションアフィニティには TTL 属性があります。

TTL が 0 秒の場合、ロードバランサは Cookie に Expires 属性を割り当てません。この場合、クライアントは Cookie をセッション Cookie として扱います。セッションの定義は、クライアントによって異なります。

ウェブブラウザなどの一部のクライアントは、ブラウジングセッション全体で Cookie を保持します。つまり、Cookie はアプリケーションが閉じられるまで複数のリクエストにわたって保持されます。
他のクライアントは、セッションを単一の HTTP リクエストとして扱い、直後に Cookie を破棄します。

セッションアフィニティの喪失

すべてのセッションアフィニティオプションには、次の要件があります。

選択したバックエンドインスタンスまたはエンドポイントは、バックエンドとして構成されたままにする必要があります。セッションアフィニティは、次のいずれかのイベントが発生すると破棄される可能性があります。
- 選択したインスタンスをインスタンスグループから削除します。
- マネージドインスタンスグループの自動スケーリングまたは自動修復により、選択したインスタンスがマネージドインスタンスグループから削除されます。
- 選択したエンドポイントを NEG から削除します。
- 選択したインスタンスまたはエンドポイントを含むインスタンスグループまたは NEG をバックエンドサービスから削除します。
選択したバックエンドインスタンスまたはエンドポイントは正常な状態を維持する必要があります。選択したインスタンスまたはエンドポイントでヘルスチェックが失敗すると、セッションアフィニティが破棄される可能性があります。
グローバル外部アプリケーションロードバランサと従来のアプリケーションロードバランサの場合、ルーティングパスの変更後に後続のリクエストまたは接続に別の第 1 レイヤの Google Front End（GFE）が使用されると、セッションアフィニティが中断される可能性があります。インターネット上のクライアントから Google へのルーティングパスがリクエストまたは接続によって異なる場合は、別の第 1 レイヤの GFE が選択される可能性があります。

ステートフル Cookie ベースのセッションアフィニティを除き、すべてのセッションアフィニティオプションには次の追加要件があります。

選択したインスタンスまたはエンドポイントを含むインスタンスグループまたは NEG は、ターゲット容量で定義されている容量を満たしてはなりません。（リージョンマネージドインスタンスグループの場合、選択したインスタンスを含むインスタンスグループのゾーンコンポーネントがいっぱいになっていないこと）。インスタンスグループまたは NEG がいっぱいで、他のインスタンスグループまたは NEG がいっぱいでない場合は、セッションアフィニティが破棄される可能性があります。UTILIZATION バランシングモードを使用すると、満杯状態が予測できない方法で変化する可能性があるため、RATE バランシングモードまたは CONNECTION バランシングモードを使用して、セッションアフィニティが破損する可能性のある状況を最小限に抑える必要があります。
構成されたバックエンドインスタンスまたはエンドポイントの合計数は一定にする必要があります。次のいずれかのイベントが 1 つ以上発生すると、構成されたバックエンドインスタンスまたはエンドポイントの数が変わり、セッションアフィニティが破損する可能性があります。
- 新しいインスタンスまたはエンドポイントを追加する:
  - バックエンドサービスで、既存のインスタンスグループにインスタンスを追加します。
  - マネージドインスタンスグループの自動スケーリングでは、バックエンドサービスのマネージドインスタンスグループにインスタンスが追加されます。
  - バックエンドサービスで、既存の NEG にエンドポイントを追加します。
  - 空ではないインスタンスグループまたは NEG をバックエンドサービスに追加します。
- 選択したインスタンスまたはエンドポイントだけでなく、インスタンスまたはエンドポイントを削除する:
  - インスタンスグループのバックエンドからインスタンスを削除した場合。
  - マネージドインスタンスグループの自動スケーリングまたは自動修復により、マネージドインスタンスグループのバックエンドからインスタンスが削除されます。
  - NEG バックエンドからエンドポイントを削除します。
  - 空ではない既存のバックエンドインスタンスグループまたは NEG をバックエンドサービスから削除します。
正常なバックエンドインスタンスまたはエンドポイントの合計数は一定にする必要があります。次のいずれかのイベントが 1 つ以上発生すると、正常なバックエンドインスタンスまたはエンドポイントの数が変わり、セッションアフィニティが破損する可能性があります。
- インスタンスまたはエンドポイントがヘルスチェックに合格し、異常な状態から正常な状態に変わります。
- インスタンスまたはエンドポイントがヘルスチェックに失敗し、正常な状態から異常な状態に移行するか、タイムアウトします。

外部アプリケーション ロードバランサのリクエストの分散 コレクションでコンテンツを整理 必要に応じて、コンテンツの保存と分類を行います。

接続の仕組み

グローバル外部アプリケーション ロードバランサの接続

リージョン外部アプリケーション ロードバランサの接続

ロードバランサとのクライアント通信

クライアント パケットの送信元 IP アドレス

特別なルーティング パス

オープンポート

TLS 終端

タイムアウトと再試行

バックエンド サービスのタイムアウト

コンソール

gcloud

API

クライアント HTTP キープアライブ タイムアウト

コンソール

gcloud

API

バックエンド HTTP キープアライブ タイムアウト

QUIC セッションのアイドル タイムアウト

再試行数

不正なリクエストとレスポンスの処理

リクエスト処理

レスポンス処理

トラフィック分散

グローバル外部アプリケーション ロードバランサ

リクエストの分散方法

リージョン外部アプリケーション ロードバランサ

セッション アフィニティ

セッション アフィニティのタイプ

ハッシュベースのセッション アフィニティ

なし

クライアント IP アフィニティ

HTTP ヘッダーベースのセッション アフィニティ

Cookie ベースのセッション アフィニティ

生成された Cookie アフィニティ

HTTP Cookie アフィニティ

ステートフル Cookie ベース セッション アフィニティ

Cookie ベースのアフィニティの TTL がゼロの場合の意味

セッション アフィニティの喪失

外部アプリケーションロードバランサのリクエストの分散

グローバル外部アプリケーションロードバランサの接続

リージョン外部アプリケーションロードバランサの接続

クライアントパケットの送信元 IP アドレス

特別なルーティングパス

バックエンドサービスのタイムアウト

クライアント HTTP キープアライブタイムアウト

バックエンド HTTP キープアライブタイムアウト

QUIC セッションのアイドルタイムアウト

グローバル外部アプリケーションロードバランサ

リージョン外部アプリケーションロードバランサ

セッションアフィニティ

セッションアフィニティのタイプ

ハッシュベースのセッションアフィニティ

HTTP ヘッダーベースのセッションアフィニティ

Cookie ベースのセッションアフィニティ

ステートフル Cookie ベースセッションアフィニティ

セッションアフィニティの喪失