Auf dieser Seite wird beschrieben, wie Sie inaktive Instanzen für einen Dienst aktivieren, indem Sie Mindestinstanzen mit dem Standardverhalten für Cloud Run-Autoscaling konfigurieren. Informationen zum manuellen Skalieren Ihres Dienstes finden Sie unter Manuelle Skalierung.
Wenn Sie das Autoscaling-Verhalten Ihres Dienstes genauer steuern möchten, können Sie eine Mindestanzahl von Instanzen festlegen, um langsame Containerstartzeiten zu vermeiden und die Dienstlatenz zu verringern. Basierend auf der Anzahl der eingehenden Anfragen skaliert Cloud Run für Cloud Run-Dienste standardmäßig die Anzahl der Instanzen herunter.
Wenn Ihr Dienst jedoch eine geringere Latenz erfordert, insbesondere bei der Skalierung von null aktiven Instanzen, können Sie dieses Standardverhalten ändern. Dazu geben Sie eine Mindestanzahl von Containerinstanzen an, die einsatzbereit gehalten werden und so stets bereit sind, Anfragen zu bedienen. Weitere Informationen zu dieser Optimierung finden Sie unter Allgemeine Entwicklungstipps.
Cloud Run entfernt Instanzen, die keine Anfragen verarbeiten (inaktiv).
Wenn eine Mindestanzahl von Instanzen festgelegt ist, führt Cloud Run mindestens die Mindestanzahl von Instanzen aus, auch wenn sie keine Anfragen verarbeiten. Aktive Instanzen oberhalb der Grenze min-instances
können inaktiv werden, wenn sie keine Anfragen empfangen.
Beispiel: Wenn min-instances
10
ist und die Anzahl der aktiven Instanzen 0
ist, beträgt die Anzahl der inaktiven Instanzen 10
. Wenn die Anzahl der aktiven Instanzen auf 6
steigt, sinkt die Anzahl der inaktiven Instanzen auf 4
.
Wenn ein Dienst in letzter Zeit keinen Traffic verarbeitet hat, kann der Messwert für aktive Instanzen angeben, dass keine Instanzen aktiv sind, auch wenn Sie eine oder mehrere Mindestinstanzen angegeben haben.
Instanzen können jederzeit neu gestartet werden.
Abrechnung
Für Instanzen, die mit der Funktion für Mindestinstanzen weiterhin ausgeführt werden, fallen Kosten an.
Das folgende Diagramm zeigt, wie die Abrechnung während des Lebenszyklus einer Instanz funktioniert, wenn Sie Mindestinstanzen für einen Dienst oder eine Revision konfigurieren:
Je nach den konfigurierten Abrechnungseinstellungen wird der Dienst so abgerechnet:
- Bei der anfragebasierten Abrechnung wird ein niedrigerer Preis berechnet, wenn Instanzen inaktiv sind und auf die Verarbeitung von Anfragen warten. Wenn die Mindestanzahl von Instanzen auf
0
festgelegt ist, werden Ihnen keine Kosten in Rechnung gestellt, wenn Instanzen inaktiv sind. - Bei der instanzbasierten Abrechnung wird Ihnen der Standardpreis für den gesamten Lebenszyklus der Instanz in Rechnung gestellt. Die Zeit vom Start bis zum Herunterfahren umfasst die Zeit, in der eine Instanz Anfragen verarbeitet oder inaktiv ist. Das bedeutet, dass Ihnen auch dann der Standardtarif in Rechnung gestellt wird, wenn „min_instances“ auf
0
festgelegt ist. Diese Option eignet sich gut, wenn Sie CPU außerhalb von Anfragen benötigen. Wenn „minInstances“ auf0
festgelegt ist, wird der Standardtarif berechnet.
Da diese Gebühren planbar sind, empfiehlt Google den Erwerb eines Rabatts für zugesicherte Nutzung.
Mindestanzahl von Instanzen auf Dienstebene oder auf Überarbeitungsebene anwenden
Sie können die Mindestanzahl von Instanzen auf Dienstebene oder auf Überarbeitungsebene konfigurieren. Google empfiehlt, die Mindestanzahl von Instanzen auf Dienstebene anzuwenden und die Kombination von Mindestanzahl von Instanzen auf Dienstebene und Überarbeitungsebene zu vermeiden. Weitere Informationen zum Verhalten, wenn Sie sowohl Skalierungseinstellungen auf Dienstebene als auch auf Revisionsebene konfigurieren
Wenn Sie die Mindestanzahl von Instanzen auf Überarbeitungsebene anwenden, werden die Einstellungen bei der Bereitstellung der Überarbeitung wirksam. Wenn Sie diese Funktion auf Dienstebene anwenden, wird die Einstellung wirksam, ohne dass Sie eine neue Revision bereitstellen müssen.
Überarbeitungen und Mindestinstanzen
Wenn eine Mindestanzahl von Instanzen auf Dienstebene festgelegt ist, werden eingehende Anfragen proportional zur Trafficaufteilung auf alle Überarbeitungen verteilt, die Traffic bereitstellen.
Wenn eine Mindestanzahl von Instanzen auf Überarbeitungsebene festgelegt ist, werden Mindestanzahl von Instanzen gestartet, wenn in einer Trafficaufteilung auf die Überarbeitung verwiesen wird oder wenn ihr ein Traffic-Tag zugewiesen ist. Das bedeutet, dass die Instanz bei der Verarbeitung von Anfragen und auch dann abgerechnet wird, wenn sie auf eingehende Anfragen wartet.
Getaggte Überarbeitungen und Mindestinstanzen auf Dienstebene
Wenn eine Überarbeitung mit einem zugewiesenen Tag gestartet wird, wird die Instanz auf die Mindestanzahl von Instanzen auf Dienstebene angerechnet, wenn sie Teil einer Trafficaufteilung ist.
Routing mit Mindestanzahl von Instanzen anfordern
Wenn Sie eine Mindestanzahl von Instanzen festlegen, verteilt Cloud Run eingehende Anfragen gleichmäßig auf alle bereitgestellten Instanzen. Dieses Verhalten ist wichtig, um Kosten zu verwalten, insbesondere bei der anfragebasierten Abrechnung oder wenn Sie Hot-Spare-Instanzen im Leerlauf beibehalten möchten. Um die Kosten zu minimieren, legen Sie die Mindestanzahl von Instanzen auf die Anzahl der Instanzen fest, die für die Bereitstellung Ihres typischen Traffics erforderlich sind.
Erforderliche Rollen
Bitten Sie Ihren Administrator, Ihnen die folgenden IAM-Rollen zuzuweisen, um die Berechtigungen zu erhalten, die Sie zum Konfigurieren und Bereitstellen von Cloud Run-Diensten benötigen:
-
Cloud Run-Entwickler (
roles/run.developer
) im Cloud Run-Dienst -
Dienstkontonutzer (
roles/iam.serviceAccountUser
) für die Dienstidentität
Eine Liste der IAM-Rollen und -Berechtigungen im Zusammenhang mit Cloud Run finden Sie unter IAM-Rollen für Cloud Run und IAM-Berechtigungen für Cloud Run. Wenn Ihr Cloud Run-Dienst mitGoogle Cloud APIs wie Cloud-Clientbibliotheken verknüpft ist, lesen Sie die Konfigurationsanleitung für Dienstidentitäten. Weitere Informationen zum Zuweisen von Rollen finden Sie unter Bereitstellungsberechtigungen und Zugriff verwalten.
Mindestinstanzen auf Dienstebene konfigurieren
Bei Containerinstanzen ist die Mindestanzahl von Instanzen auf Dienstebene standardmäßig deaktiviert und auf 0
eingestellt. Sie können diese Standardeinstellung über dieGoogle Cloud -Konsole, die Google Cloud CLI oder eine YAML-Datei ändern:
Console
Rufen Sie in der Google Cloud Console Cloud Run auf:
Wenn Sie einen neuen Dienst konfigurieren, wählen Sie im Menü Dienste aus und klicken Sie auf Container bereitstellen, um das Formular Dienst erstellen aufzurufen. Rufen Sie das Formular Dienstskalierung auf.
Wenn Sie einen vorhandenen Dienst konfigurieren, klicken Sie auf den Dienst, um das Detailfeld aufzurufen, und dann oben rechts im Detailfeld auf
Skalierungseinstellungen auf Dienstebene bearbeiten.Geben Sie im Feld Mindestinstanzen die Anzahl von Containerinstanzen an, die einsatzbereit gehalten werden sollen, um Anfragen zu erhalten.
Klicken Sie für einen neuen Dienst auf Erstellen oder für einen vorhandenen Dienst auf Bereitstellen.
gcloud
Mit dem folgenden Befehl können Sie die Mindestanzahl von Instanzen für einen bestimmten Dienst aktualisieren:
gcloud run services update SERVICE --min MIN-VALUE
Ersetzen Sie Folgendes:
- SERVICE: der Name Ihres Dienstes.
- MIN-VALUE: die Anzahl von Containerinstanzen, die einsatzbereit gehalten werden und zum Empfangen von Anfragen bereit sein sollen. Geben Sie
default
an, um alle Einstellungen für Mindestinstanzen zu löschen.
Alternativ können Sie die Mindestanzahl von Instanzen während der Bereitstellung mit dem folgenden Befehl festlegen:
gcloud run deploy --image IMAGE_URL --min MIN-VALUE
Ersetzen Sie Folgendes:
- IMAGE_URL: ein Verweis auf das Container-Image, z. B.
us-docker.pkg.dev/cloudrun/container/hello:latest
Wenn Sie Artifact Registry verwenden, muss das Repository REPO_NAME bereits erstellt sein. Die URL hat das FormatLOCATION-docker.pkg.dev/PROJECT_ID/REPO_NAME/PATH:TAG
. - MIN-VALUE: die Anzahl der Containerinstanzen, die einsatzbereit gehalten werden und zum Empfangen von Anfragen bereit sein sollen. Geben Sie
default
an, um alle Einstellungen für Mindestinstanzen zu löschen.
YAML
Jede Konfigurationsänderung führt zur Erstellung einer neuen Überarbeitung. Für nachfolgende Überarbeitungen gilt automatisch dieselbe Konfigurationseinstellung, sofern Sie sie nicht explizit aktualisieren.
Wenn Sie einen neuen Dienst erstellen, überspringen Sie diesen Schritt. Wenn Sie einen vorhandenen Dienst aktualisieren, laden Sie die zugehörige YAML-Konfiguration herunter:
gcloud run services describe SERVICE --format export > service.yaml
Aktualisieren Sie das Attribut
run.googleapis.com/minScale
:apiVersion: serving.knative.dev/v1 kind: Service metadata: name: SERVICE annotations: run.googleapis.com/minScale: 'MIN_INSTANCE'
Ersetzen Sie Folgendes:
- SERVICE: Der Name Ihres Cloud Run-Dienstes
- MIN-INSTANCE: die Anzahl der Instanzen, die einsatzbereit gehalten werden und zum Empfangen von Anfragen bereit sein sollen.
Erstellen oder aktualisieren Sie den Dienst mit dem folgenden Befehl:
gcloud run services replace service.yaml
Clientbibliotheken
So aktualisieren Sie die Mindestanzahl von Instanzen auf Dienstebene für Ihren Dienst über Code:
REST API
Wenn Sie die Mindestanzahl von Instanzen auf Dienstebene für einen bestimmten Dienst aktualisieren möchten, senden Sie eine PATCH
-HTTP-Anfrage an den Endpunkt service
der Cloud Run Admin API.
Verwenden Sie zum Beispiel curl
:
curl -H "Content-Type: application/json" \ -H "Authorization: Bearer ACCESS_TOKEN" \ -X PATCH \ -d '{ "scaling": { "minInstanceCount": MIN-VALUE }}' \ https://run.googleapis.com/v2/projects/PROJECT_ID/locations/REGION/services/SERVICE?update_mask=scaling.minInstanceCount
Ersetzen Sie Folgendes:
- ACCESS_TOKEN: Ein gültiges Zugriffstoken für ein Konto, das die IAM-Berechtigungen zum Aktualisieren eines Dienstes hat.
Wenn Sie beispielsweise in
gcloud
angemeldet sind, können Sie ein Zugriffstoken mitgcloud auth print-access-token
abrufen. Innerhalb einer Cloud Run-Containerinstanz können Sie ein Zugriffstoken über den Metadatenserver der Containerinstanz abrufen. - MIN-VALUE: Die Anzahl der Containerinstanzen, die einsatzbereit gehalten werden und zum Empfangen von Anfragen bereit sein sollen.
- SERVICE ist der Name des Diensts.
- REGION: die Google Cloud Region des Dienstes.
- PROJECT-ID: die Google Cloud Projekt-ID.
Mindestinstanzen auf Dienstebene ansehen
So rufen Sie die aktuellen Einstellungen für die Mindestinstanzen auf Dienstebene für Ihren Cloud Run-Dienst auf:
Console
Rufen Sie in der Google Cloud Console Cloud Run auf:
Klicken Sie auf den gewünschten Dienst, um den Bereich Dienstdetails zu öffnen.
Die aktuelle Einstellung wird oben rechts im Bereich mit den Dienstdetails neben Skalierung angezeigt.
gcloud
Verwenden Sie den folgenden Befehl:
gcloud run services describe SERVICE
Suchen Sie in der zurückgegebenen Konfiguration den Wert für Skalierung: automatisch (Min.: MIN_VALUE, Max.: MAX_VALUE).
Mindestanzahl von Instanzen auf Überarbeitungsebene konfigurieren
Jede Konfigurationsänderung führt zur Erstellung einer neuen Überarbeitung. Für nachfolgende Überarbeitungen gilt automatisch dieselbe Konfigurationseinstellung, sofern Sie sie nicht explizit aktualisieren.
Bei Containerinstanzen ist min-instances
standardmäßig deaktiviert und auf 0
eingestellt. Sie können diese Standardeinstellung über die Google Cloud Console, die Google Cloud CLI oder eine YAML-Datei ändern, wenn Sie einen neuen Dienst erstellen oder eine neue Überarbeitung bereitstellen:
Console
Rufen Sie in der Google Cloud Console Cloud Run auf:
Wählen Sie im Menü Dienste aus und klicken Sie auf Container bereitstellen, um einen neuen Dienst zu konfigurieren. Wenn Sie einen vorhandenen Dienst konfigurieren möchten, klicken Sie auf den Dienst und dann auf Neue Überarbeitung bearbeiten und bereitstellen.
Wenn Sie einen neuen Dienst konfigurieren, füllen Sie die Seite mit den anfänglichen Diensteinstellungen aus und klicken Sie dann auf Container, Volumes, Netzwerk, Sicherheit, um die Seite zur Dienstkonfiguration zu maximieren.
Klicken Sie auf den Tab Container.
- Geben Sie im Feld Mindestinstanzen die Anzahl von Containerinstanzen an, die einsatzbereit gehalten werden sollen, um Anfragen zu erhalten.
Klicken Sie auf Erstellen oder Bereitstellen.
gcloud
Mit dem folgenden Befehl können Sie min-instance
für einen bestimmten Dienst aktualisieren:
gcloud run services update SERVICE --min-instances MIN-VALUE
Ersetzen Sie Folgendes:
- SERVICE: der Name Ihres Dienstes.
- MIN-VALUE: die Anzahl von Containerinstanzen, die einsatzbereit gehalten werden und zum Empfangen von Anfragen bereit sein sollen. Geben Sie
default
an, um alle Einstellungen für Mindestinstanzen zu löschen.
Sie können min-instance
auch während der Bereitstellung mit dem folgenden Befehl festlegen:
gcloud run deploy --image IMAGE_URL --min-instances MIN-VALUE
Ersetzen Sie Folgendes:
- IMAGE_URL: ein Verweis auf das Container-Image, z. B.
us-docker.pkg.dev/cloudrun/container/hello:latest
Wenn Sie Artifact Registry verwenden, muss das Repository REPO_NAME bereits erstellt sein. Die URL hat das FormatLOCATION-docker.pkg.dev/PROJECT_ID/REPO_NAME/PATH:TAG
. - MIN-VALUE: die Anzahl von Containerinstanzen, die einsatzbereit gehalten werden und zum Empfangen von Anfragen bereit sein sollen. Geben Sie
default
an, um alle Einstellungen für Mindestinstanzen zu löschen.
YAML
Wenn Sie einen neuen Dienst erstellen, überspringen Sie diesen Schritt. Wenn Sie einen vorhandenen Dienst aktualisieren, laden Sie die zugehörige YAML-Konfiguration herunter:
gcloud run services describe SERVICE --format export > service.yaml
Aktualisieren Sie das Attribut
autoscaling.knative.dev/minScale:
:apiVersion: serving.knative.dev/v1 kind: Service metadata: name: SERVICE spec: template: metadata: annotations: autoscaling.knative.dev/minScale: 'MIN-INSTANCE' name: REVISION
Ersetzen Sie Folgendes:
- SERVICE: Der Name Ihres Cloud Run-Dienstes
- MIN-INSTANCE: die Anzahl der Instanzen, die einsatzbereit gehalten werden und zum Empfangen von Anfragen bereit sein sollen.
- REVISION durch einen neuen Überarbeitungsnamen oder löschen (falls vorhanden). Wenn Sie einen neuen Überarbeitungsnamen angeben, muss er die folgenden Kriterien erfüllen:
- Beginnt mit
SERVICE-
- Enthält nur Kleinbuchstaben, Ziffern und
-
- Endet nicht mit
-
- Darf nicht mehr als 63 Zeichen enthalten
- Beginnt mit
Erstellen oder aktualisieren Sie den Dienst mit dem folgenden Befehl:
gcloud run services replace service.yaml
Terraform
Informationen zum Anwenden oder Entfernen einer Terraform-Konfiguration finden Sie unter Grundlegende Terraform-Befehle.
Fügen Sie einergoogle_cloud_run_v2_service
-Ressource in Ihrer Terraform-Konfiguration Folgendes hinzu:Die vorherige google_cloud_run_v2_service
-Ressource gibt eine Mindestanzahl von Instanzen von 1
unter template.scaling
an.
Ersetzen Sie 1
durch Ihre eigene Mindestanzahl von Instanzen.
Mindestanzahl von Instanzen auf Überarbeitungsebene ansehen
So rufen Sie die aktuellen Einstellungen für die Mindestanzahl von Instanzen auf Überarbeitungsebene für Ihren Cloud Run-Dienst auf:
Console
Rufen Sie in der Google Cloud Console Cloud Run auf:
Klicken Sie auf den gewünschten Dienst, um den Bereich Dienstdetails zu öffnen.
Klicken Sie auf den Tab Überarbeitungen.
Im Detailbereich rechts wird die Einstellung Mindestanzahl von Instanzen für Revision auf dem Tab Container aufgeführt.
gcloud
Verwenden Sie den folgenden Befehl:
gcloud run services describe SERVICE
Suchen Sie in der zurückgegebenen Konfiguration nach dem Wert für Mindestanzahl von Instanzen.
Beispiele
In den folgenden Abschnitten wird das Dienstverhalten beim Konfigurieren von Mindestinstanzen beschrieben.
Mindest- oder Höchstanzahl von Instanzen auf Dienstebene und Überarbeitungsebene verwenden
Die folgende Tabelle zeigt das Verhalten, wenn Sie die Mindestanzahl von Instanzen auf Dienstebene mit der Mindest- oder Höchstanzahl von Instanzen auf Überarbeitungsebene kombinieren:
Konfigurationseinstellung | Verhalten |
---|---|
Sowohl die Mindestanzahl von Instanzen auf Dienstebene als auch die Mindestanzahl von Instanzen auf Überarbeitungsebene sind festgelegt. | Der effektive Wert für die Überarbeitung ist der größere Wert aus der Mindestanzahl von Instanzen auf Überarbeitungsebene und der Mindestanzahl von Instanzen auf Dienstebene. |
Es sind sowohl Mindestinstanzen auf Dienstebene als auch Höchstinstanzen auf Überarbeitungsebene festgelegt. | Der effektive Wert für die Überarbeitung ist der kleinere Wert aus der Höchstanzahl von Instanzen auf Überarbeitungsebene und der Mindestanzahl von Instanzen auf Dienstebene. Dies gilt auch dann, wenn die maximale Anzahl von Instanzen auf Überarbeitungsebene verhindert, dass der Dienst die Anzahl der Instanzen erreicht, die für die Mindestanzahl von Instanzen auf Dienstebene konfiguriert ist. |
Mindestanzahl von Instanzen auf Dienstebene mit Trafficaufteilung verwenden
Wenn Sie Trafficaufteilung verwenden, wird die Mindestanzahl von Instanzen auf Dienstebene entsprechend dem Anteil der Trafficaufteilung auf die Überarbeitungen aufgeteilt. Wenn beispielsweise die Mindestanzahl von Instanzen auf Dienstebene = 10 ist, werden bei einer 50/50-Trafficaufteilung jeder Überarbeitung 5 Mindestinstanzen auf Dienstebene zugewiesen.
Die folgende Tabelle enthält Beispielkonfigurationsszenarien:
Beispielanwendungsfall | Beispielkonfiguration | Ergebnis |
---|---|---|
Keine Einstellungen auf Überarbeitungsebene | Mindestanzahl von Instanzen auf Dienstebene: 10
|
Überarbeitung A erhält 6 Instanzen aus der Mindestanzahl von Instanzen auf Dienstebene, die proportional zur Trafficaufteilung sind. Überarbeitung B erhält 4 Instanzen aus der Mindestanzahl von Instanzen auf Dienstebene, die proportional zur Trafficaufteilung sind. |
Es werden mehr als die Mindestanzahl von Instanzen auf Dienstebene aufgrund der Mindestanzahl von Instanzen auf Überarbeitungsebene empfangen | Mindestanzahl von Instanzen auf Dienstebene: 10
|
Überarbeitung A erhält 6 Instanzen aufgrund der Mindestanzahl von Instanzen auf Überarbeitungsebene. Überarbeitung B erhält fünf Instanzen aus der Mindestanzahl von Instanzen auf Dienstebene, die proportional zur Trafficaufteilung sind. Dies überschreitet die Mindestanzahl von Instanzen auf Dienstebene und ist beabsichtigt. |
Es werden weniger als die Mindestanzahl von Instanzen auf Dienstebene aufgrund der Höchstanzahl von Instanzen auf Überarbeitungsebene empfangen. | Mindestanzahl von Instanzen auf Dienstebene: 10
|
Version A erhält aufgrund der Trafficaufteilung 3 Instanzen aus der Mindestanzahl von Instanzen auf Dienstebene, ist aber auf die Höchstanzahl von Instanzen auf Versionsebene beschränkt. Version B erhält proportional zur Trafficaufteilung 5 Instanzen aus der Mindestanzahl von Instanzen auf Dienstebene. Das Ergebnis sind 8 Instanzen auf Dienstebene, da 2 aufgrund der maximalen Anzahl von Instanzen auf Überarbeitungsebene von Überarbeitung A verloren gehen. |
Die Mindestanzahl der Instanzen auf Dienstebene ist größer als die Anzahl der Überarbeitungen der Trafficaufteilung und es gibt eine kleine Anzahl von Instanzen, die proportional zur Trafficaufteilung sind | Mindestinstanzen auf Dienstebene: 3
|
Überarbeitung A erhält eine Mindestinstanz und Überarbeitung B zwei Mindestinstanzen. Die Anzahl der Instanzen für den Dienst ist 3. |
Mindestanzahl der erforderlichen Instanzen ermitteln
Wenn die Mindestanzahl von Instanzen höher ist als für Ihren typischen Traffic erforderlich, werden viele Instanzen leicht aktiv und verarbeiten jeweils einige Anfragen. Wenn für Ihren Dienst beispielsweise normalerweise 200 Instanzen für die Spitzenlast erforderlich sind, aber die Mindestanzahl auf 600 konfiguriert ist, werden eingehende Anfragen auf alle 600 Instanzen verteilt. Das führt dazu, dass viele dieser 600 Instanzen etwas aktiv werden und jeweils einen kleinen Teil des Traffics verarbeiten, anstatt dass etwa 200 Instanzen sehr aktiv sind und die verbleibenden 400 Instanzen vollständig im Leerlauf bleiben.
Um die Kosten zu minimieren (durch eine höhere Auslastung bei weniger Instanzen), legen Sie die Mindestanzahl von Instanzen auf einen Wert fest, der sich eng an der tatsächlichen Anzahl von Instanzen orientiert, die zur Verarbeitung Ihres typischen Traffics erforderlich sind.
Wenn beim Autoscaling zusätzliche Instanzen über die konfigurierte Mindestanzahl von Instanzen hinaus bereitgestellt werden, leitet Cloud Run eingehende Anfragen vorzugsweise zuerst an die konfigurierten Mindestinstanzen weiter, bevor Anfragen an die automatisch skalierten Instanzen gesendet werden. Bei der anfragebasierten Abrechnung werden durch dieses bevorzugte Routing zu den konfigurierten Mindestinstanzen die Kosten gesenkt, da die konfigurierten Mindestinstanzen vor den automatisch skalierten Instanzen verwendet werden. Diese bevorzugte Weiterleitung kann je nach Traffic-Menge auch dazu führen, dass konfigurierte Mindestinstanzen eine höhere Auslastung als automatisch skalierte Instanzen haben.