Einrichtung für Ray in Vertex AI

Bevor Sie Ray on Vertex AI verwenden, führen Sie die folgenden Schritte aus, um Ihr Google-Projekt und das Vertex AI SDK für Python einzurichten:

  1. Richten Sie die Abrechnung für Ihr Projekt ein, installieren Sie die gcloud CLI und aktivieren Sie die Vertex AI API. Folgen Sie dazu der Anleitung unter Projekt- und Entwicklungsumgebung einrichten.

    Vertex AI API aktivieren

  2. Voraussetzung: Sie müssen wissen, wie man Programme mit Open-Source-Ray entwickelt.

  3. Das hier verwendete Ray on Vertex AI SDK für Python ist eine Version des Vertex AI SDK für Python, die die Funktionen von Ray Client, Ray BigQuery Connector, der Ray-Clusterverwaltung in Vertex AI und Vorhersagen in Vertex AI umfasst.

    • Wenn Sie Ray on Vertex AI in der Google Cloud Console verwenden, führt Sie ein Colab Enterprise-Notebook durch den Installationsprozess von Vertex AI SDK für Python, nachdem Sie einen Ray-Cluster erstellt haben.

    • Wenn Sie Ray on Vertex AI in der Vertex AI Workbench oder einer anderen interaktiven Python-Umgebung verwenden, installieren Sie das Vertex AI SDK für Python:

      # The latest image in the Ray cluster includes Ray 2.47
      # The latest supported Python version is Python 3.11.
      $ pip install google-cloud-aiplatform[ray]

      Starten Sie nach der Installation des SDK den Kernel neu, bevor Sie Pakete importieren.

  4. Optional: Wenn Sie Daten aus BigQuery lesen möchten, erstellen Sie ein neues BigQuery-Dataset oder verwenden Sie ein vorhandenes Dataset. Hier finden Sie eine BigQuery dazu.

  5. (Optional) Um das Risiko einer Daten-Exfiltration aus Vertex AI zu minimieren, können Sie VPC Service Controls aktivieren und beim Erstellen eines Clusters ein VPC-Netzwerk angeben. Weitere Informationen finden Sie unter VPC Service Controls mit Vertex AI.

    Wenn Sie VPC Service Controls aktivieren, können Sie keine Ressourcen außerhalb des Perimeters erreichen, z. B. Dateien in einem Cloud Storage-Bucket.

  6. Optional: Wenn Sie ein benutzerdefiniertes Container-Image verwenden möchten, hosten Sie es in Artifact Registry. Mit einem benutzerdefinierten Image können Sie Python-Abhängigkeiten hinzufügen, die nicht in den vorgefertigten Container-Images enthalten sind. Informationen zum Erstellen benutzerdefinierter Images finden Sie in der Docker-Dokumentation unter „Software verpacken“.

  7. (Optional) Wenn Sie beim Erstellen eines Ray-Clusters in Vertex AI ein VPC-Netzwerk angeben, empfehlen wir dringend, in Ihrem Projekt ein VPC-Netzwerk im automatischen Modus zu verwenden. VPC-Netzwerke im benutzerdefinierten Modus und mehrere VPC-Netzwerke im selben Projekt werden nicht unterstützt und können dazu führen, dass die Clustererstellung fehlschlägt.

Cluster schützen

Befolgen Sie die Best Practices und Richtlinien für Ray, einschließlich der Ausführung von vertrauenswürdigem Code in vertrauenswürdigen Netzwerken, um Ihre Ray-Arbeitslasten zu schützen. Die Bereitstellung von ray.io in Ihren Cloud-Instanzen fällt unter das Modell der geteilten Verantwortung.

Weitere Informationen zu den Google Cloud Best Practices finden Sie im Sicherheitsbulletin GCP-2024-020.

Unterstützte Standorte

In der Tabelle Featureverfügbarkeit werden die verfügbaren Standorte für Ray on Vertex AI für benutzerdefiniertes Modelltraining aufgeführt.

Nächste Schritte