Définir la langue des requêtes textuelles

Essayer la génération d'images (Vertex AI Studio)

Essayer Imagen dans Colab

Cette page explique comment définir un paramètre Imagen sur Vertex AI facultatif pour spécifier la langue de la requête que vous utilisez. Si vous ne spécifiez pas de langue, Imagen la détecte automatiquement.

Image d'un livre générée à partir d'un prompt en hindi
Image générée à partir du prompt : ऊपर से देखा गया किताबों का ढेर। सबसे ऊपरी पुस्तक में एक पक्षी का जलरंग चित्रण है। किताब पर VERTEX AI मोटे अक्षरों में लिखा हुआ है1

1 Une pile de livres vue du dessus. Le livre du haut contient une illustration en aquarelle d'un oiseau. VERTEX AI est écrit en gras sur le livre.
image d'une femme générée à partir d'un prompt en coréen
Image générée à partir du prompt : 어두운 노란색과 청록색으로 이루어진 밝은 색의 옷을입고 귀걸이를 끼고있는 여자 포스트 모던 패션 사진 2

2 Photographie de mode post-moderne d'une femme portant des vêtements de couleurs vives, comme du jaune foncé et du cyan foncé, et des boucles d'oreille.

Définir la langue des prompts textuels

Les valeurs d'entrée suivantes sont acceptées pour la langue des prompts textuels :

  • Chinois (simplifié) (zh/zh-CN)
  • Chinois (traditionnel) (zh-TW)
  • Anglais (en, valeur par défaut)
  • Français (fr)
  • Allemand (de)
  • Hindi (hi)
  • Japonais (ja)
  • Coréen (ko)
  • Portugais (pt)
  • Espagnol (es)

Console

Si le prompt est dans l'une des langues acceptées, Imagen détecte et traduit votre texte, et renvoie les images générées ou modifiées.

Si votre prompt est dans une langue non disponible, Imagen utilise le texte tel quel pour la requête. Cela peut entraîner un résultat inattendu.

REST

Avant d'utiliser les données de requête ci-dessous, effectuez les remplacements suivants :

  • PROJECT_ID : ID de votre projet Google Cloud .
  • TEXT_PROMPT : prompt textuel qui guide le modèle pour la génération d'images. Ce champ est obligatoire pour la génération et la modification.
  • PROMPT_LANGUAGE : chaîne. Facultatif. Code de langue correspondant à la langue de votre prompt textuel. Dans cet exemple, il s'agit de hi. Valeurs disponibles :
    • auto : détection automatique. Si Imagen détecte une langue compatible, le prompt (et éventuellement un prompt négatif) est traduit en anglais. Si la langue détectée n'est pas compatible, Imagen utilise le texte d'entrée tel quel, ce qui peut entraîner un résultat inattendu. Aucun code d'erreur n'est renvoyé.
    • en : anglais (valeur par défaut si omise)
    • es : espagnol
    • hi : hindi
    • ja : japonais
    • ko : coréen
    • pt : portugais
    • zh-TW : chinois (traditionnel)
    • zh ou zh-CN : chinois (simplifié)

Méthode HTTP et URL :

POST https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/imagegeneration@005:predict

Corps JSON de la requête :

{
  "instances": [
    {
      "prompt": "सूर्यास्त के समय एक समुद्र तट। उड़ते पक्षी, हवा में लहराते नारियल के पेड़। लोग समुद्र तट पर सैर का आनंद ले रहे हैं।"
    }
  ],
  "parameters": {
    "language": "PROMPT_LANGUAGE"
  }
}

Pour envoyer votre requête, choisissez l'une des options suivantes :

curl

Enregistrez le corps de la requête dans un fichier nommé request.json, puis exécutez la commande suivante :

curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/imagegeneration@005:predict"

PowerShell

Enregistrez le corps de la requête dans un fichier nommé request.json, puis exécutez la commande suivante :

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/imagegeneration@005:predict" | Select-Object -Expand Content
L'exemple suivant représente la réponse à une requête avec "sampleCount": 2. La réponse renvoie deux objets de prédiction, avec les octets d'image générés encodés en base64.
{
  "predictions": [
    {
      "bytesBase64Encoded": "BASE64_IMG_BYTES",
      "mimeType": "image/png"
    },
    {
      "mimeType": "image/png",
      "bytesBase64Encoded": "BASE64_IMG_BYTES"
    }
  ]
}

Étapes suivantes