Definir o idioma da solicitação de texto

Testar a geração de imagens (Vertex AI Studio)

Testar o Imagen em um Colab

Nesta página, descrevemos como definir um parâmetro opcional da Imagen na Vertex AI para especificar o idioma do comando usado. Se você não especificar um idioma, a Imagen vai detectar automaticamente.

Imagem de livro gerada a partir de um comando em hindi
Imagem gerada com base no comando: ऊपर से देखा गया किताबों का ढेर। सबसे ऊपरी पुस्तक में एक पक्षी का जलरंग चित्रण है। किताब पर VERTEX AI मोटे अक्षरों में लिखा हुआ है 1

1 Uma pilha de livros vista de cima. O livro na parte superior contém uma ilustração em aquarela de um pássaro. VERTEX AI está escrita em negrito no livro.
imagem de uma mulher com base em um comando em coreano
Imagem gerada com base no comando: 어두운 노란색과 청록색으로 이루어진 밝은 색의 옷을입고 귀걸이를 끼고있는 여자 포스트 모던 패션 사진 2

2 Mulher usando brincos e roupas com cores brilhantes, em amarelo-escuro e ciano-escuro; fotografia de moda pós-moderna.

Definir o idioma da solicitação de texto

Os seguintes valores de entrada são compatíveis com o idioma do comando de texto:

  • Chinês (simplificado) (zh/zh-CN)
  • Chinese (Traditional) (zh-TW)
  • Inglês (en, valor padrão)
  • Francês (fr)
  • Alemão (de)
  • Hindi (hi)
  • Japonês (ja)
  • Coreano (ko)
  • Português (pt)
  • Espanhol (es)

Console

Se o comando estiver em um dos idiomas compatíveis, o Imagen vai detectar e traduzir o texto e retornar as imagens geradas ou editadas.

Se o comando estiver em um idioma sem suporte, o Imagen usará o texto exatamente como ele foi escrito para a solicitação. Isso pode resultar em uma saída inesperada.

REST

Antes de usar os dados da solicitação abaixo, faça as substituições a seguir:

  • PROJECT_ID: o ID do projeto do Google Cloud .
  • TEXT_PROMPT: o comando de texto que orienta quais imagens o modelo gera. Este campo é obrigatório para geração e edição.
  • PROMPT_LANGUAGE: string. Opcional. O código do idioma correspondente ao idioma do comando de texto. Neste exemplo, seria hi. Valores disponíveis:
    • auto - Detecção automática Se o Imagen detectar um idioma compatível, o comando (e, se quiser, um comando negativo) será traduzido para o inglês. Se o idioma detectado não for compatível, o Imagen vai usar o texto de entrada sem alterações, o que pode resultar em uma saída inesperada. Nenhum código de erro é retornado.
    • en: inglês (valor padrão se omitido)
    • es - Espanhol
    • hi - Hindi
    • ja - Japonês
    • ko - Coreano
    • pt - Português
    • zh-TW - Chinese (Traditional)
    • zh ou zh-CN: chinês (simplificado)

Método HTTP e URL:

POST https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/imagegeneration@005:predict

Corpo JSON da solicitação:

{
  "instances": [
    {
      "prompt": "सूर्यास्त के समय एक समुद्र तट। उड़ते पक्षी, हवा में लहराते नारियल के पेड़। लोग समुद्र तट पर सैर का आनंद ले रहे हैं।"
    }
  ],
  "parameters": {
    "language": "PROMPT_LANGUAGE"
  }
}

Para enviar a solicitação, escolha uma destas opções:

curl

Salve o corpo da solicitação em um arquivo com o nome request.json e execute o comando a seguir:

curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/imagegeneration@005:predict"

PowerShell

Salve o corpo da solicitação em um arquivo com o nome request.json e execute o comando a seguir:

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/imagegeneration@005:predict" | Select-Object -Expand Content
O exemplo de resposta a seguir é para uma solicitação com "sampleCount": 2. A resposta retorna dois objetos de previsão, com os bytes de imagem gerados codificados em base64.
{
  "predictions": [
    {
      "bytesBase64Encoded": "BASE64_IMG_BYTES",
      "mimeType": "image/png"
    },
    {
      "mimeType": "image/png",
      "bytesBase64Encoded": "BASE64_IMG_BYTES"
    }
  ]
}

A seguir