Neste guia, mostramos como receber a contagem de tokens e o número de caracteres faturáveis de um comando. Nesta página, abordamos os seguintes tópicos: É possível receber a contagem de tokens de um comando usando a API Os modelos multimodais a seguir são compatíveis com a estimativa da contagem de tokens de solicitação: Para saber mais sobre versões de modelo, consulte Versões do modelo Genmini e ciclo de vida. É possível receber uma estimativa da contagem de tokens e o número de caracteres faturáveis de um comando
usando a API Vertex AI. Para conferir a contagem de tokens de um comando usando o Vertex AI Studio no
consoleGoogle Cloud , faça o seguinte: Para fechar o painel da ferramenta tokenizadora, clique em X ou clique fora do painel.
Para saber mais, consulte a
documentação de referência do SDK.
Defina variáveis de ambiente para usar o SDK de IA generativa com a Vertex AI:
Saiba como instalar ou atualizar o Go.
Para saber mais, consulte a
documentação de referência do SDK.
Defina variáveis de ambiente para usar o SDK de IA generativa com a Vertex AI:
Para saber mais, consulte a
documentação de referência do SDK.
Defina variáveis de ambiente para usar o SDK de IA generativa com a Vertex AI:
Saiba como instalar ou atualizar o Java.
Para saber mais, consulte a
documentação de referência do SDK.
Defina variáveis de ambiente para usar o SDK de IA generativa com a Vertex AI:
Para conferir a contagem de tokens e o número de caracteres faturáveis de um comando
usando a API do Vertex AI, envie uma solicitação POST para o endpoint do modelo do editor. Antes de usar os dados da solicitação abaixo, faça as substituições a seguir: Clicar para abrir uma lista parcial das regiões disponíveis
Método HTTP e URL:
Corpo JSON da solicitação: Para enviar a solicitação, escolha uma destas opções:
Salve o corpo da solicitação em um arquivo com o nome
Salve o corpo da solicitação em um arquivo com o nome Você receberá uma resposta JSON semelhante a seguinte. Exemplo de texto com imagem ou vídeo
Para saber mais, consulte a
documentação de referência do SDK.
Defina variáveis de ambiente para usar o SDK de IA generativa com a Vertex AI:
Saiba como instalar ou atualizar o Go.
Para saber mais, consulte a
documentação de referência do SDK.
Defina variáveis de ambiente para usar o SDK de IA generativa com a Vertex AI:
Para saber mais, consulte a
documentação de referência do SDK.
Defina variáveis de ambiente para usar o SDK de IA generativa com a Vertex AI:
Saiba como instalar ou atualizar o Java.
Para saber mais, consulte a
documentação de referência do SDK.
Defina variáveis de ambiente para usar o SDK de IA generativa com a Vertex AI:
Para conferir a contagem de tokens e o número de caracteres faturáveis de um comando
usando a API do Vertex AI, envie uma solicitação POST para o endpoint do modelo do editor. Não há cobrança pelo uso da API
countTokens
e o tokenizador integrado do SDK para selecionar a melhor opção para seu caso de uso.CountTokens
.Escolher um método para contar tokens
countTokens
ou o tokenizer do SDK da Vertex AI para Python. Na maioria dos casos, recomendamos usar o tokenizador do SDK. A tabela a seguir compara os dois métodos.
Método
Descrição
Prós
Contras
Tokenizador do SDK da Vertex AI para Python
Um tokenizer integrado no SDK do Python que realiza a contagem de tokens local. Para mais detalhes, consulte Listar e contar tokens.
Rápido (sem latência de rede) e fácil de integrar aos fluxos de trabalho do Python. Esse é o método recomendado.
Específico para o SDK do Python.
API
countTokens
Um endpoint de API REST que retorna a contagem de tokens e os caracteres faturáveis de um comando.
Independente de idioma (funciona com qualquer idioma que possa fazer chamadas REST) e fornece contagem de caracteres faturáveis.
Requer uma chamada de API de rede, o que causa latência.
Modelos compatíveis
Receber a contagem de tokens de um comando
Console
Python
Instalar
pip install --upgrade google-genai
# Replace the `GOOGLE_CLOUD_PROJECT` and `GOOGLE_CLOUD_LOCATION` values
# with appropriate values for your project.
export GOOGLE_CLOUD_PROJECT=GOOGLE_CLOUD_PROJECT
export GOOGLE_CLOUD_LOCATION=global
export GOOGLE_GENAI_USE_VERTEXAI=True
Go
# Replace the `GOOGLE_CLOUD_PROJECT` and `GOOGLE_CLOUD_LOCATION` values
# with appropriate values for your project.
export GOOGLE_CLOUD_PROJECT=GOOGLE_CLOUD_PROJECT
export GOOGLE_CLOUD_LOCATION=global
export GOOGLE_GENAI_USE_VERTEXAI=True
Node.js
Instalar
npm install @google/genai
# Replace the `GOOGLE_CLOUD_PROJECT` and `GOOGLE_CLOUD_LOCATION` values
# with appropriate values for your project.
export GOOGLE_CLOUD_PROJECT=GOOGLE_CLOUD_PROJECT
export GOOGLE_CLOUD_LOCATION=global
export GOOGLE_GENAI_USE_VERTEXAI=True
Java
# Replace the `GOOGLE_CLOUD_PROJECT` and `GOOGLE_CLOUD_LOCATION` values
# with appropriate values for your project.
export GOOGLE_CLOUD_PROJECT=GOOGLE_CLOUD_PROJECT
export GOOGLE_CLOUD_LOCATION=global
export GOOGLE_GENAI_USE_VERTEXAI=True
REST
us-central1
us-west4
northamerica-northeast1
us-east4
us-west1
asia-northeast3
asia-southeast1
asia-northeast1
USER
: especifica o conteúdo que é enviado por você.POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_ID:countTokens
{
"contents": [{
"role": "ROLE",
"parts": [{
"text": "TEXT"
}]
}]
}
curl
request.json
e execute o comando a seguir:
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_ID:countTokens"PowerShell
request.json
e execute o comando a seguir:
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_ID:countTokens" | Select-Object -Expand ContentPython
Instalar
pip install --upgrade google-genai
# Replace the `GOOGLE_CLOUD_PROJECT` and `GOOGLE_CLOUD_LOCATION` values
# with appropriate values for your project.
export GOOGLE_CLOUD_PROJECT=GOOGLE_CLOUD_PROJECT
export GOOGLE_CLOUD_LOCATION=global
export GOOGLE_GENAI_USE_VERTEXAI=True
Go
# Replace the `GOOGLE_CLOUD_PROJECT` and `GOOGLE_CLOUD_LOCATION` values
# with appropriate values for your project.
export GOOGLE_CLOUD_PROJECT=GOOGLE_CLOUD_PROJECT
export GOOGLE_CLOUD_LOCATION=global
export GOOGLE_GENAI_USE_VERTEXAI=True
Node.js
Instalar
npm install @google/genai
# Replace the `GOOGLE_CLOUD_PROJECT` and `GOOGLE_CLOUD_LOCATION` values
# with appropriate values for your project.
export GOOGLE_CLOUD_PROJECT=GOOGLE_CLOUD_PROJECT
export GOOGLE_CLOUD_LOCATION=global
export GOOGLE_GENAI_USE_VERTEXAI=True
Java
# Replace the `GOOGLE_CLOUD_PROJECT` and `GOOGLE_CLOUD_LOCATION` values
# with appropriate values for your project.
export GOOGLE_CLOUD_PROJECT=GOOGLE_CLOUD_PROJECT
export GOOGLE_CLOUD_LOCATION=global
export GOOGLE_GENAI_USE_VERTEXAI=True
REST
MODEL_ID="gemini-2.5-flash"
PROJECT_ID="my-project"
TEXT="Provide a summary with about two sentences for the following article."
REGION="us-central1"
curl \
-X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://${REGION}-aiplatform.googleapis.com/v1/projects/${PROJECT_ID}/locations/${REGION}/publishers/google/models/${MODEL_ID}:countTokens -d \
$'{
"contents": [{
"role": "user",
"parts": [
{
"file_data": {
"file_uri": "gs://cloud-samples-data/generative-ai/video/pixel8.mp4",
"mime_type": "video/mp4"
}
},
{
"text": "'"$TEXT"'"
}]
}]
}'
Preços e cotas
CountTokens
. A cota máxima para essa API é de 3.000 solicitações por minuto.A seguir
Usar a API Count Tokens
Exceto em caso de indicação contrária, o conteúdo desta página é licenciado de acordo com a Licença de atribuição 4.0 do Creative Commons, e as amostras de código são licenciadas de acordo com a Licença Apache 2.0. Para mais detalhes, consulte as políticas do site do Google Developers. Java é uma marca registrada da Oracle e/ou afiliadas.
Última atualização 2025-08-19 UTC.