O ponto final count-tokens permite-lhe determinar o número de tokens numa mensagem antes de a enviar para o Claude, o que ajuda a tomar decisões informadas sobre os seus comandos e utilização.
Não existe qualquer custo para usar o ponto final count-tokens.
Modelos Claude suportados
Os seguintes modelos suportam tokens de contagem:
- Claude Opus 4.1
- Claude Opus 4
- Claude Sonnet 4.5
- Claude Sonnet 4
- Claude 3.7 Sonnet
- Claude 3.5 Sonnet v2
- Claude Haiku 4.5
- Claude 3.5 Haiku
- Claude 3.5 Sonnet
- Claude 3 Opus
- Claude 3 Haiku
Regiões suportadas
As seguintes regiões suportam tokens de contagem:
us-east5europe-west1asia-east1asia-southeast1us-central1europe-west4
Contagem de tokens em mensagens básicas
Para contabilizar tokens, envie um pedido rawPredict para o ponto final count-tokens. O corpo do pedido tem de conter o ID do modelo para o qual quer contabilizar os tokens.
REST
Antes de usar qualquer um dos dados do pedido, faça as seguintes substituições:
- LOCATION: Uma região que suporta os modelos Claude da Anthropic. Para usar o ponto final global, consulte a secção Especifique o ponto final global.
- MODEL: o modelo para contabilizar os tokens.
- ROLE: a função associada a uma mensagem. Pode especificar um
userou umassistant. A primeira mensagem tem de usar a funçãouser. Os modelos Claude funcionam com turnos alternadosusereassistant. Se a mensagem final usar a funçãoassistant, o conteúdo da resposta continua imediatamente a partir do conteúdo dessa mensagem. Pode usar isto para restringir parte da resposta do modelo. - CONTENT: o conteúdo, como texto, da mensagem
userouassistant.
Método HTTP e URL:
POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/anthropic/models/count-tokens:rawPredict
Corpo JSON do pedido:
{
"model": "MODEL",
"messages": [
{
"role": "user",
"content":"how many tokens are in this request?"
}
],
}
Para enviar o seu pedido, escolha uma destas opções:
curl
Guarde o corpo do pedido num ficheiro com o nome request.json,
e execute o seguinte comando:
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/anthropic/models/count-tokens:rawPredict"
PowerShell
Guarde o corpo do pedido num ficheiro com o nome request.json,
e execute o seguinte comando:
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/anthropic/models/count-tokens:rawPredict" | Select-Object -Expand Content
Deve receber uma resposta JSON semelhante à seguinte.
Para obter informações sobre como contar tokens em mensagens com ferramentas, imagens e PDFs, consulte a documentação da Anthropic.
Quotas
Por predefinição, a quota para o ponto final count-tokens é de 2000 pedidos por minuto.