Como funcionam os descontos por cache?

Os descontos de cache aplicam automaticamente um desconto percentual a tokens repetidos, reduzindo seus custos gerais de API sem exigir nenhuma configuração adicional.

Há uma cobrança adicional para o armazenamento em cache de descontos?

Não, não há taxas adicionais associadas aos descontos em cache. Eles estão habilitados por padrão para modelos elegíveis.

Quais modelos suportam descontos em cache?

Os descontos de cache são aplicáveis ao GPT-4o, GPT-5 e suas versões ajustadas, a partir de 1.024 tokens em cache.

Ferramenta de IA

Desbloqueie Economias com Descontos de Cache da OpenAI

Reduza seus gastos com API com descontos automáticos de cache para prompts repetidos.

shipped 20 de nov. de 2025pricing & licensingpaid

Pricing & LicensingDiscounts & CreditsCaching Discounts

OpenAI Caching Discounts - AI tool hero image

Por que importa

1Aproveite descontos automáticos de 90% em tokens armazenados com o GPT-5.

2A implementação sem código significa economia instantânea sem taxas adicionais.

3Reduza a latência em até 80%, tornando suas aplicações mais rápidas e eficientes.

Especificações

API disponível

Sim, API pública

overview

O que são Descontos de Cache?

Os Descontos de Cache da OpenAI oferecem economias significativas ao armazenar em cache tokens de entrada repetidos. Este recurso é projetado para apoiar desenvolvedores e empresas, tornando os serviços de IA mais econômicos sem a necessidade de configuração adicional.

Descontos automáticos em tokens utilizados recentemente.
Ativado por padrão para modelos elegíveis.
Custos significativamente reduzidos para tarefas repetitivas.

features

Recursos Principais

Com a integração dos Descontos de Cache da OpenAI, você tem acesso a recursos poderosos que otimizam tanto o desempenho quanto os gastos.

Desconto de 90% em tokens em cache com o GPT-5.
O cache automático não requer alterações de código.
Redução significativa na latência e nos custos gerais.

use cases

Casos de Uso Ideais

Os Descontos de Cache são projetados para aplicações que processam frequentemente solicitações semelhantes, como bots de atendimento ao cliente ou pipelines de documentos. Essas ferramentas podem se beneficiar significativamente da redução nos custos de tokens.

Aplicativos de suporte ao cliente.
Pipelines de processamento de documentos.
Plataformas de revisão de código impulsionadas por IA.

Ferramentas similares

Comparar alternativas

Outras ferramentas a considerar

OpenAI Prompt Caching

Ver no Stork→

OpenAI Response Caching

Ver no Stork→

Anthropic Prompt Caching

Ver no Stork→

Mistral Cache Tier

Ver no Stork→

Together AI Inference Cache

Ver no Stork→

Visitar OpenAI Caching Discounts↗

AI Reputation Report

Is OpenAI Caching Discounts yours?

ChatGPT, Perplexity, Gemini, Claude & Grok answer buyer questions about OpenAI Caching Discounts every day. See whether they name OpenAI Caching Discounts — or send buyers to a rival.

See what AI saysfree preview