OpenAI Prompt Caching
Shares tags: pricing & licensing, discounts & credits, caching discounts
Reduza seus gastos com API com descontos automáticos de cache para prompts repetidos.
Similar Tools
Other tools you might consider
OpenAI Prompt Caching
Shares tags: pricing & licensing, discounts & credits, caching discounts
OpenAI Response Caching
Shares tags: pricing & licensing, discounts & credits, caching discounts
Anthropic Prompt Caching
Shares tags: pricing & licensing, discounts & credits, caching discounts
Mistral Cache Tier
Shares tags: pricing & licensing, discounts & credits, caching discounts
<a href="https://www.stork.ai/en/openai-caching-discounts" target="_blank" rel="noopener noreferrer"><img src="https://www.stork.ai/api/badge/openai-caching-discounts?style=dark" alt="OpenAI Caching Discounts - Featured on Stork.ai" height="36" /></a>
[](https://www.stork.ai/en/openai-caching-discounts)
overview
Os Descontos de Cache da OpenAI oferecem economias significativas ao armazenar em cache tokens de entrada repetidos. Este recurso é projetado para apoiar desenvolvedores e empresas, tornando os serviços de IA mais econômicos sem a necessidade de configuração adicional.
features
Com a integração dos Descontos de Cache da OpenAI, você tem acesso a recursos poderosos que otimizam tanto o desempenho quanto os gastos.
use cases
Os Descontos de Cache são projetados para aplicações que processam frequentemente solicitações semelhantes, como bots de atendimento ao cliente ou pipelines de documentos. Essas ferramentas podem se beneficiar significativamente da redução nos custos de tokens.
Os descontos de cache aplicam automaticamente um desconto percentual a tokens repetidos, reduzindo seus custos gerais de API sem exigir nenhuma configuração adicional.
Não, não há taxas adicionais associadas aos descontos em cache. Eles estão habilitados por padrão para modelos elegíveis.
Os descontos de cache são aplicáveis ao GPT-4o, GPT-5 e suas versões ajustadas, a partir de 1.024 tokens em cache.
For builders
AI agents read it. Buyers find it. Backlinks accrue. Your tool can have one too — live in 24 hours, indexed by Claude, ChatGPT, and Perplexity, queryable via MCP.