¿Cómo funciona el almacenamiento en caché de las solicitudes?

El almacenamiento en caché de solicitudes guarda y reutiliza automáticamente las solicitudes recientes para reducir costos, sin necesidad de cambios en el código.

¿Qué descuentos están disponibles con GPT-5?

GPT-5 ofrece un notable descuento del 90% en los tokens de entrada almacenados en caché, lo que reduce drásticamente tu gasto total en la API.

¿Quién puede beneficiarse de los descuentos por caching?

Los desarrolladores de aplicaciones de alta frecuencia y gran escala, como los bots de servicio al cliente o el procesamiento de documentos, pueden reducir significativamente costos y mejorar la latencia.

Herramienta de IA

Maximiza tus ahorros con los descuentos de caché de OpenAI.

Desbloquea descuentos de hasta el 90% en tokens en caché para optimizar los costos de tu API.

shipped 20 nov 2025pricing & licensingpaid

Pricing & LicensingDiscounts & CreditsCaching Discounts

OpenAI Caching Discounts - AI tool hero image

Por qué importa

1Logra descuentos de hasta el 90% en tokens de entrada repetidos, reduciendo significativamente los gastos de API.

2La caché automática de sugerencias está disponible en los últimos modelos sin necesidad de cambios en el código.

3Mejora la latencia en hasta un 80% para tus flujos de trabajo y aplicaciones de alta frecuencia.

Especificaciones

API disponible

Sí, API pública

overview

Descripción general de descuentos por almacenamiento en caché de OpenAI

Los Descuentos de Caché de OpenAI ofrecen una forma eficaz de reducir los costos de API al reutilizar solicitudes recientes. Con nuestra función de caché automática, los desarrolladores pueden beneficiarse de importantes ahorros económicos mientras mejoran la eficiencia del flujo de trabajo.

Complementario a los servicios existentes de OpenAI.
Se integra sin problemas con los últimos modelos.
No se requiere esfuerzo adicional de desarrollo.

features

Características Clave

Nuestro sistema de caché utiliza el reconocimiento semántico, asegurando que incluso las solicitudes ligeramente diferentes puedan ser almacenadas de manera efectiva. Con amplias oportunidades de reducción de costos, podrás maximizar los beneficios en diversas aplicaciones.

El reconocimiento de similitud semántica aumenta las tasas de aciertos en caché.
Descuento del 90% en tokens almacenados en caché en GPT-5.
Compatible con tareas de atención al cliente de alta frecuencia y procesamiento de documentos.

use cases

Casos de Uso Ideal

Los desarrolladores que gestionan aplicaciones a gran escala pueden aprovechar al máximo los descuentos por almacenamiento en caché. Ya sea para bots de atención al cliente, pipelines de revisión de código o cualquier tarea repetitiva, se pueden observar ganancias significativas en rendimiento y ahorros.

Automatización del servicio al cliente.
Flujos de trabajo de revisión y generación de código.
Sistemas de procesamiento de documentos.

Herramientas similares

Comparar alternativas

Otras herramientas que podrías considerar

OpenAI Prompt Caching

Ver en Stork→

OpenAI Response Caching

Ver en Stork→

Anthropic Prompt Caching

Ver en Stork→

Mistral Cache Tier

Ver en Stork→

Together AI Inference Cache

Ver en Stork→

Visitar OpenAI Caching Discounts↗

AI Reputation Report

Is OpenAI Caching Discounts yours?

ChatGPT, Perplexity, Gemini, Claude & Grok answer buyer questions about OpenAI Caching Discounts every day. See whether they name OpenAI Caching Discounts — or send buyers to a rival.

See what AI saysfree preview