Cube
Shares tags: ai, research, productivity
Pegasus 1.5 by TwelveLabs es un modelo de razonamiento de video con AI que transforma metraje de video sin procesar en datos estructurados y consultables utilizando inteligencia multimodal.
Stork Quadrant
Replaceable as a UI, but kept alive as the API the agents call.
“TwelveLabs built a capable multimodal video understanding API before the frontier labs caught up. That window is closing. GPT-4o, Gemini 1.5 Pro, and Claude already handle video natively, and they're getting faster and cheaper. There's no proprietary data, no network, no regulatory gate — just a specialized model that bigger players will commoditize.”
An LLM alone could replace
Score history · +5 pts over 3 re-scores
Go vertical and own the liability: pick one industry where wrong video analysis has real consequences — insurance claims, legal evidence, broadcast compliance — and become the vendor that signs the contract and bears the risk. That's the only move that creates a moat here.
Herramientas similares
Otras herramientas que podrías considerar
Cube
Shares tags: ai, research, productivity
MCP Bridge by Appfactor
Shares tags: ai, code, research
Devaito
Shares tags: ai, code, productivity
TabMail
Shares tags: ai, research, productivity
<a href="https://www.stork.ai/en/pegasus-1-5-by-twelvelabs" target="_blank" rel="noopener noreferrer"><img src="https://www.stork.ai/api/badge/pegasus-1-5-by-twelvelabs?style=dark" alt="Pegasus 1.5 by TwelveLabs - Featured on Stork.ai" height="36" /></a>
[](https://www.stork.ai/en/pegasus-1-5-by-twelvelabs)
overview
Pegasus 1.5 by TwelveLabs es un modelo de lenguaje centrado en video desarrollado por Twelve Labs que permite a desarrolladores y empresas transformar metraje de video sin procesar en datos estructurados y consultables. Integra información visual, de audio y de voz para generar descripciones textuales detalladas y análisis a partir del contenido de video. Lanzado el 20 de abril de 2026, Pegasus 1.5 se enfoca en Time-Based Metadata Extraction (TBM), permitiendo a los usuarios definir esquemas JSON personalizados y recibir metadatos estructurados y con marca de tiempo de videos de hasta dos horas de duración a través de una sola llamada a la API. Esta funcionalidad elimina la necesidad de pipelines de ingesta, preprocesamiento o indexación, haciendo que el contenido de video sea computable para agentes de AI y sistemas automatizados. Los modelos fundacionales de la plataforma, Marengo y Pegasus, facilitan una comprensión similar a la humana de los datos de video, imagen y audio, soportando la búsqueda semántica, clasificación, resumen y extracción de información a escala.
quick facts
| Atributo | Valor |
|---|---|
| Desarrollador | Twelve Labs |
| Modelo de Negocio | Freemium |
| Precios | Freemium a partir de $0/mes |
| Plataformas | API, Web |
| API Disponible | Sí |
| Fundado | 2020 |
| Sede | San Francisco, USA |
| Financiación | Series A |
features
Pegasus 1.5 by TwelveLabs ofrece un conjunto de características diseñadas para la comprensión y el procesamiento avanzado de video, aprovechando la AI multimodal para convertir metraje sin procesar en datos accionables.
use cases
Pegasus 1.5 by TwelveLabs está diseñado para una variedad de profesionales y organizaciones que requieren inteligencia de video avanzada para el análisis, la gestión y la monetización de contenido.
pricing
TwelveLabs ofrece un modelo de precios freemium para Pegasus 1.5, estructurado en los niveles Free, Developer y Enterprise, con componentes basados en el uso para el acceso a la API. El plan Free proporciona límites básicos sin costo. El plan Developer incluye tres niveles con límites crecientes basados en el gasto mensual. El plan Enterprise ofrece límites personalizados adaptados a las necesidades organizativas específicas. El uso de la API está sujeto a límites de tasa medidos en dimensiones como Duration per day (DPD), Duration per hour (DPH), Requests per day (RPD), Requests per minute (RPM), Tokens per day (TPD) y Tokens per minute (TPM). Exceder cualquier límite aplicable resultará en un error. El texto de entrada para el modelo Pegasus tiene un precio de $0.001 por 1,000 tokens, mientras que los tokens de texto de salida para el uso de la API Pegasus Analyze tienen un precio de $0.007 por 1,000 tokens.
competitors
TwelveLabs posiciona a Pegasus 1.5 como una solución líder para la comprensión de video de grado de producción, enfatizando su rendimiento en la generación de metadatos estructurados y el razonamiento contextual sobre modelos de propósito general. Los puntos de referencia internos afirman que Pegasus 1.5 supera a Gemini 3.1 Pro en un 13.1% en calidad de segmentación agregada, con una precisión de límite de aproximadamente 350 milisegundos, y es un 30% mejor en AI de video generativa.
Mixpeek is a multimodal data warehouse that decomposes video, images, and audio into searchable features and reassembles them through multi-stage retrieval pipelines.
Similar to TwelveLabs, Mixpeek offers a full-stack video intelligence platform with composable pipelines for various extractors (vision, audio, OCR, face), providing retrieval-ready output. It also offers a freemium model with 1,000 free credits, aligning with TwelveLabs' freemium offering.
Azure AI Video Indexer is a cloud and edge service that automatically extracts deep insights from video and audio content, integrated within the Microsoft Azure ecosystem.
Azure AI Video Indexer provides similar multimodal analysis capabilities (object detection, OCR, transcription, sentiment analysis) but is a service within the broader Azure ecosystem, potentially appealing to organizations already using Azure, whereas TwelveLabs is a specialized platform. It offers a free trial with up to 2,400 minutes of free indexing.
Moments Lab is an AI-powered video discovery platform that indexes visuals, audio, and metadata to help organizations find, repurpose, share, and monetize video content.
Moments Lab directly competes in the enterprise video discovery and content monetization space, offering similar multimodal indexing and search capabilities to TwelveLabs, but with a stronger emphasis on repurposing and monetizing content. Pricing is likely enterprise-focused, requiring a demo.
Memories.ai offers advanced AI video understanding technology that effortlessly analyzes every frame to detect objects, interpret context, recognize emotions, and extract meaningful insights.
Memories.ai provides comprehensive AI video understanding for insights, content tagging, and scene analysis, directly aligning with TwelveLabs' core offering of understanding video across vision, audio, and language. It implies a trial or freemium model.
Pegasus 1.5 by TwelveLabs es un modelo de lenguaje centrado en video desarrollado por Twelve Labs que permite a desarrolladores y empresas transformar metraje de video sin procesar en datos estructurados y consultables. Integra información visual, de audio y de voz para generar descripciones textuales detalladas y análisis a partir del contenido de video.
Sí, Pegasus 1.5 by TwelveLabs ofrece un nivel Free con límites básicos. Además, hay planes Developer con costos variables basados en el gasto mensual y planes Enterprise personalizados.
Las características clave incluyen inteligencia multimodal para AI de video, búsqueda semántica de video utilizando lenguaje natural, resumen automático de video, extracción de metadatos basada en tiempo con esquemas JSON personalizados, moderación de contenido, acceso a API/SDK, e indexación e ingesta de video de alta velocidad.
Pegasus 1.5 by TwelveLabs está destinado a desarrolladores, empresas, compañías de medios, organizaciones deportivas, agencias de publicidad y agencias gubernamentales que requieren AI avanzada para el análisis, la gestión y la monetización de contenido de video.
Pegasus 1.5 by TwelveLabs se enfoca en la generación de metadatos estructurados y basados en el tiempo y el razonamiento contextual, superando a modelos de propósito general como Gemini 3.1 Pro en puntos de referencia internos. A diferencia de Google Cloud Video Intelligence API, ofrece un enfoque de modelo de lenguaje centrado en video. En comparación con Azure Video Indexer, enfatiza los flujos de trabajo impulsados por API. Se diferencia de Mixpeek al ser una solución solo en la nube, y de Memories.ai al enfocarse en la extracción de datos estructurados en lugar de la interacción conversacional con AI.
Más en Stork
Más herramientas de esta categoría, ordenadas por señal de la comunidad
Brand Context API
🤖 AI Tools
Brandfetch es una plataforma de datos de marca que proporciona acceso instantáneo a logotipos, colores, fuentes y activos de marca para millones de empresas en todo el mundo. La Brandfetch API permite a los desarrolladores integrar identidades de marca precisas directamente en sus productos, automatizando la gestión de marca.
Veltrix AI
🤖 AI Tools
Conecta QuickBooks, Xero, Square, Shopify y más. Pregunta lo que quieras en inglés sencillo y obtén respuestas respaldadas por la fuente, alertas inteligentes y próximos pasos.
Leni
🤖 AI Tools
Descubre Leni: IA diseñada específicamente para inversores serios en CRE y PE. Optimiza la suscripción, los informes y la toma de decisiones. La IA más segura y precisa para el trabajo de inversión.
Replicas
🤖 AI Tools
Ejecuta agentes de codificación en segundo plano desde cualquier ubicación. Genera Claude Code o Codex dentro de un entorno sandbox, preconfigurado con código y herramientas. Entrega tareas a través de integraciones con Slack, Linear y GitHub. Diseñado para desarrolladores que gestionan tareas de codificación.
Choosaro
🤖 AI Tools
Compara opciones con AI y obtén análisis estructurado, puntuaciones y razonamiento claro para tomar decisiones más claras con confianza para ideas, contenido, producto y decisiones cotidianas.
remio
🤖 AI Tools
remio es una base de conocimiento de IA que captura automáticamente páginas web, reuniones y archivos. Organiza automáticamente la información y obtén respuestas de IA a partir de tus datos. El almacenamiento 100% local y BYOK garantiza la privacidad.
For builders
AI agents read it. Buyers find it. Backlinks accrue. Your tool can have one too — live in 24 hours, indexed by Claude, ChatGPT, and Perplexity, queryable via MCP.