Cube
Shares tags: ai, research, productivity
Pegasus 1.5 by TwelveLabs est un modèle de raisonnement vidéo basé sur l'IA qui transforme le contenu vidéo brut en données structurées et interrogeables en intégrant des informations visuelles, audio et vocales.
Stork Quadrant
Replaceable as a UI, but kept alive as the API the agents call.
“TwelveLabs built a capable multimodal video understanding API before the frontier labs caught up. That window is closing. GPT-4o, Gemini 1.5 Pro, and Claude already handle video natively, and they're getting faster and cheaper. There's no proprietary data, no network, no regulatory gate — just a specialized model that bigger players will commoditize.”
An LLM alone could replace
Score history · +5 pts over 3 re-scores
Go vertical and own the liability: pick one industry where wrong video analysis has real consequences — insurance claims, legal evidence, broadcast compliance — and become the vendor that signs the contract and bears the risk. That's the only move that creates a moat here.
Outils similaires
D'autres outils à considérer
Cube
Shares tags: ai, research, productivity
MCP Bridge by Appfactor
Shares tags: ai, code, research
Devaito
Shares tags: ai, code, productivity
TabMail
Shares tags: ai, research, productivity
<a href="https://www.stork.ai/en/pegasus-1-5-by-twelvelabs" target="_blank" rel="noopener noreferrer"><img src="https://www.stork.ai/api/badge/pegasus-1-5-by-twelvelabs?style=dark" alt="Pegasus 1.5 by TwelveLabs - Featured on Stork.ai" height="36" /></a>
[](https://www.stork.ai/en/pegasus-1-5-by-twelvelabs)
overview
Pegasus 1.5 by TwelveLabs est une plateforme d'intelligence vidéo développée par Twelve Labs qui permet aux développeurs et aux entreprises de transformer le contenu vidéo brut en données structurées et interrogeables. Elle traite la vidéo comme un volume multidimensionnel, intégrant des informations visuelles, audio et vocales pour générer des métadonnées basées sur le temps. Rendu généralement disponible le 20 avril 2026, Pegasus 1.5 modifie fondamentalement la compréhension vidéo, passant de la réponse à des questions sur des clips à la génération de métadonnées structurées et basées sur le temps sur des vidéos entières. La plateforme propose des modèles de fondation d'IA multimodaux, y compris Pegasus, qui facilitent une compréhension humaine des données vidéo, d'image et audio, permettant aux utilisateurs de rechercher, classer, résumer et extraire des informations du contenu vidéo à grande échelle. Ce modèle est conçu pour convertir les séquences brutes en métadonnées prêtes à être interrogées via un seul appel API, remplaçant les flux de travail de marquage vidéo manuel.
quick facts
| Attribut | Valeur |
|---|---|
| Developer | Twelve Labs |
| Modèle économique | Freemium / Hybride (Basé sur l'utilisation pour Developer/Enterprise) |
| Tarification | Freemium; Basé sur l'utilisation à partir de 0,001 $ / 1k tokens d'entrée, 0,007 $ / 1k tokens de sortie |
| Plateformes | API |
| API disponible | Oui |
| Intégrations | API/SDK pour intégrations personnalisées |
| Fondée | 2020 |
| Siège social | San Francisco, USA |
| Financement | Series A |
features
Pegasus 1.5 by TwelveLabs offre une suite complète de fonctionnalités conçues pour l'intelligence vidéo avancée et l'extraction de données structurées. Les capacités principales de la plateforme s'articulent autour de ses modèles de fondation d'IA multimodaux, permettant une compréhension et une analyse approfondies du contenu vidéo. Elle prend en charge l'ingestion et le traitement de données à haute vitesse, ce qui la rend adaptée aux applications d'entreprise à grande échelle.
use cases
Pegasus 1.5 by TwelveLabs est conçu pour un large éventail d'utilisateurs et d'organisations qui nécessitent des capacités avancées de compréhension vidéo et d'extraction de données structurées. Son approche API-first et son intelligence multimodale le rendent particulièrement précieux pour les entités traitant de grands volumes de contenu vidéo.
pricing
TwelveLabs propose un modèle de tarification freemium pour Pegasus 1.5, structuré en plans Free, Developer et Enterprise. Le plan Free offre des limites de débit de base sans coût, permettant aux utilisateurs d'explorer les capacités de la plateforme. Le plan Developer est échelonné, avec des limites croissantes basées sur les dépenses mensuelles, offrant trois niveaux distincts pour s'adapter à une utilisation croissante. Pour les opérations à grande échelle, le plan Enterprise offre des limites personnalisées et des solutions sur mesure. Les limites de débit sont mises en œuvre sur diverses dimensions, y compris la durée par jour (DPD), la durée par heure (DPH), les requêtes par jour (RPD), les requêtes par minute (RPM), les tokens par jour (TPD) et les tokens par minute (TPM). Le dépassement de toute limite applicable entraînera une erreur. La tarification spécifique par token pour le modèle Pegasus comprend un coût de texte d'entrée de 0,001 $ par 1 000 tokens et un coût de texte de sortie de 0,007 $ par 1 000 tokens pour l'utilisation de l'API Analyze.
competitors
TwelveLabs positionne Pegasus 1.5 comme une plateforme d'intelligence vidéo de premier plan, notamment pour son extraction de métadonnées basée sur le temps et sa qualité de segmentation supérieure. Lors de benchmarks internes sur du contenu d'actualités, Pegasus 1.5 a démontré une fidélité de sortie constante sur des schémas complexes et multi-définitions, surpassant les principaux modèles à usage général. Il a atteint une qualité de segmentation agrégée supérieure de 13,1 % à celle de Gemini 3 Pro, avec une précision des limites d'environ 350 millisecondes, et a surpassé Gemini 2.5 Pro de 30 % sur les benchmarks de qualité de segmentation agrégée lors des premiers tests. Contrairement aux modèles qui reposent sur le marquage manuel ou l'analyse au niveau des images, Pegasus 1.5 raisonne sur des vidéos entières pour produire des sorties structurées directement applicables aux flux de travail de production, fonctionnant comme un 'raisonneur vidéo' plutôt qu'un 'lecteur de transcription'.
Mixpeek is a multimodal data warehouse that decomposes video, images, and audio into searchable features and reassembles them through multi-stage retrieval pipelines.
Similar to TwelveLabs, Mixpeek offers a full-stack video intelligence platform with composable pipelines for various extractors (vision, audio, OCR, face), providing retrieval-ready output. It also offers a freemium model with 1,000 free credits, aligning with TwelveLabs' freemium offering.
Azure AI Video Indexer is a cloud and edge service that automatically extracts deep insights from video and audio content, integrated within the Microsoft Azure ecosystem.
Azure AI Video Indexer provides similar multimodal analysis capabilities (object detection, OCR, transcription, sentiment analysis) but is a service within the broader Azure ecosystem, potentially appealing to organizations already using Azure, whereas TwelveLabs is a specialized platform. It offers a free trial with up to 2,400 minutes of free indexing.
Moments Lab is an AI-powered video discovery platform that indexes visuals, audio, and metadata to help organizations find, repurpose, share, and monetize video content.
Moments Lab directly competes in the enterprise video discovery and content monetization space, offering similar multimodal indexing and search capabilities to TwelveLabs, but with a stronger emphasis on repurposing and monetizing content. Pricing is likely enterprise-focused, requiring a demo.
Memories.ai offers advanced AI video understanding technology that effortlessly analyzes every frame to detect objects, interpret context, recognize emotions, and extract meaningful insights.
Memories.ai provides comprehensive AI video understanding for insights, content tagging, and scene analysis, directly aligning with TwelveLabs' core offering of understanding video across vision, audio, and language. It implies a trial or freemium model.
Pegasus 1.5 by TwelveLabs est une plateforme d'intelligence vidéo développée par Twelve Labs qui permet aux développeurs et aux entreprises de transformer le contenu vidéo brut en données structurées et interrogeables. Elle traite la vidéo comme un volume multidimensionnel, intégrant des informations visuelles, audio et vocales pour générer des métadonnées basées sur le temps.
Oui, Pegasus 1.5 by TwelveLabs propose un modèle freemium avec un plan Free qui inclut des limites de débit de base sans coût. Des plans payants Developer et Enterprise sont disponibles avec des limites croissantes et une tarification personnalisée, respectivement. La tarification par token pour le modèle Pegasus comprend 0,001 $ par 1 000 tokens d'entrée et 0,007 $ par 1 000 tokens de sortie pour l'utilisation de l'API Analyze.
Les principales fonctionnalités de Pegasus 1.5 by TwelveLabs incluent la disponibilité de l'API, la recherche vidéo sémantique utilisant le langage naturel, le résumé vidéo automatisé, l'extraction de métadonnées basée sur le temps (TBM) avec une sortie de schéma JSON personnalisé, la modération de contenu, l'ingestion de données multimodales à environ 60x la vitesse en temps réel, l'indexation d'une heure de vidéo en environ une minute, le Prompting multimodal et la prise en charge des vidéos longues jusqu'à deux heures.
Pegasus 1.5 by TwelveLabs est destiné aux développeurs et aux entreprises ayant besoin d'intelligence vidéo, aux sociétés de médias et de divertissement pour la recherche et l'archivage de contenu, aux organisations sportives pour l'analyse, aux agences de publicité pour le marquage de contenu, aux agences gouvernementales pour la conformité, aux opérateurs de sécurité pour l'analyse vidéo et aux marketeurs de marque pour la compréhension du contenu vidéo.
Pegasus 1.5 by TwelveLabs se distingue par son 'modèle de langage vidéo-first' et sa qualité de segmentation supérieure, surpassant Gemini 3 Pro de 13,1 % dans les benchmarks. Contrairement aux modèles à usage général, il se concentre sur le raisonnement sur des vidéos entières pour produire des métadonnées structurées et basées sur le temps. Des concurrents comme Memories.ai mettent l'accent sur la mémoire contextuelle, Clarifai offre une plateforme de modèles d'IA personnalisés plus large, Google Cloud Video AI fournit de nombreux modèles pré-entraînés, et VIDIZMO EnterpriseTube se concentre sur la gestion complète du contenu vidéo d'entreprise pour les cas d'utilisation industriels.
Plus sur Stork
Plus d'outils dans cette catégorie, classés par signal communautaire
Brand Context API
🤖 AI Tools
Brandfetch est une plateforme de données de marque qui offre un accès instantané aux logos, couleurs, polices et éléments de marque pour des millions d'entreprises à travers le monde. L'API Brandfetch permet aux développeurs d'intégrer des identités de marque précises directement dans leurs produits, automatisant ainsi la gestion de marque.
Veltrix AI
🤖 AI Tools
Connectez QuickBooks, Xero, Square, Shopify et bien plus encore. Posez toutes vos questions en langage clair et obtenez des réponses étayées par des sources, des alertes intelligentes et les étapes suivantes.
Leni
🤖 AI Tools
Découvrez Leni : IA conçue spécifiquement pour les investisseurs sérieux dans le CRE et le PE. Rationalisez la souscription, le reporting et la prise de décision. L'IA la plus sécurisée et la plus précise pour le travail d'investissement.
Replicas
🤖 AI Tools
Exécutez des agents de codage en arrière-plan depuis n'importe quel emplacement. Générez Claude Code ou Codex dans un environnement sandbox, préconfiguré avec du code et de l'outillage. Transférez des tâches via les intégrations Slack, Linear et GitHub. Conçu pour les développeurs gérant des tâches de codage.
Choosaro
🤖 AI Tools
Comparer les options avec l'IA et obtenir une analyse structurée, des scores et un raisonnement clair pour prendre des décisions plus claires en toute confiance pour les idées, le contenu, les produits et les choix quotidiens.
remio
🤖 AI Tools
remio est une base de connaissances AI qui capture automatiquement les pages web, les réunions et les fichiers. Organisez automatiquement l'information et obtenez des réponses AI à partir de vos données. Le 100% local storage et le BYOK garantissent la confidentialité.
For builders
AI agents read it. Buyers find it. Backlinks accrue. Your tool can have one too — live in 24 hours, indexed by Claude, ChatGPT, and Perplexity, queryable via MCP.