FlowGrid
Shares tags: ai, code, research
Twelve Labs bietet eine Video-Intelligence-Plattform, die es Maschinen ermöglicht, Videoinhalte wie Menschen zu verstehen, zu durchsuchen und zu analysieren.
<a href="https://www.stork.ai/en/pegasus-1-5-by-twelvelabs" target="_blank" rel="noopener noreferrer"><img src="https://www.stork.ai/api/badge/pegasus-1-5-by-twelvelabs?style=dark" alt="Pegasus 1.5 by TwelveLabs - Featured on Stork.ai" height="36" /></a>
[](https://www.stork.ai/en/pegasus-1-5-by-twelvelabs)
overview
Pegasus 1.5 by TwelveLabs ist ein Video-first language model, das von Twelve Labs entwickelt wurde und es Entwicklern und Unternehmen ermöglicht, strukturierte, zeitbasierte Metadaten aus Videoinhalten zu generieren. Es integriert visuelle, Audio- und Sprachinformationen, um eine umfassende Videoanalyse zu bieten. Dieses Modell stellt eine bedeutende Weiterentwicklung gegenüber seinem Vorgänger, Pegasus 1.2, dar, indem es den Fokus von clip-basierten Fragen und Antworten auf eine umfassende Videoanalyse und die Generierung strukturierter, zeitbasierter Metadaten verlagert. Pegasus 1.5 wurde am 20. April 2026 auf der NAB Show in Las Vegas offiziell angekündigt und allgemein verfügbar gemacht. Seine Kernfunktion ist die Time-Based Metadata Extraction (TBM), die es Benutzern ermöglicht, ein benutzerdefiniertes JSON schema zu definieren und zeitgestempelte, strukturierte Metadaten über ganze Videos von bis zu zwei Stunden Länge in einem einzigen API-Aufruf zu erhalten. Diese Funktionalität automatisiert Video-Tagging-Workflows, die zuvor Tausende von Stunden manueller Überprüfung erforderten.
quick facts
| Attribut | Wert |
|---|---|
| Entwickler | Twelve Labs |
| Geschäftsmodell | Freemium / Hybrid (Subscription & Usage-based) |
| Preisgestaltung | Freemium, Developer tiers variieren je nach monatlichen Ausgaben, Enterprise custom. Input text $0.001/1k tokens, Output text $0.007/1k tokens. |
| Plattformen | API |
| API Verfügbar | Ja |
| Integrationen | API-gesteuert, ermöglicht breite Integration |
| Gegründet | 2020 |
| Hauptsitz | San Francisco, USA |
| Finanzierung | Series A |
features
Pegasus 1.5 by TwelveLabs bietet eine Reihe von Funktionen, die für fortgeschrittenes Videoverständnis und die Generierung strukturierter Daten entwickelt wurden. Es nutzt multimodal intelligence, um Video-, Audio- und Sprachdaten zu verarbeiten und detaillierte Einblicke sowie Automatisierungsfunktionen für verschiedene Unternehmensanwendungen zu liefern. Die technischen Spezifikationen der Plattform umfassen eine tägliche Videoindizierungskapazität von über 10.000 Stunden und eine multimodal data ingestion speed von etwa 60-facher Echtzeit.
use cases
Pegasus 1.5 by TwelveLabs wurde für Organisationen und Einzelpersonen entwickelt, die im großen Maßstab mit Videos arbeiten und fortschrittliche KI-gesteuerte Verständnis-, Such- und Analysefunktionen benötigen. Seine multimodal intelligence und die Generierung strukturierter Metadaten sind besonders vorteilhaft für developers, enterprises und kreative Fachleute in verschiedenen Branchen.
pricing
TwelveLabs bietet ein freemium pricing model für Pegasus 1.5 an, das in drei Hauptpläne unterteilt ist: Free, Developer und Enterprise. Für alle Pläne gelten Rate limits, die je nach Nutzungstyp variieren (dauerbasiert für Video-/Audioverarbeitung, token-basiert für Textausgabe und anfragebasiert für endpoints). Das Überschreiten einer anwendbaren Grenze führt zu einem Fehler. Die Preisgestaltung für die spezifische API-Nutzung ist detailliert, wobei input text tokens für das Pegasus-Modell etwa $0.001 pro 1.000 tokens und output text tokens für die Pegasus Analyze API etwa $0.007 pro 1.000 tokens betragen.
competitors
TwelveLabs positioniert Pegasus 1.5 als führendes Video reasoning model, das im Vergleich zu Allzweckmodellen eine überlegene Leistung in der Segmentierungsqualität und der Zuverlässigkeit der strukturierten Ausgabe zeigt. In Bewertungen übertraf Pegasus 1.5 Gemini 3.1 Pro Berichten zufolge um 13,1 % in der aggregierten Segmentierungsqualität, mit einer Grenzgenauigkeit von etwa 350 Millisekunden. Es behielt auch eine konsistente Ausgabegenauigkeit über komplexe, mehrfach definierte schemas bei, wo andere Modelle hohe structured JSON failure rates aufwiesen.
Pegasus 1.5 by TwelveLabs ist ein Video-first language model, das von Twelve Labs entwickelt wurde und es Entwicklern und Unternehmen ermöglicht, strukturierte, zeitbasierte Metadaten aus Videoinhalten zu generieren. Es integriert visuelle, Audio- und Sprachinformationen, um eine umfassende Videoanalyse zu bieten.
Ja, Pegasus 1.5 by TwelveLabs bietet einen Free Plan, der bis zu 10 Stunden Indizierung für die Modelle Marengo und Pegasus kostenlos ermöglicht, mit grundlegenden rate limits. Kostenpflichtige Developer und Enterprise Pläne sind ebenfalls verfügbar, mit usage-based pricing für API-Aufrufe, einschließlich etwa $0.001 pro 1.000 input text tokens und $0.007 pro 1.000 output text tokens.
Zu den Hauptmerkmalen von Pegasus 1.5 by TwelveLabs gehören enterprise video AI, angetrieben durch multimodal intelligence, semantic video search mittels natural language, automatisierte Videozusammenfassung und Time-Based Metadata Extraction (TBM) mit benutzerdefinierten JSON schemas. Es bietet auch content moderation, compliance und brand safety analysis, mit Videoindizierungsgeschwindigkeiten von etwa 60-facher Echtzeit.
Pegasus 1.5 by TwelveLabs ist für developers, enterprises, Medien- und Unterhaltungsunternehmen, Sportorganisationen, streaming platforms und security operators gedacht. Es ist besonders nützlich für diejenigen, die fortgeschrittenes KI-gesteuertes Videoverständnis, semantic search, automatisierte content analysis und die Generierung strukturierter Metadaten aus großen Mengen von Videoinhalten benötigen.
Pegasus 1.5 by TwelveLabs zeichnet sich durch seine spezialisierten video-first language models und überlegene Leistung in der Segmentierungsqualität und der Zuverlässigkeit der strukturierten Ausgabe aus, wobei es Gemini 3.1 Pro Berichten zufolge um 13,1 % übertrifft. Während Wettbewerber wie Mixpeek self-hosted options anbieten, Google Video Intelligence API breit in Google Cloud integriert ist, Azure Video Indexer ein Webportal bereitstellt und Reka AI sich auf native multimodal perception konzentriert, betont Pegasus 1.5 eine umfassende, schema-gesteuerte time-based metadata extraction für enterprise video intelligence.