Skip to content

Pegasus 1.5 by TwelveLabs Bewertung

Twelve Labs bietet eine Video-Intelligence-Plattform, die es Maschinen ermöglicht, Videoinhalte wie Menschen zu verstehen, zu durchsuchen und zu analysieren.

shipped 21. Apr. 2026aifreemium
Pegasus 1.5 by TwelveLabs - AI tool for pegasus twelvelabs. Professional illustration showing core functionality and features.
1Pegasus 1.5 by TwelveLabs übertrifft Gemini 3.1 Pro um 13,1 % in der aggregierten Segmentierungsqualität.
2Die Plattform indiziert Videos mit etwa 60-facher Echtzeitgeschwindigkeit und verarbeitet 1 Stunde Video in 1 Minute.
3Pegasus 1.5 ermöglicht die Time-Based Metadata Extraction (TBM) über ganze Videos von bis zu zwei Stunden Länge in einem einzigen API-Aufruf.
4TwelveLabs hat den SOC2-Status erreicht, was die Einhaltung von Sicherheits- und compliance-Standards belegt.

Stork Quadrant

Becomes the API· 27/100

Replaceable as a UI, but kept alive as the API the agents call.

TwelveLabs built a capable multimodal video understanding API before the frontier labs caught up. That window is closing. GPT-4o, Gemini 1.5 Pro, and Claude already handle video natively, and they're getting faster and cheaper. There's no proprietary data, no network, no regulatory gate — just a specialized model that bigger players will commoditize.

Claude Sonnet 4.6, scored 2026-05-30

Defensibility · 0/100

  • Physical-world coupling
  • Regulatory moat
  • Network liquidity
  • Proprietary refreshing data
  • High-trust catastrophic workflows
  • Multi-party coordination
  • Brand / community / taste

An LLM alone could replace

  • Summarize what happens in a video by describing its content
  • Transcribe audio and extract key topics or themes from spoken content
  • Answer questions about a video's subject matter given a transcript or description
  • Generate metadata tags or chapter markers for video content

Agent-Readiness · 60/100

  • Verified MCPStork MCP listing: io-twelvelabs-twelvelabs-mcp-server (untested)
  • Listed on agent surfacesStork:io-twelvelabs-twelvelabs-mcp-server
  • Usage-based pricingpricing page heuristic match: https://www.twelvelabs.io/pricing
  • Headless agent auth
  • Public OpenAPIhttps://docs.twelvelabs.io/v1.3/docs/resources/platform-overview
  • Active changeloghttps://www.twelvelabs.io/blog/introducing-pegasus-1-5 (2026-04-19)
  • llms.txthttps://www.twelvelabs.io/llms.txt

Score history · +5 pts over 3 re-scores

How to defend

Go vertical and own the liability: pick one industry where wrong video analysis has real consequences — insurance claims, legal evidence, broadcast compliance — and become the vendor that signs the contract and bears the risk. That's the only move that creates a moat here.

  • Ship an MCP server and list it on Stork — biggest single point gain (+25).
  • Expose API-key auth with a self-serve sandbox tier; remove sales-call gates (+15).

Pegasus 1.5 by TwelveLabs at a Glance

Best For
video, code, research
Pricing
freemium
Key Features
Processes videos up to two hours in length in a single API call. · Outperformed Gemini 3 Pro by 13.1% on aggregate segmentation quality in internal benchmarks. · Indexes an hour of video in approximately one minute, achieving ~60x real-time speed.
Alternatives
Mixpeek, Azure AI Video Indexer, Moments Lab, Memories.ai

About Pegasus 1.5 by TwelveLabs

Headquarters
San Francisco, USA
Founded
2020
Team Size
51-100
Funding
Series A

Ähnliche Tools

Alternativen vergleichen

Andere Tools, die Sie in Betracht ziehen könnten

Kontakt

</>Embed "Featured on Stork" Badge
Badge previewBadge preview light
<a href="https://www.stork.ai/en/pegasus-1-5-by-twelvelabs" target="_blank" rel="noopener noreferrer"><img src="https://www.stork.ai/api/badge/pegasus-1-5-by-twelvelabs?style=dark" alt="Pegasus 1.5 by TwelveLabs - Featured on Stork.ai" height="36" /></a>
[![Pegasus 1.5 by TwelveLabs - Featured on Stork.ai](https://www.stork.ai/api/badge/pegasus-1-5-by-twelvelabs?style=dark)](https://www.stork.ai/en/pegasus-1-5-by-twelvelabs)

overview

Was ist Pegasus 1.5 by TwelveLabs?

Pegasus 1.5 by TwelveLabs ist ein Video-first language model, das von Twelve Labs entwickelt wurde und es Entwicklern und Unternehmen ermöglicht, strukturierte, zeitbasierte Metadaten aus Videoinhalten zu generieren. Es integriert visuelle, Audio- und Sprachinformationen, um eine umfassende Videoanalyse zu bieten. Dieses Modell stellt eine bedeutende Weiterentwicklung gegenüber seinem Vorgänger, Pegasus 1.2, dar, indem es den Fokus von clip-basierten Fragen und Antworten auf eine umfassende Videoanalyse und die Generierung strukturierter, zeitbasierter Metadaten verlagert. Pegasus 1.5 wurde am 20. April 2026 auf der NAB Show in Las Vegas offiziell angekündigt und allgemein verfügbar gemacht. Seine Kernfunktion ist die Time-Based Metadata Extraction (TBM), die es Benutzern ermöglicht, ein benutzerdefiniertes JSON schema zu definieren und zeitgestempelte, strukturierte Metadaten über ganze Videos von bis zu zwei Stunden Länge in einem einzigen API-Aufruf zu erhalten. Diese Funktionalität automatisiert Video-Tagging-Workflows, die zuvor Tausende von Stunden manueller Überprüfung erforderten.

quick facts

Kurze Fakten

AttributWert
EntwicklerTwelve Labs
GeschäftsmodellFreemium / Hybrid (Subscription & Usage-based)
PreisgestaltungFreemium, Developer tiers variieren je nach monatlichen Ausgaben, Enterprise custom. Input text $0.001/1k tokens, Output text $0.007/1k tokens.
PlattformenAPI
API VerfügbarJa
IntegrationenAPI-gesteuert, ermöglicht breite Integration
Gegründet2020
HauptsitzSan Francisco, USA
FinanzierungSeries A

features

Hauptmerkmale von Pegasus 1.5 by TwelveLabs

Pegasus 1.5 by TwelveLabs bietet eine Reihe von Funktionen, die für fortgeschrittenes Videoverständnis und die Generierung strukturierter Daten entwickelt wurden. Es nutzt multimodal intelligence, um Video-, Audio- und Sprachdaten zu verarbeiten und detaillierte Einblicke sowie Automatisierungsfunktionen für verschiedene Unternehmensanwendungen zu liefern. Die technischen Spezifikationen der Plattform umfassen eine tägliche Videoindizierungskapazität von über 10.000 Stunden und eine multimodal data ingestion speed von etwa 60-facher Echtzeit.

  • 1Enterprise video AI, angetrieben durch multimodal intelligence über Vision, Audio und Sprache.
  • 2Semantic video search und Abruf mittels natural language queries.
  • 3Automatisierte Videozusammenfassung und Erkenntnisgenerierung aus Langform-Inhalten.
  • 4Time-Based Metadata Extraction (TBM) mit benutzerdefiniertem JSON schema, das zeitgestempelte, strukturierte Daten liefert.
  • 5Content moderation, compliance und brand safety analysis.
  • 6Ingestion von multimodal data durch eine einzige Pipeline für effiziente Verarbeitung.
  • 7Videoindizierung mit etwa 60-facher Echtzeitgeschwindigkeit, Verarbeitung von 1 Stunde Video in 1 Minute.
  • 8Segmentation von Videoinhalten in narrative units, scenes und topics.
  • 9Erstellung von highlights und key moments aus Videomaterial.
  • 10Überlegene multimodal prompting performance, die Gemini 3.1 Pro um 13,1 % in der aggregierten Segmentierungsqualität übertrifft.

use cases

Wer sollte Pegasus 1.5 by TwelveLabs nutzen?

Pegasus 1.5 by TwelveLabs wurde für Organisationen und Einzelpersonen entwickelt, die im großen Maßstab mit Videos arbeiten und fortschrittliche KI-gesteuerte Verständnis-, Such- und Analysefunktionen benötigen. Seine multimodal intelligence und die Generierung strukturierter Metadaten sind besonders vorteilhaft für developers, enterprises und kreative Fachleute in verschiedenen Branchen.

  • 1Developers und Enterprises: Für die Entwicklung von Anwendungen, die semantic video search, Content discovery und die Umwandlung von Rohmaterial in abfragbare, produktionsreife Daten erfordern.
  • 2Medien- und Unterhaltungsunternehmen: Für die Segmentierung von Langform-Inhalten in narrative units, Archivierung, Empfehlungssysteme und automatisierte highlight generation.
  • 3Sportorganisationen: Zum automatischen Erkennen und Beschriften von Spielzügen mit präzisen zeitlichen Grenzen, was die Erstellung von Echtzeit-highlights und performance analytics ermöglicht.
  • 4Streaming Platforms: Zum Identifizieren von Markenauftritten, Szenenübergängen und kontextuellen Momenten, um gezielte Werbung und content monetization zu erleichtern.
  • 5Security operators und Regierungsbehörden: Für content analysis, compliance checks, automatisierte Dokumentation und Berichterstellung aus Videomaterial.

pricing

Pegasus 1.5 by TwelveLabs Preise & Pläne

TwelveLabs bietet ein freemium pricing model für Pegasus 1.5 an, das in drei Hauptpläne unterteilt ist: Free, Developer und Enterprise. Für alle Pläne gelten Rate limits, die je nach Nutzungstyp variieren (dauerbasiert für Video-/Audioverarbeitung, token-basiert für Textausgabe und anfragebasiert für endpoints). Das Überschreiten einer anwendbaren Grenze führt zu einem Fehler. Die Preisgestaltung für die spezifische API-Nutzung ist detailliert, wobei input text tokens für das Pegasus-Modell etwa $0.001 pro 1.000 tokens und output text tokens für die Pegasus Analyze API etwa $0.007 pro 1.000 tokens betragen.

  • 1Free Plan: Ermöglicht bis zu 10 Stunden Indizierung für die Modelle Marengo und Pegasus kostenlos, mit grundlegenden rate limits.
  • 2Developer Plan: Bietet drei tiers mit steigenden Limits basierend auf monatlichen Ausgaben, die eine umfangreichere Nutzungskapazität für Dauer, tokens und requests bieten.
  • 3Enterprise Plan: Bietet custom limits und maßgeschneiderte Lösungen für große Organisationen mit spezifischen Anforderungen und hohem Nutzungsvolumen.
  • 4Usage-based pricing: Input text tokens für das Pegasus-Modell betragen etwa $0.001 pro 1.000 tokens. Output text tokens für die Pegasus Analyze API betragen etwa $0.007 pro 1.000 tokens.

competitors

Pegasus 1.5 by TwelveLabs vs. Wettbewerber

TwelveLabs positioniert Pegasus 1.5 als führendes Video reasoning model, das im Vergleich zu Allzweckmodellen eine überlegene Leistung in der Segmentierungsqualität und der Zuverlässigkeit der strukturierten Ausgabe zeigt. In Bewertungen übertraf Pegasus 1.5 Gemini 3.1 Pro Berichten zufolge um 13,1 % in der aggregierten Segmentierungsqualität, mit einer Grenzgenauigkeit von etwa 350 Millisekunden. Es behielt auch eine konsistente Ausgabegenauigkeit über komplexe, mehrfach definierte schemas bei, wo andere Modelle hohe structured JSON failure rates aufwiesen.

1
Mixpeek

Mixpeek is a multimodal data warehouse that decomposes video, images, and audio into searchable features and reassembles them through multi-stage retrieval pipelines.

Similar to TwelveLabs, Mixpeek offers a full-stack video intelligence platform with composable pipelines for various extractors (vision, audio, OCR, face), providing retrieval-ready output. It also offers a freemium model with 1,000 free credits, aligning with TwelveLabs' freemium offering.

2
Azure AI Video Indexer

Azure AI Video Indexer is a cloud and edge service that automatically extracts deep insights from video and audio content, integrated within the Microsoft Azure ecosystem.

Azure AI Video Indexer provides similar multimodal analysis capabilities (object detection, OCR, transcription, sentiment analysis) but is a service within the broader Azure ecosystem, potentially appealing to organizations already using Azure, whereas TwelveLabs is a specialized platform. It offers a free trial with up to 2,400 minutes of free indexing.

3
Moments Lab

Moments Lab is an AI-powered video discovery platform that indexes visuals, audio, and metadata to help organizations find, repurpose, share, and monetize video content.

Moments Lab directly competes in the enterprise video discovery and content monetization space, offering similar multimodal indexing and search capabilities to TwelveLabs, but with a stronger emphasis on repurposing and monetizing content. Pricing is likely enterprise-focused, requiring a demo.

4
Memories.ai

Memories.ai offers advanced AI video understanding technology that effortlessly analyzes every frame to detect objects, interpret context, recognize emotions, and extract meaningful insights.

Memories.ai provides comprehensive AI video understanding for insights, content tagging, and scene analysis, directly aligning with TwelveLabs' core offering of understanding video across vision, audio, and language. It implies a trial or freemium model.

Häufig gestellte Fragen

+Was ist Pegasus 1.5 by TwelveLabs?

Pegasus 1.5 by TwelveLabs ist ein Video-first language model, das von Twelve Labs entwickelt wurde und es Entwicklern und Unternehmen ermöglicht, strukturierte, zeitbasierte Metadaten aus Videoinhalten zu generieren. Es integriert visuelle, Audio- und Sprachinformationen, um eine umfassende Videoanalyse zu bieten.

+Ist Pegasus 1.5 by TwelveLabs kostenlos?

Ja, Pegasus 1.5 by TwelveLabs bietet einen Free Plan, der bis zu 10 Stunden Indizierung für die Modelle Marengo und Pegasus kostenlos ermöglicht, mit grundlegenden rate limits. Kostenpflichtige Developer und Enterprise Pläne sind ebenfalls verfügbar, mit usage-based pricing für API-Aufrufe, einschließlich etwa $0.001 pro 1.000 input text tokens und $0.007 pro 1.000 output text tokens.

+Was sind die Hauptmerkmale von Pegasus 1.5 by TwelveLabs?

Zu den Hauptmerkmalen von Pegasus 1.5 by TwelveLabs gehören enterprise video AI, angetrieben durch multimodal intelligence, semantic video search mittels natural language, automatisierte Videozusammenfassung und Time-Based Metadata Extraction (TBM) mit benutzerdefinierten JSON schemas. Es bietet auch content moderation, compliance und brand safety analysis, mit Videoindizierungsgeschwindigkeiten von etwa 60-facher Echtzeit.

+Wer sollte Pegasus 1.5 by TwelveLabs nutzen?

Pegasus 1.5 by TwelveLabs ist für developers, enterprises, Medien- und Unterhaltungsunternehmen, Sportorganisationen, streaming platforms und security operators gedacht. Es ist besonders nützlich für diejenigen, die fortgeschrittenes KI-gesteuertes Videoverständnis, semantic search, automatisierte content analysis und die Generierung strukturierter Metadaten aus großen Mengen von Videoinhalten benötigen.

+Wie schneidet Pegasus 1.5 by TwelveLabs im Vergleich zu Alternativen ab?

Pegasus 1.5 by TwelveLabs zeichnet sich durch seine spezialisierten video-first language models und überlegene Leistung in der Segmentierungsqualität und der Zuverlässigkeit der strukturierten Ausgabe aus, wobei es Gemini 3.1 Pro Berichten zufolge um 13,1 % übertrifft. Während Wettbewerber wie Mixpeek self-hosted options anbieten, Google Video Intelligence API breit in Google Cloud integriert ist, Azure Video Indexer ein Webportal bereitstellt und Reka AI sich auf native multimodal perception konzentriert, betont Pegasus 1.5 eine umfassende, schema-gesteuerte time-based metadata extraction für enterprise video intelligence.

Mehr auf Stork

Verwandte KI-Tools

Weitere Tools dieser Kategorie, geordnet nach Community-Signal

Gesamtes Verzeichnis durchsuchen →
B

Brand Context API

🤖 AI Tools

Brandfetch ist eine Markendatenplattform, die sofortigen Zugriff auf Logos, Farben, Schriftarten und Markenressourcen für Millionen von Unternehmen weltweit bietet. Die Brandfetch API ermöglicht es Entwicklern, präzise Markenidentitäten direkt in ihre Produkte zu integrieren und automatisiert so das Markenmanagement.

Veltrix AI logo

Veltrix AI

🤖 AI Tools

Verbinden Sie QuickBooks, Xero, Square, Shopify und mehr. Stellen Sie beliebige Fragen in einfachem Englisch und erhalten Sie quellenbasierte Antworten, intelligente Benachrichtigungen und nächste Schritte.

Leni logo

Leni

🤖 AI Tools

Entdecken Sie Leni: Zweckgebundene AI für ernsthafte Investoren in CRE & PE. Optimieren Sie Underwriting, Reporting und Entscheidungsfindung. Die sicherste und präziseste AI für Investmentarbeit.

Replicas logo

Replicas

🤖 AI Tools

Führen Sie Hintergrund-Coding-Agents von jedem beliebigen Standort aus. Erzeugen Sie Claude Code oder Codex innerhalb einer Sandbox-Umgebung, vorkonfiguriert mit Code und Tools. Übergeben Sie Aufgaben über Slack-, Linear- und GitHub-Integrationen. Entwickelt für Entwickler, die Coding-Aufgaben verwalten.

Choosaro logo

Choosaro

🤖 AI Tools

Optionen mit KI vergleichen und strukturierte Analysen, Bewertungen und klare Begründungen erhalten, um mit Zuversicht klarere Entscheidungen zu treffen für Ideen, Inhalte, Produkte und alltägliche Entscheidungen.

remio logo

remio

🤖 AI Tools

remio ist eine KI-Wissensdatenbank, die Webseiten, Meetings und Dateien automatisch erfasst. Organisieren Sie Informationen automatisch und erhalten Sie KI-Antworten aus Ihren Daten. 100% lokale Speicherung und BYOK gewährleisten den Datenschutz.

For builders

This page is doing a job for someone else’s tool.

AI agents read it. Buyers find it. Backlinks accrue. Your tool can have one too — live in 24 hours, indexed by Claude, ChatGPT, and Perplexity, queryable via MCP.