Skip to content

Anthropic's Fable 5: Die AI, die Benchmarks brach

Anthropic hat Claude Fable 5 veröffentlicht, die öffentliche Version seines legendären 'Mythos'-Modells. Es dominiert bereits jeden wichtigen Benchmark und zeigt eine beispiellose Fähigkeit bei komplexen, langfristigen Aufgaben.

Theo Brandt
Hero image for: Anthropic's Fable 5: Die AI, die Benchmarks brach

Zusammenfassung / Kernpunkte

  • Anthropic hat Claude Fable 5 veröffentlicht, die öffentliche Version seines legendären 'Mythos'-Modells.
  • Es dominiert bereits jeden wichtigen Benchmark und zeigt eine beispiellose Fähigkeit bei komplexen, langfristigen Aufgaben.

Die Legende von Mythos wird Realität

Anthropic hat soeben Claude Fable 5 entfesselt, die öffentlich verfügbare, geschützte Inkarnation des sagenumwobenen 'Mythos'-Modells. Diese AI galt einst als zu mächtig für eine allgemeine Veröffentlichung, umhüllt von Gerüchten über ihre rohe, ungezügelte Kraft und das Potenzial, „die ganze Welt zu zerstören.“

Mythos entstand tief innerhalb von Project Glasswing, einer geheimen Initiative, wo es alarmierende Fähigkeiten zeigte. Es demonstrierte „Cyber-Offensivfähigkeiten auf Nationalstaaten-Niveau“ und deckte Tausende von hochkritischen Schwachstellen auf. Dazu gehörten ein 27 Jahre alter Fehler in OpenBSD und 271 Bugs in Firefox – eine erstaunliche zehnfache Menge im Vergleich zu seinem Vorgänger, Opus 4.6. Dies war nicht nur ein Modell; es war eine digitale Waffe, die die „zusätzlichen Schutzschienen“ erforderte, die Fable 5 hervorbrachten.

Jetzt spielt Anthropic seine Karten aus und positioniert Fable 5 als direkte Herausforderung für die AI-Hierarchie. Es zielt darauf ab, Top-Modelle von OpenAI, Google und sogar seinen eigenen ehemaligen Champion, Claude Opus 4.8, in den Schatten zu stellen. Fable 5 ist das erste Modell, das 90% auf Anthropic's Kernanalyse-Benchmark überschreitet, was einen 10-Punkte-Sprung gegenüber früheren Opus-Modellen darstellt. Es führt die SWE-bench Verified Bestenliste mit 93,9% gegenüber Claude Opus 4.8's 88,6% an, was Anthropic's klare Absicht signalisiert, die Krone der Frontier AI zu erobern.

Benchmarks lügen nicht: Ein neuer König wird gekrönt

Zahlen lügen nicht. Anthropic's Claude Fable 5 hat gerade die Messlatte für die Fähigkeit von Frontier AI neu gesetzt und liefert eine marktdominierende Leistung über kritische Industriestandards hinweg. Es dominiert jedes andere Modell auf dem Planeten, einschließlich Opus 4.8, bei Evaluierungen wie SWE-bench, FrontierCode und GDPval. Dieses Modell ist auf fast allen getesteten Benchmarks der AI-Fähigkeit auf dem neuesten Stand der Technik und zeichnet sich in Softwareentwicklung, Wissensarbeit, Vision und wissenschaftlicher Forschung aus.

Fable 5 erreichte einen bedeutenden ersten Erfolg, indem es 90% auf Anthropic's Kernanalyse-Benchmark für komplexe, langwierige analytische Aufgaben überschritt. Dies stellt einen beispiellosen 10-Punkte-Sprung gegenüber früheren Opus-Modellen dar und signalisiert eine neue Ära für die Fähigkeit von AI, komplizierte, mehrstufige Probleme zu bewältigen. Die Kompetenz des Modells in wirtschaftlich wertvoller Wissensarbeit, bewertet über 44 Berufe und 9 Hauptsektoren in GDPval, nähert sich der Qualität menschlicher Experten an.

Matthew Berman, ein scharfer Beobachter der AI-Landschaft, nahm nach seiner Woche mit dem Modell kein Blatt vor den Mund und erklärte es zum „besten Modell auf dem Planeten.“ Er lobte die Fähigkeiten von Fable 5, insbesondere bei langfristigen Aufgaben, und bemerkte, dass er „keine Aufgaben finden konnte, die zu komplex dafür waren.“ Berman hob seine Bereitschaft hervor, jede mögliche Lösung zu erkunden, auch wenn es sich „langsam“ anfühlte, und letztendlich unvergleichliche Ergebnisse wie eine Fluiddynamik-Simulation lieferte. Dieses Modell besteht nicht nur Tests; es definiert die Obergrenze neu.

Jenseits der Zahlen: Die Beherrschung langfristiger Aufgaben

Jenseits der reinen Benchmark-Ergebnisse, wo Claude Fable 5 jetzt regiert, liegt sein wahrer strategischer Vorteil: langfristige Aufgaben. Dies sind keine einfachen Fragen und Antworten; sie erfordern autonome Planung, mehrstufige Ausführung und iterative Verfeinerung komplexer Projekte ohne ständige menschliche Intervention. Die Architektur von Fable 5 ist speziell für dieses nachhaltige Denken konzipiert, ein entscheidendes Unterscheidungsmerkmal, das neue Produktivitätsniveaus in realen Anwendungen erschließt.

Matthew Bermans Rezension zeigte diese Fähigkeit anschaulich und hob eine beeindruckende fluid dynamics simulation hervor, die von Fable 5 generiert wurde. Dies war keine vorgefertigte Demo; es war das Modell, das autonom ein komplexes System in Echtzeit erstellte und manipulierte und dabei fortschrittliche generative and reasoning capabilities demonstrierte, die weit über das hinausgehen, was seine Vorgänger leisten konnten. Dies geht über bloße problem-solving hinaus; es ist proactive project management.

Sein methodischer Ansatz, oft als 'Langsamkeit' wahrgenommen, ist tatsächlich ein feature, kein bug – eine bewusste Investition in Gründlichkeit. Fable 5 erkundet gründlich jeden möglichen Lösungsweg und gewährleistet optimal outcomes statt schneller, aber suboptimaler Ergebnisse. Dieser überlegte Prozess erklärt, warum es das erste Modell ist, das 90 % auf Anthropic's core analytics benchmark für complex, long-running tasks überschreitet, ein Sprung von 10 Punkten gegenüber früheren Opus models. Für tiefere Einblicke in Anthropic’s model releases, siehe Claude Fable 5 and Claude Mythos 5 - Anthropic.

Leistung vs. Sicherheit: Anthropic's Strategic Gambit

Anthropic bringt nicht nur ein neues Modell heraus; sie führen eine kalkulierte dual-release durch. Claude Fable 5 erreicht die Öffentlichkeit mit robusten Schutzmaßnahmen, einem für den allgemeinen Gebrauch gezähmten "Mythos-class" Modell. Währenddessen ist das leistungsstarke Claude Mythos 5 — cyber safeguards aufgehoben — für geprüfte Glasswing partners und spezifische biology researchers reserviert. Hier geht es nicht nur um Leistungsfähigkeit; es ist ein strategic gambit, das rohe Leistung mit verantwortungsvoller Bereitstellung in Einklang bringt.

Erinnern Sie sich an Project Glasswing? Die ursprüngliche Mythos Preview demonstrierte "nation-state level cyber offensive capabilities" und identifizierte Tausende von high-severity vulnerabilities, einschließlich einer 27 Jahre alten Schwachstelle in OpenBSD. Anthropic versteht die Risiken: Ein Modell, das zu solchen Leistungen fähig ist, erfordert eine sorgfältig kontrollierte Veröffentlichung, daher der zweistufige Ansatz. Sie wissen, was sie haben.

Möchten Sie diesen neuen Standard nutzen? Fable 5 ist live über die Claude API und Plattformen wie Bedrock verfügbar. Die Preisgestaltung ist aggressiv für ein frontier model: 10 $ pro 1 Million input tokens und 50 $ pro 1 Million output tokens. Dies ist nicht nur ein leistungsfähigeres Tool; es setzt einen neuen Industriestandard für die sichere Bereitstellung von frontier AI und beweist, dass Innovation nicht durch Vorsicht erstickt werden muss. Anthropic hat gerade allen gezeigt, wie es geht.

Häufig gestellte Fragen

Was ist Claude Fable 5?

Claude Fable 5 ist ein neues, öffentlich verfügbares AI model von Anthropic. Es ist ein 'Mythos-class' Modell mit fortschrittlichen safety guardrails, konzipiert für complex, long-horizon tasks.

Wie unterscheidet sich Fable 5 von Mythos 5?

Fable 5 ist die Version des Mythos Modells, die für den allgemeinen Gebrauch sicher gemacht wurde. Das vollständige Claude Mythos 5 Modell hat weniger Schutzmaßnahmen und ist auf spezialisierte Partner für Sicherheits- und biology research beschränkt.

Was macht Claude Fable 5 besser als andere Modelle?

Fable 5 dominiert Berichten zufolge benchmarks wie SWE-bench und GDPval und übertrifft sogar Claude Opus 4.8. Seine Hauptstärke ist die Bewältigung komplexer multi-step problems, die sustained reasoning erfordern.

Für wen ist Claude Fable 5?

Es wurde für Entwickler und Forscher entwickelt, die an ehrgeizigen, komplexen Problemen arbeiten, wie z.B. komplizierte software engineering, scientific research und langwierige analytical tasks, die automatisiert werden können.

Found this useful? Share it.

One short daily email of tools worth shipping. No drip funnel.

one email a day · unsubscribe in two clicks · no third-party tracking

🚀Mehr entdecken

Bleiben Sie der KI voraus

Entdecken Sie die besten KI-Tools, Agenten und MCP-Server, kuratiert von Stork.AI.

P.S. Etwas Brauchbares gebaut? Bei Stork listen