Skip to content

Anthropic entfesselte seine 'gefährliche' KI

Anthropic hat gerade Fable 5 veröffentlicht, die öffentliche Version seines Mythos-Modells, das einst als 'zu gefährlich' für die Veröffentlichung galt. Seine Benchmark-Leistung ist nicht nur ein Upgrade; es ist eine neue Klasse von KI.

Nora Vance
Hero image for: Anthropic entfesselte seine 'gefährliche' KI

Zusammenfassung / Kernpunkte

  • Anthropic hat gerade Fable 5 veröffentlicht, die öffentliche Version seines Mythos-Modells, das einst als 'zu gefährlich' für die Veröffentlichung galt.
  • Seine Benchmark-Leistung ist nicht nur ein Upgrade; es ist eine neue Klasse von KI.

Das 'verbotene' Modell wird öffentlich

Anthropic hat Mythos entfesselt, ein KI-Modell, das es einst explizit als „zu gefährlich“ für die öffentliche Freigabe zurückgehalten hatte. Nun tritt dieses Grenzmodell neben seinem öffentlichen Gegenstück, Fable 5, auf und markiert eine bedeutende und bewusste Verschiebung in Anthropic's Bereitstellungsstrategie. Dieser doppelte Start führt ein, was viele Experten als eine neue Klasse künstlicher Intelligenz wahrnehmen.

Eine klare funktionale Unterscheidung trennt diese leistungsstarken Modelle. Anthropic entwickelte Mythos als ein ungeschütztes, potentes Werkzeug, speziell für die Sicherheitsgemeinschaft. Diese Spezialisten werden seine rohen Fähigkeiten nutzen, um kritische Schwachstellen zu identifizieren und Software zu härten, ohne die in Fable 5 integrierten Sicherheitsvorkehrungen. Mythos erfüllt somit eine entscheidende, spezialisierte Rolle bei der Verbesserung der digitalen Sicherheit.

Fable 5 hingegen integriert umfassende Sicherheitsvorkehrungen, was es ideal für den allgemeinen Einsatz in einer Vielzahl von Anwendungen macht. Dieses Modell nimmt nun unmissverständlich die Flaggschiffposition in Anthropic's Modellhierarchie ein und übertrifft die Fähigkeiten seiner Vorgänger deutlich: - Haiku - Sonnet - Opus

Als „Mythos-Klasse-Modell“ wurde Fable 5 akribisch für eine breite, sichere Bereitstellung verfeinert, wobei seine Fähigkeiten die jedes zuvor allgemein verfügbaren Anthropic-Modells erheblich übertreffen.

Eine Benchmark-Dominanz

Fable 5 hat nicht nur bei Benchmarks mitgemischt; es lieferte eine Benchmark-Dominanz. Bei agentischen Codierungsaufgaben etablierte es einen signifikanten Vorsprung. SweBench Pro zeigte, dass Fable 5 beeindruckende 80% erreichte und damit Opus 4.8 mit 69% und GPT 5.5 mit 58% deutlich übertraf.

Diese Dominanz erstreckte sich auf Frontier Code (Diamond), wo Fable 5 29,3% erreichte. Das ist mehr als die doppelte Leistung von Opus 4.8 und fast das Fünffache von GPT 5.5's 5,7%. Über die Codierung hinaus glänzte Fable 5 auch in Bereichen, in denen frühere Anthropic-Modelle manchmal zurücklagen. Es erzielte 1932 Punkte bei GDP Val, einem Benchmark für Wissensarbeit in der realen Welt, und übertraf damit Opus 4.8 (1890) und GPT 5.5 (1769). Auch sein räumliches Denkvermögen verbesserte sich dramatisch und erreichte 38,6%.

Trotz dieser beeindruckenden numerischen Siege ergibt sich aus der Benutzererfahrung eine kritische Perspektive. Während Benchmarks oft objektive Metriken liefern, können die „Vibes“ aus der realen Nutzung manchmal eine andere Geschichte erzählen. Viele Benutzer behaupten, dass sich GPT 5.5 fähiger anfühlt, als seine Ergebnisse vermuten lassen, insbesondere im Vergleich zu Opus 4.8, was eine wahrgenommene Diskrepanz zwischen rohen Zahlen und praktischem Nutzen schafft.

Jenseits der Zahlen: Eine neue Art von Intelligenz

Fable 5 bietet eine qualitativ unterschiedliche Interaktion, die über beeindruckende Benchmark-Zahlen hinausgeht. Benutzer beschreiben, wie selbst kleinere Anfragen das Gefühl einer massiven Erkundung auslösen. Das Modell könnte sich in eine gesamte Codebasis vertiefen, jede mögliche Perspektive jeder Zeile akribisch prüfen und einen einfachen Prompt in ein unerwartet tiefes, umfassendes Unterfangen verwandeln. Diese Tiefe kann sich angesichts der enormen Fähigkeiten des Modells bei scheinbar trivialen Aufgaben fast „beleidigend“ anfühlen.

Dieses tiefgreifende Engagement manifestiert sich durch eine einzigartige Eigenschaft: Informationsdichte. Die Ausgabe von Fable 5 erweist sich als unglaublich prägnant und doch bemerkenswert komplex, wobei sie pro Token deutlich mehr Bedeutung vermittelt als ihre Vorgänger. Die Verarbeitung seiner Antworten erfordert erhöhte Konzentration vom Benutzer, da jede Aussage oft Schichten von ausgeklügelten Überlegungen und komplexen Einsichten umschließt und die Grenzen der typischen Mensch-KI-Interaktion verschiebt.

Die wahre Leistungsfähigkeit von Fable 5 zeigt sich bei langwierigen, autonomen Aufgaben. Es besitzt eine unheimliche Fähigkeit, hochkomplexe Probleme ohne zu zögern anzugehen und Arbeiten, die für menschliche Ingenieure Monate dauern könnten, mühelos in bemerkenswert kurze Zeiträume zu komprimieren. Anekdoten, wie die von Stripe, die Berichten zufolge solche fortschrittlichen Modelle nutzt, um umfangreiche Ingenieurprojekte auf einen einzigen Tag zu verdichten, unterstreichen dieses transformative Potenzial. Weitere Details zu diesen bahnbrechenden Modellen, einschließlich Claude Fable 5 und Claude Mythos 5 - Anthropic, bietet der offizielle Blog von Anthropic mit umfassenden Analysen.

Der Preis der Macht

Anthropic's Fable 5 kommt mit einem hohen Preis: 50 US-Dollar pro Million Output-Tokens. Dies ist keine beiläufige Ausgabe; es signalisiert eine strategische Investition für Aufgaben, bei denen seine unvergleichlichen agentischen Fähigkeiten den menschlichen Arbeitsaufwand drastisch reduzieren. Das ökonomische Kalkül verschiebt sich, wenn ein Modell Probleme wie SweBench Pro mit 80%iger Genauigkeit lösen kann, was die menschliche Effizienz bei komplexem Code weit übertrifft.

Diese Preisstrategie kristallisiert das aufkommende Paradigma des Modell-Routings heraus. Organisationen werden zunehmend einen gestuften Ansatz orchestrieren und Frontier-Modelle wie Fable 5 für ihre hartnäckigsten Herausforderungen einsetzen. Für Routineoperationen werden kostengünstigere Modelle wie Sonnet den Großteil der täglichen Aufgaben übernehmen und die Ressourcenzuweisung optimieren. Diese intelligente Orchestrierung maximiert sowohl die Ausgabequalität als auch die Kosteneffizienz.

Betrachten Sie die Implikationen einer solch hohen Informationsdichte. Die Tendenz von Fable 5, kleinere Anfragen als tiefgehende Erkundungen zu behandeln, deutet auf eine interne Verarbeitungskomplexität hin, die unser derzeitiges Verständnis übersteigt. Spekulativ könnten diese fortschrittlichen KIs, während sie sich weiterentwickeln, ihre eigenen hocheffizienten, dichten Sprachen entwickeln, die die interne Kommunikation und Wissensrepräsentation auf eine für die menschliche Kognition unverständliche Weise optimieren. Dies könnte unvorhergesehene kognitive Sprünge ermöglichen.

Häufig gestellte Fragen

Was sind Anthropic's Fable 5 und Mythos Modelle?

Fable 5 ist Anthropic's neues, hochmodernes KI-Modell, das für den allgemeinen Gebrauch verfügbar ist. Mythos ist dasselbe zugrunde liegende Modell, jedoch ohne Sicherheitsvorkehrungen, das speziell für Sicherheitsforscher veröffentlicht wurde, um Schwachstellen zu finden und zu beheben.

Warum wurde das Mythos-Modell als 'zu gefährlich' für die Veröffentlichung angesehen?

Das ursprüngliche Modell der Mythos-Klasse wurde aufgrund von Bedenken hinsichtlich seines Missbrauchspotenzials ohne entsprechende Sicherheitskontrollen zurückgehalten. Die jetzt veröffentlichte Version ist für ein kontrolliertes Publikum von Sicherheitsexperten gedacht, um Softwaresysteme proaktiv zu härten.

Wie schneidet Fable 5 im Vergleich zu Modellen wie GPT-5.5 ab?

Bei wichtigen Benchmarks wie SweBench Pro für agentisches Coding erzielt Fable 5 deutlich höhere Werte (80%) als die gemeldeten Werte für GPT-5.5 (58%). Es zeigt auch einen erheblichen Vorsprung in anderen Bereichen wie komplexer Wissensarbeit und Argumentation.

Was ist einzigartig an der Verwendung von Fable 5?

Benutzer berichten, dass sich Fable 5 wie eine andere Klasse von KI anfühlt. Es geht Aufgaben mit immenser Tiefe an, behandelt einfache Anfragen als große Erkundungen und erzeugt eine hoch 'informationsdichte' Ausgabe, die komplexe Ideen mit weniger Worten vermittelt.

Found this useful? Share it.

One short daily email of tools worth shipping. No drip funnel.

one email a day · unsubscribe in two clicks · no third-party tracking

🚀Mehr entdecken

Bleiben Sie der KI voraus

Entdecken Sie die besten KI-Tools, Agenten und MCP-Server, kuratiert von Stork.AI.

P.S. Etwas Brauchbares gebaut? Bei Stork listen