Skip to content

Diese AI tötet Frontier Models

Anthropic's Fable 5 ist verschwunden, aber eine neue 'compound' AI übertrifft sie bereits zum halben Preis. Hier erfahren Sie, wie OpenRouter Fusion funktioniert und warum es das Spiel für hochrangige AI-Aufgaben verändert.

Theo Brandt
Hero image for: Diese AI tötet Frontier Models

Zusammenfassung / Kernpunkte

  • Anthropic's Fable 5 ist verschwunden, aber eine neue 'compound' AI übertrifft sie bereits zum halben Preis.
  • Hier erfahren Sie, wie OpenRouter Fusion funktioniert und warum es das Spiel für hochrangige AI-Aufgaben verändert.

Der König ist tot, lang lebe Fusion

Anthropic's Fable 5, eine kritische Intelligenzressource für fortgeschrittene Benutzer, verschwand am 13. Juni 2026. Eine Exportkontrollrichtlinie der US-Regierung, die nationale Sicherheitsbedenken wegen eines angeblichen „Jailbreaks“ anführte, erzwang ihre weltweite Deaktivierung. Diese plötzliche Lücke ließ Power-User nach einem hochleistungsfähigen LLM-Ersatz suchen.

Hier kommt OpenRouter's Fusion API, gleichzeitig um den 13. Juni 2026 eingeführt. Dies ist nicht nur ein weiteres Modell; es ist ein Paradigmenwechsel, ein „intelligentestes compound model“, das als direkte Antwort auf die Intelligenzlücke konzipiert wurde. Fusion gibt die Abhängigkeit von Einzelmodellen auf und verfolgt einen kollektiven Ansatz.

Fusion funktioniert, indem es eine Anfrage an ein Panel von 3-8 spezialisierten AI-Modellen verteilt, jedes mit web search und bash tools. Ein dediziertes judge model, oft Opus 4.8, analysiert dann akribisch jede Antwort. Es identifiziert: - Konsenspunkte - Widersprüche - einzigartige Erkenntnisse - blinde Flecken Diese strukturierte Synthese erzeugt eine weitaus überlegene Endausgabe.

Dies ist nicht nur eine Übergangslösung; es ist eine strategische Evolution. Fusion erreicht durchweg Intelligenz auf Fable-Niveau, oft zum halben Preis. Benchmarks vom 12. Juni 2026 zeigen, dass es GPT-5.5 und Claude Opus 4.8 bei komplexen Forschungsaufgaben übertrifft. Selbst ein budget panel (Gemini 3 Flash, Kimi K2.6, DeepSeek Version 4 Pro) erreicht 64.7% Qualität, innerhalb von 1% des Höchststands von Fable 5.

Wie Fusion ein 'Super-Brain' schmiedet

Die 'Super-Brain'-Fähigkeit von Fusion basiert auf einer verfeinerten, mehrstufigen Verarbeitungspipeline. Benutzeranfragen treffen nicht auf einen einzigen Endpunkt; sie werden parallel an ein panel of models verteilt, typischerweise 3 bis 5 verschiedene LLMs (konfigurierbar bis zu 8), jedes vollständig ausgestattet mit web search und bash tools. Diese verteilte Ausführung erzeugt ein breites Spektrum an ersten Antworten, wodurch die inhärenten Verzerrungen und Wissenslücken eines einzelnen Modells umgangen werden.

Als Nächstes tritt ein designiertes 'judge' model, oft Claude Opus 4.8, in den Mittelpunkt. Dies ist kein einfacher Mittelwertmechanismus. Stattdessen unternimmt der Judge eine strukturierte, analytische Tiefenanalyse jeder Antwort des Panels. Es agiert als Orchestrator, indem es die Ausgaben systematisch vergleicht und gegenüberstellt.

Die kritische Rolle des Judges besteht darin, präzise analytische Ergebnisse zu extrahieren: - Identifizierung von starken Konsenspunkten im gesamten Panel. - Aufdeckung von Widersprüchen und subtilen Meinungsverschiedenheiten zwischen Modellen. - Hervorhebung einzigartiger Erkenntnisse oder Perspektiven, die von einzelnen LLMs angeboten werden. - Aufdeckung blinder Flecken oder Bereiche unvollständiger Abdeckung, die ein einzelnes Modell unweigerlich übersehen würde. Diese rigorose, vergleichende Analyse liefert eine endgültige, synthetisierte Antwort, die Intelligenzniveaus demonstriert, die Claude Fable 5 durchweg übertreffen, selbst wenn budget model panels eine Genauigkeit von 64.7% gegenüber 65.3% von Fable 5 erreichen.

Erhalten Sie Fable-Intelligenz mit einem Flash Budget

Verzichten Sie auf das Premium für Frontier Models. Fusions budget panel liefert Intelligenz auf Fable 5-Niveau mit einem Flash Budget. Mit einer strategischen Kombination aus Gemini 3 Flash, Kimi K2.6 und DeepSeek Version 4 Pro erreicht dieses Panel 64.7% bei Benchmarks. Das sind nur 0.6 Prozentpunkte weniger als die 65.3% Leistung von Claude Fable 5. Die Daten sprechen für sich: Nahezu-Parität ist ohne die unerschwinglichen Kosten erreichbar.

Dieses Kosten-Intelligenz-Verhältnis ist transformativ. Der Einsatz dieses optimierten budget Fusion panels reduziert die Kosten um bis zu die Hälfte im Vergleich zu einer einzelnen Claude Fable 5-Anfrage. Denken Sie darüber nach: vergleichbare Ausgabe, deutlich geringere Ausgaben. Es ist der ultimative Hack für fortgeschrittene Benutzer, die hochpräzise AI benötigen, ohne das Portemonnaie zu leeren.

Die transparente Preisgestaltung von OpenRouter ist der Schlüssel zu dieser Optimierung. Sie müssen nicht raten. Die Plattform zeigt klar die kumulativen Kosten für jedes Modell in Ihrem ausgewählten Panel – einschließlich des Judge-Modells – sowie die minimale Gebühr von OpenRouter an. Keine willkürlichen Aufschläge, keine versteckten Kosten. Diese granulare Transparenz ermöglicht eine präzise Kosten-Nutzen-Analyse für jede Abfrage und befähigt Benutzer, ihre Modellauswahl und die Wirtschaftlichkeit ihres Workflows zu optimieren. Optimieren Sie auf Geschwindigkeit, Qualität oder Kosten – die Wahl liegt bei Ihnen. Tauchen Sie ein in die Mechanik unter OpenRouter Fusion.

Ihr Fusion Playbook (und seine Grenzen)

Benutzer greifen direkt über den OpenRouter playground unter openrouter.ai/fusion auf Fusion zu. Vorkonfigurierte Panels vereinfachen die Einrichtung und bieten eine 'Quality'-Option mit Top-Modellen wie Claude Opus, dem neuesten von OpenAI und Google Gemini. Für preisbewusste Benutzer bietet das 'Budget'-Panel eine kostengünstige Alternative.

Das Budget-Panel nutzt: - Google Gemini Flash latest - Moonshot Kimi AI - DeepSeek Version 3.2 Benutzer behalten die volle Kontrolle und können Modellkombinationen einfach anpassen, indem sie jedes verfügbare LLM hinzufügen oder austauschen, um Leistung oder Kosten innerhalb der Benutzeroberfläche zu optimieren.

Fusion ist keine Patentlösung für jeden Workflow. Seine aktuelle Architektur hat Schwierigkeiten mit langfristigen, agentenbasierten Aufgaben, bei denen Fable 5 hervorragend war. Denken Sie an komplexe, mehrstufige Codierungsprojekte oder autonome Agenten, die einen persistenten Zustand und Speicher erfordern; Fusions Parallelverarbeitung ist nicht für diese tiefe, sequentielle Problemlösung optimiert.

Für tiefgehende Forschung, die Überwindung von Ein-Modell-Bias und die Generierung robuster, vielschichtiger Antworten ist Fusion unbestreitbar überlegen. Benutzer, die jedoch anspruchsvolle, langfristig zustandsbewusste Agenten benötigen, müssen diese aktuellen Kompromisse gegenüber Fusions unbestreitbaren Stärken in der parallelisierten Intelligenz verstehen.

Häufig gestellte Fragen

Was ist OpenRouter Fusion?

OpenRouter Fusion ist ein zusammengesetztes KI-Modell, das eine einzelne Eingabeaufforderung parallel durch ein Panel mehrerer KI-Modelle verarbeitet. Anschließend verwendet es ein 'Judge'-Modell, um deren Antworten zu analysieren, einzigartige Erkenntnisse und blinde Flecken zu identifizieren und eine endgültige, überlegene Antwort zu synthetisieren.

Wie ist Fusion günstiger als ein einzelnes Top-Modell?

Die Kosteneffizienz von Fusion ergibt sich aus seinem 'Budget'-Panel, das mehrere schnelle, kostengünstige Modelle (wie Gemini Flash, Kimi) verwendet. Dieses Kollektiv kann eine Leistung nahe der Spitzenklasse für kumulative Kosten erzielen, die deutlich niedriger sind als eine einzelne Anfrage an ein Premium-Modell wie Claude Fable 5.

Ersetzt Fusion Modelle wie Fable 5 vollständig?

Für tiefgehende Forschung und komplexe Analysen liefert Fusion oft überlegenere, nuanciertere Ergebnisse. Es ist jedoch noch nicht für langfristige, agentenbasierte Aufgaben (wie erweiterte Codierungsprojekte) optimiert, bei denen das kontinuierliche Zustandsmanagement von Fable 5 hervorragend war.

Wie erstellt Fusion eine bessere Antwort als ein einzelnes Modell?

Fusion zeichnet sich durch die Nutzung der Modellvielfalt aus. Das Judge-Modell sucht gezielt nach Widersprüchen, teilweiser Abdeckung und einzigartigen Erkenntnissen, die kein anderes Modell erwähnt hat. Dieser Prozess deckt blinde Flecken auf, die in den Trainingsdaten jedes einzelnen Modells inhärent sind, und führt zu einem umfassenderen und robusteren Endergebnis.

Found this useful? Share it.

One short daily email of tools worth shipping. No drip funnel.

one email a day · unsubscribe in two clicks · no third-party tracking

🚀Mehr entdecken

Bleiben Sie der KI voraus

Entdecken Sie die besten KI-Tools, Agenten und MCP-Server, kuratiert von Stork.AI.

P.S. Etwas Brauchbares gebaut? Bei Stork listen