Skip to content

Google: Hört auf, euch auf KI-Modelle zu versteifen

Googles neuestes KI-Playbook enthüllt eine klare Wahrheit: Das von Ihnen verwendete Modell macht nur 10 % Ihres Erfolgs aus. Die anderen 90 % sind das von Ihnen gebaute 'Harness', und es ist die Zukunft der Software.

Nora Vance
Hero image for: Google: Hört auf, euch auf KI-Modelle zu versteifen

Zusammenfassung / Kernpunkte

  • Googles neuestes KI-Playbook enthüllt eine klare Wahrheit: Das von Ihnen verwendete Modell macht nur 10 % Ihres Erfolgs aus.
  • Die anderen 90 % sind das von Ihnen gebaute 'Harness', und es ist die Zukunft der Software.

Von Vibe Coding zu verifizierten Systemen

Googles jüngste 50-seitige MasterClass zum Thema KI-Programmierung beleuchtet eine entscheidende Verschiebung in der Softwareentwicklung. Sie besagt, dass das KI-Modell selbst nur etwa 10 % der Ergebnisse ausmacht; die restlichen 90 % liegen im „Harness“ – dem Kontext, den Tools und der Verifizierung, die darum herum aufgebaut sind. Diese Erkenntnis unterstreicht, dass KI-Programmierung ein Spektrum ist, kein binärer Schalter.

An einem Ende sitzt Vibe Coding: schnelles, geringfügiges Prompting mit minimaler Planung, validiert durch eine schnelle „scheint es zu funktionieren?“-Überprüfung. Dieser Ansatz eignet sich hervorragend für Machbarkeitsstudien oder erste Erkundungen und ermöglicht eine schnelle Iteration. Seine inhärente Unzuverlässigkeit und mangelnde Verifizierung machen es jedoch aufgrund erheblicher Risiken ungeeignet für skalierbare, produktionsreife Software.

Entlang des Spektrums beinhaltet Structured AI-Assisted Coding detailliertere Prompts und Stichprobenprüfungen. Der Höhepunkt ist Agentic Engineering, das ein entwickeltes System aus Ressourcen, Workflows, Spezifikationen, automatisierten Evaluierungen und Continuous Integration (CI)-Gates einsetzt. Diese Methodik priorisiert Wiederholbarkeit und Zuverlässigkeit und gewährleistet robuste, verifizierbare Ergebnisse für komplexe Systeme.

Diese Beschleunigung der Implementierung, von Wochen auf wenige Minuten oder Stunden, gestaltet den KI-gesteuerten Software Development Life Cycle (SDLC) neu. Die primären Engpässe liegen nun an den Enden: der anfänglichen Anforderungserfassung und der abschließenden Validierung. Während KI die Codegenerierung drastisch beschleunigt, werden die von Menschen gesteuerte Spezifikationsqualität und die rigorose Verifizierung zu den neuen kritischen Einschränkungen für den Geschäftserfolg.

Die 90%-Regel: Warum das 'Harness' alles ist

Sich auf das Large Language Model (LLM) selbst zu konzentrieren, verfehlt das Gesamtbild. Googles jüngstes 50-seitiges Playbook, hervorgehoben in Cole Medins MasterClass, enthüllt eine kritische Formel zum Aufbau zuverlässiger KI-Agenten: Agent = Modell + Harness. Das gewählte LLM macht etwa 10 % der Leistung eines Agenten aus.

Neunzig Prozent der Effektivität eines Agenten stammen von seinem Harness. Das ist nicht abstrakt; es ist die sorgfältig entwickelte Schicht, die Sie um das Modell herum aufbauen. Es definiert: - Kontext: Relevante Informationen und Einschränkungen. - Tools: Externe Funktionen, die der Agent aufrufen kann. - Guardrails: Sicherheitsmechanismen und Verhaltensgrenzen. - Verifizierungs-Workflows: Automatisierte Tests und Evaluierungen, die eine Selbstkorrektur ermöglichen.

Dieses Konzept repräsentiert eine branchenweite Konvergenz in den Best Practices des Agentic Engineering. Unternehmen wie Anthropic formulieren ähnliche Architekturen und betonen das umgebende System gegenüber dem grundlegenden Modell. Das Harness ist die Schicht, die eine Organisation wirklich kontrolliert und iteriert.

Die Agentenleistung hängt grundlegend vom Harness ab. Sich auf marginale LLM-Verbesserungen zu versteifen und dabei robustes Kontext-Engineering, Tool-Integration und rigorose Verifizierung zu vernachlässigen, ist eine Fehlleitung. Das Harness ist der Ort, an dem echte Zuverlässigkeit und wiederholbare Ergebnisse geschmiedet werden.

Sie sind kein Dirigent, Sie sind ein Orchestrator

Die Rolle des Entwicklers verschiebt sich grundlegend, weg von einem manuellen Dirigenten von Code hin zu einem Orchestrator intelligenter, autonomer Systeme. Es geht nicht darum, jede Zeile der Anwendungslogik zu schreiben; es geht darum, die gesamte KI-gesteuerte „Fabrik“ zu entwerfen, die Code unabhängig generiert, testet und verfeinert. Sie programmieren nicht mehr nur; Sie bauen die Umgebung und die Betriebslogik für KI-Agenten.

Die Hauptaufgabe eines Orchestrators besteht darin, das harness selbst zu entwickeln und das robuste Gerüst um das LLM herum zu schaffen, das 90 % der Leistung eines Agenten ausmacht. Dies beinhaltet die sorgfältige Definition formaler Spezifikationen, die Implementierung umfassender automatisierter Tests und die Einrichtung strenger Continuous Integration (CI)-Gates. Diese programmatischen Leitplanken ermöglichen es dem Agenten, sich rigoros selbst zu korrigieren, seine eigene Ausgabe zu validieren und aus seinen Fehlern zu lernen, ohne ständiges menschliches Eingreifen.

Dieser tiefgreifende Wandel wirkt sich dramatisch auf den Software Development Life Cycle (SDLC) aus. Ein gut orchestriertes System ermöglicht es dem AI agent, unabhängig zu iterieren und die Codegenerierung und -verfeinerung von Wochen auf wenige Minuten oder Stunden zu beschleunigen. Dieser proaktive Ansatz mindert den traditionellen Engpass der menschlichen Validierung erheblich und befreit Ingenieure, sich auf die Definition übergeordneter Probleme und die Systemarchitektur zu konzentrieren, anstatt auf manuelles Debugging. Weitere Einblicke finden Sie im grundlegenden Whitepaper von Google, The New SDLC With Vibe Coding - Kaggle.

Enjoying this? Get one like it in your inbox each morning.

one email a day · unsubscribe in two clicks · no third-party tracking

Die unschlagbare Wirtschaftlichkeit von Agentic AI

Der Aufbau eines effektiven AI system erfordert eine grundlegende wirtschaftliche Neuausrichtung. Betrachten Sie die Vorabinvestition in ein robustes harness als Capital Expenditure (CapEx). Dies umfasst die Ingenieurzeit für die Gestaltung eines umfassenden Kontexts, die Integration spezialisierter Tools, die Definition von Leitplanken und die Implementierung einer rigorosen automatisierten Verifizierung. Dies steht im Gegensatz zu den laufenden, variablen Kosten für den Roh-Token-Verbrauch, das kontinuierliche manuelle Debugging und die iterative Nacharbeit, die alle unter Operational Expenditure (OpEx) fallen.

Ein höheres CapEx im harness reduziert das langfristige OpEx dramatisch. Durch die Architektur eines zuverlässigen, wiederholbaren agentic system senken Organisationen zukünftige Token-Ausgaben, oft um einen erheblichen Betrag, da Agenten selbstständig iterieren. Noch wichtiger ist, dass sie die erheblichen Arbeitskosten minimieren, die mit kontinuierlichem menschlichem Eingreifen, der Fehlerbehebung bei Ad-hoc-Prompts und der Validierung unzuverlässiger Ausgaben verbunden sind. Diese strategische Investition in ein umfassendes harness verhindert den endlosen Zyklus des „vibe coding“, der schlecht skaliert und Ingenieurressourcen aufzehrt.

Für jedes ernsthafte Softwareprojekt erweist sich die wirtschaftliche Logik als unbestreitbar. Die Erkenntnisse von Google unterstreichen, dass der Aufbau eines systematischen, agentic engineering-Prozesses eine überlegene Kosteneffizienz und Skalierbarkeit liefert im Vergleich zur Abhängigkeit von manueller Prompting. Dies ist nicht nur eine technische Präferenz; es ist ein strategisches Gebot für eine nachhaltige, qualitativ hochwertige AI-driven development, die sicherstellt, dass die Anfangsinvestition über den Lebenszyklus des Systems hinweg kumulative Erträge abwirft.

Häufig gestellte Fragen

Was ist der Unterschied zwischen vibe coding und agentic engineering?

Vibe coding verwendet ungezwungene Prompts mit minimaler Planung, geeignet für Wegwerfcode oder MVPs. Agentic engineering ist ein systematischer Ansatz, der entwickelte Spezifikationen, Tools und automatisierte Verifizierung verwendet, um zuverlässigen, produktionsreifen Code zu erstellen.

Was ist ein KI-'harness'?

Das harness ist das gesamte System, das Sie um ein AI model herum aufbauen. Es umfasst den spezifischen Kontext, Tools, Leitplanken, Verifizierungs-Workflows und die Orchestrierung, die das Modell anleiten, ein gewünschtes Ergebnis zu erzielen.

Warum sagt Google, dass das AI model nur 10 % des Systems ausmacht?

Während das Modell die Kernlogik liefert, wird seine Leistung überwiegend von der Qualität des 'harness' (den anderen 90 %) bestimmt. Ein gut entwickeltes harness kann ein gutes Modell außergewöhnlich gut performen lassen, während ein schlechtes harness selbst das beste Modell einschränken wird.

Wie verändert agentic engineering die Rolle eines Softwareentwicklers?

Es verschiebt die Rolle des Entwicklers von einem 'Dirigenten', der jede Codezeile schreibt, zu einem 'Orchestrator', der das automatisierte System (das harness) entwirft, baut und wartet, das einen AI agent befähigt, den Code zu schreiben.

Found this useful? Share it.

One short daily email of tools worth shipping. No drip funnel.

one email a day · unsubscribe in two clicks · no third-party tracking

🚀Mehr entdecken

Bleiben Sie der KI voraus

Entdecken Sie die besten KI-Tools, Agenten und MCP-Server, kuratiert von Stork.AI.

P.S. Etwas Brauchbares gebaut? Bei Stork listen