Zusammenfassung / Kernpunkte
Das Harness ist der neue Hype
Standard AI coding agents versagen konsequent, wenn sie mit der ausufernden Komplexität realer Codebasen konfrontiert werden. Diese Systeme, oft für ihre Leistungsfähigkeit gepriesen, versagen dramatisch in Umgebungen mit Zehntausenden oder Hunderttausenden von Codezeilen, da ihnen das entscheidende situational awareness fehlt, das zur Navigation durch komplexe Architekturen und Legacy-Systeme erforderlich ist. Strategien, die in einfachen Projekten effektiv sind, erweisen sich schnell als unzureichend und legen eine grundlegende Einschränkung in ihrem autonomen Betrieb offen.
Anthropic hat kürzlich eine MasterClass zu genau dieser Herausforderung gehalten und eine starke zentrale These aufgestellt: Das Harness, das einen AI agent umgibt, ist kritischer als die Rohleistung des zugrunde liegenden Large Language Models (LLM) selbst. Dieses Ökosystem aus Tools, Kontext und Konfiguration – nicht nur Benchmark-Ergebnisse – bestimmt den Erfolg eines Agents. Es geht darum, die richtige Umgebung zu kuratieren, um den Agenten zu leiten und ihm zu ermöglichen, effektiv über Monorepos mit Millionen von Zeilen oder verteilte Systeme hinweg zu agieren.
Dieses unverzichtbare Harness bildet nun eine neue, essentielle dritte Komponente einer modernen Codebasis, passenderweise als AI Layer bezeichnet. Es existiert neben dem traditionellen Anwendungscode und den zugehörigen Tests und dient als explizite Anleitung für agentische Systeme. Der AI Layer umfasst Elemente wie globale Regeln, path-scoped skills, self-improving hooks und einen Model Context Protocol (MCP) Server, die alle darauf ausgelegt sind, den strukturierten Kontext bereitzustellen, den ein Agent benötigt, um komplexe Aufgaben zuverlässig auszuführen.
Architektur Ihres AI Layers
Die Architektur eines effektiven AI Layers beginnt mit einem Lean & Layered Regelsystem, verkörpert durch `claude.md`-Dateien. Root-Level `claude.md`-Dateien etablieren globalen Kontext – den Kernzweck der Codebasis und übergreifende Konventionen. Unterverzeichnis `claude.md`-Dateien führen dann schrittweise offengelegte, bereichsspezifische Regeln ein, die Agenten relevante, lokalisierte Konventionen für bestimmte Module oder Funktionen bereitstellen, ohne sie mit unnötigen Details zu überfordern. Diese hierarchische Struktur stellt sicher, dass der Kontext immer präzise und handhabbar ist.
Jenseits statischer Regeln sind dynamische Fähigkeiten entscheidend. Path-Scoped Skills statten Agenten mit spezialisierten Tools aus, die gezielte Aktionen innerhalb spezifischer Codebasisbereiche ermöglichen. Ergänzt wird dies durch das Model Context Protocol (MCP), ein System für die effiziente Symbolsuche. Das MCP ermöglicht es Agenten, Definitionen, Verwendungen und Beziehungen in einer riesigen Codebasis schnell zu lokalisieren, was die Fähigkeit eines Ingenieurs widerspiegelt, komplexe Projekte mit einer IDE zu navigieren, und die Navigationseffizienz erheblich steigert.
Man kontrastiere diese intelligente Schichtung mit einem gängigen Anti-Pattern: einer einzelnen, massiven Prompt-Datei. Dieser Ansatz versucht, den gesamten möglichen Kontext in ein einziges Dokument zu kippen, oft Tausende von Zeilen lang. Solche monolithischen Prompts überfordern selbst die fähigsten LLMs, verschlechtern die Leistung, erhöhen die Inferenzkosten und machen Agenten weniger effektiv als einen menschlichen Ingenieur. Anthropic's MasterClass betont, dass kuratierter, geschichteter Kontext, nicht bloßes Volumen, den Erfolg eines Agenten in großen Codebasen bestimmt.
Von statischen Regeln zu einem lebendigen System
Jenseits statischer `claude.md`-Dateien erfordert ein effektiver AI Layer eine dynamische, sich selbst verbessernde Architektur. Implementieren Sie self-improving hooks, um statische Richtlinien in ein lebendiges System zu verwandeln. Insbesondere können `stop hooks` die Sitzung eines Agenten überprüfen, Ineffizienzen oder häufige Fehler identifizieren und automatisch Aktualisierungen der Regeldateien des Projekts vorschlagen, wodurch das zukünftige Verhalten des Agenten verfeinert und eine kontinuierliche Optimierung sichergestellt wird.
Ergänzend dazu liefern `start hooks` entscheidenden dynamischen Kontext. Bevor ein Agent eine Aufgabe beginnt, kann ein `start hook` relevante Dokumentation aus Confluence abrufen, basierend auf dem Team des Entwicklers oder dem spezifischen Modul, das bearbeitet wird. Dies füllt den Kontext des Agenten vorab auf und stellt sicher, dass er mit den relevantesten Echtzeitinformationen beginnt. Anthropic's Erkenntnisse zum Aufbau dieser hochentwickelten Agenten-Harnesses sind in ihrem Leitfaden How Claude Code works in large codebases detailliert beschrieben.
Für komplexe Aufgaben bieten Subagenten eine leistungsstarke Strategie für eine fokussierte Ausführung. Anstatt den primären Codierungsagenten mit breiter Exploration oder spezialisierter Analyse zu überfordern, können Subagenten entsandt werden, um spezifische, komplexe Probleme zu bearbeiten. Diese spezialisierten Entitäten könnten: - Legacy-Code-Architektur tiefgehend analysieren. - Neue API-Dokumentation erkunden. - Umfassende Unit-Test-Suiten generieren. Diese Kompartimentierung ermöglicht es dem Hauptagenten, sich auf seine Kernimplementierung zu konzentrieren, was die Effizienz und Genauigkeit in großen, realen Codebasen erheblich steigert. Das Ergebnis ist ein robusterer, anpassungsfähigerer und leistungsfähigerer KI-Codierungsassistent, der seinen Ansatz über verschiedene Projekte hinweg kontinuierlich lernt und optimiert.
Hören Sie auf zu prompten, fangen Sie an zu entwickeln.
Hören Sie auf, KI-Codierung mit „Prompt-Flüstern“ oder „Vibe-Coding“ anzugehen. Die Ära, in der man einfach auf das Beste von einem LLM hoffte, ist vorbei. Nehmen Sie stattdessen eine bewusste Denkweise des Harness-Engineerings an und bauen Sie robuste Systeme für vorhersehbare, skalierbare Ergebnisse. Anthropic's jüngste MasterClass bestätigte die entscheidende Erkenntnis: Das Harness um das Modell herum, der KI-Kontext und die Tools in Ihrem Repo, sind wichtiger als das Modell selbst.
Dieser Engineering-Ansatz erschließt erhebliche Vorteile. Projekte gewinnen größere KI-Autonomie und erzielen eine zuverlässigere Codegenerierung, die über triviale Aufgaben hinausgeht. Eine solche strukturierte KI-Schicht befähigt Agenten, komplexe Umgebungen effektiv zu navigieren und dazu beizutragen, einschließlich Monorepos mit Millionen von Zeilen, jahrzehntealten Legacy-Systemen und verteilten Architekturen, die Dutzende von Repositories umfassen. Intern liefern Anthropic-Ingenieure, die Claude Code verwenden, dreimal mehr Code und mergen 31 % mehr Pull Requests, was greifbare Produktivitätssteigerungen demonstriert.
Beginnen Sie noch heute Ihre Reise ins Agentic Engineering. Erstellen Sie eine einfache `claude.md`-Datei im Root-Verzeichnis Ihres Repositorys, um einen anfänglichen globalen Kontext herzustellen. Erweitern Sie dieses Fundament schrittweise, indem Sie geschichtete Regeln in Unterverzeichnissen hinzufügen und sich selbst verbessernde Stop-Hooks implementieren. Dieser iterative Prozess baut nach und nach die maßgeschneiderte KI-Schicht Ihres Projekts auf und transformiert Ihren Entwicklungs-Workflow.
Häufig gestellte Fragen
Was ist ein KI-Agenten-Harness?
Ein KI-Agenten-Harness ist die Sammlung von Kontext, Tools und Konfigurationen, die ein KI-Modell umgeben, um ihm zu helfen, in einer spezifischen Umgebung, wie einer großen Codebasis, effektiv zu arbeiten. Es ist das Ökosystem, das um das Modell herum aufgebaut ist.
Warum ist ein Harness wichtiger als das Modell?
In komplexen Codebasen ist die reine Modellintelligenz unzureichend. Das Harness liefert entscheidenden, eingegrenzten Kontext, definiert Regeln und bietet spezialisierte Tools, die das Modell leiten und verhindern, dass es sich verirrt oder kritische Fehler macht.
Was ist Agentic Search?
Es ist die Art und Weise, wie Claude Code ein Repository erkundet. Anstatt einen vorgefertigten Index (wie RAG) zu verwenden, nutzt es Kommandozeilen-Tools wie `grep`, um das Dateisystem zu navigieren und die Struktur des Codes zu verstehen, ähnlich wie es ein menschlicher Entwickler tun würde.
Wie funktionieren sich selbst verbessernde Hooks?
Es sind Skripte, die am Anfang oder Ende einer AI-Sitzung ausgeführt werden. Ein 'stop hook' kann zum Beispiel die Aktionen der Sitzung analysieren und Verbesserungen für die Regeldateien des Projekts (claude.md) vorschlagen, wodurch das System mit der Zeit intelligenter wird.