Создайте систему управления агентом ИИ для больших кодовых баз | Руководство Anthropic

💡

Кратко / Главное

Anthropic выяснила, что инструменты, окружающие ИИ, имеют большее значение, чем сама модель, для кодирования в больших кодовых базах. Это руководство по созданию такой 'обвязки' и повышению реальной эффективности вашего ИИ-агента.

Обвязка — это новый хайп

Стандартные ИИ-агенты для кодирования постоянно терпят неудачу при столкновении с разрастающейся сложностью реальных кодовых баз. Эти системы, часто рекламируемые за их мастерство, резко дают сбой в средах с десятками или сотнями тысяч строк кода, испытывая недостаток в критически важной ситуационной осведомленности, необходимой для навигации по сложным архитектурам и устаревшим системам. Стратегии, эффективные в простых проектах, быстро оказываются неадекватными, выявляя фундаментальное ограничение в их автономной работе.

Anthropic недавно провела MasterClass по этой конкретной проблеме, выдвинув мощный центральный тезис: обвязка, окружающая ИИ-агента, более критична, чем необработанная мощь базовой большой языковой модели (LLM) как таковой. Эта экосистема инструментов, контекста и конфигурации — а не только результаты бенчмарков — определяет успех агента. Речь идет о создании правильной среды для направления агента, позволяющей ему эффективно работать в монорепозиториях с миллионами строк кода или распределенных системах.

Эта незаменимая обвязка теперь составляет новый, существенный третий компонент современной кодовой базы, метко названный AI Layer. Он существует наряду с традиционным кодом приложения и связанными с ним тестами, служа явным руководством для агентных систем. AI Layer включает в себя такие элементы, как глобальные правила, path-scoped skills, self-improving hooks и сервер Model Context Protocol (MCP), все они разработаны для обеспечения структурированного контекста, необходимого агенту для надежного выполнения сложных задач.

Архитектура вашего AI Layer

Проектирование эффективного AI layer начинается с Бережливой и многоуровневой системы правил, воплощенной в файлах `claude.md`. Файлы `claude.md` корневого уровня устанавливают глобальный контекст — основное назначение кодовой базы и общие соглашения. Файлы `claude.md` подкаталогов затем вводят постепенно раскрываемые, ограниченные по области действия правила, предоставляя агентам релевантные, локализованные соглашения для конкретных модулей или функций, не перегружая их ненужными деталями. Эта иерархическая структура гарантирует, что контекст всегда точен и управляем.

Помимо статических правил, динамические возможности имеют решающее значение. Path-Scoped Skills оснащают агентов специализированными инструментами, позволяя целенаправленные действия в определенных областях кодовой базы. Дополняет это Model Context Protocol (MCP), система для эффективного поиска символов. MCP позволяет агентам быстро находить определения, использования и взаимосвязи по всей обширной кодовой базе, отражая способность инженера ориентироваться в сложных проектах с помощью IDE, значительно повышая эффективность навигации.

Сравните это интеллектуальное наслаивание с распространенным антипаттерном: одним, массивным файлом промпта. Этот подход пытается сбросить весь возможный контекст в один документ, часто длиной в тысячи строк. Такие монолитные промпты перегружают даже самые способные LLM, ухудшая производительность, увеличивая затраты на инференс и делая агентов менее эффективными, чем инженер-человек. MasterClass от Anthropic подчеркивает, что курируемый, многоуровневый контекст, а не чистый объем, определяет успех агента в больших кодовых базах.

От статических правил к живой системе

Помимо статических файлов `claude.md`, эффективный AI layer требует динамичной, самосовершенствующейся архитектуры. Внедрите self-improving hooks, чтобы преобразовать статические руководства в живую систему. В частности, `stop hooks` могут анализировать сессию агента, выявлять неэффективность или распространенные ошибки и автоматически предлагать обновления для файлов правил проекта, уточняя будущее поведение агента и обеспечивая непрерывную оптимизацию.

В дополнение к этому, `start hooks` предоставляют критически важный динамический контекст. Прежде чем агент приступит к задаче, `start hook` может получить соответствующую документацию из Confluence на основе команды разработчика или конкретного редактируемого модуля. Это предварительно заполняет контекст агента, гарантируя, что он начинает работу с самой актуальной информацией в реальном времени. Подробные сведения Anthropic о создании этих сложных систем для агентов изложены в их руководстве How Claude Code works in large codebases.

Для сложных задач subagents предлагают мощную стратегию для сфокусированного выполнения. Вместо того чтобы перегружать основного агента кодирования широким исследованием или специализированным анализом, subagents могут быть направлены для решения конкретных, сложных проблем. Эти специализированные сущности могут: - Глубоко анализировать архитектуру устаревшего кода. - Изучать новую документацию API. - Генерировать комплексные наборы модульных тестов. Такая декомпозиция позволяет основному агенту сосредоточиться на своей основной реализации, значительно повышая эффективность и точность в больших, реальных кодовых базах. Результатом является более надежный, адаптируемый и производительный помощник по кодированию на базе ИИ, постоянно обучающийся и оптимизирующий свой подход в различных проектах.

Перестаньте просто давать подсказки, начните проектировать

Перестаньте подходить к кодированию с ИИ с помощью «шепота подсказок» или «кодирования по наитию». Эпоха простого ожидания лучшего от LLM закончилась. Вместо этого примите целенаправленный подход harness engineering, создавая надежные системы для предсказуемых, масштабируемых результатов. Недавний MasterClass от Anthropic подтвердил критически важное понимание: система вокруг модели, контекст ИИ и инструментарий в вашем репозитории имеют большее значение, чем сама модель.

Этот инженерный подход открывает значительные преимущества. Проекты получают большую автономию ИИ и достигают более надежной генерации кода, выходя за рамки тривиальных задач. Такой структурированный AI Layer позволяет агентам эффективно ориентироваться и вносить вклад в сложные среды, включая многомиллионные `monorepos`, устаревшие системы десятилетней давности и распределенные архитектуры, охватывающие десятки репозиториев. Внутри компании инженеры Anthropic, использующие Claude Code, поставляют в три раза больше кода и объединяют на 31% больше `pull requests`, демонстрируя ощутимый прирост производительности.

Начните свой путь в агентную инженерию сегодня. Создайте простой файл `claude.md` в корне вашего репозитория, установив начальный глобальный контекст. Постепенно расширяйте эту основу, добавляя многоуровневые правила в подкаталоги и внедряя самосовершенствующиеся `stop hooks`. Этот итеративный процесс постепенно формирует индивидуальный AI Layer вашего проекта, преобразуя ваш рабочий процесс разработки.

Часто задаваемые вопросы

Что такое система для ИИ-агента?

Система для ИИ-агента — это совокупность контекста, инструментов и конфигураций, окружающих модель ИИ, чтобы помочь ей эффективно работать в определенной среде, например, в большой кодовой базе. Это экосистема, построенная вокруг модели.

Почему система важнее самой модели?

В сложных кодовых базах чистый интеллект модели недостаточен. Система предоставляет критически важный, ограниченный контекст, определяет правила и предлагает специализированные инструменты, которые направляют модель, не давая ей запутаться или совершить критические ошибки.

Что такое агентный поиск?

Это то, как Claude Code исследует репозиторий. Вместо использования предварительно созданного индекса (например, RAG), он использует инструменты командной строки, такие как `grep`, для навигации по файловой системе и понимания структуры кода, подобно тому, как это делает разработчик-человек.

Как работают самосовершенствующиеся `hooks`?

Это скрипты, которые запускаются в начале или конце сессии ИИ. Например, «stop hook» может анализировать действия сессии и предлагать улучшения для файлов правил проекта (claude.md), делая систему умнее со временем.

𝕏 in ↑↗

One weekly email of tools worth shipping. No drip funnel.

one email per week · unsubscribe in two clicks · no third-party tracking

Часто задаваемые вопросы

Что такое система для ИИ-агента?

Почему система важнее самой модели?

Что такое агентный поиск?

Это то, как Claude Code исследует репозиторий. Вместо использования предварительно созданного индекса , он использует инструменты командной строки, такие как `grep`, для навигации по файловой системе и понимания структуры кода, подобно тому, как это делает разработчик-человек.

Как работают самосовершенствующиеся `hooks`?

Это скрипты, которые запускаются в начале или конце сессии ИИ. Например, «stop hook» может анализировать действия сессии и предлагать улучшения для файлов правил проекта , делая систему умнее со временем.

Вашему AI-кодеру нужна обвязка

Кратко / Главное

Обвязка — это новый хайп

Архитектура вашего AI Layer

От статических правил к живой системе

Перестаньте просто давать подсказки, начните проектировать

Часто задаваемые вопросы

Что такое система для ИИ-агента?

Почему система важнее самой модели?

Что такое агентный поиск?

Как работают самосовершенствующиеся `hooks`?

One weekly email of tools worth shipping. No drip funnel.

Часто задаваемые вопросы

Читать далее

ИИ только что отобразил всю мою кодовую базу

Режим 'Бога' ИИ от Google разблокирован

Темный секрет AI: Вы — «избыточная биомасса»

Будьте в курсе трендов ИИ