Искусственный интеллект Кодирующий Агент от Anthropic: Результаты 24-часового тестирования и будущее разработки

💡

Кратко / Главное

Мы протестировали нового AI-кодировщика от Anthropic на пределе возможностей в бесконечном 24-часовом марафоне программирования. Результаты открывают шокирующий взгляд на будущее разработки программного обеспечения.

Невозможный вызов: ИИ кодирует в течение 24 часов

Последний эксперимент по программированию компании Anthropic звучит как дерзкий вызов: подключите Claude к длительному агенту "хеви" (harness), нажмите "старт" и пусть он кодит 24 часа подряд. Ни кофе, ни перерывов, просто модель ИИ, работающая над обширной спецификацией программного обеспечения, пока вы спите. Цель: выяснить, может ли современная модель программирования вести себя меньше как автозаполнение и больше как неутомимая команда младших разработчиков.

Долгие задачи обычно выводят AI-агентов из строя скучными, предсказуемыми способами. Через несколько часов они переполняют свое контекстное окно, забывают прежние решения и либо создают неверную структуру, либо просто объявляют проект «завершенным», в то время как половина функций существует только в запросе. Традиционные инструменты сбрасывают состояние, теряют историю действий и заставляют людей следить за каждой крупной переработкой.

Открытая система Anthropic напрямую нацелена на эту неудачу. Вместо одной большой монологи с моделью, система координирует несколько агентов, распределяет работу по отдельным контекстным окнам и сохраняет состояние на диск. Она опирается на метод разработки через тестирование: сначала определяются сотни тестовых случаев и подробные спецификации приложения, а затем агенты взаимодействуют до тех пор, пока тесты не будут успешно пройдены.

Эксперимент Коула Медина выводит это средство на экстремальный уровень: 24-часовой марафон кодирования для создания работающего клона веб-приложения Клода, полностью с проектами, разговорами, артефактами и загрузкой файлов. Средство запускает инициализирующий агент, чтобы создать список функций с примерно 200+ детализированными тестовыми случаями, создает каркас проекта и настраивает Git с самого начала, так что каждое изменение имеет след. После этого агенты по кодированию работают часами, внедряя и исправляя функции на основе этих тестов.

Оформленный как зрелище на YouTube, это все еще предвещает серьезное будущее для агентного кодирования. Долговечные ИИ-агенты, которые тихо создают MVP, фоновые прототипы и полные оболочки пользовательского интерфейса за ночь, могут сократить недели подготовки до одного календарного дня. Этот 24-часовой трюк лишь демонстрирует, что происходит, когда вы перестаете рассматривать ИИ как чат-бот и начинаете воспринимать его как процесс.

Преодоление барьера выносливости ИИ

Выносливость, а не чистый IQ, тихо уничтожает большинство экспериментов с ИИ-кодированием. Долгосрочные агенты ускользают, переписывают собственные планы или просто «решают», что всё, закончено, как только контекстное окно заполняется полусырыми кодами и блуждающими инструкциями. Настройка Anthropic напрямую борется с этой проблемой: ремешок, который запоминает то, что агент не может.

Вместо того чтобы быть умным новым агентом, обвязка действует как координационный слой, оборачивающий обычные сессии Claude Code. Она отслеживает файлы, задачи и результаты тестов на протяжении нескольких часов выполнения, открывая новые разговоры, когда одна тема становится слишком громоздкой, чтобы оставаться связной. Каждая новая сессия начинается с сжатого обзора того, что имеет значение, а не с путаного транскрипта всего, что происходило ранее.

Массированные проекты превращаются в структурированные списки задач. Процесс начинается с простого текстового приложения спецификации или PRD, а затем раскладывается на список функций с сотнями мелких, тестируемых поведений. Запуск Коула Медина нацелился на 200+ тестовых случаев для клона в стиле Claude.ai, все они были сгенерированы заранее из той самой спецификации.

Эти функции не существуют как расплывчатые пункты. Они превращаются в JSON-объекты с полями, такими как описание, измененные файлы и конкретные критерии приемки. Затем инструмент может выбрать одну функцию за раз, предоставить соответствующий контекст Claude и попросить его реализовать или исправить именно этот участок системы.

Вместо одного мегачата на 24 часа система проводит десятки или сотни целенаправленных «спринтов». Каждый спринт – это короткая сессия агента с узкой целью: добавить компонент, подключить вызов API, выполнить тест. Когда окно контекста начинает перегружаться, система закрывает эту сессию и открывает новую, основанную на текущем состоянии репозитория и списке задач.

Состояние хранится на диске и в git, а не в памяти модели. Оборудование опирается на: - Сам код - JSON-файл списка функций - Растущий набор тестов и логи

Экстернализируя состояние, harness превращает нестабильного, забывчивого агента в нечто, что ведет себя больше похоже на детерминированный пайплайн сборки — такой, который может продолжать кодировать в течение 24 часов, не теряя суть.

Миссия: Создать клон Claude.ai с нуля.

Миссия Клода на 24 часа имела жестко сформулированное задание: воссоздать веб-приложение Claude.ai с нуля, без человеческого сопровождения и без возможности корректировок в процессе. Не игрушечный чат, а рабочий клон интерфейса, с которым миллионы пользователей взаимодействуют каждый день. Те же основные потоки, то же ощущение отработанности, работающий от начала до конца на коде, написанном полностью искусственным интеллектом, который никогда не спит.

Это означает воспроизведение всей полноты разговорной поверхности. Агенту было необходимо обеспечить постоянное управление разговорами с историей сообщений, боковыми потоками и правильной маршрутизацией к различным проектам. Также требовались настоящие загрузки файлов и вложения, а не заглушки — управление документами, кодом и PDF, которые поступают в модель и выходят из нее как ссылки в интерфейсе.

Кроме того, спецификация Кола Медіна требовала организацию на уровне проекта и чистый, современный интерфейс. Клон должен был включать: - Создание и переключение проектов - Группированные обсуждения по проектам - Поддержку «артефактов» или богатых выходных данных - Адаптивный макет в стиле Клода с легким UX, а не голым Bootstrap

Это именно тот вид задач, в которых долгосрочные агенты должны преуспевать: плотное сочетание фронтенд-работы с React или Next.js, задействования API на бэкенде и вспомогательного кода для поддержания согласованности состояния. Это заставляет Клода балансировать между маршрутизацией, авторизацией, сохранением данных и состоянием интерфейса, оставаясь при этом в соответствии с понятной спецификацией продукта. Ни один одиночный запрос не может этого охватить; только система, которая разбивает работу на части и многократно revisits контекст, имеет шансы.

Статья Anthropic «Эффективные конструкции для долгосрочных агентов» использует клон Claude.ai в качестве своего образца, дополненный сотнями тестов и многоагентским рабочим процессом. На бумаге конструкция координирует инициализаторы и кодирующие агенты, создает инфраструктуру и проходит более 200 тестов, пока приложение не будет успешным. На YouTube эта глянцевая схема превращается в жестокий вопрос: может ли та же настройка действительно создать клон Claude.ai за 24 часа без каких-либо правок со стороны человека, или же блог просто положился на ручную настройку и тщательно отобранные скриншоты?

Эти ставки делают это больше, чем просто новое достижение. Если хардварный комплект вместе с Claude действительно сможет без участия человека создать клон Claude.ai рядом с производством, это намекает на близкое будущее, в котором "начать новое приложение" означает написать спецификацию, запустить процесс и вернуться наутро к работающему каркасу SaaS.

Архитектор: Познакомьтесь с Инициатором Агентом

Инициализирующий агент выступает в роли главного архитектора проекта, но без всякой гордости и с безграничным терпением. Это первый процесс, который запускает система Anthropic, и всё, что произойдет дальше, зависит от качества его работы. Прежде чем будет написан хоть один код, этот агент тщательно изучает спецификацию приложения — псевдо-PRD для клона Claude.ai — и превращает её в полностью структурированный план.

Его задача кажется простой: «анализировать требования и настраивать проект». На практике это означает преобразование нескольких страниц текста в читаемый машинами план, которому другие агенты могут следовать 24 часа подряд, не отвлекаясь. Никакой отладки, никакой доработки интерфейса, никаких повторных реформ—только настройка.

Пояс заставляет Инициализирующий Агент создать четыре ключевых артефакта, которые определяют весь процесс сборки:

1Список возможностей в формате JSON с более чем 200 детализированными тестовыми случаями
2Скрипт инициализации для запуска проекта
3Шаблонный кодовое каркасирование для полного стека
4Свежесозданный репозиторий Git

Этот список функций в формате JSON незаметно выполняет самую сложную работу. Он разбивает спецификацию клона Claude.ai на сотни мелких, проверяемых действий: начало нового разговора, загрузка файла, переключение проектов, рендеринг артефактов, обработка пустых состояний и многое другое. Каждый тестовый случай становится целью для будущих кодировщиков, что обеспечивает своего рода AI-ориентированную разработку через тестирование.

Скрипт инициализации объединяет среду, чтобы будущие агенты не тратили токены на переосмысление этапов настройки. Он кодирует решения, такие как выбор фреймворка, менеджеры пакетов и команды для разработки — подумайте о `npm install`, начальной настройке базы данных и аналогах `npm run dev`, захваченных в одной воспроизводимой точке входа.

scaffolding предоставляет кодировщикам карту кодовой базы, прежде чем они коснутся хотя бы одного компонента. Вы получаете предварительно определенные директории для фронтенда, бэкенда, API маршрутов и общих утилит, а также файлы-заглушки, которые намекают на архитектуру: маршрутизация, управление состоянием и точки интеграции для чата Клода, артефактов и обработки файлов.

Git — это последний нерешаемый элемент. Агент Инициализатор создает новый репозиторий, устанавливая историю версий с первой строки, чтобы последующие агенты могли безопасно коммитить, сравнивать и откатывать изменения. Для долгосрочных агентных кодирующих систем именно эта история – единственное, что предотвращает превращение 24-часовой сессии в хаос.

Неустанная логика кода цикла

Иллюстрация: Непоколебимая логика цикла кода

Кодирование зависит от своего основного "рабочего коня": Кодирующего Агента. Как только Инициализирующий Агент наметит план, этот агент входит в безжалостный цикл, просыпаясь с новым контекстом, перечитывая состояние проекта и шаг за шагом прорабатывая функции. Никаких разговоров, никаких мозговых штурмов — только жесткий цикл обратной связи: тесты, правки и коммиты.

В центре находится строгое развитие через тестирование (TDD). Прежде чем изменится хотя бы одна строчка производственного кода, система уже знает, как выглядит «завершенное» состояние, благодаря огромному списку функций в формате JSON, часто содержащему более 200 детализированных тестов. Задача Кодового Агента не в том, чтобы быть креативным; его задача — сделать так, чтобы тесты прошли успешно.

Каждый цикл начинается с того, что агент загружает артефакт прогресса: структурированный файл, который отслеживает, какие функции существуют, какие тесты проходят и что сломалось недавно. Затем он выбирает следующую задачу — скажем, «поддержка загрузки нескольких файлов в проект» или «отображение истории бесед с артефактами», — основываясь на приоритетах и зависимостях. Этот выбор происходит внутри запроса, но состояние, направляющее его, хранится на диске.

Прежде чем работать с кодовой базой, агент запускает полный набор регрессии. Это значит, что каждая итерация начинается с повторной проверки всего, что было разработано до сих пор, что позволяет сразу же выявлять регрессии, а не через несколько часов. Если ранее прошедший тест не проходит, агент переключается на его исправление, прежде чем добавлять что-то новое.

Только после успешного прохождения регрессионных тестов агент реализует новую функциональность. Он редактирует исходные файлы, обновляет компоненты, настраивает обработчики API и связывает поведение пользовательского интерфейса — всё это через один и тот же интерфейс инструмента. Затем он повторно запускает тесты, работая по циклу до тех пор, пока новый случай не пройдет или не будет достигнут установленный предел попыток.

Когда функция работает, система заставляет агента вывести свою память наружу. Она обновляет файл прогресса с деталями: какая функция была реализована, какие тесты теперь проходят, известные ограничения и следующие логические шаги. Этот файл становится компактным, воспринимаемым машиной журналом изменений для следующей сессии.

Каждый цикл заканчивается коммитом в Git. Система рассматривает Git не как что-то второстепенное, а как основную память: изменения точно сообщают следующему экземпляру Кодирующего Агента, что было изменено, сообщения коммитов подводят итоги намерения, а история защищает от катастрофических ошибок. В сочетании с файлом прогресса эти коммиты позволяют новому контекстному окну «помнить» 18 часов работы, не перечитывая весь код.

За пределами CLI: Сила SDK

Командные инструменты, такие как Claude Code, кажутся мощными, но этот 24-часовой эксперимент тихо обходит их. Вместо того чтобы взаимодействовать с CLI, данный инструмент напрямую общается с Claude через Claude Agents SDK на Python, рассматривая модель как полноценный программный компонент, а не как сложную команду терминала.

Аппаратное средство Anthropic запускает агентов, планирует задачи и проверяет состояние git исключительно через вызовы SDK. Процесс на Python оркестрирует все: создание сессий, потоковые вызовы инструментов, чтение и запись файлов, а также перезапуск агентов, когда они застревают. Ни один человек никогда не вводит `claude code` в командную строку, как только запуск начинается.

Прямой доступ к SDK также превращает выбор модели в деталь конфигурации, а не в необходимость перепостройки. Один и тот же харт может вызывать: - Claude Sonnet 4.5 для экономичных итераций - Claude Opus 4.5 для более сложных рефакторингов - Модели третьих сторон, такие как Code Llama или кодировщики в стиле GPT через совместимые API

Замена моделей превращается в одну строку изменений в инициализаторе клиента, а не в совершенно новый рабочий процесс. Хардвар уже рассматривает "Клода" как абстракцию: программный агент с инструментами, контекстом и контрактом. В своей основе этот контракт может указывать на любую модель, которая работает с JSON и соблюдает протокол.

Вот почему SDK выглядят как истинное будущее агентного программирования. CLI отлично подходят для быстрого решения одноразовых задач или интерактивной отладки; они не справляются, когда требуется постоянное состояние, фоновые задачи или координация между агентами. Долговременные системы, подобные этой, используют программные хуки для ведения журналов, повторных попыток, метрик и контроля безопасности.

Собственный Быстрый старт автономного кодирования - репозиторий Anthropic на GitHub учитывает это предположение. Репозиторий состоит лишь из Python, подсказок и обвязки вокруг SDK для агентов, что делает весь процесс похожим не на инструмент для разработчиков, а на расширяемый микросервис для создания программного обеспечения.

Как запустить своего собственного 24-часового ИИ-программиста

Запуск собственного 24-часового Claude-кодера начинается с открытого программного обеспечения Anthropic на GitHub. Перейдите к быстрому старту автономного кодирования в репозитории claude-quickstarts, конкретно в директорию `autonomous-coding`, и клонируйте её локально. Вы получите готовую структуру: подсказки, подключение агентов и скрипты для запуска долгосрочных coding-агентов Claude.

Настройка кажется более похожей на конфигурацию инструментария для разработчиков, чем на демонстрацию игрушечного приложения. Вам нужно установить зависимости (Python, Node и пакеты проекта через `npm install` или `pnpm install`), поместить ваши переменные окружения в файл `.env` и указать систему на ваши учетные данные Claude. В репозитории есть примерные конфигурации для клона Claude.ai, так что вы в основном можете вносить изменения вместо того, чтобы изобретать что-то новое.

Контроль затрат становится неочевидной ключевой функцией. Коул Медин упоминает важный прием из видео: используйте токен подписки Claude (тот же, что ваш браузер использует для Claude Code) вместо лицензированного API-ключа. Если вы подключите это к платному ключу на основе использования и оставите его работать 24 часа, вы рискуете проснуться с счетом на три или четыре цифры.

Запуск всего процесса сводится к одной команде из корневого каталога репозитория, что-то вроде:

- `python main.py --app-spec=app_spec.txt`

После нажатия клавиши Enter ничего интересного не происходит в течение 10–20 минут. Это Инициализатор Агент тихо генерирует более 200 тестовых случаев, подготавливает проект, пишет инициализационный скрипт и настраивает репозиторий git, прежде чем появится какой-либо видимый интерфейс.

Все зависит от вашего файла спецификации приложения. Система Anthropic ожидает ужасно детализированного текстового файла в стиле PRD, описывающего страницы, потоки, крайние случаи, роли и нефункциональные требования. Если вы подадите ей расплывчатый абзац о «клоне чат-приложения», вы получите расплывчатый продукт.

Сильная спецификация приложения для клона Claude.ai выглядит как документ, который вы бы передали команде: структура URL, состояния беседы, лимиты на загрузку файлов, поведение артефактов, горячие клавиши, тексты ошибок и даже дизайны пустых состояний. Агент Инициализатор разлагает это на детализированные тесты, так что каждое расплывчатое предложение в вашей спецификации через 12 часов превращается в неопределённую или отсутствующую функцию.

Начинается Испытание: Клод Освобожден

Иллюстрация: Начало испытания: Клода освободили

Полночь наступает, команда выполняется, и система тихо переключается с настройки на исполнение. Агент Инициализации запускает свою первую сессию, загружая спецификацию приложения, генерируя обширный файл feature_list.json с примерно 200 детализированными тестовыми случаями и настраивая начальную структуру в стиле Next.js, а также создавая новый репозиторий git. Как только он создает эти артефакты, управление передается рабочей лошадке: циклу Кодирующего Агента.

Ваш терминал перестает выглядеть как обычная консоль разработчика и начинает восприниматься как живой системный журнал от инопланетного парного программиста. Вызовы инструментов появляются каждые несколько секунд: `read_file`, `write_file`, `run_tests`, `git diff`, `git commit`. Вы наблюдаете, как директории `app/`, `components/` и `lib/` наполняются TypeScript, React-компонентами и обработчиками API-маршрутов, все создано Клодом без ваших подсказок после первой команды `npm start`.

Очереди на выходе накапливаются с темпом, который не под силу человеку. В одно мгновение агент создает боковую панель для проектов, в следующее — настраивает потоки разговора, затем исправляет ненадежный тест в панели артефактов. Система управления поддерживает небольшие сессии, меняет контекст и запускает новые сеансы Кодирующего Агента, при этом сохраняя состояние через файловую систему, историю git и список функций в формате JSON.

Руки остаются в стороне от клавиатуры по замыслу. Никаких кнопок "утвердить", никаких ручных повторов, никаких изменений в процессе выполнения. Как только вы запускаете `node run_harness.mjs`, система берет на себя управление в течение следующих 24 часов: планирование, кодирование, запуск тестов и коммит кода. Единственная человеческая активность — это наблюдение за прокруткой и время от времени проверка системных метрик, чтобы убедиться, что сама машина не перегревается.

Безопасность и проверка пронизывают почти каждое действие. Обертка ограничивает shell-команды, чтобы заблокировать все опасное, ограничивает записи файлов в директорию проекта и использует Puppeteer через сервер MCP для визуальной проверки клона Claude.ai в безголовом браузере. Агент может:

1Запустите сервер разработки
2Откройте localhost в Chromium
3Перейдите по проектам, разговорам и загрузке файлов.
4Сравните отрисованный пользовательский интерфейс с его спецификацией и тестовыми ожиданиями.

Каждый проход Puppeteer возвращается в цикл в качестве нового сигнала: действительно ли приложение работало так, как ожидалось, или следующая правка требует вырезать и переписать половину пользовательского интерфейса?

Окончательный вердикт: Что может создать ИИ за 24 часа

Через двадцать четыре часа и сотни циклов агентов Клод вышел с чем-то реальным: рабочим, полностековым веб-приложением в стиле Claude.ai. Это не игрушка, не статическая макета, а фронтенд на React, бэкенд API и тестовый пакет, подключенные к одной и той же системе, которая управляла сборкой. Коул Медин прокручивает его на видео, как любой нормальный SaaS-продукт, потому что функционально именно так оно и есть.

Визуально, клон приземляется удивительно близко. Размещение боковой панели, чаты, список проектов и общая эстетика Claude проявляются: светлые, чистые и знакомые. Вы можете начинать разговоры, переименовывать их и видеть, как они заполняют панель постоянной истории.

Основное взаимодействие также работает. Приложение отправляет сообщения Клоду, транслирует ответы и сохраняет контекст в ходе разговора. Загрузка файлов функционирует для основных сценариев, позволяя прикреплять документы к чату и отображать их в интерфейсе, хотя крайние случаи с большими или необычными файлами все еще могут вызывать сбои.

Артефакты, отличительная функция «встраиваемых приложений» Клода, приходят в частичном формате. Клонированное приложение может отображать простые артефакты, показывать их в отдельной панели и поддерживать связь с беседой. Более сложные процессы — сессии с несколькими артефактами, комплексные инструменты с сохранением состояния или редактирование артефактов на месте — либо завершаются без уведомления об ошибке, либо ведут себя непостоянно.

Управление проектами находится где-то посередине. Агент с управлением через интерфейс реализует: - Создание и удаление проектов - Присвоение разговоров проектам - Базовая фильтрация чатов по проектам

Однако массовые операции, надежный поиск и кросспроектные представления остаются нестабильными или отсутствуют, часто проявляясь в виде не реализованных кнопок или мёртвых состояний пользовательского интерфейса.

Под капотом стратегия разработки через тестирование оправдывает себя. Из примерно 200 сгенерированных тестовых случаев большой процент проходит тестирование к концу 24 часов, при этом сбои в основном сосредоточены на усовершенствовании пользовательского интерфейса и сложной обработке ошибок. Система продолжает работать до тех пор, пока прогресс не достигнет плато, а не когда Клод «устает» или решает, что работа завершена.

Медин на камеру называет harness «легитимным», и это не кажется рекламным хайпом. Он подчеркивает, что это еще не инженерия промышленного уровня, но как доказательство того, что агентное кодирование может автономно создавать сложное многофункциональное веб-приложение за день, демонстрация производит сильное впечатление. Учитывая более широкие достижения Anthropic в области долгосрочных агентов и моделей, таких как Claude Opus 4.5, подробно описанные в Представляем Claude Opus 4.5 - Anthropic, вывод очевиден: этот рабочий процесс еще на ранней стадии, но он уже работает.

Ваш новый AI-коллега заступает на работу завтра.

Ваш текущий «AI парный программист» скоро будет казаться устаревшим. Долгосрочные системы, такие как открытая агентская система от Anthropic, преобразуют модели, такие как Claude, из болтливых ассистентов в фоновую работу, которая тихо обрабатывает накопившиеся задачи в течение 24 часов и более, не теряя нить повествования в середине рефакторинга.

Вместо того чтобы присматривать за окном ввода, вы можете передать агенту PRD, репозиторий и набор тестов, а затем вернуться к рабочему прототипу. Эксперимент Коула Мединa с Claude демонстрирует это на конкретном примере: скоординированный с помощью хранилища экземпляр Claude Code создает интерфейс в стиле Claude.ai, связывает проекты и беседы, и проходит сотни тестов в течение полного дня вычислений.

Для разработчиков это выглядит не как новшество, а скорее как новый уровень инфраструктуры. Рассматривайте агентов как: - Ночными строителями прототипов - Действенными рефакторинговыми демонами - Ботами для генерации тестов и покрытия - Ассистентами по документации и миграции

Дайте одной из этих систем 24 часа и список функций в формате JSON с более чем 200 случаями, и она добросовестно будет стремиться к зеленым галочкам, пока вы спите.

Ничто из этого пока не кажется «готовым к производству». Проводка в репозитории быстрого старта Anthropic экспериментальная, уязвима из-за нестабильных тестов и подвержена тем же галлюцинациям, что и любой другой LLM. Но стратегии, которые она кодирует — тестируемые запросы, строгие критерии успеха, Git как источник правды, координация между агентами — напрямую соответствуют тому, как вы укрепляете реальные AI системы.

Вы уже можете интегрировать эти шаблоны в свою стек. Используйте инициализирующего агента для генерации спецификаций, каркасов и тестов; ограничьте агента по кодированию на внесение изменений только в определенные директории; настройте CI для выполнения тех же проверок, основанных на вспомогательных инструментах, перед слиянием. Каждый шаг делает ваших AI-помощников менее похожими на автозаполнение и более на детерминированных работников, прикрепленных к вашему конвейеру.

Агентная инженерия изменит само понятие "написание программного обеспечения". Человеческие инженеры определяют архитектуры, ограничения и контрольные точки, в то время как флоты специализированных агентов поглощают реализацию, тестирование и интеграцию на протяжении десятков часов. Эксперимент с клоном Клода является грубым наброском этого будущего: кодовые базы формируются не столько на основе нажатий клавиш, сколько благодаря организации легионов неутомимых, obsessed-тестированием сотрудников.

Часто задаваемые вопросы

Что такое Антропный Хартинг для долгосрочных агентов?

Это уровень координации с открытым исходным кодом, который позволяет ИИ-агентам кодирования выполнять сложные задачи в течение длительного времени (часов или дней), управляя контекстными окнами и разбивая работу на более мелкие, проверяемые части.

Можно ли использовать этот шлейф с моделями, отличными от Claude?

Да. Удобство работает независимо от модели. Поскольку это система подсказок и артефактных файлов, вы можете заменить Claude Code на другие модели, такие как OpenAI или альтернативы с открытым исходным кодом, адаптировав клиентский SDK.

Готова ли эта система автономного кодирования к использованию в производственной среде?

Нет, это все еще весьма экспериментально. Это лучше всего подходит для быстрого прототипирования, генерации концепций и изучения будущего агентной инженерии, а не для создания приложений, готовых к производству.

Как система управления избегает ограничений контекстного окна?

Это создает новое, свежее контекстное окно для каждой сессии кодирующего агента. Агент ознакомливается с прогрессом, читая основные артефакты, такие как сводка прогресса, список функций и существующую кодовую базу, обеспечивая необходимость в актуальном контексте только для следующей детализированной задачи.

𝕏 in ↑↗

One weekly email of tools worth shipping. No drip funnel.

one email per week · unsubscribe in two clicks · no third-party tracking

Часто задаваемые вопросы

Что такое Антропный Хартинг для долгосрочных агентов?

Это уровень координации с открытым исходным кодом, который позволяет ИИ-агентам кодирования выполнять сложные задачи в течение длительного времени , управляя контекстными окнами и разбивая работу на более мелкие, проверяемые части.

Можно ли использовать этот шлейф с моделями, отличными от Claude?

Готова ли эта система автономного кодирования к использованию в производственной среде?

Как система управления избегает ограничений контекстного окна?

Клод кодировал 24 часа. Результаты впечатляют.

Кратко / Главное

Невозможный вызов: ИИ кодирует в течение 24 часов

Преодоление барьера выносливости ИИ

Миссия: Создать клон Claude.ai с нуля.

Архитектор: Познакомьтесь с Инициатором Агентом

Неустанная логика кода цикла

За пределами CLI: Сила SDK

Как запустить своего собственного 24-часового ИИ-программиста

Начинается Испытание: Клод Освобожден

Окончательный вердикт: Что может создать ИИ за 24 часа

Ваш новый AI-коллега заступает на работу завтра.

Часто задаваемые вопросы

Что такое Антропный Хартинг для долгосрочных агентов?

Можно ли использовать этот шлейф с моделями, отличными от Claude?

Готова ли эта система автономного кодирования к использованию в производственной среде?

Как система управления избегает ограничений контекстного окна?

One weekly email of tools worth shipping. No drip funnel.

Часто задаваемые вопросы

Читать далее

Этот AI-агент Создает Бизнесы Для Вас

Проверка реальности ИИ: Бенчмарк, который сломал LLM

Скрытый кризис выгорания ИИ

Будьте в курсе трендов ИИ