Кратко / Главное
Обещание рабочих процессов AI по принципу «запустил и забыл» уже здесь благодаря agentic loops. Но без правильных ограничений вы просто создаете «slop machine», которая сжигает токены и порождает хаос.
Мечта об автоматизации против кошмара токенов
Мечта об автоматизации обещает грандиозный жест: один запрос, полная автономия. Это видение agentic loops резко контрастирует с рабочими процессами human-in-the-loop. Human-in-the-loop означает, что вы даете запрос, AI строит, вы проверяете, затем снова даете запрос, шаг за шагом, направляя каждое движение, чтобы обеспечить соответствие вашему видению, подобно тому, как Professor Ras Mic руководит AI при создании приложения для списка дел, функция за функцией.
Представьте себе задачу описания сложной татуировки по телефону. Именно такой опыт представляет собой запуск Wide AI-open agentic loop. Вы формулируете одну, всеобъемлющую `/goal` для агента, чтобы он автономно ее преследовал, но такой запрос неизбежно оставляет критические пробелы и приводит к значительному неверному толкованию.
Это приводит к центральной проблеме автономных предположений: агенты заполняют детали, которые вы явно не указали. Без точного направления агент угадывает, как обрабатывать «какой экран появляется после входа в систему» или «что происходит при сбое платежа». Такие предположения часто отклоняются от намерения, создавая slop machine, которая выдает ошибочные результаты и сжигает токены, что является дорогостоящей реальностью для большинства пользователей по сравнению с неограниченными бюджетами Boris Cherny Cherny или Peter Steinberger Steinberger, которые, как сообщается, потратили 1,3 миллиона долларов за один месяц.
Высокая стоимость автономных догадок
Обещание полной автономии Wide AI часто упускает из виду ошеломляющие затраты на токены. Разработчики, такие как Peter Steinberger Steinberger, публично сообщали о сжигании 1,3 миллиона долларов в токенах за один месяц, преследуя Wide AI-open agentic loops. Эта модель, при которой агент непрерывно генерирует, проверяет и уточняет свой собственный вывод из одного запроса `/goal`, по своей сути приводит к массивному потреблению.
Такой подход жизнеспособен только для тех, у кого практически неограниченные бюджеты, как, например, хорошо финансируемые операции Boris Cherny Cherny и Peter Steinberger Steinberger. Для подавляющего большинства разработчиков и стартапов на многоуровневых планах — уровнях за 20 или 100 долларов — эти meta-harnesses быстро превращаются в «slop machine», поглощая бюджеты слишком быстро. Постоянные догадки делают их непрактичными для реальных ограничений.
Представьте себе, что вы нанимаете блестящего разработчика, передаете ему высокоуровневую спецификацию и уходите. Агент, как и этот разработчик-одиночка, заполняет критические пробелы предположениями — деталями вроде «какой экран появляется после входа в систему» или «что происходит при сбое платежа». Эти догадки неизбежно отклоняются от первоначального product vision, что приводит к потерянным циклам, пропущенным целям и неожиданно огромному счету за токены за работу, которая в конечном итоге не достигает цели.
Найдите свое «бинарное» поле битвы
Wide AI-open agentic loops, как обсуждалось, становятся сжигающими токены «slop machines» из-за их зависимости от непроверенных предположений. Секрет успешных циклов заключается в обратном: фиксированные, определенные системы обратной связи. Агенты процветают, когда работают в четких, количественно измеримых сценариях — подумайте о недвусмысленном «прошел/не прошел» или конкретной числовой цели. Без этого бинарного поля битвы агент просто угадывает, что приводит к дорогостоящим, нецелевым итерациям.
Ежедневный цикл code review профессора Раса Мика прекрасно иллюстрирует этот принцип. Используя Cursor в качестве основы, GitHub для контроля версий и Greptile в качестве интеллектуального агента для проверки, его система автономно стремится к идеальной оценке 5/5. Команда Мика `grep loop` направляет агента: прочитать проверку Greptile, применить исправления, затем отправить изменения и повторить. Этот итеративный процесс продолжается до тех пор, пока код не достигнет 5/5 или не завершит пять циклов, гарантируя, что готовый к производству код всегда набирает более четырех баллов из пяти.
Этот тесный цикл обратной связи работает, потому что агент не делает субъективных дизайнерских выборов. Он оптимизирует работу в соответствии с точным, измеримым результатом. Агент точно знает, как выглядит «хорошо» — это конкретная оценка от Greptile — и может методично работать над этим, не скатываясь в дорогостоящие догадки.
Этот бинарный принцип выходит за рамки кода. Агентные циклы проявляют себя в любой задаче с четкой, измеримой метрикой успеха: - Генерация шаблонных SEO-страниц - Выполнение повторяющейся очистки данных по фиксированному набору правил - Валидация конфигураций по схеме
Для более глубокого погружения в проектирование циклов, включая паттерны ReAct и будущие разработки, изучите Объяснение агентных циклов: от ReAct до проектирования циклов (Руководство 2026).
Почему человек все еще побеждает (пока)
Сложные, творческие начинания, такие как полная разработка приложений, сопротивляются полной агентной автономии. Все видение продукта находится в голове человека, требуя постоянной, субъективной обратной связи и итеративной доработки, которую машины пока не могут полностью освоить. Это предотвращает токен-кошмар открытых циклов Wide AI, делающих дорогостоящие предположения.
Enjoying this? Get one like it in your inbox each morning.
one email a day · unsubscribe in two clicks · no third-party tracking
Представьте, что вы полностью доверяете автопилоту в поездке из Майами в Чарльстон без единой проверки. Вам неизбежно придется остановиться, скорректировать курс и переоценить поездку на основе непредвиденных условий или меняющихся предпочтений. Агенты ИИ сталкиваются с аналогичными проблемами при выполнении открытых задач.
Профессор Рас Мик постоянно подчеркивает эту реальность: модель human-in-the-loop остается наиболее надежной конфигурацией для большинства разработчиков сегодня. Этот подход предотвращает сжигание миллионов токенов из-за автономных догадок, как это наблюдается у некоторых ведущих разработчиков, стремящихся к полной автоматизации.
Хотя будущее, несомненно, указывает на большую автономию, самый мощный и надежный рабочий процесс для сложных задач по-прежнему интегрирует человеческий интеллект на каждом критическом этапе. Пока что лучший цикл твердо держит человеческую руку, направляющую общее видение и подтверждающую прогресс.
Часто задаваемые вопросы
Что такое агентный цикл?
Агентный цикл — это рабочий процесс ИИ, в котором человек дает один высокоуровневый запрос, а агент ИИ затем генерирует, проверяет свою собственную работу и многократно итерирует, пока задача не будет завершена, без дальнейшего участия человека.
В чем основная проблема агентных циклов?
Основная проблема заключается в том, что один запрос редко охватывает все граничные случаи. ИИ заполняет эти пробелы предположениями, что может привести к неверным результатам («машина ошибок») и чрезвычайно высоким затратам на токены.
Когда агентные циклы наиболее эффективны?
Они превосходны в задачах с бинарной или четко определенной обратной связью, таких как сценарии «прошел/не прошел». Code review, где ИИ может оценивать код и итерировать, пока не достигнет целевой оценки, является идеальным примером.
Является ли 'human-in-the-loop' по-прежнему лучшим подходом?
Да. Для сложных, тонких задач, таких как разработка приложений, требующих субъективной обратной связи, human-in-the-loop — где человек проверяет и направляет каждый шаг — остается наиболее эффективным и экономичным подходом сегодня.
