Агентные петли объяснены: «Машина для отходов» против «Умного рабочего процесса»

Евангелисты Loop против реальности

AI представил два различных рабочих процесса для разработчиков. Традиционные системы human-in-the-Loop Engineering оставляют вас в кресле пилота: вы даете подсказку агенту, просматриваете его вывод и вручную повторяете каждый шаг. Напротив, автономный Loop Engineering Engineering представляет AI на автопилоте, где одна человеческая подсказка инициирует самокорректирующегося агента, который генерирует, просматривает и уточняет свои собственные результаты в соответствии с определенной спецификацией.

Ведущие разработчики, такие как Boris Cherny Cherny и Peter Steinberger Steinberger, отстаивают Loop Engineering Engineering как будущее разработки. Они утверждают, что разработчики должны проектировать системы, которые дают подсказки AI, а не напрямую давать подсказки самому AI, тем самым давая агентам возможность автономно выполнять сложные задачи.

Хотя этот подход указывает на амбициозное будущее, он представляет собой опасную и неэффективную реальность для большинства разработчиков сегодня. Cherny и Steinberger работают с фактически неограниченными бюджетами на токены, что делает постоянный Loop Engineeringing рациональным для них. Для подавляющего большинства без таких ресурсов, широко открытые Loop Engineerings быстро становятся "slop machine", сжигая значительные токены и приводя к непредсказуемым затратам. Ras Ras Mic (Michael Shimeles) (Ras Mic (Michael Shimeles)hael Shimeles) подчеркивает, что Peter Steinberger Steinberger однажды написал в твиттере о трате $1.3 миллиона на токены за один месяц, что подчеркивает потенциал для неконтролируемых расходов.

Почему ваш AI Loop — это 'Slop Machine'

Свободно работающая агентная модель Loop Engineering Engineering, предоставленная самой себе, отражает проблему найма блестящего разработчика стартапа и передачи ему единственной спецификации. Без постоянного человеческого руководства агент заполняет каждую двусмысленность своими собственными предположениями и интерпретациями. Эти догадки неизменно отклоняются от первоначального видения продукта, что приводит к ошибочному выполнению и потраченным впустую циклам.

Эта неограниченная автономия создает два основных режима отказа для разработчиков. Во-первых, агент делает неверные предположения в каждом крайнем случае и неопределенной детали, систематически отклоняясь от предполагаемого результата. Во-вторых, этот обширный процесс проб и ошибок приводит к astronoRas Mic (Michael Shimeles)al token burn, быстро истощая бюджеты. Peter Steinberger Steinberger, разработчик, известный экспериментами с Loop Engineerings, как известно, сообщил о трате $1.3 миллиона на токены всего за один месяц.

Команды, такие как /goal, предлагают возможности быстрого прототипирования для первоначального исследования, но оказываются катастрофическими для надежной производственной работы. Они быстро превращают ваш рабочий процесс разработки в сжигающую деньги slop machine. Хотя они эффективны для тех, у кого почти неограниченные бюджеты, таких как Boris Cherny Cherny и Peter Steinberger Steinberger, большинство разработчиков быстро исчерпывают свои лимиты токенов, делая такие широко открытые Loop Engineerings неустойчивыми для реальной, бюджетно-ориентированной разработки. Ras Ras Mic (Michael Shimeles) (Ras Mic (Michael Shimeles)hael Shimeles) подчеркивает, что human-in-the-Loop Engineering остается самой сильной конфигурацией сегодня для контролируемого, эффективного вывода.

Единственный Loop, который действительно работает

Ras Ras Mic (Michael Shimeles) (Ras Mic (Michael Shimeles)hael Shimeles) предлагает наглядный пример агентного Loop Engineering Engineering, который действительно работает. Его ежедневный code review Loop Engineering — это мастер-класс по ограниченной автоматизации, использующий точную комбинацию инструментов: Cursor в качестве AI harness, GitHub для контроля версий и Greptile в качестве автоматизированного code reviewer. Это не теоретическая шумиха; это реальность для практической разработки.

Операционная механика удивительно специфична и детерминирована: пользовательский навык grep Loop Engineering направляет агента. Сначала он читает всесторонний обзор Greptile, который включает объективную оценку качества из пяти баллов, затем интеллектуально применяет необходимые исправления к кодовой базе, отправляет новый коммит в GitHub и повторяет этот цикл. Процесс продолжается до тех пор, пока код не достигнет идеальной оценки 5/5 или не исчерпает свои попытки после пяти отдельных итераций; строгое правило диктует, что код отправляется в продакшн только в том случае, если он поддерживает оценку выше четырех из пяти.

Неоспоримый успех этого Loop Engineering основан на фундаментальном принципе: он работает в строго ограниченном пространстве с четкой, количественно измеримой обратной связью. В отличие от широкомасштабной разработки приложений, ревью кода предоставляет недвусмысленный, объективный показатель завершенности и качества. Этот точный механизм обратной связи предотвращает широкие предположения AI и его дрейф в область «машины для халтуры». В то время как такие визионеры, как Peter Steinberger Steinberger и Boris Cherny Cherny, подчеркивают огромный потенциал агентных систем, реализация Ras Ras Mic (Michael Shimeles) демонстрирует конкретные, практические условия, при которых они действительно преуспевают прямо сейчас.

Нравится статья? Получайте такие каждое утро на почту.

одно письмо в день · отписка в два клика · без сторонних трекеров

Лакмусовый тест Loop: Когда брать управление на себя

Когда Loop Engineering заслуживает своего места? Ras Ras Mic (Michael Shimeles) проводит четкую границу: Loop Engineering превосходно справляется с ограниченными задачами с фиксированной, бинарной или количественно измеримой обратной связью. Его успешный Loop Engineering для ревью кода, использующий Cursor, GitHub и Greptile для достижения оценки 5/5, является примером этой точности. Генерация структурированных страниц SEO также соответствует этой модели, где метрики успеха ясны.

Сравните это с аморфной задачей полной разработки приложений. Здесь видение продукта — это тонкая, развивающаяся сущность, часто частично находящаяся в человеческой интуиции. Автономный агент, предоставленный самому себе, заполняет каждый пробел предположениями, быстро отклоняясь от предполагаемого видения продукта и сжигая токены, как показывают опыты Boris Cherny Cherny и Peter Steinberger Steinberger для тех, у кого нет неограниченных бюджетов.

Ras Ras Mic (Michael Shimeles) отмечает, что даже его надежный Loop Engineering для ревью кода дает сбой после 1000 строк кода, что требует вмешательства человека для разделения работы на несколько pull requests. В тот момент, когда задача требует субъективного суждения, творческого решения проблем или навигации в условиях неопределенности, человеческая интуиция и надзор становятся незаменимыми.

В конечном итоге, будущее действительно может принадлежать полностью автономным системам. Но на сегодняшний день, для создания чего-либо сложного, human-in-the-Loop Engineering остается более умным, безопасным и экономически эффективным рабочим процессом. Ваша рука на руле предотвращает выход «машины для халтуры» из-под контроля, обеспечивая соответствие видению и бюджету.

Часто задаваемые вопросы

Что такое агентный цикл в AI?

Агентный цикл — это автономный процесс, при котором агент AI генерирует результат, просматривает свой собственный вывод и использует его в качестве обратной связи для продолжения работы без прямого вмешательства человека на каждом шаге.

В чем разница между агентным циклом и human-in-the-loop?

В системе human-in-the-loop человек направляет, просматривает и одобряет каждый шаг, который предпринимает AI. В агентном цикле человек запускает процесс один раз, а AI самостоятельно управляет итеративным циклом проверки и построения.

Почему открытые агентные циклы так дороги?

Они быстро расходуют токены, потому что ИИ делает предположения для заполнения пробелов в своих инструкциях. Эти предположения часто приводят к ошибочным результатам, требуя больше циклов и больше токенов для исправления, создавая дорогостоящую петлю обратной связи.

Какой хороший вариант использования для агентной петли?

Идеальны ограниченные задачи с четкой, объективной обратной связью. Например, цикл проверки кода, где агент пересматривает код на основе оценки качества от другого инструмента, пока не достигнет цели, очень эффективен.

Found this useful? Share it.

For builders

Want Stork to write one of these about your product?

Send us a URL. We use the product, form a view, and publish what we actually think — in 8 languages, labeled Sponsored, with no copy approval on your side. That last part is what makes it worth quoting.

See how it works$500 · AI tools & software only

Ваш AI Loop — это Slop Machine