要約 / ポイント
'fire-and-forget' な AI ワークフローの可能性は agentic loops によって実現します。しかし、適切なガードレールがなければ、トークンを消費し、混乱をもたらすだけの「スロップマシン」を構築しているに過ぎません。
自動化の夢 vs. トークンの悪夢
自動化の夢は、壮大なジェスチャーを約束します。つまり、1つのプロンプトで完全な自律性を実現することです。このagentic loopsのビジョンは、human-in-the-loopワークフローとは対照的です。human-in-the-loopとは、プロンプトを与え、AIが構築し、レビューし、再度プロンプトを与えるという、ステップバイステップで、あなたのビジョンとの整合性を確保するためにすべての動きを指示することを意味します。これは、Professor Ras Mic がAIをガイドして、機能ごとにToDoアプリを構築するのと非常によく似ています。
電話で複雑なタトゥーを説明する難しさを考えてみてください。それがまさに、Wide AI-open agentic loop を開始する際の経験です。エージェントが自律的に追求するための単一の包括的な`/goal`を明確にしますが、そのようなプロンプトは必然的に重要なギャップを残し、重大な誤解を招きます。
これは自律的な仮定という中心的な問題につながります。エージェントは、あなたが明示的に指定しなかった詳細を埋めます。正確な指示がなければ、エージェントは「ログイン後にどの画面が表示されるか」や「支払いが失敗した場合に何が起こるか」をどのように処理するかを推測します。このような仮定は意図から逸脱することが多く、欠陥のある結果を生み出し、トークンを消費するスロップマシンを作り出します。これは、Boris Cherny Cherny や Peter Steinberger Steinberger のような無制限の予算を持つ人々(彼らは1ヶ月で130万ドルを費やしたと報じられています)と比較して、ほとんどのユーザーにとって費用のかかる現実です。
自律的な推測の高コスト
Wide AI AI の完全な自律性という約束は、驚くべきトークンコストを見落としがちです。Peter Steinberger Steinbergerのようなビルダーは、Wide AI-open agentic loops を追求する中で、1ヶ月で130万ドルものトークンを消費したことを公に共有しています。エージェントが単一の`/goal`プロンプトから自身の出力を継続的に生成、レビュー、洗練するこのモデルは、本質的に大量の消費につながります。
このようなアプローチは、Boris Cherny Cherny や Peter Steinberger Steinberger のような潤沢な資金を持つ組織のように、事実上無制限の予算を持つ人々にのみ実行可能です。20ドルや100ドルのティアプランを利用している大多数の開発者やスタートアップにとって、これらのmeta-harnessesはすぐに「スロップマシン」となり、予算をあまりにも早く食い尽くします。絶え間ない推測は、現実世界の制約に対してそれらを非実用的なものにします。
優秀な開発者を雇い、高レベルの仕様書を渡して立ち去るようなものだと考えてください。エージェントは、その単独の開発者と非常によく似ており、「ログイン後にどの画面が表示されるか」や「支払いが失敗した場合に何が起こるか」といった詳細を仮定で埋めます。これらの推測は必然的に元のproduct visionから逸脱し、無駄なサイクル、目標の未達、そして最終的に的を外した作業に対して予期せぬ莫大なトークン請求につながります。
あなたの「バイナリ」な戦場を見つけよう
これまで議論してきたように、Wide AI-open agentic loops は、未検証の仮定に依存するため、トークンを消費する「スロップマシン」になります。成功するループの秘訣はその逆、つまり固定された、明確に定義されたフィードバックシステムにあります。エージェントは、明確で定量化可能なシナリオ、例えば曖昧さのない「合格/不合格」や特定の数値目標内で動作するときに最も効果を発揮します。このバイナリな戦場がなければ、エージェントは単に推測するだけで、高価で的を外れた反復につながります。
ラス・ミック教授の毎日のコードレビューループは、この原則を完璧に示しています。Cursorをハーネスとして、ソース管理にGitHubを、インテリジェントなレビューエージェントとしてGreptileを使用することで、彼のシステムは自律的に完璧な5/5スコアを追い求めます。ミックの`grep loop`コマンドはエージェントに指示します:Greptileのレビューを読み、修正を適用し、変更をプッシュして繰り返す。この反復プロセスは、コードが5/5に達するか、または5回のターンを完了するまで続き、常に本番環境に対応できるコードが5点中4点以上を確実に獲得するようにします。
この密なフィードバックループが機能するのは、エージェントが主観的な設計上の選択を行っていないからです。それは、正確で測定可能な結果に対して最適化されています。エージェントは「良い」ものがどのようなものか、つまりGreptileからの特定のスコアを正確に知っており、費用のかかる当て推量に陥ることなく、体系的にそれに向かって作業することができます。
このバイナリ原則はコードを超えて広がります。エージェンティックループは、明確で測定可能な成功指標を持つあらゆるタスクで輝きを放ちます。 - テンプレート化されたSEOページの生成 - 固定されたルールセットに対する反復的なデータクリーンアップの実行 - スキーマに対する構成の検証
ReActパターンや将来の発展を含むループエンジニアリングの詳細については、エージェンティックループ解説:ReActからループエンジニアリングまで(2026年ガイド)をご覧ください。
なぜ人間が(今のところ)まだ勝つのか
完全なアプリケーション開発のような複雑で創造的な取り組みは、完全なエージェンティックな自律性に抵抗します。製品全体のビジョンは人間の頭の中にあり、機械がまだ完全に把握できない絶え間ない主観的なフィードバックと反復的な洗練を必要とします。これにより、Wide AI-openループが高価な仮定を立てるというトークンの悪夢を防ぎます。
Enjoying this? Get one like it in your inbox each morning.
one email a day · unsubscribe in two clicks · no third-party tracking
マイアミからチャールストンへのロードトリップで、一度もチェックインせずに完全自動運転を信頼することを想像してみてください。予期せぬ状況や変化する好みに基づいて、必然的に停車し、進路を修正し、旅を再評価する必要があるでしょう。AIエージェントも、オープンエンドなタスクで同様の課題に直面します。
ラス・ミック教授は、この現実を一貫して強調しています。ヒューマン・イン・ザ・ループモデルは、今日のほとんどのビルダーにとって最も強力な設定であり続けています。このアプローチは、一部のトップビルダーが完全自動化を追求する中で見られたように、自律的な当て推量による数百万のトークンの浪費を防ぎます。
未来がより大きな自律性に向かっていることは間違いありませんが、複雑なタスクにとって最も強力で信頼性の高いワークフローは、依然としてあらゆる重要な局面で人間の知能を統合しています。今のところ、最高のループは、全体的なビジョンをしっかりと導き、進捗を検証するために人間の手をしっかりと保持しています。
よくある質問
エージェンティックループとは何ですか?
エージェンティックループとは、人間が単一の高レベルのプロンプトを与え、AIエージェントが自身の作業を生成、レビューし、さらなる人間の入力なしにタスクが完了するまで繰り返し反復するAIワークフローです。
エージェンティックループの主な問題は何ですか?
主な問題は、単一のプロンプトではすべてのエッジケースをカバーすることがめったにないことです。AIはこれらのギャップを仮定で埋め、それが誤った出力(「スロップマシン」)や極めて高いトークンコストにつながる可能性があります。
エージェンティックループはいつ最も効果的ですか?
合格/不合格のシナリオのように、バイナリまたは明確に定義されたフィードバックを持つタスクで優れています。AIがコードを採点し、目標スコアに達するまで反復できるコードレビューは、完璧な例です。
「ヒューマン・イン・ザ・ループ」はまだ最良のアプローチですか?
はい。主観的なフィードバックを必要とするアプリ開発のような複雑で微妙なタスクの場合、人間が各ステップをレビューし、ガイドするヒューマン・イン・ザ・ループは、今日最も効果的で費用対効果の高いアプローチであり続けています。
