クロードのラルフ・ウィグムプラグイン: 自律型AIデバッグループ

💡

TL;DR / Key Takeaways

新しいクロードプラグインは、『ザ・シンプソンズ』の最も愚かなキャラクターにインスパイアされており、徹底的に自律的にアプリを一晩で構築しています。この「容赦ない継続的な」AIループが、開発者にとってゲームを変えるようになっている方法をご紹介します。

ラルフに会おう、上昇する失敗型AI

ラルフ・ウィッグム、スプリングフィールドで最も知恵のない子供として知られる彼が、AI開発における最も賢いアイデアの一つのミューズとなりました。それは、最終的に成功するまで失敗を続けることを決して諦めない執拗にこだわるエージェントです。すべてを初回で完璧にこなす天才的なモデルを目指すのではなく、このアプローチはより信頼性のあるものに重きを置いています。それは、機械のスケールでの愚かで繰り返し可能な努力です。

今日のほとんどのAIツールは、完璧な一発回答の幻想を追い求めています。プロンプトを貼り付け、指を交差させ、モデルが幻覚を見たり、途中で投げ出したり、難しい部分を静かにスキップしたりしないことを願っています。そうなった場合は、やり直し、プロンプトを調整し、とても我慢強く、とても安い給料のプロジェクトマネージャーのようにプロセスを見守ります。

ラルフ・ウィグムがそのスクリプトをひっくり返す。ジェフリー・ハントリーのオリジナルのアイデアは、ほとんど侮辱的なほどシンプルだった：明確な完了信号が現れるまで、クラウドに同じプロンプトを送り続ける無限の`while`ループ。AnthropicはこれをClaude Codeプラグインに変え、停止フックと状態ファイルを使用して自動的にタスクを再実行し、人間の手を介さず、介入なしで実行できるようにした。

結果はおもちゃのようではなく、新しいワークフローの基本要素のように見えます。YCのハッカソンでは、Repomirrorチームがこの方法を使って一晩で6つの完全なリポジトリを配信しました。これにはPythonからTypeScriptへのBrowser Useの完全な書き直しも含まれています。別のエンジニアは、約297ドルのAPIコストでMVPを提供し、レビューし、テストしたと報告されています。これは、50,000ドルの契約者請求書の代わりでした。

パターンは非常にシンプルです：仕事を説明し、「完了」の定義を明確にし、ループを前進させます。ラルフ・ウィッグムはコードを書き、テストを実行し、失敗に直面し、修正を加え、成功の条件が現れるまで、または最大反復回数のトリップワイヤーが作動するまでサイクルを続けます。「飽きてやめた」ということはなく、リポジトリの中で静かに腐っていく部分的な実装もありません。

シンプソンズのジョークの裏には、真剣な開発哲学が存在します。それは「予測可能な失敗は予測不可能な素晴らしさを上回る」という考え方です。検証可能な結果—テストの合格、緑のCI、コンパイル済みのバイナリ—を明示できれば、疲れることも恥ずかしがることもなく、常に挑戦し続けるAIにその作業を任せることができます。

「執拗な粘り強さ」の奇妙な起源

ジェフリー・ハントリーは、GPUで満ちたラボを持って始めたわけではありません。彼は次の一行のbashスクリプトから始めました：`while :; do cat PROMPT.md | claude ; done`。この小さなループは、マークダウンファイルとAnthropicのClaudeを指し示し、現在では静かに徹夜のビルドやテスト移行、さらには全体のMVPを支える技術の種となりました。

ハントレーはそれを『ラルフ・ウィグム・ウィグム』にちなんで名付けました。彼は『ザ・シンプソンズ』の中で最もひねりのないキャラクターです。ラルフ・ウィグム・ウィグムは決して止まらず、最適化せず、深く考えすぎることもありません。ただひたすら続けるのです。たとえそれが適切でない時でも。ハントレーの洞察は、そのような素朴で無理やりな持続力が、大型言語モデルを通常途中でやめてしまう作業に駆り立てることができるということです。

モデルを完璧な一発回答に導くのではなく、ハントリーはクロードに同じプロンプトを繰り返し読ませ、明確な完了信号（「完了」や「終了」など）が出るまで続けさせた。各失敗は無限ループの中の別のステップとなった。その洗練さはモデルからプロンプトファイルに移り、明示的な基準、テストコマンド、そして「完了」の定義が、無能なエージェントでも従えるほど十分に厳密なものとなった。

そのシフトは、ハントリーのマントラである「予測可能に失敗する方が、予測不可能に成功するよりも良い」という考え方を支えています。フロンティアモデルから得られる一時的なひらめきは、それを要求に応じて再現できなければ役に立ちません。同じ方法で50回失敗する決定論的なループは、オペレーターがプロンプトを洗練させ、テストを厳密にし、システムを徐々に信頼性に向けて調整することを可能にします。

ハントリーの議論は、AIの仕事をオペレーターのスキルゲームとして再定義します。質問は「モデルはどれほど賢いか？」から「PROMPT.mdで現実をどれほど正確に指定できるか？」に変わります。ラルフ・ウィグムでは、バッシュループは賢くなりません；人間が賢くなり、テスト駆動開発、CIコマンド、及びガードレールを1つの再実行可能な仕様にエンコードします。

自称「ヤギ農家」のハントリーは、起源のストーリーがどれほどローテクであるかを強調しています。独自のオーケストレーションレイヤーも、ベンチャー資金を受けたエージェントフレームワークもなく、ただの便利なシェルループとマークダウンファイルだけ。そんな草の根のハックは、アンソロピックが洗練されたクロードコードプラグインに仕上げるずっと前に、ハッカソン、YouTubeのデモ、GitHubのギストを通じて広まったもので、ヤギ農家のジョークをビッグテックのインフラストラクチャに変えてしまいました。

アンソロピックがミームを武器化した方法

Anthropicは単にバッシュのミームをUIに包み込んだだけではなく、Claude Code内でラルフ・ウィッグムを第一級のランタイム動作として再構築しました。外部の `while :; do ...; done` ループがAPIをスパムするのではなく、Claudeは製品内からループを所有しており、自身のツール、ファイルシステム、実行環境にアクセスできます。

主要なアップグレードはストップフックです。通常、Claude Codeはタスクが完了したと思った時にストップフックを発動しますが、Anthropicはその瞬間を奪い、Claudeが自らの終了を中断し、何が起こったのかを検査し、ループを再び回すかどうかを決定できるようにしました。

開発者は、Claude Codeで`/Ralph Wiggum-loop`のようなスラッシュコマンドを入力することでこれをトリガーします。彼らはプロンプトファイルを指定し、`<promise>DONE</promise>`や`<promise>COMPLETE</promise>`などの完了プロミスを定義し、オプションで`max_iterations`の値を設定して、エージェントが無限にGPU予算を消費しないようにします。

一度開始すると、プラグインはディスクに状態ファイルを書き込みます。そのファイルは、現在のイテレーション、最新の出力、完了の約束が現れたかどうか、ループが進捗を推測するために必要なメタデータを追跡します。

クラウドコードが停止フックに達するたびに、プラグインはその状態ファイルを解析します。完了の約束が欠けていて、イテレーションカウンターが最大値未満の場合、停止フックは終了をブロックし、最新のコード、テスト結果、およびログで強化された同じプロンプトを静かに再キューイングします。

この内部ループは、ジェフリー・ハントリーの元のシェルスクリプトの最大の欠点であるコンテキストの喪失を修正します。同じ静的な `PROMPT.md` を盲目的に再投入するのではなく、ステートファイルはクロードが失敗したテスト、スタックトレース、部分的なリファクタリング、および以前の試みについての進行中の詳細を持ち越えることを可能にします。

実際の作業フローは以下のようになります： - タスクと明確な成功基準を記述したプロンプトファイルを書く - `<promise>DONE</promise>`のような機械で検証可能な約束を埋め込む - プロンプトパスと適切な`max_iterations`（例：20〜50）を指定して`/Ralph Wiggum-loop`を実行する

このように使われると、ラルフ・ウィグムは単なるジョークではなく、AIエージェントのための原始的なビルドシステムのように見えてきます。この概念の背後にある哲学について深く掘り下げたい方は、ジェフリー・ハントリーの著作「ラルフ・ウィグムを『ソフトウェアエンジニア』として」Ralph Wiggum Wiggum as a 'software engineer' - Geoffrey Huntleyを読むと、意図的に失敗して前進するためのオペレーターズマニュアルのように感じられます。

$297のMVP対$50,000の請負業者

ラルフ・ウィグムは、最近のAIの歴史において最も攻撃的なコンセプト証明の一つを静かに提供しました：わずか297ドルのClaude API費用で、完全にテストされ、レビューされたMVPです。ジュニア開発者もなく、スプリント計画もなく、Jiraボードもなく、ただループするプロンプト、明確な完了の定義、そして判断者として機能する自動テストのスタックがあるだけです。

デモの背後にいるエンジニアは、クロードを安価な契約者の群れのように扱った。複数のエージェントが並行して動き、それぞれにシステムの一部が割り当てられた：API、フロントエンド、テスト、インフラストラクチャ。ラルフ・ウィグムは、すべてのテストが合格し、すべてのチェックリスト項目が完了信号を出すまで、同じ指示を何度も送り続けた。

それを古いやり方と対比してください。優秀なフリーランスのエンジニアや小規模な代理店だと、同じ仕様に対して$30,000–$50,000を見積もるでしょう。数週間の作業、会議、修正、バグ修正作業が含まれます。ラルフ・ウィグムは、それを一晩と三桁の請求書に圧縮しました。実際のボトルネックは、あなたのCIとリンターの実行速度のみです。

スタートアップにとって、これは予算の計算を一新します。クレジットカードと確かなプロンプトを持つ創業者は、次のものを構築できます： - テスト駆動開発（TDD）を用いた生産品質のAPI - テストを備えたTypeScriptのSPA - CIパイプラインとインフラをコードとして管理

すべてはMacBookのドングル予算以下で。インディー開発者は、「ウィークエンドプロジェクト」を出荷できるようになり、資金提供を受けたスタートアップに静かに対抗できます。また、ハッカソンチームは審査が始まる前にデモ用ソフトウェアから出荷可能なコードに移行できます。

RepoMirrorのクルーは、YCハッカソンでこれを極限まで追求しました。ラルフ・ウィグムを携えて、彼らは一晩で6つのリポジトリを出荷し、その中にはPythonからTypeScriptへの完全なブラウザの書き換えも含まれています。このループは単にファイルを翻訳するだけでなく、テストを生成し、それを実行し、失敗を修正し、緑色になるまで反復しました。

そのブラウザの書き換えは、真の破壊を見せています。ラルフ・ウィグムは、人間が嫌う単純な作業において活躍しています。プログラミング言語の移植、数十万行にわたるHTTPタイムアウトの配線、不安定なテストを繰り返すこと—通常、請負業者の請求時間を消耗させる作業が、フィードバックループ内のAPIトークンに変わるのです。

経済的重力がその役割を担います。297ドルのコンピュータが、明確に範囲が定義されたビルドに対して50,000ドルの契約を信頼性をもって代替できるとき、初期段階のチームにとっての問いは「これを構築する余裕はあるか？」から「自動化しない余裕はあるか？」に変わります。

ラルフを解き放て：あなたの24時間365日コードリファクタリングマシン

ラルフ・ウィッグムがミームであることをやめ、リファクタリングに向けて指を向けると機械のように感じ始めます。基本的なパターンは厳しくシンプルです：成功をマークダウンファイルで定義し、DONEのような完了キーワードを組み込み、次にクロードがそのプロンプトに繰り返し挑むことを許可します。コードベースが仕様に一致するか、ループがタイムアウトするまで続けます。

ラルフ・ウィグム・ウィグムを最もスムーズに運用する方法は、テスト駆動開発です。まず失敗するテストを作成し、それをコミットします。そしてクロードに「すべてのテストがパスし、3回連続でグリーンである必要があるので、DONEと印刷する前に確認してほしい」と伝えます。ラルフ・ウィグム・ウィグムは、その後、テスト駆動開発の基本的なループ—レッド、グリーン、リファクタリング—を、あなたがすべてのアサーションの失敗を見守ることなく回していきます。

実用的なTDDプロンプトには通常、以下が含まれます： - 明確なリポジトリレイアウトとツール（Vitest、Jest、Pytest、Bun test） - 実行するための正確なコマンド（例：`bun test audio-delay.test.ts`） - 厳格な制約：スキップされたテストはなし、100％の合格率、新しい不安定さはなし

大規模なリファクタリングがラルフ・ウィグムの恐ろしいほどの効果を発揮する場面です。Better Stackのデモでは、マイクロフォンの音声を遅延させるPythonスクリプトが、すべての生成されたテストが合格するまでループを繰り返すことで、完全に機能するTypeScriptバージョンに変換されました。同じパターンが全体のサービスに拡張されます：PythonのFastAPIバックエンドをTypeScriptに移行し、HTTP契約を同一のまま保ち、契約テストが合格するまで終了を拒否します。

移行作業はこのパターンを好みます。Ralph Wiggum Wiggumを次のものに指摘できます： - より高速なユニットテストに分割したい統合テスト - Playwrightに移行したい古いSeleniumスイート - GitHub Actionsに変換する必要があるレガシーCIスクリプト

バグ修正も完璧に適合します。決定的な再現がある限りです。ラルフ・ウィッグムに失敗したテスト、正確なエラー出力、およびループが失敗が消えるまでテストコマンドを実行し続け、再発が現れないという要件を与えてください。クロードは段階的に故障を特定し、修正を行い、修正周辺のカバレッジを強化します。

ラルフ・ウィッグムはドキュメンテーションマシンとしても機能します。すべての公開関数にドックストリングがあり、すべてのエンドポイントにOpenAPIアノテーションがあり、すべてのモジュールにREADMEがあるまで実行し続けるよう指示し、ドキュメントリントやスキーマバリデーターがクリーンであることを条件に完了させてください。

AIを甘やかすのはやめよう：勝てるライティングプロンプト

AIにすべてのキーストロークを語らせようとするのはやめましょう。ラルフ・ウィグムのように、仕事は旅を細かく管理することではなく、「素朴で relentless な」ループが見逃せないほど明確な目的地を指定することです。何度戻っても大丈夫です。「どうやって？」と尋ねるのをやめ、「完了」を定義することを始めましょう。

つまり、収束プロンプトを書くことを意味します。これは、自然に単一の検証可能な最終状態に収束する指示です。例えば、「これをTypeScriptに移植してください」と言う代わりに、「`tests/`内のすべてのテストが`bun test`の下で、スキップされたケースもタイプスクリプトコンパイラエラーもなくパスします」と言います。このループは、条件が満たされるまでまたは最大反復数のトリガーに達するまで続きます。

あいまいな目標はラルフ・ウィッグムを殺す。「良くする」「UIを改善する」「コードを整理する」といった指示は、客観的な終着点がないため、エージェントはあなたの感覚を追いかけながら永遠に回り続け、トークンを消費します。主観的な指示は、人間によるレビューに委ねるべきであり、コアループには適していません。

良いラルフ・ウィグムのプロンプトは、会話というよりも契約のように読まれます。それは以下を定義します： - 実行する具体的なコマンド（`npm test`、`pytest`、`golangci-lint run`） - 成功の定義（失敗したテストゼロ、リンタエラーゼロ、型エラーなし） - 完了の信号（「すべての基準が満たされたらDONEと書いてください」）

そのツールはモデルにバックプレッシャーをかけます。テスト、リンター、型チェックツールは、クロードが仕様から外れるたびに反発し、次の反復に正確でマシン可読なエラーメッセージを提供します。失敗したアサーションの修正方法を教えるのではなく、赤が残らないように要求するのです。

Anthropicのプラグインは、このパターンに強く依存しています。プロンプトとともに`/Ralph Wiggum`を呼び出し、“DONE”のような完了の約束とオプションの最大繰り返し回数を指定すると、Claude Codeのストップフックが成功基準が自身の出力に現れるまで、全く同じ指示を繰り返します。面倒を見る必要もなく、手動で再実行することもなく、スタックトレースを通じて手助けをすることもありません。

より深いパターンや例となるプロンプトのために、Ralph Wiggum Wiggum - Claude CodeのAIループテクニックでは、6つのリポジトリを一晩で出荷したリアルワールドのスクリプトを収集し、PythonからTypeScriptにブラウザを再構築し、297ドルで完全なMVPを提供しました。共通する糸口は、「完了」とは何かに関する無慈悲な明確さと、いつ終了するかについての完全な曖昧さの排除です。

安全スイッチ：暴走するAI請求を回避する方法

ラルフ・ウィグムはシンプルな約束のもとに動いています：仕事が終わるまで続けること。しかし、そのシンプルさは、ガードレールを設けなければ、静かにクレジットカードを燃やす危険があります。無邪気な無限ループと、Claude 3.5 Opusのような百万トークンあたり15ドルのモデルが組み合わさると、一晩で数十ドル、あるいは数百ドルの請求が発生する可能性があります。

AnthropicのClaude Code統合には、ハードストップが追加されました：max-iterationsフラグです。ストップフックがプロンプトを再生するたびに、内部カウンターが状態ファイルに関連付けられ、指定した制限に達するとループが終了します。完了信号がなくても問題ありません—イテレーションが20または50に達すると、ループは自動的に終了します。

最大イテレーション数を自律性のための回路ブレーカーと考えてください。以下のように設定できます： - 小規模なリファクタリングや単一のバグ修正には10〜15イテレーション - テスト駆動のAPI作業や小さな機能には20〜30イテレーション - 複数段階のリファクタリングや「一晩」でのMVPプッシュには40〜50イテレーション

プロンプト内の脱出ハッチは数値制限と同じくらい重要です。モデルに明確に敗北を認める方法を指示します：「もし資格情報の不足、外部APIの失敗、またはあいまいな要件によってブロックされている場合は、BLOCKED: と短い説明を出力し、停止してください。」これにより、ラルフ・ウィッグムが進行を幻想する代わりに、すっきりと退くことができます。

優れたプロンプトは、「完了」を機械的に確認可能な条件で定義します。「すべてのテストが合格していること」、「`tsc --noEmit`でTypeScriptエラーがないこと」、または「CIパイプラインが正常であること」を求め、単に「本番環境にふさわしいと感じるコード」を求めてはいけません。ストップフックはDONEやCOMPLETEといった完了トークンを監視しますが、あなたのテスト、リンター、型チェック機能が実際の圧力となります。

コストの管理はモデルの選択から始まります。複雑なアーキテクチャやプランニングにはOpusを使い、その後、面倒なリファクタリングや単純なテスト修正には安価なモデルに切り替えましょう。大規模リポジトリでの30回のイテレーションを伴うOpusループは数百万トークンを消費しますが、軽量モデルでの同様のループはごくわずかなコストで済みます。

すべてのラルフ・ウィグムの実行を予算化されたジョブとして扱いましょう。最大反復回数を設定し、サイクルごとのトークン使用量を見積もり、クラウドインスタンスやCI分と同様に総支出に上限を設けます。自律性は強力ですが、それを運用できる余裕がある場合に限ります。

私たちが知っている手動コーディングの終わり？

マニュアルコーディングは直線的に進むものでした：計画、コーディング、テスト、デプロイ。しかし、ラルフ・ウィッグムはそれを静かに壊します。無意味な while ループと従順なモデルが SDLC を、眠らず、47回目の `npm test` を再実行することに飽きることもない、単一の脈動するフィードバック回路に変えます。

人間がJiraチケットからステージングまで作業を管理する代わりに、デザイン、実装、テスト、リファクタリングを一つの継続的なフローで行う自律エージェントループが得られます。ジェフリー・ハントリーのオリジナルの `while :; do cat PROMPT.md | claude ; done` スクリプトは、徹夜ビルドでこれを示しました；アンソロピックの統合プラグインは、これを公式な製品戦略にしています。線形の組み立てラインは、閉じたループシステムに収束します。

開発者はタイピストとしての行動をやめ、システムデザイナーとしての役割を担い始めます。彼らの仕事は、制約、成功基準、ガードレールを明確にすることに移行します。「すべてのテストが合格」、「TypeScriptの厳密モード」、「bun testがパス」、「ログにDONE」といった具合です。優れたエンジニアは、テストスイート、リンター、CIを結びつけて、ループが収束するよう強制的な境界を設けるプロンプトアーキテクトへと進化します。

ラルフ・ウィッグムは、エージェントが数時間または数日間コンテキストを持続できると何が起こるかをほのめかしています。もし素朴なループがPythonからTypeScriptへブラウザを一晩で書き換え、YCハッカソン中に6つのリポジトリを出荷できるとしたら、より能力の高い後継者は数週間にわたるリファクタリングやサービス間の移行を管理できるでしょう。「設計文書」、「実装」、「コードレビュー」との引き継ぎは、同じエージェント内の内部的な相転移となります。

未来のワークフローは、スプリントのようには見えず、むしろプラントの運営に似ています。目標状態を定義し、テレメトリ（テスト、メトリクス、ログ）を付与し、その状態にシステムを持続的に推進するエージェントを起動します。人的レビューは、主要な生産ステップではなく、スポットチェックや監査となります。

それはシニアリティを再定義します。シニアエンジニアは、プロンプト、アーキテクチャ、最大反復回数の制限やコスト予算などの安全スイッチをキュレーションします。ジュニアはダッシュボードを監視し、失敗を解釈し、ループがあいまいさや製品の判断に達したときだけ介入します。手動コーディングは消えるわけではありませんが、デフォルトではなく例外的な道になります。

ラルフがあなたのクリエイティブな仕事を処理できない理由

ラルフ・ウィグムは、緑のチェックマークに収束する問題で繁栄します：テストが合格し、リンターが静まり、HTTP 200が返ってくる。その同じ機械的効率性は、「これが正しいように感じる」や「利害関係者が会議で微笑んだ」といった成功が見えないものに対してはひどく苦手です。勝利の状態を明確で機械で確認可能な条件として表現できなければ、ループは収束するための確固たるものが何もありません。

UXデザインはこれを瞬時に明らかにします。「このオンボーディングを魅力的にしてください」には、明確な完了のシグナルも、テストスイートも、ベンチマークもありません。ラルフ・ウィグムはレイアウトやコピーの修正、カラーパレットを永遠に生み出し続け、誰もが「魅力」はログファイルの中で「完了」として存在しないため、どこにも向かっていない自信を持って反復します。

戦略的な業務の休憩もそれに該当します。製品ロードマップ、価格戦略、採用計画、ブランドポジショニングは以下に依存しています： - 対立する人間のインセンティブ - 雑多な市場データ - 政治とタイミング

「私たちのCEOと営業リーダーが両方とも賛同している」ということを単体テストとしてエンコードすることはできません。再試行の方法しか知らないループは、与えられたプロキシ指標に過剰適合してしまい、実際のトレードオフを見逃してしまいます。

コードでも、ラルフ・ウィッグムは問題が曖昧なときにつまずきます。「このコードを整理して」や「パフォーマンスを改善して」といった曖昧な指示は、逆戻りや行き詰まり、誤ったことの過剰最適化を招きます。明確な制約がないと、「公開APIを安定させる」「p95レイテンシを150ms未満に保つ」「カバレッジを90%以上にする」といった具体的な指示がない限り、その relentless persistence（しつこい努力）はむしろあなたの曖昧さを増幅させるだけです。

本番環境ではリスクが高まります。ホットフィックス、データ移行、インフラの変更はしばしば部族的知識、文書化されていない特異な点、そして一時的なエッジケースに依存します。シニアエンジニアはこれを以下の方法でデバッグします： - カスタムログの追加 - 状態のライブ検査 - バグに影響を受けた人々との会話

ラルフ・ウィッグムはあなたのSREにインタビューすることも、パニックになったSlackスレッドを解釈することもできません。

実践的なデバッグは、フィードバックチャネルが定性的な場合にループを凌駕します：ユーザーインタビュー、デザイン批評、ロードマップの議論、インシデントの事後分析などです。退屈な部分は後でラルフ・ウィグガムを使って処理することもできます—リファクタリング、テストスカフォールディング、マイグレーションスクリプトなどですが、目標を定義するには人間が必要です。

境界を越えようとする人には、frankbria/Ralph Wiggum-claude-code: Claudeのための自律AI開発ループのようなプロジェクトが警告ラベルとして機能します：これはパワーツールであり、プロダクトマネージャーでもなければ、デザイナーでもなく、確実にあなたのクリエイティブディレクターでもありません。

初めての「ウォークアウェイ」開発プロジェクト

ウォークアウェイ開発は、小さくて退屈な問題から始まります。既に使用しているPythonスクリプトを選びましょう—バックアップヘルパー、ポッドキャストのリネームツール、あの不安定なマイク遅延ツールなど—そして、ラルフ・ウィグムに渡します。彼の仕事は一つ：これをTypeScriptに書き直し、完全なテストを通過させることです。あなたの目標は魔法ではなく、エージェント、テスト、またはビルドループを手動で再実行する必要がないようにすることです。

タスクを明確で検証可能な最終状態として設定します。次の指示を含む `PROMPT.md` を作成してください： - PythonスクリプトをTypeScriptに移植すること - 完全なテストカバレッジを追加すること - テストを実行し、すべてが成功するまで繰り返すこと - すべてが成功したら `DONE` を表示すること

もしClaude Codeをお持ちの場合は、Ralph Wiggum Wiggumプラグインを`/Ralph Wiggum`で呼び出し、そのプロンプトファイルを指定し、API予算が過剰に消費されないように最大反復数の制限を設定してください。その後は放っておいてください。戻ったときには、動作するTypeScriptモジュールとテストがあるか、進行を妨げた理由を詳しく説明した失敗ログがあるはずです。

オリジナルのフレーバーを好む場合、Geoffrey Huntleyのワンライナーをコピーしてください：`while :; do cat PROMPT.md | claude ; done`。同じアイデアですが、安全策は少なめです。自分自身の完了シグナルを設定し、コストに注意を払う必要があります。

モノリスを再構築したり、新しい製品を設計したりすることから始めないでください。まずは、手動で5分以内に検証できるスクリプトから始めましょう：TypeScriptバージョンを実行し、テストを実行し、元のPythonと挙動を照らし合わせて確認します。もし間違っている場合は、コードを修正するのではなく、プロンプトを改善してください。

ジェフリー・ハントリーのラルフ・ウィグムに関する記事には、起源ストーリーと哲学が記されています。詳しくはghuntley.com/Ralph Wiggumをご覧ください。Anthropicの統合版については、公式のClaude Codeプラグインがリポミラーのドキュメントにあります。詳しくはgithub.com/repomirrorhq/repomirror/blob/main/repomirror.mdを参照してください。実際の動作を観たい場合は、Better Stackのビデオ「Claudeが自律的にデバッグするためのプラグイン」が、実際の動作、最大イテレーション制限、ストップフックについて詳しく解説しています。

小さなスクリプトでそのループを信頼できるようになったら、影響範囲を広げましょう：モジュールをリファクタリングしたり、APIを移行したり、何ヶ月も無視していたテストスイートを徹底的にチェックしたりします。ラルフ・ウィグムは、面倒で決定論的な失敗と修正の作業を行ってくれるので、あなたはアーキテクチャや製品の意思決定、実際に人間の脳が必要な問題に時間を費やすことができます。

よくある質問

「ラルフ・ウィグム」テクニックとは、クロードにとって何ですか？

それは、同じプロンプトが繰り返しClaudeに与えられる自律型AIループです。AIはタスクに対して反復的に作業を行い、コードを実行し、結果を確認し、手動での介入なしに指定された完了条件が満たされるまでエラーを修正します。

ラルフ・ウィグムプラグインは使用するのに高価ですか？

それは可能です。各イテレーションでトークンを消費するためです。高いコストや無限ループを防ぐために、プラグインには「最大イテレーション」安全機能が含まれており、実行するサイクル数を制限することができます。

ラルフ・ウィグム技法はどのようなタスクに最適ですか？

明確に定義された、検証可能なタスクに優れており、具体的なテストを通過するためのコードを書くこと（TDD）、コードベースのリファクタリング（例えば、PythonからTypeScriptへの移行）、明確な再現手順を伴うバグ修正、そして明確な仕様に基づいたグリーンフィールドプロジェクトの構築などがあります。

ラルフ・ウィグム・テクニックを創造したのは誰ですか？

この技術はもともとジェフリー・ハントリーによって単純なバッシュのwhileループとして考案されました。その後、Anthropicがこの概念を正式に体系化し、'stop hook'機能を使用してClaude Codeにより堅牢なプラグインとして統合しました。

𝕏 in ↑↗

クロードの最も馬鹿なAIは、その最も賢い武器である。