要約 / ポイント
Googleの最新のAIプレイブックは、厳しい真実を明らかにしています。使用するモデルは成功のわずか10%に過ぎません。残りの90%は構築する「ハーネス」であり、それがソフトウェアの未来です。
Vibe Codingから検証済みシステムへ
Googleが最近公開したAIコーディングに関する50ページのMasterClassは、ソフトウェア開発における重要な転換を明らかにしています。AIモデル自体が結果の約10%しか占めず、残りの90%は、モデルの周囲に構築されるコンテキスト、ツール、検証といった「ハーネス」にあると提唱しています。この洞察は、AIコーディングが二者択一ではなく、スペクトラムであることを強調しています。
一方の端には、Vibe Codingがあります。これは、最小限の計画で迅速かつ低労力なプロンプトを行い、「うまく機能しているように見えるか?」という簡単なチェックで検証されます。このアプローチは、概念実証や初期探索に優れており、迅速なイテレーションを可能にします。しかし、その本質的な信頼性の低さと検証の欠如により、重大なリスクがあるため、スケーラブルな本番環境レベルのソフトウェアには不向きです。
スペクトラムに沿って進むと、Structured AI-Assistedコーディングは、より詳細なプロンプトとスポットチェックを伴います。その頂点にあるのがAgentic Engineeringであり、これはリソース、ワークフロー、仕様、自動評価、継続的インテグレーション(CI)ゲートからなる設計されたシステムを採用します。この方法論は再現性と信頼性を優先し、複雑なシステムに対して堅牢で検証可能な出力を保証します。
実装が数週間からわずか数分または数時間に短縮されるこの加速は、AI駆動のSoftware Development Life Cycle(SDLC)を再構築します。主要なボトルネックは現在、初期要件収集と最終検証という両端に存在します。AIがコード生成を劇的に高速化する一方で、人間主導の仕様品質と厳格な検証が、ビジネス成果にとって新たな重要な制約となります。
90%の法則:「ハーネス」がすべてである理由
大規模言語モデル(LLM)自体に焦点を当てることは、全体像を見失うことになります。Cole MedinのMasterClassで強調されたGoogleの最近の50ページのプレイブックは、信頼性の高いAIエージェントを構築するための重要な公式を明らかにしています。エージェント = モデル + ハーネス。選択されたLLMは、エージェントのパフォーマンスの約10%を占めます。
エージェントの有効性の90%は、そのハーネスに由来します。これは抽象的なものではなく、モデルの周囲に構築する綿密に設計されたレイヤーです。それは以下を定義します。 - コンテキスト: 関連情報と制約。 - ツール: エージェントが呼び出すことができる外部機能。 - ガードレール: 安全メカニズムと行動境界。 - 検証ワークフロー: 自己修正を可能にする自動テストと評価。
この概念は、Agentic Engineeringのベストプラクティスにおける業界全体の収束を表しています。Anthropicのような企業も同様のアーキテクチャを明確にし、基盤モデルよりも周囲のシステムを重視しています。ハーネスは、組織が真に制御し、反復できるレイヤーです。
エージェントのパフォーマンスは、根本的にハーネスに依存します。堅牢なコンテキストエンジニアリング、ツール統合、厳格な検証を怠りながら、LLMのわずかな改善に執着することは誤った方向性です。ハーネスこそが、真の信頼性と再現可能な結果が生まれる場所です。
あなたは指揮者ではなく、オーケストレーターである
開発者の役割は根本的に変化しており、コードの手動の指揮者から、インテリジェントで自律的なシステムのオーケストレーターへと移行しています。これは、アプリケーションロジックのすべての行を書くことではなく、コードを独立して生成、テスト、洗練するAI駆動の「工場」全体を設計することです。あなたはもはや単にコーディングしているのではなく、AIエージェントのための環境と運用ロジックを構築しているのです。
オーケストレーターの主なタスクは、エージェントのパフォーマンスの90%を占めるLLMの堅牢な足場を構築するハーネス自体を設計することです。これには、正式な仕様を綿密に定義し、包括的な自動テストを実装し、厳格な継続的インテグレーション(CI)ゲートを確立することが含まれます。これらのプログラムによるガードレールは、エージェントが絶え間ない人間の介入なしに、厳密に自己修正し、自身の出力を検証し、間違いから学ぶことを可能にします。
この大きな変化は、ソフトウェア開発ライフサイクル(SDLC)に劇的な影響を与えます。適切にオーケストレーションされたシステムは、AIエージェントが独立して反復することを可能にし、コード生成と洗練の時間を数週間からわずか数分または数時間に短縮します。このプロアクティブなアプローチは、従来の人間の検証ボトルネックを大幅に軽減し、エンジニアが手動デバッグではなく、より高レベルの問題定義とシステムアーキテクチャに集中できるようにします。さらなる洞察については、Googleの基礎的なホワイトペーパー、The New SDLC With Vibe Coding - Kaggleを参照してください。
Enjoying this? Get one like it in your inbox each morning.
one email a day · unsubscribe in two clicks · no third-party tracking
エージェンティックAIの比類なき経済性
効果的なAIシステムを構築するには、根本的な経済的再構築が必要です。堅牢なハーネスへの初期投資を設備投資(CapEx)と見なしてください。これには、包括的なコンテキストの設計、専門ツールの統合、ガードレールの定義、厳格な自動検証の実装にかかるエンジニアリング時間が含まれます。これに対し、生のトークン消費、継続的な手動デバッグ、反復的な再作業にかかる継続的な変動費用は、すべて運用費用(OpEx)に分類されます。
ハーネスへのCapExを増やすことで、長期的なOpExが劇的に削減されます。信頼性が高く、反復可能なエージェンティックシステムを構築することで、組織は将来のトークン消費を大幅に削減できます。エージェントが自律的に反復するため、その削減幅はしばしば大きいです。さらに重要なのは、継続的な人間の介入、アドホックなプロンプトのトラブルシューティング、信頼性の低い出力の検証に伴う多大な人件費を最小限に抑えることです。包括的なハーネスへのこの戦略的投資は、スケーリングが不十分でエンジニアリングリソースを消耗させる「vibe coding」の無限のサイクルを未然に防ぎます。
どのような本格的なソフトウェアプロジェクトにとっても、その経済的論理は否定できません。Googleの洞察は、手動プロンプトに依存するよりも、体系的なエージェンティックエンジニアリングプロセスを構築する方が、優れた費用対効果とスケーラビリティをもたらすことを強調しています。これは単なる技術的な好みではなく、持続可能で高品質なAI主導の開発にとって戦略的な必須事項であり、初期投資がシステムのライフサイクル全体にわたって複利的なリターンを生み出すことを保証します。
よくある質問
vibe codingとagentic engineeringの違いは何ですか?
Vibe codingは、使い捨てのコードやMVPに適した、最小限の計画でカジュアルなプロンプトを使用することです。Agentic engineeringは、設計された仕様、ツール、自動検証を使用して、信頼性の高い、本番環境に対応したコードを作成する体系的なアプローチです。
AIの「ハーネス」とは何ですか?
ハーネスとは、AIモデルの周囲に構築するシステム全体のことです。これには、モデルが望ましい結果を生み出すように導く特定のコンテキスト、ツール、ガードレール、検証ワークフロー、およびオーケストレーションが含まれます。
GoogleはなぜAIモデルがシステムのわずか10%だと言うのですか?
モデルはコアとなる推論を提供しますが、そのパフォーマンスは「ハーネス」(残りの90%)の品質によって圧倒的に決定されます。適切に設計されたハーネスは、優れたモデルを例外的に機能させることができますが、不十分なハーネスは最高のモデルでさえも制限します。
agentic engineeringはソフトウェア開発者の役割をどのように変えますか?
開発者の役割を、あらゆるコード行を書く「指揮者」から、AIエージェントがコードを書くことを可能にする自動化されたシステム(ハーネス)を設計、構築、保守する「オーケストレーター」へと移行させます。
