このAIは自身の会社を構築し運営する

個々のAIエージェントは強力ですが、それらのチームは混沌と化します。Paperclipと呼ばれる新しいオープンソースツールは、AIエージェントを自律的に管理し、コードを出荷し、予算を守る自律的な会社に変えることで、この問題を解決しています。

Stork.AI
Hero image for: このAIは自身の会社を構築し運営する
💡

要約 / ポイント

個々のAIエージェントは強力ですが、それらのチームは混沌と化します。Paperclipと呼ばれる新しいオープンソースツールは、AIエージェントを自律的に管理し、コードを出荷し、予算を守る自律的な会社に変えることで、この問題を解決しています。

The Multi-Agent Anarchy 問題

単一のAIコーディングエージェントの魅力は強力です。特定の課題を与えれば、必要なコードを熱心に書き、目覚ましい結果をもたらします。この単一の焦点と即座の有用性は、当初、ソフトウェア開発に革命的な変化をもたらし、前例のない効率と精度でプロセスを合理化することを約束しました。

しかし、複数のエージェントが関与すると、この洗練されたシンプルさは急速に混沌へと陥ります。2番目、あるいは3番目のエージェントが導入されるとすぐに、ワークフローは管理上のオーバーヘッドの泥沼へと一変します。重要な疑問が生じます:誰が真にタスクを所有しているのか?どのエージェントが全体的な目標を覚えているのか?そして、決定的に重要なのは、エージェントが軌道から外れ、非生産的なトークン消費ループに陥ったときに誰が介入するのか?この現象はすぐにmulti-agent anarchy問題として知られるようになりました。

動画『I Tried Running a Company Made of AI Agents In』で鮮やかに示されているように、かつて生産的だった孤立したAIワーカーのチームは、徐々に混乱した管理業務へと変わり、runaway API costsにつながる可能性があります。自律エージェントの当初の約束は、まとまりのある製品を構築するのではなく、調整されていないプロセスが「請求額を積み上げ」、リソースを浪費するという厳しい現実にすぐに道を譲ります。監視がなければ、エージェントは数分で予算を使い果たす可能性があります。

この増大する問題は、単純なエージェントフレームワークが現在提供しているものを超える、洗練された新しい調整レイヤーを必要とします。CrewAIやAutoGenのようなツールは、研究者、プランナー、ライターといった線形ワークフローの定義には優れていますが、複雑で永続的なマルチエージェント運用に必要な堅牢な組織構造が本質的に欠けています。彼らはワーカーを提供しますが、マネージャーはいません。

したがって、これらの異質なワーカーをまとまりのある、目標指向の「会社」に変えることができる、より高レベルのcontrol planeという新しいパラダイムが切実に必要とされています。これは、単純なプロンプトを超えて、役割を調整し、予算を管理し、目標を強制し、エージェントが孤立して動作するのではなく、共有されたビジョンに戦略的に貢献することを保証するシステムを必要とします。

Paperclipのご紹介:あなたのAI会社のCEO

イラスト:Paperclipのご紹介:あなたのAI会社のCEO
イラスト:Paperclipのご紹介:あなたのAI会社のCEO

Paperclipは、単なる別のAIエージェントとしてではなく、あなたの新興AIワーカーを管理するために設計された洗練されたcontrol planeとしてご紹介します。このオープンソースソリューションは、個々のエージェントを孤立した問題解決者から、まとまりのある目標指向の「会社」へと高めます。それは、以前の「雰囲気ベースのオーケストレーション」の時代を、堅牢で構造化された管理システムに置き換えます。

Paperclipの核となる革新は、その説得力のあるcompany metaphorにあります。これは、CEO、CTO、エンジニアといった定義された役割を含む完全な組織構造を確立します。このフレームワークは、org charts、tickets、予算、audit logsといった従来のビジネスツールを活用して、エージェントの行動と進捗を管理し、すべてのアクションが追跡可能であり、全体的な会社の目標と一致していることを保証します。

生のAIエージェントがしばしば調整されていない混沌に陥るのに対し、Paperclipはそれらを統一されたチームに変えます。ユーザーは明確な会社の目標を定義し、AI CTOエージェントがそれを実行可能なticketsに細かく分解します。エンジニアエージェントはこれらのタスクを引き受け、Paperclipが委任の調整、系統の追跡、ステータス変更の管理、予算消費の監視を行い、そのすべてにおいて透明性のためにstate、heartbeats、hierarchy、logsを提供します。

このパラダイムシフトは、単にエージェントにプロンプトを出すだけにとどまりません。企業のミッションを設定し、内部ルールを確立し、リソースを割り当て、その後自律的に実行させることを含みます。Paperclipは、厳格な予算制限を通じて、エージェントが「APIを使いすぎて請求額が爆発する」のを防ぎ、制御された自律性を可能にします。これにより、エージェントは適切なタスクに取り組み、適切なタイミングで停止し、明確に作業を引き継ぐことが保証されます。

この新しいアプローチに対する開発者の関心は否定できません。PaperclipはGitHubで急速に64,000以上のスターを獲得し、このorchestration layerに対する強力なコミュニティの採用を示しています。JiraやLinearに似たダッシュボード体験を提供し、異なるAIツールを単一の管理可能なエンティティに統合する共有オペレーティングモデルを提供します。

5分で最初のAIスタートアップを立ち上げる

Paperclipを使って最初のAIスタートアップを立ち上げるのにかかる時間はわずか数分です。`npx paperclipai onboard --yes`という単一のコマンドで、ローカルセットアッププロセス全体が開始されます。この合理化されたオンボーディングにより、Paperclipのcontrol planeが迅速にデプロイされ、洗練されたAIエージェントチームをオーケストレーションする準備があなたのマシンに整います。最近GitHubスターが64,000を超えたこのプロジェクトは、マルチエージェントシステムを探求したい開発者向けの迅速なデプロイメントを重視しています。

Paperclipは堅牢なlocal-first architectureで動作します。Node.jsサーバーを実行し、インタラクション用の応答性の高いReact UIを動かし、組み込みのPostgresデータベースを含んでおり、これらすべてがあなたのローカルマシン内に限定されています。この自己完結型環境は、完全な制御とプライバシーを提供し、開発および実験中に外部のクラウド依存関係を不要にします。開発者は、すべてのエージェントのアクション、ログ、およびデータポイントを完全に可視化できます。

オンボーディングが完了したら、最初のステップは新しい会社を作成し、その全体的な目的を定義することです。ユーザーは、「今週中にURL短縮MVPを構築して出荷する」といった高レベルの目標を明確にします。この初期目標は北極星として機能し、その後のすべてのエージェント活動を導き、誕生したばかりのAI組織全体での整合性を確保します。Paperclipはその後、組織図の作成を容易にし、CTOやエンジニアのような役割を特定のエージェントに割り当てます。

この驚くほど低い参入障壁は、高度なマルチエージェントシステム開発へのアクセスを民主化します。開発者は、広範なインフラストラクチャのセットアップなしに、理論的な概念から実用的で構造化されたAI企業へと迅速に移行し、複雑なワークフローと自律的な操作を実験できます。Paperclipは、AI駆動型ソフトウェアエンジニアリングという急成長分野における迅速なプロトタイピングとイテレーションを可能にする、不可欠な足場を提供します。そのコードベースとコミュニティ貢献についてさらに深く掘り下げるには、paperclipai/paperclipリポジトリをご覧ください。

組織図の設計:AIのC-Suite

合理化されたセットアップの後、Paperclipの直感的なダッシュボードは、ユーザーがAI企業の内部構造をすぐに構築できるようにします。UI内で明示的なorganizational hierarchyを定義し、個々のエージェントに特定の役職と報告ラインを割り当てます。この堅牢なシステムにより、従来の企業構造を正確に模倣した、カスタマイズされたC-suiteと部門チームを作成できます。例えば、ユーザーは最初からCEO、CTO、2人の専門Engineers、さらには専任のResearch Agentを確立でき、これらすべてが相互に接続されます。

Paperclip内の各定義された役割は明確な責任を伴い、明確な境界を強制することで混沌とした「multi-agent anarchy problem」に効果的に対処します。例えば、CTO agentは「今週中にURL shortener MVPを構築し出荷する」といった包括的な会社目標を受け取り、それを一連の実行可能なチケットに体系的に分解します。その後、専門のフロントエンドおよびバックエンドEngineerなどの後続のエージェントがこれらのチケットを引き受け、それぞれの特定のドメインに専念し、タスクの集中的かつ効率的な実行を保証します。

Paperclipは柔軟な「bring-your-own-bot」哲学を提唱し、エージェントの展開において驚くべき多様性を提供します。これは厳格なエージェントフレームワークではなく、強力なオーケストレーターとして機能し、ユーザーは確立された階層内で多様な大規模言語モデルや単純なbashスクリプトさえもエージェントとしてプラグインできます。このオープンなアプローチは既存のツールとシームレスに統合し、OpenClaw、Claude Code、Codex、Cursor、またはあらゆるHTTP-based agentのようなエージェントをサポートし、幅広いAI機能にわたる適応性を保証します。

この構造化された委任は、比類のない明瞭さと追跡可能性を提供し、「誰が何をなぜ行ったのか?」という重要な問いに直接答えます。すべてのタスク、決定、および結果として生じるコードコミットは、割り当てられたエージェントとその元のチケットに直接リンクされます。Paperclipはすべての行動をログに記録し、タスクの来歴、予算支出、正確な目標アライメントを詳細に記した不変の監査証跡を提供し、以前は不透明だったエージェントの行動を透明で説明責任のあるワークフローに変えます。これにより、マルチエージェント環境における推測が排除されます。

目標からGit Commitまで:自律的なワークフロー

図:目標からGit Commitまで:自律的なワークフロー
図:目標からGit Commitまで:自律的なワークフロー

AI C-suiteが配置されると、Paperclipは自律的な運用フローをオーケストレートします。指定されたCTO agentは、「URL shortener MVPを構築し出荷する」といった包括的な会社目標を受け取り、直ちにそれを分析し始めます。このインテリジェントな分解により、洗練されたプロジェクト管理システムを反映した一連の実行可能なチケットが生成されます。

Paperclipは、継続的で高コストなtoken consumptionを防ぐための重要なハートビートシステムを採用しています。エージェントは常に実行されているわけではなく、代わりに所定のスケジュールで定期的に「起動」します。これらのアクティブなフェーズ中に、チケットキューで利用可能な作業をスキャンし、タスクを実行した後、休止状態に戻り、運用費用を綿密に管理します。

Paperclipダッシュボードの顕著な機能は、リアルタイムの予算カウンターです。これは、ライブのtoken expenditureを表示する重要な制御ループとして機能します。ユーザーは特定の支出制限を定義し、予算が上限に近づくとPaperclipはエージェントのアクティビティをインテリジェントに抑制し、管理されていないAIシステムによく関連する悪名高い「runaway token burn」を効果的に防ぎます。

エンドツーエンドのプロセスは、Paperclipのオーケストレーション能力を示しています。最初の会社目標から、CTO agentは自律的に構造化されたチケットのバックログを作成します。その後、Engineer agentがこれらのタスクを引き受け、必要なコーディングと開発を実行します。コードが書かれると、それは指定された作業ディレクトリに直接配置されます。ダッシュボードは、タスクのステータス、委任、および予算使用に関するライブアップデートを提供し、最初の目標から最終的なGit commitまでの完全な追跡可能性を保証します。

この構造化されたアプローチは、Paperclipをより単純なエージェントフレームワークから根本的に区別します。それは個々のAIエージェントの集合体を、まとまりのある目標指向の「Company Made」のAI Agentsに変革します。このシステムは、チケット作成からコードコミットまで、すべての行動が主要な目標と一致することを保証し、効率的でコスト管理された開発を促進します。

ワークフロー以上のもの:Paperclip vs. CrewAI & AutoGen

「Paperclip」は、CrewAI、AutoGen、LangGraphといった確立されたエージェントフレームワークと比較されることがよくあります。AIエージェントのオーケストレーションという共通の領域を考えると、この最初の混乱は理解できます。しかし、「Paperclip」は全く異なるレベルで機能し、シーケンシャルなタスク実行を超えたマルチエージェントコラボレーションを再定義します。

従来のフレームワークは、線形または分岐するワークフローの作成に優れています。それらは、研究者、プランナー、ライター、そして最終的なレビュー担当者といった一連のステップを定義し、エージェントが従うべきデジタルチェックリストとして機能します。これらのツールは、アクションの順序が最も重要であり、各エージェントがバトンを渡す前に自分の役割を完了することを保証する、構造化された段階的なプロセスにとって非常に貴重です。洗練された連携を提供しますが、通常、より高レベルの管理コンテキストを欠いています。

対照的に、「Paperclip」はこれらのワーカーを取り巻く管理レイヤー全体を提供します。それは単にアクションを順序付けることだけではありません。自律的な組織を構築し、運営することです。このプラットフォームは、組織図、永続的なチケットシステム、重要な財務管理機能を備えたAI企業の完全なインフラストラクチャを提供します。これは、管理されていない生のエージェントがすぐに混乱に陥り、過剰なトークン使用量を積み重ねる「Multi-Agent Anarchy Problem」に直接対処します。

この根本的な違いを明確にするビデオからのアナロジーを考えてみましょう。 - 単一のエージェントは単なる従業員です。 - ワークフローはチェックリストを表します。 - Paperclipは、マネージャー、組織図、チケットボード、予算システム、監査ログを具現化します。

「Paperclip」のミッションは、単なるオーケストレーションを超えています。その核となる目的は、シミュレートされた企業内でAIエージェントの永続的な状態、階層構造、および堅牢なガバナンスを管理することです。これは、一連のタスクを指示するだけでなく、明確な所有権を確立し、全体的な目標に対する進捗を追跡し、説明責任を確保することを意味します。AIで構成された会社の「コントロールプレーン」を提供し、エージェントが適切なタスクに取り組み、必要なときに停止し、監査可能なフレームワーク内で作業を明確に引き継ぐことを保証します。その機能と哲学の包括的な概要については、Paperclipをご覧ください。これは、個々のエージェントにプロンプトを出すことから、予算、ハートビート、承認を備えたミニ組織を制御することへと、メンタルモデルを根本的に変えます。それは、タスク自動化から組織的自律性への根本的な転換です。

利点:AIの混沌に対する真のガバナンス

「Paperclip」は、マルチエージェントAI開発を根本的に再定義し、調整されていないボットの混沌を超越します。開発者は、「multi-agent anarchy problem」を抑制し、孤立したAIエージェントをまとまりのある「AI company」に変えるその堅牢なフレームワークを賞賛しています。この転換は、構造、明確な説明責任、トレーサビリティを提供し、曖昧な「vibes-based orchestration」を具体的なガバナンスに置き換えます。

決定的に、コスト管理は後付けではなく、主要な設計原則となります。ユーザーは、エージェントがタスクを実行する前に予算を設定し、エージェントまたは部門ごとに月間の支出制限を設定します。この積極的な財務上のガードレールは、エージェントを自動的に抑制し、自律システムによく関連する悪名高い暴走APIコストを防ぎます。ビデオでは、これがエージェントが「請求書が爆発するまでAPIを使い続ける」のをどのように防ぎ、制御された自律性を確保するかを示しました。

Paperclipの直感的なダッシュボードを通じて、可観測性が際立ちます。これは単なるチャットウィンドウではありません。エージェント向けにJiraやLinearのように機能し、運用状況の包括的なビューを提供します。ユーザーは、委任、チケット、履歴、ステータス変更、予算カウンターをリアルタイムで追跡できます。すべてのエージェントの会話、決定、行動は不変の監査ログを生成し、コンプライアンス、デバッグ、戦略的介入に不可欠な監視を提供します。

さらに、Paperclipのオープンソースかつセルフホストの性質は、ユーザーに完全な所有権を与えます。組み込みのPostgresデータベースとReactダッシュボードでローカルに実行されるため、クラウドへの依存がなくなります。このアーキテクチャにより、システムの完全な検査と変更が可能になり、透明性の高い環境が育まれます。GitHubで64,000以上のスターを獲得したこのプロジェクトの急速な台頭は、AIの混乱に対する真のガバナンスを求める開発者にとって、その大きな影響力とコミュニティからの魅力を強調しています。

欠点:AI企業が暴走するとき

イラスト:欠点:AI企業が暴走するとき
イラスト:欠点:AI企業が暴走するとき

構造化されたAI自律性の約束にもかかわらず、Paperclipには実用上の限界と潜在的な落とし穴があります。「ゴミを入れればゴミが出る」の原則は依然として非常に重要です。不適切に定義された企業目標や曖昧な`SKILLS.md`ファイルは、オペレーション全体を迅速に頓挫させる可能性があります。曖昧な目標は、CTOエージェントがタスクを無意味なチケットに分解し、エンジニアを非生産的な無駄な作業に陥らせることがよくあります。

Paperclipの堅牢な予算管理があっても、トークン消費は常にリスクです。割り当てられた予算は財政的なガードレールとして機能し、API料金の暴走を防ぎますが、ずさんなプロンプトや非効率なエージェントの行動を魔法のように修正するわけではありません。エージェントは、その根底にある指示が正確でない場合、冗長で重複した、または誤ったコードを生成するために大量のトークンを消費する可能性があります。システムはコストに上限を設けるのであって、非効率性に上限を設けるわけではありません。

さらに、Paperclipの包括的な構造は、より単純で直接的なタスクには過剰である可能性があります。単一のドキュメントを要約したり、軽微なバグを修正したり、迅速なデータ抽出を実行したりするだけが目的の場合、複数のエージェント、チケット、ハートビートを含む完全な組織図を立ち上げるのは煩雑です。ロールの定義、作業ディレクトリの設定、エージェントのライフサイクルが完了するのを待つというオーバーヘッドは、単発の操作のメリットをはるかに上回ります。この強力なコントロールプレーンは、複雑な多段階プロジェクトで威力を発揮しますが、些細な作業にはそのアーキテクチャが煩わしいと感じられることがあります。

秘密兵器:あなたの`SKILLS.md`ファイル

組織図やチケットキューを超えて、Paperclipのエージェントガバナンスにおける真の秘密兵器は、一見するとシンプルなファイル、`SKILLS.md`にあります。このMarkdownドキュメントは単なる設定ではありません。それは、あなたのAI企業内における各エージェントの能力、ルール、および重要な制約を定義する基礎的な契約です。これを怠ると、パフォーマンスが著しく低下し、最もよく構造化されたAI企業でさえも迅速に頓挫する可能性があります。

ビデオが明確に強調しているように、「あなたのSKILLS.mdファイルがひどい場合、あなたの会社は混乱したスタートアップのように振る舞います。」これは誇張ではありません。不適切に定義されたスキルファイルは、エージェントが関連性のないタスクにトークンを浪費したり、引き継ぎに苦労したり、あるいは暴走したりすることにつながります。明確で簡潔な指示は、効果的な自律運用にとって最も重要であり、予算効率とプロジェクトのタイムラインに直接影響します。このファイルは、あなたのAI従業員の運用DNAをエンコードする場所です。

堅牢な`SKILLS.md`を作成するには、正確さと先見性が必要です。エージェントの主要な責任とドメイン専門知識を明確に概説し、指定された役割に集中できるようにする必要があります。特に、「`git`コマンドを実行できる」、「会社の内部知識ベースにアクセスできる」、「外部サービスと連携するためにPythonスクリプトを実行できる」など、エージェントがアクセスできる正確なツールやAPIを指定する必要があります。

ツールを超えて、`SKILLS.md`ファイルは行動のガードレールを確立するために不可欠です。これには、「50ドルを超える予算支出には承認を求める必要がある」、「すべてのコードコミットでセキュリティのベストプラクティスを優先する」、「アーキテクチャの決定については常にCTOに相談する」といった指示が含まれる場合があります。また、エージェントが同僚とどのように対話し、進捗を報告し、問題をエスカレートするかを規定するコミュニケーションプロトコルも定義し、情報サイロを防ぎます。

効果的な`SKILLS.md`は、エージェントが定義された役割内で厳密に動作し、不必要な回り道をすることなく、会社全体の目標に効率的に貢献することを保証します。これは、包括的な職務記述書、トレーニングマニュアル、コンプライアンスハンドブックが一体となったものであり、すべての決定を導きます。この綿密なガイダンスがなければ、システムはPaperclipが防ごうとしているまさにマルチエージェントの無秩序状態に急速に陥り、可能性が費用のかかる混乱へと変わってしまいます。AIスタックをさらに最適化することに関心のある方には、Better Stackのリソースが可観測性とパフォーマンスに関する追加の洞察を提供します。この重要なファイルは、最終的にあなたのAI企業が繁栄するか停滞するかを決定し、制御された自律性の青写真として機能します。

あなたの次の同僚はAI企業ですか?

Paperclipは、個々のAIエージェントを管理するための単なるツールではありません。それは、開発者が人工知能とどのように相互作用するかにおける深い変化を示しています。今日、その主な有用性は、ソロ開発者、インディーハッカー、そして真に自律的なシステムを実験している先進的なR&Dチームにとって際立っています。これらの早期採用者は、Paperclipを活用して単一エージェントのスクリプトを超え、前例のない制御で複雑なマルチエージェントプロジェクトを編成しています。

パラダイムシフトは、「エージェントにプロンプトを出す」ことから「会社を指揮する」ことへと移行します。開発者は個々のタスクのためにプロンプトを細かく作成するのではなく、会社全体の目標を定義し、組織図を確立し、予算を設定します。Paperclipは、これらの高レベルの指示を実行可能なチケットに変換し、作業を委任し、人間がチームを監督するのと同様に、エージェントが連携して協力することを保証します。この抽象化レイヤーにより、開発者はマルチエージェント調整の細かな複雑さから解放されます。

この相互作用の再定義は、ソフトウェア開発の未来において、人間の入力が戦術的ではなく戦略的かつ管理的なものになることを示唆しています。アイデア出しからデプロイ、メンテナンスに至る製品ライフサイクル全体が、AIによって管理されるエンティティによって統治されることを想像してみてください。Paperclipは、このビジョンのためのコントロールプレーンを提供し、従来のAIエージェントフレームワークには欠けていた監視、追跡可能性、コスト管理を提供します。

最終的に、Paperclipは、人間ゼロの企業が実現可能で、まだ初期段階ではあるものの、現実となる未来を早期に具体的に示しています。これは単にタスクを自動化することではありません。自律的な製品開発が可能な、自己統治型で目標指向のエンティティを作成することです。この先駆的なアプローチは、あなたの次の同僚が個々のAIではなく、AIを搭載した組織全体である可能性を示唆しており、技術革新の状況を根本的に再構築します。

よくある質問

Paperclip AIとは何ですか?

Paperclipは、複数のAIエージェントを構造化された「AIカンパニー」に組織するオープンソースのコントロールプレーンです。組織図、チケット、予算、監査ログなどのツールを提供し、共通の目標に向かって彼らの作業を調整します。

PaperclipはCrewAIやAutoGenとどう違うのですか?

CrewAIやAutoGenのようなツールはエージェントのワークフロー(例:リサーチャー -> ライター -> レビュアー)の構築を支援しますが、Paperclipはより高いレベルで動作します。単なるタスクのシーケンスではなく、これらのワークフローを取り巻く「マネージャー」または「会社構造」として機能し、目標設定、委任、予算編成、監督を処理します。

Paperclip AIは無料でセルフホスト型ですか?

はい、Paperclipはオープンソースであり、ローカルで実行するように設計されています。ご自身のマシンにセットアップでき、クラウドサービスに依存することなく、データ、エージェント、コストを完全に制御できます。

AIエージェントカンパニーの主な制限は何ですか?

主な制限には、高いトークン消費(APIコスト)の可能性、適切に設定されていない場合にエージェントがループに陥ったり、無意味なタスクを作成したりする可能性、そして単純な単一エージェントタスクには複雑さが過剰であることなどが挙げられます。

🚀もっと見る

AI最前線をキャッチアップ

Stork.AIが厳選したAIツール、エージェント、MCPサーバーをご覧ください。

すべての記事に戻る