Skip to content

AIが12日間稼働し、Excelを完璧にクローン

AIエージェントはたった6語のプロンプトを与えられ、Microsoft Excelをクローンするために12日間連続で稼働しました。その結果、完全に機能するレプリカが完成し、自律型エージェントが信じられないほど複雑で長期間にわたるタスクを処理できることが証明されました。

Nora Vance
Hero image for: AIが12日間稼働し、Excelを完璧にクローン

要約 / ポイント

AIエージェントはたった6語のプロンプトを与えられ、Microsoft Excelをクローンするために12日間連続で稼働しました。その結果、完全に機能するレプリカが完成し、自律型エージェントが信じられないほど複雑で長期間にわたるタスクを処理できることが証明されました。

アプリを生み出した6語のプロンプト

Matthew Bermanは、「/goal clone Excel, full feature parity.」という簡潔な6語のプロンプトで画期的な実験を開始しました。この指示は、「Codex」と名付けられたAIエージェントに、Microsoftのユビキタスなスプレッドシートソフトウェアを複製するという野心的なミッションを与えました。エージェントのタスクは、単に模倣するだけでなく、完全な機能的同等性を達成することでした。

次に展開されたことは、自律型AIエージェントの能力における大きな飛躍を示しました。Codexは12日以上にわたり監視なしで稼働し、Bermanが手動でプロセスを停止するまで、その目標に向かって熱心に作業を続けました。この前例のない持続性は、AIエージェントが短期間の指示に従うものという従来の概念を打ち破り、長期間にわたって複雑な操作を維持する能力を実証しました。

この実験は、AIエージェントが単純な逐次コマンドの実行を超えて進化しているという深い変化を示しています。代わりに、彼らは今や長期的な目標追求と洗練されたタスク分解を示し、Excelのクローン作成のような巨大な目標を独立して分解しています。Codexは実際のExcelデスクトップアプリのすべての機能を分析し、その後、それらを独自のバージョンで体系的に複製し、複雑な自己主導型開発能力を証明しました。

AIが構築したExcelクローンの解体

簡潔な6語のコマンドに促され、「Codex」と名付けられたAIエージェントは、野心的な12日間のミッションに着手しました。それは単にコードを生成するだけでなく、Matthew BermanのPC上でMicrosoft Excelのデスクトップバージョンを自律的に開きました。Codexはその後、ライブアプリケーション内の「すべての機能」を綿密に分析し、そのメカニズムとユーザーインターフェースを解体しました。

その結果、驚くほど正確なExcelクローンが完成しました。Bermanはその検証済みの機能を紹介し、主要機能のほぼ完璧な複製を確認しました。ユーザーは列を調整して強調表示したり、「1+2」のような数式を入力して即座に出力したり、データを昇順にシームレスに並べ替えたりすることもできました。これは表面的なモックアップではなく、深く機能的なレプリカでした。

Bermanはその品質に驚きを表明し、AIが構築したアプリケーションを「美しい」そして「機能的に完全」と表現しました。彼は、主要な操作においてオリジナルと視覚的に区別できないことを指摘し、「完璧」だと宣言しました。12日以上にわたって稼働したこの自律的なプロセスは、AIエージェントが複雑なソフトウェアを理解し、複製し、出荷する能力における大きな飛躍を強調しています。

数日間にわたるAIタスクを可能にする技術

自律型AIエージェントは、Bermanの数日間にわたる実験に代表されるように、基礎的な変化として急速に台頭しています。これらのシステムが複雑で長期間にわたるタスクを完了する能力は、約7ヶ月ごとに倍増しており、単純な反応型プロンプトの限界を超えています。この絶え間ない進歩は、AIをクエリ応答エンジンから、積極的で持続的な共同作業者へと変貌させています。

この持続性を支えているのは、LangChainのような洗練されたエージェントフレームワークとハーネスです。これらのアーキテクチャは、外部ツールを統合し、多段階プロセスをオーケストレーションすることで、長期間にわたる操作に不可欠な足場を提供します。それらは内部状態を管理し、時間の経過とともに一貫した計画を維持し、タスクの反復分析を促進することで、エージェントがExcelのフル機能クローン作成のような複雑なプロジェクトをナビゲートできるようにします。

数日間にわたる運用は、コンテキストドリフトやメモリ過負荷といった重大な技術的課題をもたらします。以前のAIモデルは、長時間のセッションにわたって焦点と関連情報を維持するのに苦労していました。現代のエージェント設計は、高度なメモリシステム、階層型計画モジュール、選択的情報検索を通じてこれらの問題に対処し、エージェントが初期の目標に沿った状態を保ち、時間の経過によるパフォーマンスの低下を防ぎます。関連する開発に関する詳細については、Codex is becoming a productivity tool for everyone - OpenAIをご覧ください。

アプリのクローン作成からワークフローの所有へ

Berman氏の「Excelをクローンする」デモンストレーションは、業界全体の加速と一致する強力なシグナルです。私たちは、単純なコード生成を超えて、AIを活用したアプリケーション開発ツールや深く統合されたAI生産性ソフトウェアの急速な台頭を目の当たりにしています。エージェントは単なるアシスタントから、既存のソフトウェアを分析し、ユーザーの意図を理解し、開発サイクルを自律的に推進できる能動的な参加者へと進化しています。

Enjoying this? Get one like it in your inbox each morning.

one email a day · unsubscribe in two clicks · no third-party tracking

この進歩は、AIエージェントが永続的で、アイデンティティを持つソフトウェアの同僚となる未来を示唆しています。彼らは複雑なワークフローを自律的に管理し、複数のアプリケーションやサービスにわたるタスクを調整し、人間の介入を最小限に抑えます。Gartnerの2025年AIハイプサイクルでは、エージェントが最も急速に進歩しているテクノロジーの1つとして特定されており、2026年までにこの統合されたAIの同僚という現実を予測しています。

このエージェント革命に起因する経済的変化は深く、あらゆる分野に影響を与えています。エージェントAIの市場は、2024年の50億ドルから2034年までに2000億ドルへと爆発的な成長を遂げると予測されています。この大規模な拡大は、主にエンタープライズオートメーションによって推進され、世界中の産業における業務効率、イノベーションサイクル、価値創造を根本的に再定義するでしょう。

よくある質問

AIにExcelをクローンさせるためにどのようなプロンプトが使用されましたか?

AIには、Matthew Berman氏によって「/goal Clone Excel, full feature parity.」というシンプルな6語のプロンプトが与えられました。これが数日間にわたるプロセス全体を開始しました。

AIエージェントは停止されるまでにどれくらいの期間実行されましたか?

Codexと呼ばれるAIエージェントは、Matthew Berman氏が手動で停止するまで12日以上自律的に実行されました。彼は、さらに長く継続できた可能性があると推測しました。

自律型AIエージェントとは何ですか?

自律型AIエージェントとは、人間の直接的な介入なしに、長期間にわたって複雑な多段階タスクを独立して計画、推論、実行できるシステムです。彼らは単純なツールから、永続的な「ソフトウェアの同僚」へと進化しています。

クローンされたExcelのバージョンは完全に機能しましたか?

クローンされたアプリケーションは、調整可能な列、機能する数式、セル書式設定、データ並べ替えなど、重要なコア機能を示しました。示されたコアタスクについては「機能が完全である」と説明されました。

Found this useful? Share it.

One short daily email of tools worth shipping. No drip funnel.

one email a day · unsubscribe in two clicks · no third-party tracking

🚀もっと見る

AI最前線をキャッチアップ

Stork.AIが厳選したAIツール、エージェント、MCPサーバーをご覧ください。

P.S. 使えるものを作りましたか? Storkに掲載