overview
Arena Agent Modeとは?
Arena Agent Modeは、Arena(旧LMArena)が開発したAI評価プラットフォームツールであり、AI愛好家、研究者、企業が、複雑な多段階タスクにおける最先端の大規模言語モデル(LLM)のパフォーマンスをベンチマークすることを可能にします。テキスト、コード、画像生成を含む様々なモダリティにわたるAIモデルの実際の評価とコミュニティ主導のランキングを促進します。2026年6月4日にローンチされたAgent Modeは、数百万のライブセッションでモデルがウェブ検索、ファイルシステム、bash、画像生成などのツールを利用できるようにすることで、エージェント性能を具体的に測定します。Arena AIは、透明性、セキュリティ、人間による監視の原則を遵守する責任あるAIポリシーに従い、EU AI ActやData Actなどの進化する規制に準拠しています。顧客データは保護され、顧客のインスタンス外でのモデルトレーニングには使用されず、AIリクエストの入力/出力は監査とパフォーマンスチューニングのためだけに記録されます。