overview
O que é Agent Arena?
Agent Arena é uma plataforma de avaliação e comparação de modelos de IA desenvolvida pela Arena.ai que permite a pesquisadores, desenvolvedores e organizações de IA avaliar e comparar modelos de IA de ponta (LLMs, imagem, código, vídeo, visão, documento, pesquisa) através de comparações anônimas lado a lado e votação humana. Ela molda classificações públicas para modelos de IA com base em feedback humano do mundo real, fornecendo um ambiente dinâmico para entender o desempenho da IA além de benchmarks sintéticos. O 'Agent Mode' da plataforma, lançado em 4 de junho de 2026, foca especificamente na avaliação de agentes LLM autônomos que lidam com tarefas complexas e multi-etapas dentro de um ambiente sandbox.