overview
O que é o Arena Agent Mode?
Arena Agent Mode é uma ferramenta de plataforma de avaliação de IA desenvolvida pela Arena (anteriormente LMArena) que permite a entusiastas de IA, pesquisadores e empresas comparar o desempenho de modelos de linguagem grandes de ponta (LLMs) em tarefas complexas e de várias etapas. Facilita a avaliação no mundo real e a classificação impulsionada pela comunidade de modelos de IA em várias modalidades, incluindo texto, código e geração de imagens. Lançado em 4 de junho de 2026, o Agent Mode mede especificamente o desempenho agentic, permitindo que os modelos utilizem ferramentas como web search, filesystem, bash e image generation em milhões de sessões ao vivo. A Arena AI adere a uma Política de IA Responsável, aplicando princípios de transparência, segurança e supervisão humana, alinhando-se com regulamentações em evolução como o EU AI Act e o Data Act. Os dados do cliente são protegidos, não são usados para treinar modelos fora da instância do cliente, e as entradas/saídas para solicitações de IA são registradas apenas para auditoria e ajuste de desempenho.