overview
¿Qué es Arena Agent Mode?
Arena Agent Mode es una herramienta de plataforma de evaluación de IA desarrollada por Arena (anteriormente LMArena) que permite a entusiastas de la IA, investigadores y empresas comparar el rendimiento de modelos de lenguaje grandes (LLM) de vanguardia en tareas complejas y de varios pasos. Facilita la evaluación en el mundo real y la clasificación impulsada por la comunidad de modelos de IA en diversas modalidades, incluyendo texto, código y generación de imágenes. Lanzado el 4 de junio de 2026, Agent Mode mide específicamente el rendimiento agéntico al permitir que los modelos utilicen herramientas como búsqueda web, sistema de archivos, bash y generación de imágenes en millones de sesiones en vivo. Arena AI se adhiere a una Política de IA Responsable, aplicando principios de transparencia, seguridad y supervisión humana, alineándose con regulaciones en evolución como la EU AI Act y la Data Act. Los datos del cliente están protegidos, no se utilizan para entrenar modelos fuera de la instancia del cliente, y las entradas/salidas para las solicitudes de IA se registran únicamente para auditoría y ajuste de rendimiento.