overview
Qu'est-ce qu'Arena Agent Mode ?
Arena Agent Mode est un outil de plateforme d'évaluation d'IA développé par Arena (anciennement LMArena) qui permet aux passionnés d'IA, aux chercheurs et aux entreprises d'évaluer les performances des modèles de langage de grande taille (LLMs) de pointe sur des tâches complexes et multi-étapes. Il facilite l'évaluation en conditions réelles et le classement communautaire des modèles d'IA à travers diverses modalités, y compris la génération de texte, de code et d'images. Lancé le 4 juin 2026, Agent Mode mesure spécifiquement les performances agentiques en permettant aux modèles d'utiliser des outils comme la recherche web, le système de fichiers (filesystem), bash et la génération d'images dans des millions de sessions en direct. Arena AI adhère à une politique d'IA responsable (Responsible AI Policy), appliquant les principes de transparence, de sécurité et de supervision humaine, en accord avec les réglementations en évolution telles que l'EU AI Act et le Data Act. Les données des clients sont protégées, non utilisées pour l'entraînement de modèles en dehors de l'instance du client, et les entrées/sorties des requêtes d'IA sont enregistrées uniquement à des fins d'audit et d'optimisation des performances.