overview
Was ist Arena Agent Mode?
Arena Agent Mode ist ein von Arena (ehemals LMArena) entwickeltes KI-Bewertungsplattform-Tool, das KI-Enthusiasten, Forschern und Unternehmen ermöglicht, die Leistung führender großer Sprachmodelle (LLMs) bei komplexen, mehrstufigen Aufgaben zu benchmarken. Es erleichtert die reale Bewertung und das community-gesteuerte Ranking von KI-Modellen über verschiedene Modalitäten hinweg, einschließlich Text-, Code- und Bildgenerierung. Am 4. Juni 2026 eingeführt, misst Agent Mode speziell die agentische Leistung, indem es Modellen erlaubt, Tools wie Websuche, Dateisystem, Bash und Bildgenerierung in Millionen von Live-Sitzungen zu nutzen. Arena AI hält sich an eine Responsible AI Policy, die Prinzipien der Transparenz, Sicherheit und menschlichen Aufsicht durchsetzt und sich an sich entwickelnde Vorschriften wie den EU AI Act und Data Act anpasst. Kundendaten werden geschützt, nicht zum Trainieren von Modellen außerhalb der Kundeninstanz verwendet, und Eingaben/Ausgaben für KI-Anfragen werden ausschließlich zu Prüfungs- und Leistungsoptimierungszwecken protokolliert.