overview
Agent Arena란 무엇인가요?
Agent Arena는 Arena.ai가 개발한 AI 모델 평가 및 비교 플랫폼으로, AI 연구자, 개발자 및 조직이 익명으로 이루어지는 나란히 비교와 인간 투표를 통해 최첨단 AI 모델(LLMs, 이미지, 코드, 비디오, 비전, 문서, 검색)을 평가하고 비교할 수 있도록 합니다. 이는 실제 인간 피드백을 기반으로 AI 모델의 공개 리더보드를 형성하며, 합성 벤치마크를 넘어 AI 성능을 이해하기 위한 동적인 환경을 제공합니다. 2026년 6월 4일에 출시된 이 플랫폼의 'Agent Mode'는 샌드박스 환경 내에서 복잡한 다단계 작업을 처리하는 자율적인 LLM 에이전트의 평가에 특별히 중점을 둡니다.