대규모 언어 모델을 평가하고 비교할 수 있는 오픈 플랫폼입니다. GPT-4, Claude, Gemini 등 다양한 모델을 간편하게 나란히 비교해 보세요.
Similar Tools
Other tools you might consider
TruLens
Shares the same subcategory
Galileo Judge
LangSmith Evaluations
Promptfoo
overview
대규모 언어 모델을 평가하고 비교하기 위한 오픈 플랫폼으로, 크라우드 소싱된 배틀을 통해 진행됩니다. GPT-4, 클로드, 제미니 등을 나란히 비교해 보세요.