大規模言語モデルをクラウドソーシングによるバトルを通じて評価・比較するためのオープンプラットフォーム。GPT-4、Claude、Geminiなどを並べて比較できます。
Similar Tools
Other tools you might consider
TruLens
Shares the same subcategory
Galileo Judge
LangSmith Evaluations
Promptfoo
overview
大規模言語モデルを評価し、クラウドソーシングによるバトルで比較するオープンプラットフォーム。GPT-4、Claude、Geminiなどを並べて比較できます。