Ragas
Shares tags: analyze, monitoring & evaluation, eval harnesses
A Solução de Código Aberto para Avaliações em Lote e em Streaming
Ferramentas similares
Outras ferramentas a considerar
Ragas
Shares tags: analyze, monitoring & evaluation, eval harnesses
LangSmith Eval Harness
Shares tags: analyze, monitoring & evaluation, eval harnesses
TruLens
Shares tags: analyze, monitoring & evaluation, eval harnesses
Promptfoo
Shares tags: analyze, monitoring & evaluation, eval harnesses
<a href="https://www.stork.ai/en/arize-phoenix-evaluations" target="_blank" rel="noopener noreferrer"><img src="https://www.stork.ai/api/badge/arize-phoenix-evaluations?style=dark" alt="Arize Phoenix Evaluations - Featured on Stork.ai" height="36" /></a>
[](https://www.stork.ai/en/arize-phoenix-evaluations)
overview
Arize Phoenix Evaluations é uma ferramenta inovadora de código aberto, projetada para usuários que necessitam de avaliações robustas em lote e em streaming. Ela oferece a flexibilidade e o poder necessários para analisar o desempenho do modelo e garantir resultados otimizados.
features
Arize Phoenix oferece uma gama de recursos que facilitam processos de avaliação abrangentes. Desde fluxos de trabalho personalizáveis até monitoramento de desempenho em tempo real, é projetado para aprimorar sua experiência de análise.
use cases
Seja você do setor financeiro, de saúde ou de tecnologia, o Arize Phoenix foi desenvolvido para atender a múltiplos setores. Descubra como ele pode transformar suas estratégias de avaliação e impulsionar decisões informadas.
A Arize Phoenix oferece um modelo pago com diversos planos de preços, adaptados para atender às necessidades de diferentes usuários e organizações.
Claro! Arize Phoenix foi projetado para ser escalável, tornando-se uma excelente opção tanto para pequenas equipes quanto para grandes empresas.
Começar é simples! Visite nosso site em https://arize.com/phoenix para acessar recursos e guias de instalação para configurar seu suporte de avaliação.
Mais no Stork
Mais ferramentas nesta categoria, classificadas por sinal da comunidade
Ragas
📊 Analyze
Equipamento de avaliação específico do RAG com métricas.
Promptfoo
📊 Analyze
Aproveite a CLI comparando variantes de prompt em escala.
Tecido de pesos e preconceitos
📊 Analyze
Arnês de avaliação LLM com conjunto de dados + suporte de rubrica.
Equipe Vermelha de Inteligência Robusta
📊 Analyze
Testes de estresse automatizados cobrindo toxicidade e preconceito.
Equipe Vermelha Cranium AI
📊 Analyze
Plataforma para avaliações adversárias baseadas em cenários.
Equipe Vermelha Lakera
📊 Analyze
Testes contínuos de jailbreak com corpora de ataques selecionados.
For builders
AI agents read it. Buyers find it. Backlinks accrue. Your tool can have one too — live in 24 hours, indexed by Claude, ChatGPT, and Perplexity, queryable via MCP.