Promptfoo
Shares tags: analyze, monitoring & evaluation, eval harnesses
Évaluez et sécurisez sans effort vos intégrations LLM grâce au cadre de test avancé de Promptfoo.
Outils similaires
D'autres outils à considérer
Promptfoo
Shares tags: analyze, monitoring & evaluation, eval harnesses
Ragas
Shares tags: analyze, monitoring & evaluation, eval harnesses
Weights & Biases Weave
Shares tags: analyze, monitoring & evaluation, eval harnesses
LangSmith Eval Harness
Shares tags: analyze, monitoring & evaluation, eval harnesses
<a href="https://www.stork.ai/en/promptfoo" target="_blank" rel="noopener noreferrer"><img src="https://www.stork.ai/api/badge/promptfoo?style=dark" alt="Promptfoo - Featured on Stork.ai" height="36" /></a>
[](https://www.stork.ai/en/promptfoo)
overview
Promptfoo est un cadre de test de prompts compatible avec CLI/CI, conçu pour une évaluation rigoureuse et une sécurité des grands modèles linguistiques (LLMs). Avec un accent sur l'amélioration des performances et la conformité, il s'adresse aussi bien aux startups qu'aux organisations de grande envergure.
features
Promptfoo regorge de fonctionnalités qui améliorent les tests de LLM, en faisant un outil essentiel pour les développeurs et les équipes de sécurité. Grâce à une convivialité accrue et des métriques puissantes, vous pouvez obtenir des informations exploitables rapidement.
use cases
Promptfoo est conçu pour les développeurs, les équipes de sécurité des applications et les organisations qui nécessitent des évaluations approfondies de leurs systèmes d'IA. Que vous soyez une startup innovant dans le domaine de l'IA ou une entreprise du Fortune 500 gérant des risques de conformité, notre plateforme est développée pour répondre à vos besoins.
Promptfoo propose des fonctionnalités de sécurité complètes, incluant des rapports de remédiation automatisés et une gestion améliorée des jetons et des identifiants, garantissant une approche proactive pour sécuriser vos modèles d'IA.
Bien sûr ! Promptfoo est conçu avec l'intégration CI/CD à l'esprit, vous permettant d'incorporer sans effort des évaluations LLM dans vos flux de développement.
Promptfoo prend en charge plusieurs fournisseurs de LLM de premier plan, notamment OpenAI GPT-5, Anthropic Claude Opus 4.1, xAI Grok Code Fast et Gemini 2.5 Flash de Google.
Plus sur Stork
Plus d'outils dans cette catégorie, classés par signal communautaire
Ragas
📊 Analyze
Harnais d’évaluation spécifique à RAG avec métriques.
Invitefoo
📊 Analyze
Exploitation CLI comparant les variantes d'invite à grande échelle.
Arize Phoenix Évaluations
📊 Analyze
Exploitation open source pour les évaluations par lots et en streaming.
Tissage de poids et de biais
📊 Analyze
Harnais d’évaluation LLM avec support d’ensemble de données + rubrique.
Équipe rouge de renseignement robuste
📊 Analyze
Tests de résistance automatisés couvrant la toxicité et les biais.
Équipe rouge de Cranium AI
📊 Analyze
Plateforme d'évaluations contradictoires basées sur des scénarios.
For builders
AI agents read it. Buyers find it. Backlinks accrue. Your tool can have one too — live in 24 hours, indexed by Claude, ChatGPT, and Perplexity, queryable via MCP.