overview
¿Qué es DeepSWE?
DeepSWE es una herramienta de benchmark de codificación de IA desarrollada por Datacurve que permite a investigadores, proveedores de modelos y equipos de ingeniería evaluar las capacidades genuinas de resolución de problemas de la IA agéntica en escenarios novedosos e inéditos. Proporciona un entorno libre de contaminación para evaluar el rendimiento de la IA en tareas de ingeniería de software realistas y de largo alcance.