El boletín de calificaciones de codificación de la IA es una mentira
Los principales modelos de IA están sobresaliendo en las pruebas de codificación, pero los desarrolladores saben que algo anda mal. Un nuevo benchmark llamado DeepSWE expone la verdad, dando un vuelco a la clasificación.