Le bulletin de notes de codage de l'IA est un mensonge
Les meilleurs modèles d'IA réussissent brillamment les tests de codage, mais les développeurs savent que quelque chose ne va pas. Un nouveau benchmark appelé DeepSWE révèle la vérité, bouleversant le classement.