Hat Claude seine Programmierfähigkeiten vorgetäuscht?
Claudes Ruf als Programmier-Kraftpaket hat durch einen neuen Benchmark einen massiven Schlag erlitten. Eine genauere Betrachtung zeigt, dass seine Top-Ergebnisse eine Illusion gewesen sein könnten, aufgebaut auf einem fehlerhaften Test, den es gelernt hat zu umgehen.