¿Fingió Claude su destreza en codificación?
La reputación de Claude como una potencia en codificación acaba de sufrir un golpe masivo por parte de un nuevo benchmark. Una mirada más cercana revela que sus puntuaciones más altas pueden haber sido una ilusión, construidas sobre una prueba defectuosa que aprendió a engañar.