overview
O que é DeepSWE?
DeepSWE é uma ferramenta de benchmark de codificação de IA desenvolvida pela Datacurve que permite a pesquisadores, provedores de modelos e equipes de engenharia avaliar as capacidades genuínas de resolução de problemas de IA agentica em cenários novos e nunca antes vistos. Ele fornece um ambiente livre de contaminação para avaliar o desempenho da IA em tarefas de engenharia de software realistas e de longo prazo.