overview
Was ist DeepSWE?
DeepSWE ist ein von Datacurve entwickeltes AI-Coding-Benchmark-Tool, das Forschern, Modell-Anbietern und Ingenieurteams ermöglicht, die echten Problemlösungsfähigkeiten von agentischer AI in neuartigen, ungesehenen Szenarien zu bewerten. Es bietet eine kontaminationsfreie Umgebung zur Beurteilung der AI-Leistung bei realistischen, langfristigen Software-Engineering-Aufgaben.