Devin, the first AI software engineer.
Devin ist der neue State-of-the-Art im SWE-Bench-Coding-Benchmark, hat erfolgreich praktische Ingenieurgespräche bei führenden KI-Unternehmen bestanden und sogar echte Jobs auf Upwork erledigt. Devin ist ein autonomer Agent, der Ingenieuraufgaben mithilfe seiner eigenen Shell, des Code-Editors und des Webbrowsers löst. Bei der Auswertung des SWE-Bench-Benchmarks, bei dem eine KI GitHub-Probleme in Open-Source-Projekten lösen soll, löst Devin unabhängig 13,86% der Probleme korrekt und übertrifft damit deutlich die bisherige Bestleistung des Modells von 1,96% unabhängig und 4,80% unterstützt....