Devin ist der neue State-of-the-Art im SWE-Bench-Coding-Benchmark, hat erfolgreich praktische Ingenieurgespräche bei führenden KI-Unternehmen bestanden und sogar echte Jobs auf Upwork erledigt.
Devin ist ein autonomer Agent, der Ingenieuraufgaben mithilfe seiner eigenen Shell, des Code-Editors und des Webbrowsers löst.
Bei der Auswertung des SWE-Bench-Benchmarks, bei dem eine KI GitHub-Probleme in Open-Source-Projekten lösen soll, löst Devin unabhängig 13,86% der Probleme korrekt und übertrifft damit deutlich die bisherige Bestleistung des Modells von 1,96% unabhängig und 4,80% unterstützt.
Sehen Sie, was Devin im folgenden Thread kann.
Devin, der erste KI-Softwareingenieur
1/4 Devin kann lernen, wie man mit unbekannten Technologien umgeht.
lernen, wie man mit unbekannten Technologien umgeht
2/4 Devin kann zu etablierten Produktionsrepositories beitragen.
zu etablierten Produktionsrepositories beitragen
3/4 Devin kann seine eigenen KI-Modelle trainieren und optimieren.
eigene KI-Modelle trainieren und optimieren
4/4 Wir haben Devin sogar echte Jobs auf Upwork gegeben und es konnte diese auch erledigen!
hat echte Jobs auf Upwork erledigt
Für weitere Einzelheiten zu Devin besuchen Sie den Blogbeitrag hier: https://cognition-labs.com/blog