Devin, the first AI software engineer.
Devin est le nouvel état de l’art sur le référentiel de codage SWE-Bench, a réussi avec succès des entretiens d’ingénierie pratique auprès des principales entreprises d’IA, et a même réalisé de vrais travaux sur Upwork. Devin est un agent autonome qui résout des tâches d’ingénierie en utilisant son propre shell, éditeur de code et navigateur web. Lorsqu’il est évalué sur le benchmark SWE-Bench, qui demande à une IA de résoudre des problèmes GitHub trouvés dans des projets open source du monde réel, Devin résout correctement 13,86% des problèmes sans assistance, dépassant largement les performances précédentes du modèle de référence de 1,96% sans assistance et 4,80% avec assistance....