Devin est le nouvel état de l’art sur le référentiel de codage SWE-Bench, a réussi avec succès des entretiens d’ingénierie pratique auprès des principales entreprises d’IA, et a même réalisé de vrais travaux sur Upwork.

Devin est un agent autonome qui résout des tâches d’ingénierie en utilisant son propre shell, éditeur de code et navigateur web.

Lorsqu’il est évalué sur le benchmark SWE-Bench, qui demande à une IA de résoudre des problèmes GitHub trouvés dans des projets open source du monde réel, Devin résout correctement 13,86% des problèmes sans assistance, dépassant largement les performances précédentes du modèle de référence de 1,96% sans assistance et 4,80% avec assistance.

Découvrez ce que Devin peut faire dans le fil de discussion ci-dessous.

Devin, le premier ingénieur logiciel IA

1/4 Devin peut apprendre à utiliser des technologies inconnues.

apprendre à utiliser des technologies inconnues

2/4 Devin peut contribuer à des référentiels de production matures.

contribuer à des référentiels de production matures

3/4 Devin peut entraîner et affiner ses propres modèles d’IA.

entraîner et affiner ses propres modèles d'IA

4/4 Nous avons même essayé de confier de vrais travaux à Devin sur Upwork et il a réussi à les faire aussi !

a fait les vrais travaux sur Upwork

Pour plus de détails sur Devin, consultez l’article de blog ici : https://cognition-labs.com/blog