Devin, the first AI software engineer.
Devin es el nuevo estado del arte en el benchmark de programación SWE-Bench, ha pasado con éxito entrevistas de ingeniería práctica de las principales empresas de IA e incluso ha completado trabajos reales en Upwork. Devin es un agente autónomo que resuelve tareas de ingeniería utilizando su propia terminal, editor de código y navegador web. Cuando se evalúa en el benchmark SWE-Bench, que requiere que una IA resuelva problemas de GitHub encontrados en proyectos de código abierto del mundo real, Devin resuelve correctamente el 13,86% de los problemas sin ayuda, superando con creces el rendimiento del modelo anterior estado del arte del 1,96% sin ayuda y 4,80% asistido....