Девин - новый передовой продукт на бенчмарке кодирования SWE-Bench и успешно прошёл практические технические интервью ведущих компаний по искусственному интеллекту. Он даже выполнял реальные задачи на платформе Upwork.
Девин - автономный агент, который решает инженерные задачи при помощи своей собственной оболочки, редактора кода и веб-браузера.
При оценке на бенчмарке SWE-Bench, который требует от ИИ решения проблем GitHub, найденных в реальных проектах с открытым исходным кодом, Девин правильно решает 13,86% проблем, не прибегая к помощи, что значительно превосходит прошлую передовую модель с результатом 1,96% без помощи и 4,80% с помощью.
Ознакомьтесь с возможностями Девина в следующем сообщении.
Девин, первый ИИ-инженер
1/4 Девин может освоить работу с незнакомыми технологиями.
научиться работе с незнакомыми технологиями
2/4 Девин может вносить вклад в зрелые производственные репозитории.
вносить вклад в зрелые производственные репозитории
3/4 Девин может обучать и настраивать собственные модели искусственного интеллекта.
обучать и настраивать собственные модели искусственного интеллекта
4/4 Мы даже попробовали поручить Девину выполнение реальных задач на Upwork, и он успешно справился!
выполнил реальные задания на Upwork
Для получения дополнительной информации о Девине ознакомьтесь со статьей на блоге: https://cognition-labs.com/blog