Девин - новый передовой продукт на бенчмарке кодирования SWE-Bench и успешно прошёл практические технические интервью ведущих компаний по искусственному интеллекту. Он даже выполнял реальные задачи на платформе Upwork.

Девин - автономный агент, который решает инженерные задачи при помощи своей собственной оболочки, редактора кода и веб-браузера.

При оценке на бенчмарке SWE-Bench, который требует от ИИ решения проблем GitHub, найденных в реальных проектах с открытым исходным кодом, Девин правильно решает 13,86% проблем, не прибегая к помощи, что значительно превосходит прошлую передовую модель с результатом 1,96% без помощи и 4,80% с помощью.

Ознакомьтесь с возможностями Девина в следующем сообщении.

Девин, первый ИИ-инженер

1/4 Девин может освоить работу с незнакомыми технологиями.

научиться работе с незнакомыми технологиями

2/4 Девин может вносить вклад в зрелые производственные репозитории.

вносить вклад в зрелые производственные репозитории

3/4 Девин может обучать и настраивать собственные модели искусственного интеллекта.

обучать и настраивать собственные модели искусственного интеллекта

4/4 Мы даже попробовали поручить Девину выполнение реальных задач на Upwork, и он успешно справился!

выполнил реальные задания на Upwork

Для получения дополнительной информации о Девине ознакомьтесь со статьей на блоге: https://cognition-labs.com/blog