Devin은 SWE-Bench 코딩 벤치마크에서 최신 기술입니다. 주요 AI 기업들의 실제 엔지니어링 면접을 성공적으로 통과하였으며, Upwork에서 실제 작업도 완료하였습니다.
Devin은 자체 쉘, 코드 편집기, 웹 브라우저를 사용하여 엔지니어링 작업을 해결하는 자율 에이전트입니다.
SWE-Bench 벤치마크에서 평가를 받았을 때, Devin은 실제 오픈 소스 프로젝트에서 발견된 GitHub 이슈를 해결하는 것을 요구합니다. 이를 통해 Devin은 13.86%의 이슈를 보조 없이 정확하게 해결하였으며, 보조 없이 1.96%의 성능을 가진 이전의 최고 모델을 크게 능가하였습니다.
아래 스레드에서 Devin이 할 수 있는 일을 확인해보세요.
Devin, 첫 번째 AI 소프트웨어 엔지니어
1/4 Devin은 익숙하지 않은 기술을 사용하는 방법을 학습할 수 있습니다.
익숙하지 않은 기술을 사용하는 방법을 학습하기
2/4 Devin은 성장한 제작 저장소에 기여할 수 있습니다.
성장한 제작 저장소에 기여하기
3/4 Devin은 자체 AI 모델을 훈련하고 세부 조정할 수 있습니다.
자체 AI 모델 훈련 및 세부 조정하기
4/4 우리는 실제 Upwork 작업을 Devin에게도 시켜보았고, Devin은 그 작업도 완료할 수 있었습니다!
Upwork에서 실제 작업을 수행하기
Devin에 대한 자세한 내용은 다음 블로그 글을 확인하세요: https://cognition-labs.com/blog