Devin, the first AI software engineer.
Devin은 SWE-Bench 코딩 벤치마크에서 최신 기술입니다. 주요 AI 기업들의 실제 엔지니어링 면접을 성공적으로 통과하였으며, Upwork에서 실제 작업도 완료하였습니다. Devin은 자체 쉘, 코드 편집기, 웹 브라우저를 사용하여 엔지니어링 작업을 해결하는 자율 에이전트입니다. SWE-Bench 벤치마크에서 평가를 받았을 때, Devin은 실제 오픈 소스 프로젝트에서 발견된 GitHub 이슈를 해결하는 것을 요구합니다. 이를 통해 Devin은 13.86%의 이슈를 보조 없이 정확하게 해결하였으며, 보조 없이 1.96%의 성능을 가진 이전의 최고 모델을 크게 능가하였습니다. 아래 스레드에서 Devin이 할 수 있는 일을 확인해보세요....