ديفين هو أحدث التقنيات في مجال البرمجة على تقنية طاقة الحالة الجديدة في اختبار كنش تشيز على البرمجة (SWE-Bench). لقد نجح في اجتياز المقابلات الهندسية العملية من قبل شركات الذكاء الاصطناعي الرائدة، وحتى أكمل وظائف حقيقية على Upwork.
ديفين هو وكيل ذاتي القدرة يحل المهام الهندسية من خلال استخدام قذيفته الخاصة، ومحرر البرمجة، والمتصفح الإلكتروني.
عندما يتم تقييمه على اختبار SWE-Bench، الذي يطلب من الذكاء الاصطناعي حل مشكلات GitHub الموجودة في مشاريع مفتوحة المصدر في العالم الحقيقي، يحل ديفين بشكل صحيح 13.86% من المشكلات بدون مساعدة، ويتفوق بكثير على أداء النموذج المتقدم السابق البالغ 1.96% بدون مساعدة و 4.80% بمساعدة.
شاهد ما يمكن لديفين أن يقوم به في الموضوع أدناه.
لمزيد من التفاصيل حول ديفين، تفضل بزيارة المدونة هنا: https://cognition-labs.com/blog
1/4 ديفين يمكنه تعلم كيفية استخدام تقنيات غير مألوفة.
2/4 ديفين يمكنه المساهمة في مستودعات الإنتاج الناضجة.
3/4 ديفين يمكنه تدريب وضبط نماذج ذكاء اصطناعي خاصة به.
4/4 حتى جربنا اعطاء ديفين وظائف حقيقية على Upwork وكان قادرًا على القيام بها أيضًا!
للاطلاع على مزيد من التفاصيل حول ديفين، تفضل بزيارة المدونة https://cognition-labs.com/blog