AlpacaEval 2.0

عمل Meta AI المبتكر يقدم نموذجًا لغويًا يتحسن ذاتيًا ويبتكر إنتاج واستخدام بيانات تدريبه الخاصة. تمكّن هذه الطريقة الذاتية النمو النموذج من تطوير قدراته تدريجيًا، وتفوق على نظرائه البارزة مثل Claude 2 وGemini Pro وGPT-4 0613 في تصنيف AlpacaEval 2.0.

وفيما يلي كيفية عمله:

البدء: يبدأ بنموذج لغوي مدرب مسبقًا وعينة من البيانات التدريبية الموسومة بواسطة البشر.
إنشاء التعليمات الذاتية: يقوم النموذج بإنشاء تعليمات جديدة ذاتيًا من البيانات الأصلية، ثم يصيغ مجموعة من الإجابات المحتملة.
التقييم الذاتي: يقوم النموذج بتقييم وتسجيل كل استجابة استنادًا إلى معايير مثل الصلة والدقة الواقعية.
إنتاج بيانات التدريب: يتم اختيار الإجابات المثلى والمُقلة لإنشاء مجموعة تدريب متنوعة، والتي تعلم النموذج التمييز بين الإجابات عالية الجودة والجودة المنخفضة.
التدريب المتكرر: بواسطة مجموعة التدريب الجديدة، يقوم النموذج بإعادة تدريب نفسه، ويكرر هذه العملية باستمرار للتحسين الذاتي التدريجي.

من خلال استغلال هذا النهج المبتكر، يعتمد النموذج على الرؤى التي ينشئها بنفسه، مما يقلل من اعتماده على الموارد الخارجية ويحسّن قدرات التقييم الذاتي. يتحسن الموديل بكل تكرار، فإنه يكشف الطريق نحو أنظمة لغوية ذكاء اصطناعي أكثر استقلالية.

اكتشف المنهجية الكاملة في ورقة البحث هنا.

Official Website

موديل لغة ميتا الذي يتطور ذاتيًا يولّد بيانات تدريبه الخاصة

Official Website