انغمس في عالم الإبداع الموسيقي القائم على الذكاء الاصطناعي مع “M2UGen”! إن M2UGen هو تعاون مبتكر بين شركة تنسنت وجامعة سنغافورة الوطنية، وهو أداة متطورة تجمع قدرات نماذج اللغة الكبيرة لتتفوق ليس فقط في فهم الموسيقى ولكن أيضًا في إنتاجها. سواء كان الأمر يتعلق بالرد على استفسارات حول الموسيقى أو إنشاء ألحان جديدة من النصوص أو الصور أو مقاطع الفيديو أو الموسيقى - فإن M2UGen لديها كل الإمكانات.
استكشف وظائفها من خلال العرض التوضيحي العملي!
في جوهرها، M2UGen هي تكامل لعدة مشفرات:
- MERT: استكشاف تفاصيل الموسيقى
- ViT: فك رموز الصور
- ViViT: تفسير محتوى الفيديو
… وتعتمد على نموذج MusicGen / AudioLDM2 لإنشاء موسيقى لا مثيل لها، محسن بالمحولات (Adapters) والنموذج الابتكاري LLaMA 2.
بالنسبة لعشاق الذكاء الاصطناعي، يكشف النموذج الأساسي “m2ugen.py” عن بنية شاملة مصممة لأداء متعدد الطرق المبهر.
نقوم بتغذية عملية تعلم M2UGen بمجموعات البيانات التي تم إعدادها بواسطة نموذج MU-LLaMA، المعروف بقدرته على وصف الموسيقى والإجابة على الأسئلة. هل ترغب في معرفة التفاصيل الدقيقة؟ بروتوكول بناء مجموعة البيانات في مجلد “Datasets” في انتظارك.
ارتقِ بتجربتك في مجال الموسيقى الذكية بواسطة M2UGen، حيث تتواصل الألحان والذكاء الاصطناعي بانسجام. 🎵🤖
The demo is here