Погрузитесь в мир творчества, основанного на искусственном интеллекте, с помощью M2UGen! Инновационное сотрудничество между Tencent и NUS, M2UGen - это передовой инструмент, который сочетает возможности больших языковых моделей для превосходства не только в понимании музыки, но и в её генерации. Будь то ответы на вопросы о музыке или создание новых мелодий на основе текста, изображений, видео или аудио - M2UGen справится с этим.

Исследуйте его функциональность в интерактивной демонстрации!

В основе M2UGen лежит синергия нескольких кодировщиков:

  • MERT: Исследование музыкальной сложности
  • ViT: Расшифровка изображений
  • ViViT: Интерпретация видеоконтента

…и работает на модели MusicGen/AudioLDM2 для беспрецедентного создания музыки, оптимизированной с помощью адаптеров и инновационной модели LLaMA 2.

Для любителей искусственного интеллекта чертеж модели m2ugen.py раскрывает всестороннюю архитектуру, разработанную для впечатляющей мультимодальной производительности.

Мы питаем процесс обучения M2UGen наборами данных, созданными моделью MU-LLaMA, известной своей способностью подписывать музыку и отвечать на вопросы. Хотите больше подробностей? Протокол создания набора данных находится в папке Datasets.

Поднимите свой опыт искусственного интеллекта в области музыки с M2UGen, где мелодии и машинный интеллект гармонизируют. 🎵🤖

Official Website

The demo is here

M2UGen — инструмент для творчества в области музыки, с использованием искусственного интеллекта, созданный Tencent и NUS, объединяющий языковые модели для генерации музыки из различных источников, таких как тексты, изображения, видео и аудио.

Official Website