M2UGen

M2UGen와 함께 AI-기반 음악 창작의 세계로 빠져들어보세요! 텐센트와 NUS의 혁신적인 협업인 M2UGen은 대형 언어 모델의 능력을 접목하여 음악 이해와 생성에 뛰어난 성과를 보입니다. 음악에 대한 질문에 응답하거나 텍스트, 이미지, 동영상 또는 오디오로부터 새로운 곡을 만드는 등, M2UGen은 다양한 기능을 가지고 있습니다.

데모를 통해 M2UGen의 기능을 자세히 알아보세요!

M2UGen은 여러 인코더의 시너지인 기능을 가지고 있습니다:

MERT: 음악의 복잡성을 탐구합니다.
ViT: 이미지 해석을 담당합니다.
ViViT: 동영상 콘텐츠를 이해합니다.

…또한 뛰어난 음악 생성을 위해 MusicGen/AudioLDM2 모델을 기반으로 하며, 어댑터와 혁신적인 LLaMA 2 모델을 최적화하여 작동합니다.

AI 애호가들을 위해 모델의 청사진인 m2ugen.py는 멀티모달 성능을 위해 설계된 포괄적인 아키텍처를 구현하고 있습니다.

MU-LLaMA 모델에서 제작한 데이터셋을 통해 M2UGen의 학습 과정을 지원하며, 그 데이터셋 구축 프로토콜은 Datasets 폴더에서 확인할 수 있습니다.

멜로디와 기계지능이 조화를 이루는 M2UGen으로 AI 음악 경험을 한층 높여보세요. 🎵🤖

Official Website

The demo is here

텐센트와 NUS가 만든 인공지능 기반 음악 창작 도구인 M2UGen은 텍스트, 이미지, 비디오, 오디오 등 다양한 입력을 기반으로 음악을 생성하는 언어 모델을 결합합니다.

Official Website