MusicGen متا: تغییر موسیقی متن با موسیقی تولید شده توسط هوش مصنوعی
متا، غول فناوری، سیستم هوش مصنوعی موسیقی (AI) ابتکاری به نام MusicGen را معرفی کرده است که این پتانسیل را دارد که فرآیند ساخت موسیقی متن و آهنگها را متحول کند. MusicGen که توسط تیم Audiocraft داخلی Meta توسعه یافته است، عملکردی مشابه ChatGPT دارد، اما به طور خاص برای موسیقی طراحی شده است.
با MusicGen، کاربران می توانند به سادگی شرح متنی مختصری از سبک یا ویژگی های موسیقی مورد نظر ارائه دهند و روی دکمه "ایجاد" کلیک کنند. در چند لحظه، الگوریتم هوش مصنوعی یک مسیر 12 ثانیه ای ایجاد می کند که با دستورالعمل های ارائه شده مطابقت دارد. برای مثال، کاربران میتوانند یک «آهنگ lofi slow BPM electro Chill [آهنگ] با نمونههای ارگانیک» درخواست کنند، و MusicGen قطعهای صوتی را ارائه میکند که یادآور آهنگهایی است که در کانال رادیویی محبوب Lofi Girl YouTube پخش میشود.
یکی از ویژگیهای جذاب MusicGen توانایی آن در «هدایت» با آپلود آهنگهای موجود است که به هوش مصنوعی اجازه میدهد ساختارهای موسیقی را بهتر درک کند. فلیکس کروک، یکی از توسعه دهندگان این مدل یادگیری زبان (LLM)، نمونه هایی را در پروفایل توییتر خود به اشتراک گذاشت. برای مثال، MusicGen میتواند از آهنگهای معروف سباستین باخ، Toccata و Fugue in D Minor استفاده کند و آن را با ضربهای درام و سینتسایزرهای دهه 1980 تلفیق کند، و در نتیجه تنوعی خوشبینانه از قطعه اصلی ایجاد کند.
در حال حاضر، MusicGen به صورت عمومی در وب سایت Hugging Face متا در دسترس است، جایی که هر کسی می تواند آن را امتحان کند. با این حال، توجه به این نکته مهم است که برخلاف موزیکالام، موزیکالام، تولیدکننده موسیقی هوش مصنوعی گوگل، مدل متا تنها سازهای موسیقی تولید میکند و فاقد قابلیتهای صوتی است. با در نظر گرفتن خروجی صوتی MusicLM که شبیه به Simlish، یک زبان داستانی است، احتمالا بهترین است. با این وجود، نوازندگان نیازی به نگرانی در مورد تهدید شغلی خود نداشته باشند، زیرا مهارت MusicGen در درجه اول در تولید ملودی های ساده و کوتاه نهفته است. کیفیت ترکیبات آن نمی تواند با آنهایی که با خلاقیت انسان ساخته شده است مطابقت داشته باشد. بهعلاوه، برخی از آهنگهای تولید شده میتوانند تکراری شوند و چندین بار از طریق یک پیشروی یکسان حرکت کنند. اگرچه MusicGen میتواند برای تولید صدای پسزمینه برای ویدیوها یا ارائهها مفید باشد، اما ممکن است تجربههای موسیقی واقعاً فریبنده یا جذابی ایجاد نکند. بنابراین، بعید به نظر میرسد که موفقیت بعدی در صدر جدول از موسیقی تولید شده توسط هوش مصنوعی سرچشمه بگیرد – حداقل هنوز نه.
برای کسانی که علاقه مند به کاوش MusicGen هستند، توصیه می شود که سریع عمل کنند. اولاً، پایداری وبسایت Hugging Face مشکوک بوده است، زیرا در طول فرآیند تحقیقاتی ما دچار خرابیهایی شد و دسترسی به آهنگهای تولید شده توسط هوش مصنوعی را که برای اشتراکگذاری آماده کرده بودیم قطع کرد. این اختلالات احتمالاً به دلیل افزایش ناگهانی ترافیک کاربران ایجاد شده است که امیدواریم با خواندن این مطلب برطرف شده باشد.
ثانیاً یک جنبه قانونی وجود دارد که باید در نظر گرفته شود. صفحه رسمی GitHub متا بیان میکند که تیم توسعه از 10000 «تراک موسیقی [مجوز] با کیفیت بالا» به همراه آهنگهای بدون حق امتیاز از Shutterstock و Pond5 برای آموزش مدل MusicGen استفاده کرده است. از زمان ظهور فناوری هوش مصنوعی مولد در اوایل سال جاری، هنرمندان شروع به شکایت علیه توسعهدهندگان و پلتفرمها به دلیل «استفاده غیرقانونی از آثار دارای حق چاپ» کردهاند. متا ممکن است خود را با چالشهای قانونی از سوی نوازندگان ناراضی مواجه کند، یا شرکتهای ضبط ممکن است از نفوذ صنعت خود برای بستن چنین محتوایی استفاده کنند. این مسائل احتمالی دعوی، لایهای از عدم قطعیت را به آینده MusicGen و پلتفرمهای موسیقی هوش مصنوعی مشابه اضافه میکنند.