به گزارش تجارت نیوز، شرکت OpenAI، خالق ChatGPT و مدل ویدئوساز سورا، reportedly در حال توسعه ابزاری جدید برای تولید موسیقی مولد است که میتواند از طریق متن یا ورودیهای صوتی، آهنگهای تازه و باکیفیت بسازد. به گزارش نشریه The Information، این ابزار قادر است موسیقیهایی تولید کند که در ویدئوها به کار روند یا با صداهای موجود ترکیب شوند. اگر این پروژه عملی شود، OpenAI در خط مقدم حوزه موسیقی تولیدشده با هوش مصنوعی قرار خواهد گرفت.
هدف این پروژه طراحی سامانهای است که کاربران بتوانند عناصر موسیقی را به زبان طبیعی توصیف کنند؛ برای مثال «یک پسزمینه جاز با پیانو و درام بساز» یا «آکوردهای گیتار آرام زیر این صدای خواننده اضافه کن». سپس مدل، قطعهای کامل و هماهنگ با درخواست تولید میکند.
احتمال ادغام با ChatGPT و سورا
منابع نزدیک به OpenAI میگویند هنوز تصمیم نهایی درباره عرضه ابزار بهصورت مستقل یا ادغام آن با پلتفرمهای فعلی گرفته نشده است. اگر با ChatGPT ترکیب شود، کاربران میتوانند مستقیماً در گفتوگوهای متنی، موسیقی تولید کنند. درصورت ادغام با سورا، این مدل قادر خواهد بود موسیقی پسزمینه را برای ویدئوهای تولیدشده با هوش مصنوعی بهصورت خودکار بسازد.
چنین رویکردی با چشمانداز بزرگتر OpenAI هماهنگ است که درصدد یکپارچهسازی تولید متن، تصویر، ویدئو و صدا در یک اکوسیستم واحد است. این امر میتواند کاربران را قادر سازد تا بدون مهارتهای فنی یا هنری پیچیده، محتوایی حرفهای خلق کنند.
گزارش The Information حاکی از آن است که OpenAI با گروهی از دانشجویان مدرسه موسیقی جولیارد همکاری میکند تا پارتیتورهای موسیقی را برای استفاده در دادههای آموزشی مدل، حاشیهنویسی کنند. این فرایند به مدل کمک میکند تا ساختار موسیقی، ریتم، ملودی، هارمونی و تعامل سازها را بهتر درک کند.
این همکاری نشان میدهد که OpenAI قصد دارد مدلی با درک عمیقتری از خلاقیت انسانی توسعه دهد؛ مدلی که نه تنها توالی نتها، بلکه احساس و پویایی موسیقی را بازتولید کند.
بازگشت OpenAI به دنیای موسیقی
این نخستین تجربه OpenAI در زمینه موسیقی مولد نیست. چند سال پیش، نمونههایی اولیه از مدلهای موسیقیساز معرفی شده بود، اما بهدلیل محدودیت فنی هرگز به استفاده عمومی نرسیدند.
در سالهای اخیر تمرکز شرکت بیشتر بر فناوریهای صوتی مانند تبدیل متن به گفتار و گفتار به متن بوده است. این فناوریها اکنون در حالت صوتی ChatGPT به کار میروند. تجربه OpenAI در تحلیل صدا و تشخیص لحن و احساس در گفتار انسانی، میتواند پایهای قوی برای ساخت مدل موسیقی مولد پیشرفتهتر باشد.
در حالی که OpenAI قدم تازهای در این مسیر برمیدارد، شرکتهایی مانند گوگل با مدل MusicLM و استارتآپ Suno نیز در حال توسعه ابزارهای مشابه هستند. MusicLM میتواند از طریق متن، آهنگهای پیچیده بسازد و Suno بهدلیل تولید ترانههای کامل و صداهای واقعی مورد توجه قرار گرفته است.
با این حال، مزیت OpenAI در یکپارچگی اکوسیستم آن نهفته است. در حالی که رقبا ابزارهای تکمنظوره ارائه میدهند، OpenAI تلاش میکند تجربهای جامع فراهم آورد که تولید متن، تصویر، ویدئو و موسیقی را در یک بستر واحد ممکن کند.
همچون سایر پروژههای مولد، این ابزار نیز با پرسشهایی درباره کپیرایت، منبع داده و اخلاق روبهروست. همکاری با جولیارد نشان میدهد که OpenAI بر دادههای مجاز و دارای برچسب تمرکز دارد، اما نگرانیها درباره استفاده از آثار دارای حق نشر همچنان باقی است.
نهادهای نظارتی در اروپا و آمریکا نیز در حال تدوین مقرراتی برای شفافیت و پرداخت عادلانه به هنرمندان هستند. OpenAI در صورت عرضه رسمی این محصول باید نشان دهد چگونه تعادل میان نوآوری و احترام به حقوق خالقان آثار را برقرار میکند.
اگر این پروژه به مرحله عرضه برسد، میتواند نحوه خلق و استفاده از موسیقی را دگرگون کند. از تولید موسیقی برای فیلمها و تبلیغات گرفته تا الهامبخشی برای آهنگسازان، این فناوری میتواند پلی میان خلاقیت انسانی و توان پردازشی هوش مصنوعی باشد.
به نظر میرسد OpenAI با ترکیب دانش فنی و همکاری هنرمندان، گامی تازه در مسیر تلفیق هنر و فناوری برداشته است. هرچند هنوز جزئیات زمان عرضه مشخص نیست، اما توسعه این ابزار نشان میدهد که آینده موسیقی با حضور هوش مصنوعی، نزدیکتر از همیشه است.