«تجارت‌نیوز» گزارش می‌دهد:

توسعه ابزار موسیقی مولد جدید توسط OpenAI

OpenAI در حال توسعه ابزاری برای تولید موسیقی با هوش مصنوعی است که از متن و صدا آهنگ می‌سازد و احتمالا با ChatGPT و سورا ترکیب می‌شود.

به گزارش تجارت نیوز، شرکت OpenAI، خالق ChatGPT و مدل ویدئوساز سورا، reportedly در حال توسعه ابزاری جدید برای تولید موسیقی مولد است که می‌تواند از طریق متن یا ورودی‌های صوتی، آهنگ‌های تازه و باکیفیت بسازد. به گزارش نشریه (The Information)، این ابزار قادر است موسیقی‌هایی تولید کند که در ویدئوها به کار روند یا با صداهای موجود ترکیب شوند. اگر این پروژه عملی شود، OpenAI در خط مقدم حوزه موسیقی تولیدشده با هوش مصنوعی قرار خواهد گرفت.

هدف این پروژه طراحی سامانه‌ای است که کاربران بتوانند عناصر موسیقی را به زبان طبیعی توصیف کنند؛ برای مثال «یک پس‌زمینه جاز با پیانو و درام بساز» یا «آکوردهای گیتار آرام زیر این صدای خواننده اضافه کن». سپس مدل، قطعه‌ای کامل و هماهنگ با درخواست تولید می‌کند.

احتمال ادغام با ChatGPT و سورا

منابع نزدیک به OpenAI می‌گویند هنوز تصمیم نهایی درباره عرضه ابزار به‌صورت مستقل یا ادغام آن با پلتفرم‌های فعلی گرفته نشده است. اگر با ChatGPT ترکیب شود، کاربران می‌توانند مستقیما در گفت‌وگوهای متنی، موسیقی تولید کنند. درصورت ادغام با سورا، این مدل قادر خواهد بود موسیقی پس‌زمینه را برای ویدئوهای تولیدشده با هوش مصنوعی به‌صورت خودکار بسازد.

چنین رویکردی با چشم‌انداز بزرگ‌تر OpenAI هماهنگ است که درصدد یکپارچه‌سازی تولید متن، تصویر، ویدئو و صدا در یک اکوسیستم واحد است. این امر می‌تواند کاربران را قادر سازد تا بدون مهارت‌های فنی یا هنری پیچیده، محتوایی حرفه‌ای خلق کنند.

گزارش The Information حاکی از آن است که OpenAI با گروهی از دانشجویان مدرسه موسیقی جولیارد همکاری می‌کند تا پارتیتورهای موسیقی را برای استفاده در داده‌های آموزشی مدل، حاشیه‌نویسی کنند. این فرایند به مدل کمک می‌کند تا ساختار موسیقی، ریتم، ملودی، هارمونی و تعامل سازها را بهتر درک کند.

این همکاری نشان می‌دهد که OpenAI قصد دارد مدلی با درک عمیق‌تری از خلاقیت انسانی توسعه دهد؛ مدلی که نه تنها توالی نت‌ها، بلکه احساس و پویایی موسیقی را بازتولید کند.

بازگشت OpenAI به دنیای موسیقی

این نخستین تجربه OpenAI در زمینه موسیقی مولد نیست. چند سال پیش، نمونه‌هایی اولیه از مدل‌های موسیقی‌ساز معرفی شده بود، اما به‌دلیل محدودیت فنی هرگز به استفاده عمومی نرسیدند.

در سال‌های اخیر تمرکز شرکت بیشتر بر فناوری‌های صوتی مانند تبدیل متن به گفتار و گفتار به متن بوده است. این فناوری‌ها اکنون در حالت صوتی ChatGPT به کار می‌روند. تجربه OpenAI در تحلیل صدا و تشخیص لحن و احساس در گفتار انسانی، می‌تواند پایه‌ای قوی برای ساخت مدل موسیقی مولد پیشرفته‌تر باشد.

در حالی که OpenAI قدم تازه‌ای در این مسیر برمی‌دارد، شرکت‌هایی مانند گوگل با مدل MusicLM و استارت‌آپ Suno نیز در حال توسعه ابزارهای مشابه هستند. MusicLM می‌تواند از طریق متن، آهنگ‌های پیچیده بسازد و Suno به‌دلیل تولید ترانه‌های کامل و صداهای واقعی مورد توجه قرار گرفته است.

با این حال، مزیت OpenAI در یکپارچگی اکوسیستم آن نهفته است. در حالی که رقبا ابزارهای تک‌منظوره ارائه می‌دهند، OpenAI تلاش می‌کند تجربه‌ای جامع فراهم آورد که تولید متن، تصویر، ویدئو و موسیقی را در یک بستر واحد ممکن کند.

همچون سایر پروژه‌های مولد، این ابزار نیز با پرسش‌هایی درباره کپی‌رایت، منبع داده و اخلاق روبه‌روست. همکاری با جولیارد نشان می‌دهد که OpenAI بر داده‌های مجاز و دارای برچسب تمرکز دارد، اما نگرانی‌ها درباره استفاده از آثار دارای حق نشر همچنان باقی است.

نهادهای نظارتی در اروپا و آمریکا نیز در حال تدوین مقرراتی برای شفافیت و پرداخت عادلانه به هنرمندان هستند. OpenAI در صورت عرضه رسمی این محصول باید نشان دهد چگونه تعادل میان نوآوری و احترام به حقوق خالقان آثار را برقرار می‌کند.

اگر این پروژه به مرحله عرضه برسد، می‌تواند نحوه خلق و استفاده از موسیقی را دگرگون کند. از تولید موسیقی برای فیلم‌ها و تبلیغات گرفته تا الهام‌بخشی برای آهنگ‌سازان، این فناوری می‌تواند پلی میان خلاقیت انسانی و توان پردازشی هوش مصنوعی باشد.

به نظر می‌رسد OpenAI با ترکیب دانش فنی و همکاری هنرمندان، گامی تازه در مسیر تلفیق هنر و فناوری برداشته است. هرچند هنوز جزئیات زمان عرضه مشخص نیست، اما توسعه این ابزار نشان می‌دهد که آینده موسیقی با حضور هوش مصنوعی، نزدیک‌تر از همیشه است.

توسعه ابزار موسیقی مولد جدید توسط OpenAI

احتمال ادغام با ChatGPT و سورا

بازگشت OpenAI به دنیای موسیقی

لغو پاسخ

وب‌گردی