به گزارش تجارت نیوز، هوش مصنوعی در حال دگرگون کردن تمامی حوزهها است. سینما و عرصه فیلمسازی هم از این قاعده نانوشته هم مستثنی نیست.
ویدئویی که مشاهده میکنید، تکامل ابزارآلات هوش مصنوعی را نشان میدهد. تکاملی که شاید خیلی زودتر از آنچه که تصور میشود بر ساختارهای سنتی سایه میاندازد. حالا هوش مصنوعی (ابزارهایی که در ادامه با جزئیات بیشتری معرفی خواهند شد) به قدرتی حیرتانگیز دست یافته است. توانایی تلفیق و ترکیب و ساخت محتوایی با کیفیت بالا دارد. چهبسا اگر گفته نمیشد تمام این ویدئو خروجی هوش مصنوعی است، تشخیص این نکته امری دشوار بود.
Gen AI یا هوش مصنوعی مولد
گوگل از جدیدترین و جاهطلبانهترین ابزار خود برای ورود به دنیای فیلمسازی رونمایی کرده است؛ پلتفرم هوش مصنوعی Google Flow که نه فقط به عنوان یک ابزار، بلکه بهعنوان یک «همکار خلاق» برای فیلمسازان و تولیدکنندگان محتوای دیجیتال معرفی شده است.
Flow ترکیبی است از سه مدل قدرتمند هوش مصنوعی گوگل: Veo 3، Imagen و Gemini. برخلاف ابزارهای عمومی تولید ویدئو که تنها روی تولید خودکار ویدئو تمرکز دارند، Flow برای حرفهایهایی طراحی شده که به دنبال کنترل خلاق، انسجام بصری و الهامگیری مستمر هستند.
مدلهای هوش مصنوعی Google Flow درک دراماتیک دارند
هسته اصلی Flow بر پایه سه مدل تخصصی استوار شده که هرکدام نقشی متمایز در فرآیند تولید فیلم ایفا میکنند. در مرکز این مجموعه، Veo 3 قرار دارد؛ پیشرفتهترین مدل تولید ویدئوی گوگل که بهواسطه حفظ واقعگرایی بصری و رعایت منطق فیزیکی شناخته میشود. مشکلی که در بسیاری از مدلهای پیشین، نظیر لرزشها، حرکتهای ناسازگار یا چیدمان ناپایدار عناصر دیده میشد، در Veo 3 تا حد زیادی کنترل شده است.
در کنار آن، Imagen قرار دارد؛ مدلی برای تولید تصویر بر پایه متن که به کاربران امکان میدهد تنها با چند خط دستور نوشتاری، محیطها و اشیای بصری منحصربهفرد خلق کنند. از منظرههای رویاگون تا شخصیتهای فوقواقعگرا، Imagen توانسته نیاز به تیمهای بزرگ طراحی گرافیک را در بسیاری از پروژهها کاهش دهد.
در این میان، نقش Gemini نیز کلیدی است. این مدل زبان طبیعی، به کاربر امکان میدهد صحنهها را به زبان معمول و غیرتخصصی توصیف کند و از طریق آن، ساختار روایی فیلم را در قالب تصویر و صدا پیادهسازی کند. تعامل با Gemini، نه تنها آسان بلکه خلاقانه است و باعث میشود کارگردانان و نویسندگان بدون نیاز به مهارتهای فنی، ایدههای خود را پیادهسازی کنند.
آیا هوش مصنوعی، سینما و فیلمسازی را متحول خواهد کرد؟
مدل پیشرفته Veo 3، ستون اصلی Flow است. این مدل ویدیویی نهتنها توانایی درک دستورهای متنی پیچیده را دارد، بلکه با استفاده از زبان سینما صحنههایی تولید میکند که با استانداردهای تصویربرداری حرفهای برابری میکند. ویدیوی «SWAT» که بهطور کامل توسط این مدل و در پلتفرم Flow ساخته شده، نه تنها کیفیت فنی بالا دارد، بلکه تماشاگر را با واقعگرایی خیرهکننده و ترکیب دقیق عناصر روایی مواجه میکند؛ چیزی که پیشتر تصور میشد فقط از عهده تیمهای بزرگ فیلمسازی با بودجههای کلان برمیآید.
«SWAT» یک ویدیوی اکشن کوتاه با فضایی شهری، تنش بالا و درگیریهای تاکتیکی است. تمام صحنهها با دقت بالایی طراحی شدهاند: نورپردازیها قابلباور، سایهها متناسب با موقعیت فیزیکی اجسام، زاویههای دوربین متنوع و پویا، و دکوپاژ حرفهای که ریتم سکانس را حفظ میکند.
حرکت دوربین در این ویدیو نه تصادفی، بلکه هدایتشده و دقیق است. نماهای تعقیبی، بسته و بالابهپایین بهگونهای ترکیب شدهاند که گویی یک فیلمبردار ماهر پشت هر قاب ایستاده است. این هماهنگی نشان میدهد که Veo 3 به سطحی از درک فضاسازی و ترکیببندی بصری رسیده که میتواند با ابزارهای سنتی رقابت کند.
با ورود ابزارهایی مانند Veo 3، برخی پرسشهای بنیادی در مورد آینده سینما مطرح شده است. مثل این پرسش که آیا حضور کارگردان، فیلمبردار، طراح صحنه و تدوینگر انسانی همچنان ضروری است؟ یا این مساله که آیا هوش مصنوعی صرفا نقش ابزاری دارد، یا در حال تبدیلشدن به «همکار خلاق» در فرآیند تولید یک اثر خلاقه است؟
پاسخ شاید در تجربههایی مثل «SWAT» نهفته باشد. پروژهای که بدون استفاده از بازیگر، دوربین یا لوکیشن واقعی، یک سکانس اکشن قابل قبول تولید کرده است. اما آیا همین ابزار میتواند با دخالت انسانی به خلق آثار پیچیدهتر، دارای گفتوگو، تعلیق و گرهگشایی روایی نیز منجر شود؟ این همان چشماندازی است که Google Flow وعده میدهد.
آینده سینما در دست کسانی است که قلمشان را با هوش مصنوعی تیز کردهاند؟
Flow صرفا یک ابزار جدید برای تولید ویدئو نیست. این پلتفرم قرار است پلی میان هوش مصنوعی و هنر داستانگویی و روایت باشد؛ پلی که از یک سو ابزارهای تولید حرفهای و هوشمند را در اختیار خلاقان قرار میدهد و از سوی دیگر آنها را در فرایند خلاقیت تنها نمیگذارد. این ابزار هوش مصنوعی میتواند به شریکی راهبردی برای تولیدکنندگان مستقل، استودیوهای کوچک و هنرمندانی تبدیل شود که به دنبال کشف افقهای جدید در هنر دیجیتال هستند.
همانطور که سوندار پیچای در شبکه اجتماعی ایکس نوشت: «برای فیلمسازان و خلاقان، بهترینهای Veo، Imagen و Gemini را در ابزار جدیدی بهنام Flow ترکیب کردهایم.»
بهنظر میرسد ما فقط در آغاز داستان Flow هستیم؛ آیندهای که شاید روایتهای آن توسط خلاقانی نوشته شود که قلمشان را با قدرت هوش مصنوعی تیز کردهاند.
اخبار حوزه استارتاپ و فناوری اطلاعات را در صفحه علم و فناوری تجارتنیوز بخوانید.