موضوعات داغ: # استقلال # جام حذفی # غزه # فوتبال # عراقچی # اسرائیل # پزشکیان # جنگ
«تجارت‌نیوز» گزارش می‌دهد:

آغاز عصر جدید فیلمسازی با Google Flow / این ویدئو تماما توسط هوش مصنوعی ساخته شده است + ببینید

مدل‌های هوش مصنوعی Google Flow درک دراماتیک دارند / آیا هوش مصنوعی، سینما و فیلمسازی را متحول خواهد کرد؟
حامد اناری 7 خرداد 1404 ساعت 16:15
فیلم‌سازان کارایی Veo 3، Imagen و Gemini را در پلتفرم جدید گوگل به نمایش گذاشتند.

به گزارش تجارت نیوز، هوش مصنوعی در حال دگرگون‌ کردن تمامی حوزه‌ها است. سینما و عرصه فیلمسازی هم از این قاعده نانوشته هم مستثنی نیست.

ویدئویی که مشاهده می‌کنید، تکامل ابزارآلات هوش مصنوعی را نشان می‌دهد. تکاملی که شاید خیلی زودتر از آنچه که تصور می‌شود بر ساختارهای سنتی سایه می‌اندازد. حالا هوش مصنوعی (ابزارهایی که در ادامه با جزئیات بیشتری معرفی خواهند شد) به قدرتی حیرت‌انگیز دست یافته است. توانایی تلفیق و ترکیب و ساخت محتوایی با کیفیت بالا دارد. چه‌بسا اگر گفته نمی‌شد تمام این ویدئو خروجی هوش مصنوعی است، تشخیص این نکته امری دشوار بود.

Gen AI یا هوش مصنوعی مولد

گوگل از جدیدترین و جاه‌طلبانه‌ترین ابزار خود برای ورود به دنیای فیلم‌سازی رونمایی کرده است؛ پلتفرم هوش مصنوعی Google Flow که نه فقط به عنوان یک ابزار، بلکه به‌عنوان یک «همکار خلاق» برای فیلم‌سازان و تولیدکنندگان محتوای دیجیتال معرفی شده است.

Flow ترکیبی است از سه مدل قدرتمند هوش مصنوعی گوگل: Veo 3، Imagen و Gemini. برخلاف ابزارهای عمومی تولید ویدئو که تنها روی تولید خودکار ویدئو تمرکز دارند، Flow برای حرفه‌ای‌هایی طراحی شده که به دنبال کنترل خلاق، انسجام بصری و الهام‌گیری مستمر هستند.

مدل‌های هوش مصنوعی Google Flow درک دراماتیک دارند

هسته اصلی Flow بر پایه سه مدل تخصصی استوار شده که هرکدام نقشی متمایز در فرآیند تولید فیلم ایفا می‌کنند. در مرکز این مجموعه، Veo 3 قرار دارد؛ پیشرفته‌ترین مدل تولید ویدئوی گوگل که به‌واسطه حفظ واقع‌گرایی بصری و رعایت منطق فیزیکی شناخته می‌شود. مشکلی که در بسیاری از مدل‌های پیشین، نظیر لرزش‌ها، حرکت‌های ناسازگار یا چیدمان ناپایدار عناصر دیده می‌شد، در Veo 3 تا حد زیادی کنترل شده است.

در کنار آن، Imagen قرار دارد؛ مدلی برای تولید تصویر بر پایه متن که به کاربران امکان می‌دهد تنها با چند خط دستور نوشتاری، محیط‌ها و اشیای بصری منحصربه‌فرد خلق کنند. از منظره‌های رویاگون تا شخصیت‌های فوق‌واقع‌گرا، Imagen توانسته نیاز به تیم‌های بزرگ طراحی گرافیک را در بسیاری از پروژه‌ها کاهش دهد.

در این میان، نقش Gemini نیز کلیدی است. این مدل زبان طبیعی، به کاربر امکان می‌دهد صحنه‌ها را به زبان معمول و غیرتخصصی توصیف کند و از طریق آن، ساختار روایی فیلم را در قالب تصویر و صدا پیاده‌سازی کند. تعامل با Gemini، نه تنها آسان بلکه خلاقانه است و باعث می‌شود کارگردانان و نویسندگان بدون نیاز به مهارت‌های فنی، ایده‌های خود را پیاده‌سازی کنند.

آیا هوش مصنوعی، سینما و فیلمسازی را متحول خواهد کرد؟

مدل پیشرفته Veo 3، ستون اصلی Flow است. این مدل ویدیویی نه‌تنها توانایی درک دستورهای متنی پیچیده را دارد، بلکه با استفاده از زبان سینما صحنه‌هایی تولید می‌کند که با استانداردهای تصویربرداری حرفه‌ای برابری می‌کند. ویدیوی «SWAT» که به‌طور کامل توسط این مدل و در پلتفرم Flow ساخته شده، نه تنها کیفیت فنی بالا دارد، بلکه تماشاگر را با واقع‌گرایی خیره‌کننده و ترکیب دقیق عناصر روایی مواجه می‌کند؛ چیزی که پیش‌تر تصور می‌شد فقط از عهده تیم‌های بزرگ فیلم‌سازی با بودجه‌های کلان برمی‌آید.

«SWAT» یک ویدیوی اکشن کوتاه با فضایی شهری، تنش بالا و درگیری‌های تاکتیکی است. تمام صحنه‌ها با دقت بالایی طراحی شده‌اند: نورپردازی‌ها قابل‌باور، سایه‌ها متناسب با موقعیت فیزیکی اجسام، زاویه‌های دوربین متنوع و پویا، و دکوپاژ حرفه‌ای که ریتم سکانس را حفظ می‌کند.

حرکت دوربین در این ویدیو نه تصادفی، بلکه هدایت‌شده و دقیق است. نماهای تعقیبی، بسته و بالا‌به‌پایین به‌گونه‌ای ترکیب شده‌اند که گویی یک فیلم‌بردار ماهر پشت هر قاب ایستاده است. این هماهنگی نشان می‌دهد که Veo 3 به سطحی از درک فضاسازی و ترکیب‌بندی بصری رسیده که می‌تواند با ابزارهای سنتی رقابت کند.

با ورود ابزارهایی مانند Veo 3، برخی پرسش‌های بنیادی در مورد آینده سینما مطرح شده است. مثل این پرسش که آیا حضور کارگردان، فیلم‌بردار، طراح صحنه و تدوین‌گر انسانی همچنان ضروری است؟ یا این مساله که آیا هوش مصنوعی صرفا نقش ابزاری دارد، یا در حال تبدیل‌شدن به «همکار خلاق» در فرآیند تولید یک اثر خلاقه است؟

پاسخ شاید در تجربه‌هایی مثل «SWAT» نهفته باشد. پروژه‌ای که بدون استفاده از بازیگر، دوربین یا لوکیشن واقعی، یک سکانس اکشن قابل قبول تولید کرده است. اما آیا همین ابزار می‌تواند با دخالت انسانی به خلق آثار پیچیده‌تر، دارای گفت‌وگو، تعلیق و گره‌گشایی روایی نیز منجر شود؟ این همان چشم‌اندازی است که Google Flow وعده می‌دهد.

آینده سینما در دست کسانی است که قلم‌شان را با هوش مصنوعی تیز کرده‌اند؟

Flow صرفا یک ابزار جدید برای تولید ویدئو نیست. این پلتفرم قرار است پلی میان هوش مصنوعی و هنر داستان‌گویی و روایت باشد؛ پلی که از یک سو ابزارهای تولید حرفه‌ای و هوشمند را در اختیار خلاقان قرار می‌دهد و از سوی دیگر آن‌ها را در فرایند خلاقیت تنها نمی‌گذارد. این ابزار هوش مصنوعی می‌تواند به شریکی راهبردی برای تولیدکنندگان مستقل، استودیوهای کوچک و هنرمندانی تبدیل شود که به دنبال کشف افق‌های جدید در هنر دیجیتال هستند.

همان‌طور که سوندار پیچای در شبکه اجتماعی ایکس نوشت: «برای فیلم‌سازان و خلاقان، بهترین‌های Veo، Imagen و Gemini را در ابزار جدیدی به‌نام Flow ترکیب کرده‌ایم.»

به‌نظر می‌رسد ما فقط در آغاز داستان Flow هستیم؛ آینده‌ای که شاید روایت‌های آن توسط خلاقانی نوشته شود که قلمشان را با قدرت هوش مصنوعی تیز کرده‌اند.

اخبار حوزه استارتاپ و فناوری اطلاعات را در صفحه علم و فناوری تجارت‌نیوز بخوانید.

نظرات