رونمایی گوگل از هوش مصنوعی پیشرفته برای تولید ویدیو از متن و تصویر

تیمی از محققان گوگل ریسرچ ابزار هوش مصنوعی جدیدی با نام Lumiere را توسعه داده‌اند که از آن به‌عنوان نسل بعدی ابزارهای تولید ویدیو براساس متن یاد شده است. گوگل مدعی شده که Lumiere می‌تواند ویدیوهای کاملی با حرکات منسجم، روان و واقعی ایجاد کند.

به گزارش تجارت‌نیوز، بسیاری از مدل‌های هوش مصنوعی تولید ویدیوی فعلی در نمایش حرکات مشکل دارند و حتی اگر بتوانند این کار را به‌خوبی انجام دهند، سایر عناصر آن‌ها ممکن است دچار اختلال شوند. گوگل برای برطرف‌کردن این مشکلات، در Lumiere که نام آن احتمالاً از «برادران لومیر»، مخترعان سینما گرفته شده، از رویکرد متفاوتی برای تولید ویدیو استفاده کرده است. درواقع Lumiere به‌جای کنارهم قراردادن فریم‌های مجزا، کل ویدیو را در یک فرایند ایجاد می‌کند و می‌تواند محل قرارگیری اشیا و حرکت آن‌ها را به‌طور هم‌زمان مدیریت کند.

هوش مصنوعی Lumiere هنوز یک پروژه تحقیقاتی است، بنابراین نمی‌توانید از آن استفاده کنید. بااین‌حال، گوگل یک ویدیوی کوتاه از قابلیت‌های آن به اشتراک گذاشته است که در ادامه می‌توانید آن را مشاهده کنید.

قابلیت‌های هوش مصنوعی تولید ویدیو Lumiere

Lumiere می‌تواند به‌عنوان یک ابزار «متن به ویدیو» و «تصویر به ویدیو» استفاده شود. همچنین می‌توان سبک مدنظر خود را نیز به آن ارائه کرد تا ویدیوی نهایی را براساس آن تولید کند. علاوه‌براین، می‌توان با استفاده از دستورات متنی، ویدیوی خود را از طریق آن ویرایش کرد.

گوگل مدل هوش مصنوعی خود را براساس معماری فضا-زمان ساخته است؛ به این معنا که Lumiere می‌تواند تمام جنبه‌های حرکت و مکان را درنظر بگیرد. درواقع این مدل در فرایند تولید ویدیوی خود می‌تواند درک کند که سوژه عکس در چه مکانی قرار گرفته است و همچنین برای ساخت ویدیو مواردی ازجمله زمان و نحوه حرکت اشیا را نیز بررسی می‌کند.