رونمایی گوگل از هوش مصنوعی پیشرفته برای تولید ویدیو از متن و تصویر
تیمی از محققان گوگل ریسرچ ابزار هوش مصنوعی جدیدی با نام Lumiere را توسعه دادهاند که از آن بهعنوان نسل بعدی ابزارهای تولید ویدیو براساس متن یاد شده است. گوگل مدعی شده که Lumiere میتواند ویدیوهای کاملی با حرکات منسجم، روان و واقعی ایجاد کند.
به گزارش تجارتنیوز، بسیاری از مدلهای هوش مصنوعی تولید ویدیوی فعلی در نمایش حرکات مشکل دارند و حتی اگر بتوانند این کار را بهخوبی انجام دهند، سایر عناصر آنها ممکن است دچار اختلال شوند. گوگل برای برطرفکردن این مشکلات، در Lumiere که نام آن احتمالاً از «برادران لومیر»، مخترعان سینما گرفته شده، از رویکرد متفاوتی برای تولید ویدیو استفاده کرده است. درواقع Lumiere بهجای کنارهم قراردادن فریمهای مجزا، کل ویدیو را در یک فرایند ایجاد میکند و میتواند محل قرارگیری اشیا و حرکت آنها را بهطور همزمان مدیریت کند.
هوش مصنوعی Lumiere هنوز یک پروژه تحقیقاتی است، بنابراین نمیتوانید از آن استفاده کنید. بااینحال، گوگل یک ویدیوی کوتاه از قابلیتهای آن به اشتراک گذاشته است که در ادامه میتوانید آن را مشاهده کنید.
قابلیتهای هوش مصنوعی تولید ویدیو Lumiere
Lumiere میتواند بهعنوان یک ابزار «متن به ویدیو» و «تصویر به ویدیو» استفاده شود. همچنین میتوان سبک مدنظر خود را نیز به آن ارائه کرد تا ویدیوی نهایی را براساس آن تولید کند. علاوهبراین، میتوان با استفاده از دستورات متنی، ویدیوی خود را از طریق آن ویرایش کرد.
گوگل مدل هوش مصنوعی خود را براساس معماری فضا-زمان ساخته است؛ به این معنا که Lumiere میتواند تمام جنبههای حرکت و مکان را درنظر بگیرد. درواقع این مدل در فرایند تولید ویدیوی خود میتواند درک کند که سوژه عکس در چه مکانی قرار گرفته است و همچنین برای ساخت ویدیو مواردی ازجمله زمان و نحوه حرکت اشیا را نیز بررسی میکند.
نظرات