حجم ویدیو: ۱.۳۶M مدت زمان ویدیو: ۰۰:۰۰:۱۴ دانلود ویدیو

گوگل از VLOGGER رونمایی کرد؛ تبدیل عکس به ویدیو با هوش مصنوعی

۰۱ فروردین ۱۴۰۳

لینک کوتاه کپی شد

هوش مصنوعی VLOGGER گوگل می‌تواند فقط از یک عکس، ویدیو واقعی از صحبت‌کردن و حرکت‌ فرد حاضر در عکس تولید کند.

به گزارش تجارت‌نیوز، محققان گوگل یک سیستم هوش مصنوعی جدید توسعه داده‌اند که می‌تواند فقط از یک عکس، ویدیوهای واقعی از صحبت‌کردن و حرکت‌ فرد حاضر در عکس ایجاد کند. این فناوری که VLOGGER نام دارد، از مدل‌های پیشرفته یادگیری ماشینی برای ترکیب فیلم‌های واقع‌بینانه استفاده می‌کند. درعین‌حال نگرانی‌های درباره انتشار دیپ‌فیک‌ها و اطلاعات غلط با این فناوری بیشتر خواهد شد.

محققان گوگل در مقاله‌ای به معرفی فناوری هوش مصنوعی VLOGGER پرداخته‌اند. این هوش مصنوعی می‌تواند با دریافت عکس یک شخص به همراه یک کلیپ صوتی از او، ویدیویی همراه با صدا از آن شخص تولید کند. در ویدیوهای این هوش مصنوعی، حالات صورت، حرکات سر و دست نیز لحاظ می‌شود. البته هنوز نقص‌ها در این ویدیوها مشهود هستند، اما به‌مرور می‌توان آن‌ها را برطرف کرد.

هوش مصنوعی VLOGGER گوگل

محققان گوگل، از نوعی مدل یادگیری ماشینی به نام «مدل‌های انتشاری» (Diffusion Models) برای توسعه این هوش مصنوعی استفاده کرده‌اند. مدل‌های انتشاری اخیراً عملکرد قابل‌توجهی در تولید تصاویر بسیار واقعی از توضیحات متنی نشان داده‌اند. با تعمیم این مدل‌ها به حوزه ویدیو، محققان توانستند یک سیستم هوش مصنوعی ایجاد کنند که می‌تواند عکس‌ها را به شیوه‌ای واقعی زنده کند.

این هوش مصنوعی می‌تواند در حوزه‌های مختلف کاربردهای گوناگونی داشته باشد. برای مثال بازیگران می‌توانند مدل‌های سه‌بعدی دقیقی از خودشان تولید کنند تا در بخشی از یک فیلم به‌کار برده شود. این فناوری همچنین می‌تواند برای ایجاد آواتارهای واقعی در هدست‌های واقعیت مجازی و ویدیوگیم‌ها کاربرد داشته باشد.

بااین‌حال، از این فناوری می‌توان سوءاستفاده کرد. به‌عنوان مثال می‌توان از آن برای ایجاد دیپ‌فیک‌ استفاده کرد. همچنین چون این هوش مصنوعی تنها با یک عکس و فایل صوتی می‌تواند ویدیویی باورپذیر بسازد، مسلماً نگرانی‌هایی به دنبال خواهد داشت.

منبع : دیجیاتو

گوگل هوش مصنوعی