«تجارت‌نیوز» گزارش می‌دهد:

OpenAI مدل جدید تصویرساز را در رقابت با گوگل رونمایی کرد

انتشار: 26 آذر 1404 - 17:09

بروزرسانی: 7 ماه پیش

امین ربیعی کد خبر: 1142043

OpenAI مدل جدید تصویرساز را در رقابت با گوگل رونمایی کرد

OpenAI با معرفی مدل جدید تولید تصویر، به موفقیت مدل Nano Banana Pro گوگل پاسخ داد و بر سرعت بالاتر، دقت و کنترل خلاقانه بیشتر تأکید کرد.

به گزارش تجارت نیوز، OpenAI به‌طور رسمی از یک مدل جدید و پیشرفته تولید تصویر رونمایی کرده است؛ مدلی که به‌عنوان پاسخ مستقیم به موج توجه و استقبال گسترده از مدل تصویرساز Nano Banana Pro گوگل معرفی می‌شود. این اقدام نشان‌دهنده تشدید رقابت میان دو غول فناوری در یکی از حساس‌ترین و پرطرفدارترین حوزه‌های هوش مصنوعی است؛ جایی که کیفیت بصری، واقع‌گرایی، و توانایی پیروی دقیق از دستورهای کاربر به معیارهای اصلی برتری تبدیل شده‌اند.

ماه گذشته گوگل با معرفی Nano Banana Pro همزمان با مدل زبانی پرچم‌دار Gemini 3، توجه زیادی را به خود جلب کرد. این مدل تصویرساز به‌سرعت در شبکه‌های اجتماعی و میان کاربران حرفه‌ای و عادی فراگیر شد و به دلیل تولید تصاویر بسیار واقع‌گرایانه و جزئیات بصری چشمگیر، مورد تحسین قرار گرفت. اکنون OpenAI با معرفی مدل جدید خود تلاش دارد نشان دهد که نه‌تنها از این رقابت عقب نمانده، بلکه آماده است جایگاه پیشروی خود را در این عرصه حفظ کند.

OpenAI اعلام کرده است که مدل جدید تصویرساز آن نسبت به نسل قبلی صرفاً یک به‌روزرسانی جزئی نیست، بلکه جهشی معنادار در عملکرد به حساب می‌آید. به گفته این شرکت، سرعت تولید تصاویر افزایش یافته، ویرایش تصاویر با دقت بالاتری انجام می‌شود و جزئیات ظریف در هنگام تولید یا اصلاح تصویر بهتر حفظ می‌شوند. این ویژگی‌ها به‌ویژه برای کاربران حرفه‌ای، طراحان، هنرمندان و کسب‌وکارهایی که به خروجی‌های دقیق و قابل‌اعتماد نیاز دارند، اهمیت زیادی دارد.

یکی از مهم‌ترین پیشرفت‌های این مدل، بهبود قابل توجه در پیروی از دستورهای کاربر است. OpenAI تأکید کرده که توانایی درک و اجرای دقیق درخواست‌ها، به اندازه کیفیت بصری اهمیت دارد. در بسیاری از کاربردهای تجاری و خلاقانه، یک تغییر کوچک یا برداشت نادرست از دستور می‌تواند کل نتیجه را بی‌ارزش کند. به همین دلیل، تمرکز بر دقت در اجرای دستورها به یکی از محورهای اصلی توسعه این مدل تبدیل شده است.

برای نمایش این پیشرفت‌ها، OpenAI نمونه‌هایی از مقایسه خروجی مدل قدیمی و مدل جدید خود منتشر کرده است. در یکی از این نمونه‌ها، از مدل خواسته شده صحنه‌ای فوتورئالیستی از محله چلسی لندن در دهه ۱۹۷۰ تولید کند. تصاویر تولیدشده توسط مدل جدید از نظر دقت تاریخی، نورپردازی، و جزئیات محیطی هماهنگ‌تر و باورپذیرتر به نظر می‌رسند و نشان می‌دهند که مدل قادر است دستورهای پیچیده و دارای ظرافت را بهتر درک کند.

OpenAI همچنین به کاربردهای تجاری این مدل توجه ویژه‌ای داشته است. در نمونه‌ای دیگر، تصاویر مربوط به یک مکانیک در حال تعمیر خودرو به نمایش گذاشته شد. در این تصاویر، هماهنگی آناتومی بدن، ابزارها و قطعات مکانیکی نسبت به گذشته به‌مراتب بهتر بود؛ حوزه‌ای که بسیاری از مدل‌های تصویرساز پیشین در آن ضعف داشتند. چنین بهبودهایی برای صنایعی مانند تبلیغات، آموزش، طراحی صنعتی و نمایش محصول اهمیت بالایی دارد.

در کنار واقع‌گرایی، OpenAI تأکید کرده که مدل جدید به سبک خاصی محدود نیست. این سیستم قادر است تصاویر کارتونی، گرافیکی، انیمیشنی و انواع سبک‌های هنری دیگر را نیز تولید کند. این تنوع، بخشی از استراتژی کلان OpenAI است که می‌خواهد ابزارهای خود را به‌عنوان موتورهای خلاقیت عمومی و چندمنظوره معرفی کند، نه صرفاً ابزارهایی برای تولید تصاویر واقعی.

همزمان با معرفی این مدل، OpenAI از تجربه جدیدی با عنوان Images در داخل اپلیکیشن ChatGPT نیز رونمایی کرده است. هرچند قابلیت تولید تصویر پیش‌تر هم در ChatGPT وجود داشت، اما نسخه جدید با هدف ساده‌تر کردن فرایند خلاقیت و الهام‌بخشی بیشتر طراحی شده است. این قابلیت جدید به کاربران اجازه می‌دهد بدون نیاز به ابزارهای پیچیده یا گردش‌کارهای فنی، ایده‌های بصری خود را سریع‌تر و آسان‌تر بررسی کنند.

این به‌روزرسانی تنها چند هفته پس از معرفی Nano Banana Pro گوگل انجام می‌شود؛ مدلی که بسیاری آن را نشانه‌ای از نزدیک شدن گوگل به OpenAI یا حتی پیشی گرفتن موقت آن در حوزه تولید تصویر می‌دانستند. مدل گوگل به‌ویژه به دلیل تولید تصاویر بسیار واقعی و کاربردهای سرگرم‌کننده، مانند ساخت تصاویر جعلی از حضور چهره‌های مشهور در جمع‌های خانوادگی، به سرعت محبوب شد.

بازخوردهای اولیه از جامعه هوش مصنوعی نشان می‌دهد که مدل جدید OpenAI توانسته به سطح رقابتی قابل توجهی برسد. یوچن جین، هم‌بنیان‌گذار و مدیر ارشد فناوری شرکت Hyperbolic Labs، اعلام کرده است که در آزمایش‌های شخصی خود، عملکرد این مدل را هم‌تراز با Nano Banana Pro ارزیابی کرده است. چنین اظهارنظرهایی نشان می‌دهد که فاصله میان این دو رقیب دست‌کم در حال حاضر بسیار کم شده است.

در مجموع، این رونمایی نشان می‌دهد که رقابت در حوزه تولید تصویر با هوش مصنوعی با سرعت بالایی در حال پیشرفت است. این حوزه نه‌تنها به دلیل پتانسیل وایرال شدن، بلکه به‌عنوان نمادی از پیشرفت در درک چندوجهی، استدلال و اجرای دقیق دستورها اهمیت دارد. با ادامه این رقابت میان OpenAI و گوگل، انتظار می‌رود کاربران شاهد بهبودهای سریع‌تر، خروجی‌های باکیفیت‌تر و ابزارهای خلاقانه قدرتمندتری در آینده نزدیک باشند.