به گزارش تجارت نیوز، OpenAI بهطور رسمی از یک مدل جدید و پیشرفته تولید تصویر رونمایی کرده است؛ مدلی که بهعنوان پاسخ مستقیم به موج توجه و استقبال گسترده از مدل تصویرساز Nano Banana Pro گوگل معرفی میشود. این اقدام نشاندهنده تشدید رقابت میان دو غول فناوری در یکی از حساسترین و پرطرفدارترین حوزههای هوش مصنوعی است؛ جایی که کیفیت بصری، واقعگرایی، و توانایی پیروی دقیق از دستورهای کاربر به معیارهای اصلی برتری تبدیل شدهاند.
ماه گذشته گوگل با معرفی Nano Banana Pro همزمان با مدل زبانی پرچمدار Gemini 3، توجه زیادی را به خود جلب کرد. این مدل تصویرساز بهسرعت در شبکههای اجتماعی و میان کاربران حرفهای و عادی فراگیر شد و به دلیل تولید تصاویر بسیار واقعگرایانه و جزئیات بصری چشمگیر، مورد تحسین قرار گرفت. اکنون OpenAI با معرفی مدل جدید خود تلاش دارد نشان دهد که نهتنها از این رقابت عقب نمانده، بلکه آماده است جایگاه پیشروی خود را در این عرصه حفظ کند.
OpenAI اعلام کرده است که مدل جدید تصویرساز آن نسبت به نسل قبلی صرفاً یک بهروزرسانی جزئی نیست، بلکه جهشی معنادار در عملکرد به حساب میآید. به گفته این شرکت، سرعت تولید تصاویر افزایش یافته، ویرایش تصاویر با دقت بالاتری انجام میشود و جزئیات ظریف در هنگام تولید یا اصلاح تصویر بهتر حفظ میشوند. این ویژگیها بهویژه برای کاربران حرفهای، طراحان، هنرمندان و کسبوکارهایی که به خروجیهای دقیق و قابلاعتماد نیاز دارند، اهمیت زیادی دارد.
یکی از مهمترین پیشرفتهای این مدل، بهبود قابل توجه در پیروی از دستورهای کاربر است. OpenAI تأکید کرده که توانایی درک و اجرای دقیق درخواستها، به اندازه کیفیت بصری اهمیت دارد. در بسیاری از کاربردهای تجاری و خلاقانه، یک تغییر کوچک یا برداشت نادرست از دستور میتواند کل نتیجه را بیارزش کند. به همین دلیل، تمرکز بر دقت در اجرای دستورها به یکی از محورهای اصلی توسعه این مدل تبدیل شده است.
برای نمایش این پیشرفتها، OpenAI نمونههایی از مقایسه خروجی مدل قدیمی و مدل جدید خود منتشر کرده است. در یکی از این نمونهها، از مدل خواسته شده صحنهای فوتورئالیستی از محله چلسی لندن در دهه ۱۹۷۰ تولید کند. تصاویر تولیدشده توسط مدل جدید از نظر دقت تاریخی، نورپردازی، و جزئیات محیطی هماهنگتر و باورپذیرتر به نظر میرسند و نشان میدهند که مدل قادر است دستورهای پیچیده و دارای ظرافت را بهتر درک کند.
OpenAI همچنین به کاربردهای تجاری این مدل توجه ویژهای داشته است. در نمونهای دیگر، تصاویر مربوط به یک مکانیک در حال تعمیر خودرو به نمایش گذاشته شد. در این تصاویر، هماهنگی آناتومی بدن، ابزارها و قطعات مکانیکی نسبت به گذشته بهمراتب بهتر بود؛ حوزهای که بسیاری از مدلهای تصویرساز پیشین در آن ضعف داشتند. چنین بهبودهایی برای صنایعی مانند تبلیغات، آموزش، طراحی صنعتی و نمایش محصول اهمیت بالایی دارد.
در کنار واقعگرایی، OpenAI تأکید کرده که مدل جدید به سبک خاصی محدود نیست. این سیستم قادر است تصاویر کارتونی، گرافیکی، انیمیشنی و انواع سبکهای هنری دیگر را نیز تولید کند. این تنوع، بخشی از استراتژی کلان OpenAI است که میخواهد ابزارهای خود را بهعنوان موتورهای خلاقیت عمومی و چندمنظوره معرفی کند، نه صرفاً ابزارهایی برای تولید تصاویر واقعی.
همزمان با معرفی این مدل، OpenAI از تجربه جدیدی با عنوان Images در داخل اپلیکیشن ChatGPT نیز رونمایی کرده است. هرچند قابلیت تولید تصویر پیشتر هم در ChatGPT وجود داشت، اما نسخه جدید با هدف سادهتر کردن فرایند خلاقیت و الهامبخشی بیشتر طراحی شده است. این قابلیت جدید به کاربران اجازه میدهد بدون نیاز به ابزارهای پیچیده یا گردشکارهای فنی، ایدههای بصری خود را سریعتر و آسانتر بررسی کنند.
این بهروزرسانی تنها چند هفته پس از معرفی Nano Banana Pro گوگل انجام میشود؛ مدلی که بسیاری آن را نشانهای از نزدیک شدن گوگل به OpenAI یا حتی پیشی گرفتن موقت آن در حوزه تولید تصویر میدانستند. مدل گوگل بهویژه به دلیل تولید تصاویر بسیار واقعی و کاربردهای سرگرمکننده، مانند ساخت تصاویر جعلی از حضور چهرههای مشهور در جمعهای خانوادگی، به سرعت محبوب شد.
بازخوردهای اولیه از جامعه هوش مصنوعی نشان میدهد که مدل جدید OpenAI توانسته به سطح رقابتی قابل توجهی برسد. یوچن جین، همبنیانگذار و مدیر ارشد فناوری شرکت Hyperbolic Labs، اعلام کرده است که در آزمایشهای شخصی خود، عملکرد این مدل را همتراز با Nano Banana Pro ارزیابی کرده است. چنین اظهارنظرهایی نشان میدهد که فاصله میان این دو رقیب دستکم در حال حاضر بسیار کم شده است.
در مجموع، این رونمایی نشان میدهد که رقابت در حوزه تولید تصویر با هوش مصنوعی با سرعت بالایی در حال پیشرفت است. این حوزه نهتنها به دلیل پتانسیل وایرال شدن، بلکه بهعنوان نمادی از پیشرفت در درک چندوجهی، استدلال و اجرای دقیق دستورها اهمیت دارد. با ادامه این رقابت میان OpenAI و گوگل، انتظار میرود کاربران شاهد بهبودهای سریعتر، خروجیهای باکیفیتتر و ابزارهای خلاقانه قدرتمندتری در آینده نزدیک باشند.