به گزارش تجارت نیوز، اخیرا، تصاویری که بهکمک هوش مصنوعی Nano-Banana ساخته شدهاند و در شبکههای مجازی آپلود شدهاند، توجه بسیاری از افراد را به خود جذب کرده است. این هوش مصنوعی توانسته عکسهای تار را شفاف کند، بک گراند تصاویر را تغییر دهد و در چند ثانیه تصاویری کاملا واقعی را بر اساس خواسته کاربر به وی تحویل دهد. برخی بر این باورند که به کمک این ابزار، دیگر نیازی به برنامه ادوبی فوتوشاپ نخواهد بود و بدون نیاز به مهارت تخصصی و تنها با نوشتن دستوری ساده میتوان عکس مورد نظر را ادیت کرد.
آشنایی با هوش مصنوعی Nano-Banana
بر اساس گزارشهای منتشر شده، هوش مصنوعی Nano-Banana در چهاردهم ماه آگوست سال جاری، در بلاگ Flux AI و بدون تبلیغات خاصی عرضه و معرفی شد. با این وجود، این هوش مصنوعی توانسته توجه بسیاری از افراد را بهدلیل عملکرد فوقالعادهاش جذب کند. برخلاف گذشته، دیگر نیاز به جدا کردن لایه (layer) در عکسها نیست و با نوشتن دستوری ساده، کاربر میتواند تصاویر مدنظر را ادیت کند. کاربر میتواند به راحتی نور عکس را تنظیم کند، آن را از حالت کدر به شفاف تبدیل کند و شی مورد نظر را در تصویر جایگزین کند.
از دیگر قابلیتهای این هوش مصنوعی میتوان به ترکیب دو عکس با یکدیگر، تغییر تصویر پشت زمینه و ترمیم چهرهها در تصاویر اشاره کرد. این هوش مصنوعی حتی میتوانند صورتهایی که بهشکل عکس برای آن آپلود شده را بخاطر بسپارد و در صورت نیاز، آنها را از زوایای مختلف، بازتولید کند
هوش مصنوعی Nano-Banana متعلق به کدام شرکت است؟
هویت سازنده و تیم فنی این هوش مصنوعی جدید هنوز مشخص نیست. با این وجود، بهدلیل سابقه شرکت گوگل در نامگذاری پروژههای داخلی خود با نام میوهها، پیشبینی میشود که این هوش مصنوعی، نسل جدید هوش مصنوعی گوگل ایمج (Google Image) باشد. برخی نیز پیشبینی میکنند که این هوش مصنوعی ممکن است در سیستم هوش مصنوعی جیمنای گوگل یا گوشیهای هوشمند پیکسل نیز قرار بگیرد. با وجود اینکه گوگل در حال توسعه مدلهای هوش مصنوعی تصویری است، اما تاکنون بیانهای رسمی درباره عرضه هوش مصنوعی Nano-Banana منتشر نکرده است.
عملکرد رقابتی هوش مصنوعی تصویری جدید
بر اساس تست و مقایسهای که برخی از تحلیلگران حوزه هوش مصنوعی انجام دادهاند، این هوش مصنوعی توانسته عملکرد بهتری نسبت به دیگر رقبای خود در انجام تسکهای مختلف داشته باشد، بخصوص از این لحاظ که با ادیت عکس آپلود شده، نور و کیفیت تصاویر هیچ تغییری نمیکنند. بنظر میرسد که این مدل میتواند دستورالعملهای پیچیده را بهخوبی اجرا کند و محتوا و محیط تصویر را بهخوبی درک میکند.