«تجارت‌نیوز» گزارش می‌دهد:

گام بزرگ مایکروسافت در هوش مصنوعی با رونمایی از مدل MAI-Image-1

مایکروسافت با معرفی مدل MAI-Image-1 وارد مرحله تازه‌ای از توسعه درون‌سازمانی هوش مصنوعی شده و برای نخستین بار تصویرساز اختصاصی خود را معرفی کرده است.

به گزارش تجارت نیوز، مایکروسافت به‌طور رسمی از نخستین مدل درون‌سازمانی تولید تصویر مبتنی بر متن خود با نام MAI-Image-1 رونمایی کرد؛ مدلی که نشانه‌ای از تغییر مسیر این شرکت در استراتژی هوش مصنوعی‌اش است. این مدل که به‌طور کامل توسط تیم «مایکروسافت AI» طراحی و ساخته شده، به سرعت مورد توجه جامعه فناوری قرار گرفته و در میان ده مدل برتر پلتفرم LMArena جای گرفته است؛ به طوری که کاربران می‌توانند کیفیت خروجی مدل‌های تولید تصویر را ارزیابی و مقایسه کنند.

گامی تازه در مسیر استقلال هوش مصنوعی مایکروسافت

مایکروسافت اعلام کرده است که MAI-Image-1 گام بعدی در مسیر توسعه فناوری‌های اختصاصی هوش مصنوعی این شرکت است. این مدل ادامه روندی است که با معرفی مدل‌های MAI-Voice-1 (تبدیل متن به گفتار) و MAI-1-preview (چت‌بات مکالمه‌ای) آغاز شد. هدف این مسیر، کاهش وابستگی مایکروسافت به شرکای بیرونی، به‌ویژه OpenAI و ایجاد اکوسیستم هوش مصنوعی خودکفا برای محصولات و خدمات آینده است.

در فرآیند ساخت MAI-Image-1، این شرکت همکاری نزدیکی با هنرمندان، طراحان و متخصصان صنایع خلاق داشت تا از تکراری شدن یا خروجی‌های بیش از حد ماشینی جلوگیری شود؛ مشکلی که بسیاری از مدل‌های تصویرساز فعلی با آن روبه‌رو هستند. بازخورد این متخصصان به تیم مایکروسافت کمک کرده تا دقت مدل در درک ترکیب‌بندی، رنگ و جزئیات هنری به شکل طبیعی‌تر و انسانی‌تری افزایش یابد.

تمرکز بر سرعت، دقت و واقع‌گرایی

این شرکت در بیانیه خود تأکید کرده است که MAI-Image-1 در تولید تصاویر فوتورئالیستی (واقع‌نما) عملکرد چشمگیری دارد؛ به‌ویژه در بازآفرینی صحنه‌هایی مانند رعدوبرق، مناظر طبیعی یا موقعیت‌های پویا. این مدل در مقایسه با رقبای بزرگ‌تر و پرهزینه‌تر، خروجی‌ها را سریع‌تر تولید می‌کند و در عین حال از کیفیت بالایی برخوردار است.

به گفته شرکت، این مدل با بهینه‌سازی عمیق، قادر است درخواست‌های متنوع تصویری را با تأخیر کمتر و ثبات بیشتر پردازش کند. این ویژگی آن را برای کاربردهایی مانند تولید محتوای دیجیتال، طراحی گرافیک، بازاریابی و تولید رسانه‌ای به گزینه‌ای جذاب تبدیل کرده است.

حضور MAI-Image-1 در جمع برترین مدل‌های LMArena نیز نشانه‌ای از موفقیت اولیه آن است. این جایگاه، MAI-Image-1 را در کنار مدل‌های شناخته‌شده‌ای چون Midjourney، DALL·E و Stable Diffusion قرار داده است.

گسترش خانواده MAI و راهبرد جدید مایکروسافت

مدل MAI-Image-1 بخشی از خانواده در حال رشد مدل‌های اختصاصی مایکروسافت است که قرار است در آینده به اکوسیستم نرم‌افزارها و خدمات این شرکت، از جمله Microsoft 365 و Azure، متصل شود. هرچند مایکروسافت همچنان از سرمایه‌گذاران کلیدی OpenAI به شمار می‌رود، روابط این دو شرکت در سال گذشته پیچیده‌تر شده است. مایکروسافت در برخی بخش‌ها همچنان از مدل‌های GPT در سرویس‌هایی مانند Copilot و Azure استفاده می‌کند، اما به‌طور هم‌زمان در حال آزمایش همکاری با شرکت Anthropic برای برخی قابلیت‌های جدید است.

توسعه مدل تصویری MAI-Image-1 نشان می‌دهد مایکروسافت به‌دنبال استقلال فناورانه و ایجاد مدل‌های پایه در حوزه‌های متن، صدا و تصویر است. شرکت اعلام کرده که سرمایه‌گذاری گسترده‌ای در زمینه آموزش مدل‌های اختصاصی انجام می‌دهد تا نسل بعدی ابزارهای هوشمند خود را بر پایه فناوری‌های بومی بنا کند.

تعهد به هوش مصنوعی مسئولانه

مایکروسافت تأکید کرده است که پیش از عرضه عمومی MAI-Image-1، سیستم‌های ایمنی و فیلترهای محتوایی را در آن پیاده‌سازی خواهد کرد. در حال حاضر، این مدل فقط برای مقاصد آزمون و ارزیابی در دسترس است و هنوز مستندات ایمنی آن به‌صورت عمومی منتشر نشده است.

شرکت می‌گوید تمامی مدل‌هایش مطابق با چارچوب «هوش مصنوعی مسئولانه» طراحی می‌شوند تا از تولید محتوای گمراه‌کننده یا آسیب‌زا جلوگیری شود. قرار است در مراحل بعدی، گزارش‌های شفافیت درباره دقت، بی‌طرفی و کنترل خروجی مدل منتشر شود.

کارشناسان و تحلیلگران فناوری مشتاق‌اند تا در مرحله آزمایشی عمومی، عملکرد خلاقانه MAI-Image-1 و سیستم‌های ایمنی آن را ارزیابی کنند.

مایکروسافت و آینده استقلال در هوش مصنوعی

رونمایی از MAI-Image-1 نقطه عطفی در مسیر مایکروسافت به‌سوی استقلال در حوزه هوش مصنوعی است. این شرکت که پیش‌تر به‌عنوان شریک استراتژیک OpenAI شناخته می‌شد، اکنون خود را به‌عنوان توسعه‌دهنده‌ای توانمند در زمینه مدل‌های پایه معرفی می‌کند.

با توجه به بازخورد مثبت اولیه و جایگاه قابل توجه MAI-Image-1 در رتبه‌بندی‌های جهانی، مایکروسافت در حال تثبیت موقعیت خود به‌عنوان یکی از رهبران آینده‌نگر در هوش مصنوعی خلاق است. این مدل می‌تواند پایه‌گذار نسل تازه‌ای از ابزارهای تولید محتوا در سراسر محصولات مایکروسافت باشد.

به‌نظر می‌رسد MAI-Image-1 تنها آغاز راه است؛ گامی جدی برای تبدیل مایکروسافت از مصرف‌کننده فناوری‌های هوش مصنوعی به خالق مدل‌های بنیادینی که می‌توانند معنای «خلاقیت با هوش مصنوعی» را از نو تعریف کنند.