به گزارش تجارت نیوز، مایکروسافت بهطور رسمی از نخستین مدل درونسازمانی تولید تصویر مبتنی بر متن خود با نام MAI-Image-1 رونمایی کرد؛ مدلی که نشانهای از تغییر مسیر این شرکت در استراتژی هوش مصنوعیاش است. این مدل که بهطور کامل توسط تیم «مایکروسافت AI» طراحی و ساخته شده، به سرعت مورد توجه جامعه فناوری قرار گرفته و در میان ده مدل برتر پلتفرم LMArena جای گرفته است؛ به طوری که کاربران میتوانند کیفیت خروجی مدلهای تولید تصویر را ارزیابی و مقایسه کنند.
گامی تازه در مسیر استقلال هوش مصنوعی مایکروسافت
مایکروسافت اعلام کرده است که MAI-Image-1 گام بعدی در مسیر توسعه فناوریهای اختصاصی هوش مصنوعی این شرکت است. این مدل ادامه روندی است که با معرفی مدلهای MAI-Voice-1 (تبدیل متن به گفتار) و MAI-1-preview (چتبات مکالمهای) آغاز شد. هدف این مسیر، کاهش وابستگی مایکروسافت به شرکای بیرونی، بهویژه OpenAI و ایجاد اکوسیستم هوش مصنوعی خودکفا برای محصولات و خدمات آینده است.
در فرآیند ساخت MAI-Image-1، این شرکت همکاری نزدیکی با هنرمندان، طراحان و متخصصان صنایع خلاق داشت تا از تکراری شدن یا خروجیهای بیش از حد ماشینی جلوگیری شود؛ مشکلی که بسیاری از مدلهای تصویرساز فعلی با آن روبهرو هستند. بازخورد این متخصصان به تیم مایکروسافت کمک کرده تا دقت مدل در درک ترکیببندی، رنگ و جزئیات هنری به شکل طبیعیتر و انسانیتری افزایش یابد.
تمرکز بر سرعت، دقت و واقعگرایی
این شرکت در بیانیه خود تأکید کرده است که MAI-Image-1 در تولید تصاویر فوتورئالیستی (واقعنما) عملکرد چشمگیری دارد؛ بهویژه در بازآفرینی صحنههایی مانند رعدوبرق، مناظر طبیعی یا موقعیتهای پویا. این مدل در مقایسه با رقبای بزرگتر و پرهزینهتر، خروجیها را سریعتر تولید میکند و در عین حال از کیفیت بالایی برخوردار است.
به گفته شرکت، این مدل با بهینهسازی عمیق، قادر است درخواستهای متنوع تصویری را با تأخیر کمتر و ثبات بیشتر پردازش کند. این ویژگی آن را برای کاربردهایی مانند تولید محتوای دیجیتال، طراحی گرافیک، بازاریابی و تولید رسانهای به گزینهای جذاب تبدیل کرده است.
حضور MAI-Image-1 در جمع برترین مدلهای LMArena نیز نشانهای از موفقیت اولیه آن است. این جایگاه، MAI-Image-1 را در کنار مدلهای شناختهشدهای چون Midjourney، DALL·E و Stable Diffusion قرار داده است.
گسترش خانواده MAI و راهبرد جدید مایکروسافت
مدل MAI-Image-1 بخشی از خانواده در حال رشد مدلهای اختصاصی مایکروسافت است که قرار است در آینده به اکوسیستم نرمافزارها و خدمات این شرکت، از جمله Microsoft 365 و Azure، متصل شود. هرچند مایکروسافت همچنان از سرمایهگذاران کلیدی OpenAI به شمار میرود، روابط این دو شرکت در سال گذشته پیچیدهتر شده است. مایکروسافت در برخی بخشها همچنان از مدلهای GPT در سرویسهایی مانند Copilot و Azure استفاده میکند، اما بهطور همزمان در حال آزمایش همکاری با شرکت Anthropic برای برخی قابلیتهای جدید است.
توسعه مدل تصویری MAI-Image-1 نشان میدهد مایکروسافت بهدنبال استقلال فناورانه و ایجاد مدلهای پایه در حوزههای متن، صدا و تصویر است. شرکت اعلام کرده که سرمایهگذاری گستردهای در زمینه آموزش مدلهای اختصاصی انجام میدهد تا نسل بعدی ابزارهای هوشمند خود را بر پایه فناوریهای بومی بنا کند.
تعهد به هوش مصنوعی مسئولانه
مایکروسافت تأکید کرده است که پیش از عرضه عمومی MAI-Image-1، سیستمهای ایمنی و فیلترهای محتوایی را در آن پیادهسازی خواهد کرد. در حال حاضر، این مدل فقط برای مقاصد آزمون و ارزیابی در دسترس است و هنوز مستندات ایمنی آن بهصورت عمومی منتشر نشده است.
شرکت میگوید تمامی مدلهایش مطابق با چارچوب «هوش مصنوعی مسئولانه» طراحی میشوند تا از تولید محتوای گمراهکننده یا آسیبزا جلوگیری شود. قرار است در مراحل بعدی، گزارشهای شفافیت درباره دقت، بیطرفی و کنترل خروجی مدل منتشر شود.
کارشناسان و تحلیلگران فناوری مشتاقاند تا در مرحله آزمایشی عمومی، عملکرد خلاقانه MAI-Image-1 و سیستمهای ایمنی آن را ارزیابی کنند.
مایکروسافت و آینده استقلال در هوش مصنوعی
رونمایی از MAI-Image-1 نقطه عطفی در مسیر مایکروسافت بهسوی استقلال در حوزه هوش مصنوعی است. این شرکت که پیشتر بهعنوان شریک استراتژیک OpenAI شناخته میشد، اکنون خود را بهعنوان توسعهدهندهای توانمند در زمینه مدلهای پایه معرفی میکند.
با توجه به بازخورد مثبت اولیه و جایگاه قابل توجه MAI-Image-1 در رتبهبندیهای جهانی، مایکروسافت در حال تثبیت موقعیت خود بهعنوان یکی از رهبران آیندهنگر در هوش مصنوعی خلاق است. این مدل میتواند پایهگذار نسل تازهای از ابزارهای تولید محتوا در سراسر محصولات مایکروسافت باشد.
بهنظر میرسد MAI-Image-1 تنها آغاز راه است؛ گامی جدی برای تبدیل مایکروسافت از مصرفکننده فناوریهای هوش مصنوعی به خالق مدلهای بنیادینی که میتوانند معنای «خلاقیت با هوش مصنوعی» را از نو تعریف کنند.