«تجارت نیوز» گزارش میدهد:
توسعه مدل هوش مصنوعی ارزانقیمت با عملکرد پیشرفته
محققان دانشگاهی مدل هوش مصنوعی s1 را با هزینه کمتر از ۵۰ دلار توسعه دادند که عملکردی مشابه مدلهای پیشرفته دارد و بهصورت متنباز منتشر شده است.
محققان دانشگاه استنفورد و دانشگاه واشینگتن موفق به آموزش یک مدل هوش مصنوعی به نام s1 شدهاند که با هزینهای کمتر از ۵۰ دلار عملکردی مشابه مدلهای پیشرفتهای مانند o1 از OpenAI و R1 از DeepSeek دارد. این مدل، که در حوزههای ریاضیات و کدنویسی عملکرد برجستهای نشان داده، به همراه کد منبع و دادههای آموزشی، بهصورت متنباز در گیتهاب منتشر شده است. این دستاورد نشان میدهد که حتی تیمهای کوچک بدون حمایت شرکتهای بزرگ فناوری نیز میتوانند به پیشرفتهای قابلتوجهی در حوزه هوش مصنوعی دست یابند.
فرآیند آموزش: استفاده از مدل جمینی گوگل
محققان برای توسعه مدل s1 از تکنیکی به نام "استخراج دانش" (distillation) استفاده کردند. در این روش، یک مدل کوچکتر، قابلیتهای استدلالی خود را از یک مدل پیشرفتهتر استخراج میکند. در این پروژه، مدل s1 با استفاده از نسخه آزمایشی "Flash Thinking" از مدل جمینی ۲.۰ گوگل آموزش داده شد.
در مرحله بعد، تیم تحقیقاتی یک مدل متنباز کوچک از آزمایشگاه هوش مصنوعی Qwen (وابسته به علیبابا) را انتخاب کردند. سپس مجموعهای از ۱۰۰۰ پرسش به همراه پاسخها و مراحل استدلالی آنها را که توسط مدل جمینی ایجاد شده بود، گردآوری کردند. این دادهها از طریق "تنظیم دقیق تحت نظارت" (Supervised Fine-Tuning) به مدل s1 آموزش داده شد که منجر به بهبود قابلتوجه تواناییهای استدلالی آن گردید.
عملکرد قدرتمند با هزینهای ناچیز
فرآیند آموزش s1 بسیار سریع و مقرونبهصرفه بود. با استفاده از ۱۶ کارت گرافیک Nvidia H100، کل فرآیند آموزش کمتر از ۳۰ دقیقه زمان برد. نیکلاس مونینگهوف، یکی از محققان استنفورد، تخمین زده که هزینه اجاره این قدرت پردازشی امروز حدود ۲۰ دلار خواهد بود.
علیرغم هزینه ناچیز، مدل s1 توانست در آزمونهای ارزیابی هوش مصنوعی عملکرد چشمگیری از خود نشان دهد، بهویژه در حوزه استدلال منطقی. تیم تحقیقاتی همچنین دریافت که افزودن یک مرحله ساده در فرآیند استدلال مانند تأخیر کوتاه در تولید پاسخ،میتواند دقت مدل را بهبود بخشد، چرا که این روش به مدل اجازه میدهد پاسخهای خود را بازبینی و اصلاح کند.
پیامدهای توسعه این مدل در رقابت هوش مصنوعی
موفقیت s1 پرسشهایی را درباره آینده رقابت در صنعت هوش مصنوعی مطرح میکند. اگر محققان بتوانند مدلهایی با کیفیت مشابه محصولات چندمیلیوندلاری را با کسری از هزینه توسعه دهند، مزیت رقابتی شرکتهای بزرگ فناوری چه خواهد شد؟
این موضوع باعث نگرانی برخی شرکتهای بزرگ شده است. بهعنوان مثال، OpenAI اخیراً شرکت DeepSeek را به سوءاستفاده از API خود برای توسعه مدلهای مشابه متهم کرده است. گوگل نیز، که دسترسی محدودی به جمینی ۲.۰ را در اختیار کاربران قرار داده، قوانین سختگیرانهای علیه استفاده از مدلهایش برای ایجاد سیستمهای رقیب دارد و هنوز مشخص نیست که توسعه s1 نقض سیاستهای این شرکت محسوب میشود یا خیر.
آینده توسعه مدلهای متنباز و ارزانقیمت
اگرچه تکنیکهایی مانند استخراج دانش امکان بازتولید مدلهای پیشرفته را با هزینه کم فراهم میکنند، اما این روش لزوماً منجر به جهشهای اساسی در پیشرفت هوش مصنوعی نمیشود. شرکتهای بزرگی مانند متا، گوگل و مایکروسافت قصد دارند در سال ۲۰۲۵ صدها میلیارد دلار در زیرساختهای هوش مصنوعی سرمایهگذاری کنند تا مدلهایی پیشرفتهتر و خلاقانهتر توسعه دهند.
با این حال، موفقیت s1 نشان میدهد که تحقیقهای دانشگاهی و پروژههای متنباز همچنان میتوانند نقشی کلیدی در پیشرفت این فناوری ایفا کنند. این پروژه همچنین نشان میدهد که دسترسی گستردهتر به هوش مصنوعی، حتی با منابع محدود، میتواند رقابت در این حوزه را تقویت کرده و فرصتهای جدیدی برای نوآوری ایجاد کند.
نظرات