تجارت‌نیوز گزارش می‌دهد:

متا وارد مسابقه هوش مصنوعی می‌شود/ مدل زبانی LLaMA چگونه کار می‌کند؟

شرکت مادر اینستاگرام و فیسبوک از مدل هوش مصنوعی خود به LLaMA رونمایی کرده است. این مدل زبانی جدید ‌متا‌ به نسبت کوچک اما قدرتمند است.

به گزارش تجارت‌نیوز ، در حالی که رقابت بین بزرگ‌ترین غول‌های فناوری جهان برای عرضه ابزارهای جدید مبتنی بر هوش مصنوعی داغ شده است، شرکت متا مادر فیسبوک، اینستاگرام و واتساپ تلاش‌های خود را برای پیشرفت تحقیقات در مورد هوش مصنوعی افزایش می‌دهد.

متا به تازگی از مدل زبانی هوش‌ مصنوعی LLaMA رونمایی کرده است که این مدل زبانی به عنوان ابزاری برای محققان طراحی شده تا مشکلات و خطرهای احتمالی AI را پیش‌بینی کند. مدل زبانی جدید ‌متا‌ به نسبت کوچک اما قدرتمند است.

مدل زبان LLaMA هوش مصنوعی متا است

به گزارش CNET ، مارک زاکربرگ، مدیرعامل ‌متا‌ در یک پست فیسبوکی نوشت که «‌متا‌ برای توسعه مدل زبان LLaMA هوشمند در تولید متن، گفتگو، خلاصه کردن مطالب نوشته شده و کارهای پیچیده‌تر مانند حل قضایای ریاضی یا پیش‌بینی ساختارهای پروتئینی، تمایل زیادی نشان داده‌ است.»

زاکربرگ همچنین در یک مصاحبه گفته بود: «‌هوش مصنوعی مولد یک حوزه جدید بسیار هیجان‌انگیز با کاربردهای مختلف است و یکی از اهداف من برای ‌متا این است که بر اساس تحقیقات خود برای تبدیل شدن به یک رهبر در ‌هو‌ش‌ مصنو‌عی مولد علاوه‌بر کارهای پیشرو در زمینه هو‌ش‌‌‌ مصنو‌عی‌‌، پیشرو باشیم.»

شرکت متا نیز در یک پست وبلاگی نوشت: «ما بر این باوریم که کل جامعه ‌‌هوش‌ ‌مصنوعی‌ (محققان دانشگاهی، جامعه مدنی، سیاست‌گذاران و صنعت) باید با هم همکاری کنند تا دستورالعمل‌های روشنی را در مورد هو‌ش‌ مصنوعی و به طور کلی مدل‌های زبان بزرگ مسئول به طور خاص ایجاد کنند. ما مشتاقانه منتظریم ببینیم که جامعه با استفاده از LLaMA چه چیزی می‌تواند یاد بگیرد و در نهایت بسازد.»

با وجود این، دسترسی به مدل زبانی LLaMA محدود به محققانی است که متا تایید می‌کند، پیشرفت هو‌ش مصنو‌عی به طور کلی می‌تواند به همراه سایر شرکت‌های فناوری به نفع این غول رسانه‌های اجتماعی باشد.

در ماه فوریه، زاکربرگ گفت ‌متا پس از اخراج و تجدید ساختار در شرکت، ‌هوش‌ مصنوعی را برای کمک به مهندسان بهره‌ورتر به کار می‌گیرد. فیسبوک همچنین از هوش‌‌‌ مصنوعی‌ برای توصیه محتوایی که ممکن است به آن علاقه‌مند باشد، استفاده می‌کند و ‌هو‌ش‌‌ مصنوعی را در تجارت تبلیغاتی شرکت به کار خواهد گرفت.

کارکرد هوش مصنوعی LLaMA

LLaMA به عنوان یک مدل زبانی بزرگ، اما به نسبت کوچک است. برای ساخت یک مدل زبانی که به‌اندازه کافی پیچیده باشد و بتواند در یک زبان یا زمینه مشخص به حل مسئله و گفتگو بپردازد، به داده‌های زیادی احتیاج دارد. با این وجود کوچک بودن یک مدل زبانی بزرگ، منابع و توان پردازشی مورد نیاز برای تست رویکردهای تازه را کاهش می‌دهد.

برای تمرین دادن LLaMA به جای کلمات کامل، از قسمت‌هایی از کلمه یا توکن استفاده شده است. این توکن‌ها از 20 زبان با بیشترین تعداد سخنگو با تمرکز بر الفبای لاتین و سیریلیک تولید شده‌اند. LLaMA مجموعه‌ای از مدل‌هاست که بین 7 تا 65 میلیارد پارامتر دارند.

LLaMA 65B و LLaMA 33B با 1.4 تریلیون توکن آموزش دیده‌اند و LLaMA 7B با یک تریلیون توکن تمرین داده شده است. گزارش‌ها می‌گویند که LLaMA کوچک است، اما قدرت بسیار بالایی دارد؛ متا گفته در بسیاری از بنچمارک‌ها، LLaMA-13B توانسته GPT-3 را شکست دهد.

‌متا مدل‌های زبانی مختلف مجموعه LLaMA را در اختیار محققان خواهد گذاشت. همچنین بنچمارک‌هایی نیز طراحی شده تا سوگیری‌های اشتباه مدل زبانی را در صورت لزوم به محققان گوشزد نمایند.

تجربه‌های شکست خورده متا‌‌ از هو‌ش مصنوعی

این اولین بار نیست که ‌‌متا قصد دارد که مدلی از هو‌ش مصنو‌عی را توسعه دهد، اما این تجربه‌ها با شکست مواجه شد. در سال 2022، متا‌ دموی زنده از یک چت بات به نام BlenderBot 3 منتشر کرد، اما طولی نکشید که این ربات تئوری‌های توطئه، اظهارات دین ستیزانه و حتی توهین به فیسبوک را منتشر کرد.

در نوامبر 2022، متا همچنین یک نسخه نمایشی از یک مدل زبان به نام Galactica را متوقف کرد که می‌توانست تحقیقات آکادمیک را خلاصه کند، مسائل ریاضی را حل کند و محتوای علمی دیگری را ایجاد کند. ابزار هو‌ش مصنوعی اطلاعات غلط تولید کرده بود.

مهم‌ترین اخبار و گزارش‌های مربوط به حوزه تکنولوژی و استارتاپ را در صفحه اخبار استارتاپ تجارت‌نیوز بخوانید.