تجارتنیوز گزارش میدهد:
متا وارد مسابقه هوش مصنوعی میشود/ مدل زبانی LLaMA چگونه کار میکند؟
شرکت مادر اینستاگرام و فیسبوک از مدل هوش مصنوعی خود به LLaMA رونمایی کرده است. این مدل زبانی جدید متا به نسبت کوچک اما قدرتمند است.
به گزارش تجارتنیوز ، در حالی که رقابت بین بزرگترین غولهای فناوری جهان برای عرضه ابزارهای جدید مبتنی بر هوش مصنوعی داغ شده است، شرکت متا مادر فیسبوک، اینستاگرام و واتساپ تلاشهای خود را برای پیشرفت تحقیقات در مورد هوش مصنوعی افزایش میدهد.
متا به تازگی از مدل زبانی هوش مصنوعی LLaMA رونمایی کرده است که این مدل زبانی به عنوان ابزاری برای محققان طراحی شده تا مشکلات و خطرهای احتمالی AI را پیشبینی کند. مدل زبانی جدید متا به نسبت کوچک اما قدرتمند است.
مدل زبان LLaMA هوش مصنوعی متا است
به گزارش CNET ، مارک زاکربرگ، مدیرعامل متا در یک پست فیسبوکی نوشت که «متا برای توسعه مدل زبان LLaMA هوشمند در تولید متن، گفتگو، خلاصه کردن مطالب نوشته شده و کارهای پیچیدهتر مانند حل قضایای ریاضی یا پیشبینی ساختارهای پروتئینی، تمایل زیادی نشان داده است.»
زاکربرگ همچنین در یک مصاحبه گفته بود: «هوش مصنوعی مولد یک حوزه جدید بسیار هیجانانگیز با کاربردهای مختلف است و یکی از اهداف من برای متا این است که بر اساس تحقیقات خود برای تبدیل شدن به یک رهبر در هوش مصنوعی مولد علاوهبر کارهای پیشرو در زمینه هوش مصنوعی، پیشرو باشیم.»
شرکت متا نیز در یک پست وبلاگی نوشت: «ما بر این باوریم که کل جامعه هوش مصنوعی (محققان دانشگاهی، جامعه مدنی، سیاستگذاران و صنعت) باید با هم همکاری کنند تا دستورالعملهای روشنی را در مورد هوش مصنوعی و به طور کلی مدلهای زبان بزرگ مسئول به طور خاص ایجاد کنند. ما مشتاقانه منتظریم ببینیم که جامعه با استفاده از LLaMA چه چیزی میتواند یاد بگیرد و در نهایت بسازد.»
با وجود این، دسترسی به مدل زبانی LLaMA محدود به محققانی است که متا تایید میکند، پیشرفت هوش مصنوعی به طور کلی میتواند به همراه سایر شرکتهای فناوری به نفع این غول رسانههای اجتماعی باشد.
در ماه فوریه، زاکربرگ گفت متا پس از اخراج و تجدید ساختار در شرکت، هوش مصنوعی را برای کمک به مهندسان بهرهورتر به کار میگیرد. فیسبوک همچنین از هوش مصنوعی برای توصیه محتوایی که ممکن است به آن علاقهمند باشد، استفاده میکند و هوش مصنوعی را در تجارت تبلیغاتی شرکت به کار خواهد گرفت.
کارکرد هوش مصنوعی LLaMA
LLaMA به عنوان یک مدل زبانی بزرگ، اما به نسبت کوچک است. برای ساخت یک مدل زبانی که بهاندازه کافی پیچیده باشد و بتواند در یک زبان یا زمینه مشخص به حل مسئله و گفتگو بپردازد، به دادههای زیادی احتیاج دارد. با این وجود کوچک بودن یک مدل زبانی بزرگ، منابع و توان پردازشی مورد نیاز برای تست رویکردهای تازه را کاهش میدهد.
برای تمرین دادن LLaMA به جای کلمات کامل، از قسمتهایی از کلمه یا توکن استفاده شده است. این توکنها از 20 زبان با بیشترین تعداد سخنگو با تمرکز بر الفبای لاتین و سیریلیک تولید شدهاند. LLaMA مجموعهای از مدلهاست که بین 7 تا 65 میلیارد پارامتر دارند.
LLaMA 65B و LLaMA 33B با 1.4 تریلیون توکن آموزش دیدهاند و LLaMA 7B با یک تریلیون توکن تمرین داده شده است. گزارشها میگویند که LLaMA کوچک است، اما قدرت بسیار بالایی دارد؛ متا گفته در بسیاری از بنچمارکها، LLaMA-13B توانسته GPT-3 را شکست دهد.
متا مدلهای زبانی مختلف مجموعه LLaMA را در اختیار محققان خواهد گذاشت. همچنین بنچمارکهایی نیز طراحی شده تا سوگیریهای اشتباه مدل زبانی را در صورت لزوم به محققان گوشزد نمایند.
تجربههای شکست خورده متا از هوش مصنوعی
این اولین بار نیست که متا قصد دارد که مدلی از هوش مصنوعی را توسعه دهد، اما این تجربهها با شکست مواجه شد. در سال 2022، متا دموی زنده از یک چت بات به نام BlenderBot 3 منتشر کرد، اما طولی نکشید که این ربات تئوریهای توطئه، اظهارات دین ستیزانه و حتی توهین به فیسبوک را منتشر کرد.
در نوامبر 2022، متا همچنین یک نسخه نمایشی از یک مدل زبان به نام Galactica را متوقف کرد که میتوانست تحقیقات آکادمیک را خلاصه کند، مسائل ریاضی را حل کند و محتوای علمی دیگری را ایجاد کند. ابزار هوش مصنوعی اطلاعات غلط تولید کرده بود.
مهمترین اخبار و گزارشهای مربوط به حوزه تکنولوژی و استارتاپ را در صفحه اخبار استارتاپ تجارتنیوز بخوانید.
نظرات