«تجارتنیوز» گزارش میدهد:
روش نوین MIT برای آموزش ربات ها با دادههای بزرگ
محققان MIT با استفاده از رویکردی مشابه مدلهای زبانی بزرگ، رباتها را قادر به انطباق با محیطهای متنوع کردند.
محققان MIT روش نوینی برای آموزش ربات ها معرفی کردند که به جای استفاده از مجموعه دادههای محدود و سنتی، از مدلی الهام گرفتهشده از دادههای وسیع به کاررفته در آموزش مدلهای زبانی بزرگ مانند GPT-4 استفاده میکند. این رویکرد که این هفته ارائه شد، میتواند به ربات ها کمک کند تا با روشهای مؤثرتر و مشابه به جمعآوری اطلاعات در مدلهای زبانی، آموزش ببینند.
چالشهای یادگیری تقلیدی
بهطور معمول، آموزش ربات ها شامل روش «یادگیری تقلیدی» است. در این روش، ربات با مشاهده انسانها در حال انجام کارهای خاص، یاد میگیرد و سعی دارد آنها را تکرار کند. اگرچه این روش در محیطهای کنترلشده مؤثر است، اما در مواجهه با چالشهای غیرمنتظره، مانند تغییرات نور، موانع جدید یا محیطهای مختلف، یادگیری تقلیدی ناکام میماند. در این شرایط، ربات ها معمولاً توانایی انطباقی انسانها در حل مسائل را ندارند و این ناتوانی هم به این خاطر است که آنها با دادههای متنوع کافی برای مدیریت همه متغیرهای ممکن، مواجه نشدهاند.
الهام از مدلهای زبانی بزرگ
محققان MIT برای غلبه بر این محدودیت، از نحوه عملکرد مدلهای زبانی بزرگ الهام گرفتند. لیری وانگ، محقق اصلی این پروژه، توضیح داد: «در زبان، دادهها همه جملات هستند، اما در رباتیک، دادهها بسیار متنوعترند. برای آموزش ربات ها به شیوهای مشابه، به رویکرد متفاوتی نیاز داریم که بتواند این پیچیدگی را مدیریت کند.» با این دیدگاه، تیم تحقیقاتی، معماری جدیدی به اسم «ترنسفورمرهای پیشآموخته ناهمگن(HPT) » را توسعه دادند که قادر به مدیریت انواع مختلف دادههایی است که ربات ها با آنها روبرو میشوند.
تواناییهای HPT در یادگیری ربات ها
HPT اطلاعات را از منابع مختلف، از جمله سنسورها و تنظیمات محیطی متفاوت، ترکیب میکند و به ربات اجازه میدهد تا از دامنه وسیعتری از تجربیات استفاده کند. با استفاده از ترنسفورمرها، که نوعی شبکه عصبی برای سازماندهی و پردازش مجموعه دادههای بزرگ هستند، تیم تحقیقاتی هدف داشت تا توانایی ربات را برای انطباق با سناریوهای جدید افزایش دهد. درست مثل مدلهای زبانی، هرچه ترنسفورمر بزرگتر در HPT استفاده شود، عملکرد ربات بهتر خواهد بود.
روند آموزش ربات ها با HPT
برای آموزش ربات ها با استفاده از این روش، کاربران طراحی و پیکربندی ربات و وظیفهای که باید انجام دهد را وارد میکنند. پس از آن، معماری HPT دادههای مرتبط را استخراج کرده و ربات را در یادگیری و انجام وظیفه مورد نظر راهنمایی میکند. ربات هم بهطور مداوم با توجه به محیط خود منطبق میشود.
چشمانداز آینده ربات ها
این دستاورد با دیدگاهی که دیوید هلد، استاد دانشگاه کارنگی ملون، به اشتراک گذاشت، همخوانی دارد. او در این باره گفت: «رویای ما این است که یک مغز ربات جهانی داشته باشیم که بتوانید آن را دانلود و بدون هیچ آموزشی استفاده کنید.» او افزود که در حالی که این تحقیق هنوز در مراحل اولیه خود است، امیدوارند با مقیاسگذاری مدل، پیشرفتهای قابلتوجهی مشابه آنچه در زمینه پردازش زبان طبیعی با مدلهای زبانی بزرگ اتفاق افتاد، حاصل شود.
همکاری با صنعت رباتیک
مؤسسه تحقیقاتی تویوتا (TRI) بخشی از این تحقیق را تامین مالی کرده است. این موسسه سابقهای در حمایت از تحقیق پیشرفته در زمینه رباتیک دارد. در سال ۲۰۲۳، TRI روشی برای آموزش ربات ها در طول شب را ارائه کرد و اخیراً وارد همکاری استراتژیکی با Boston Dynamics شده است تا تخصص TRI در یادگیری رباتها را با فناوریهای پیشرفته Boston Dynamics ترکیب کند. این همکاری نشاندهنده گام مهمی در کاربرد و احتمال تجاریسازی برخی از یافتههای MIT در رباتیک واقعی است.
پتانسیلهای هیجانانگیز ربات ها
در حال حاضر، مدل HPT MIT نمایانگر تغییری امیدوارکننده به سمت ایجاد ربات هایی است که میتوانند با محیطهای متنوع انطباق و با چالشهای غیرمنتظره برخورد کنند. اگرچه هنوز کارهای زیادی در پیش است، تحقیق اخیر MIT پتانسیل هیجانانگیزی را برای رباتها به نمایش میگذارد تا تواناییهای حل مسئله مشابه انسان را در آینده نزدیک به دست آورند.
اخبار حوزه استارتاپ و فناوری اطلاعات را در صفحه علم و فناوری تجارتنیوز بخوانید.
نظرات