هوش مصنوعی «نمیدانم» بلد نیست
براساس تحقیقی جدید مدلهای زبانی بزرگ احتمال کمتری دارد که اعلام کنند پاسخ سوالی را نمیدانند و به همین دلیل اعتبار کمتری دارند.
محققان هوش مصنوعی دانشگاه پلیتکنیک والنسیا در اسپانیا جدیدترین نسخههای هوش مصنوعی BLOOM متعلق به شرکت بیگساینس، Llama متا و جیپیتی شرکت اوپنایآی را برای دقت آزمایش کردند. آنها از مدل هزاران سوال درباره ریاضی، علوم و زمینشناسی پرسیدند. در مرحله بعد پژوهشگران کیفیت پاسخهای هر مدل را مقایسه و به دستههای صحیح، اشتباه یا اجتنابشده تقسیم کردند.
این تحقیق که در نشریه نیچر منتشر شده است، نشان داد دقت در مسائل چالشبرانگیزتر در هر مدل جدید بهبود مییابد. اما این مدلها در مورد اینکه آیا میتوانند به یک سوال به درستی پاسخ دهند یا خیر، شفافیت کمتری داشتند. مدلهای زبانی بزرگتر اولیه در صورت ندانستن پاسخ، اعلام میکردند که نمیتوانند جوابی بیابند یا به اطلاعات بیشتری نیاز دارند. اما مدلهای هوش مصنوعی جدید احتمال بیشتری دارد حتی در پاسخ به سوالات سادهتر پاسخهای نادرست بدهند. هرچند مدلهای هوش مصنوعی جدید میتوانند مشکلات پیچیدهتر را با دقت بیشتری حل کنند، مدلهای زبانی بزرگ به کار رفته در این تحقیق هنگام پاسخ دادن به سوالات ساده اشتباهات بیشتری داشتند.
نظرات