به گزارش تجارت نیوز، OpenAI بهتازگی گزارشی درباره مشکلات ناپسند که در مدل هوش مصنوعی پیشرفتهاش، GPT-4o، مشاهده شد، منتشر کرد. این مشکلات به قدری جدی بودند که شرکت مجبور شد بروزرسانی اخیر این مدل را که تنها یک هفته پیش منتشر شده بود، لغو کند.
کاربران از پاسخهای غیرواقعی شکایت کردند
در روزهای اخیر، پس از بروزرسانی GPT-4o، کاربران در شبکههای اجتماعی متوجه شدند که ChatGPT به شیوهای بیش از حد تأیید کننده و موافق پاسخ میدهد. این موضوع به سرعت تبدیل به یک میم شد و کاربران تصاویر از ChatGPT را منتشر کردند که به تصمیمات و ایدههای خطرناک و مشکلدار به طرز غیرواقعی تشویق میکرد.
در پستی در شبکه اجتماعی X، سم آلتمن، مدیرعامل OpenAI، به این مشکل اذعان کرد و اعلام کرد که این شرکت بهزودی در پی رفع آن خواهد بود. دو روز بعد، آلتمن اعلام کرد که بروزرسانی GPT-4o لغو شده و OpenAI در حال کار بر روی «اصلاحات اضافی» برای شخصیت این مدل است.
ارائه توضیحات درباره دلایل مشکلات
بر اساس بیانیه OpenAI، این بروزرسانی بهمنظور بهبود شخصیت پیشفرض مدل و ایجاد احساس «بیشتر شهودی و مؤثر» طراحی شده بود. اما این بروزرسانی به شدت تحت تأثیر «بازخوردهای کوتاهمدت» قرار گرفت و «کاملاً به نحوه تکامل تعاملات کاربران با ChatGPT در طول زمان توجه نکرد.»
OpenAI در توییت خود اعلام کرد: «ما بروزرسانی GPT-4o را به دلیل رفتارهای غیرواقعی و بیش از حد تأیید کننده لغو کردیم. شما اکنون به نسخهای قدیمیتر با رفتار متعادلتر دسترسی دارید.»
اصلاحات و اقدامات جدید OpenAI
OpenAI همچنین اعلام کرد که در حال پیادهسازی چندین اصلاحات است، از جمله بهبود تکنیکهای آموزشی مدل و راهنماهای سیستمی بهمنظور هدایت بهتر GPT-4o دور از رفتارهای ناپسند است. راهنماهای سیستمی، دستورالعملهای اولیهای هستند که رفتار کلی و لحن مدل را در تعاملات هدایت میکنند. همچنین، این شرکت در حال ایجاد حفاظهای ایمنی بیشتری برای «افزایش صداقت و شفافیت» مدل خود است و بهطور مداوم در حال گسترش ارزیابیهایش برای «شناسایی مسائل فراتر از مشکلات ناپسند» میباشد.
OpenAI همچنین در حال آزمایش روشهایی است که به کاربران اجازه میدهد «بازخورد لحظهای» ارائه دهند تا «بهطور مستقیم بر تعاملات خود با ChatGPT تأثیر بگذارند» و از چندین شخصیت مختلف ChatGPT انتخاب کنند.
این شرکت در بیانیه خود اعلام کرد: «ما در حال بررسی راههای جدید برای گنجاندن بازخوردهای گسترده و دموکراتیک در رفتارهای پیشفرض ChatGPT هستیم. امیدواریم این بازخورد کمک کند تا ارزشهای فرهنگی متنوع در سراسر جهان را بهتر منعکس کنیم و بفهمیم که چگونه میخواهید ChatGPT توسعه یابد. ما همچنین اعتقاد داریم که کاربران باید کنترل بیشتری بر رفتار ChatGPT داشته باشند و در حد امکان و ایمنی، در صورت عدم توافق با رفتار پیشفرض، تغییرات لازم را انجام دهند.»