به گزارش تجارت نیوز، شرکت چینی بایدو که یکی از پیشگامان حوزه هوش مصنوعی در کشور چین است، در رویداد سالانه بایدو 2025، از مدل جدید هوش مصنوعی خود یعنی ERNIE 5.0 رونمایی کرده است. این هوش مصنوعی، قابلیت پرداز متن، تصاویر، صدا و ویدئو را دارد. معرفی این هوش مصنوعی چینی، تنها یک روز پس از معرفی مدل GPT-5.1 توسط OpenAI رخ داده است که اتفاقی بنظر نمیرسد. شرکت بایدو این مدل هوش مصنوعی جدید را یک سیستم ذاتاً همهوجهی (omni-modal) معرفی کرده است.

رونمایی از هوش مصنوعی ERNIE 5.0
هوش مصنوعی ERNIE 5.0، مدلی همهوجهی و انحصاری مختص به شرکت بایدو است که میتواند رقیبی قدرتمند برای دیگر هوش مصنوعیهای مشهور بازار یعنی جمینای گوگل و جیپیتی شرکت OpenAI باشد. برخلاف مدل پیشین این شرکت یعنی ERNIE-4.5-VL ، مدل ERNIE 5.0 دیگر بهشکل متنباز ارائه نخواهد شد. مدیران این شرکت توضیح دادهند که نسخه جدید، توانایی پردازش زبان، تحلیل داده و تولید محتوا را با جهشی قابلتوجه افزایش میدهد. این مدل میتواند حجم بالایی از دادههای متنی، تصویری و ساختاریافته را بدون کاهش سرعت پردازش میکند. مهندسان شرکت بایدو تأکید کردهاند که نسخه جدید نسبت به نسل قبلی پاسخدهی سریعتر و قابلیتهای چندرسانهای دقیقتری ارائه میدهد. مدل جدید هوش مصنوعی این شرکت چینی، فقط از طریق وبسایت ERNIE Bot و پلتفرم ابری Qianfan (از طریق API) در دسترس خواهد بود.
قابلیتهای ERNIE 5.0
یکی از قابلیتهای مهم این مدل جدید، تفکر با تصاویر (Thinking with Images) است که به این هوش مصنوعی اجازه میدهد تا به صورت پویا در تصاویر بزرگنمایی و کوچکنمایی کند و جزئیات ریز بصری را بررسی و تحلیل نماید. شرکت بایدو توضیح داده است که این قابلیت مشابه حل مسئله بصری انسان است و هنگام ادغام شدن با ابزارهای جستجوی تصویر، کارایی مدل را در پردازش اطلاعات بصری پیچیده و دسترسی به دانش گسترده افزایش میدهد.
همچنین، این شرکت چینی تأکید کرده که نسخه جدید با لایههای امنیتی قویتر عرضه شده است. سیستم بررسی و فیلتر محتوای ERNIE 5.0 دقت بیشتری دارد و اجازه نمیدهد که مدل محتوای حساس یا نادرست تولید شود. این ویژگی باعث شده که سازمانهای دولتی، مالی و دیگر نهادها بتوانند با اطمینان بیشتری از این مدل در کسب و کار خود استفاده کنند.
مقایسه عملکرد با جمینای و جیپیتی
بر اساس ارائهای که این شرکت داشته است، هوش مصنوعی 5.0 ERNIE در مقایسه با هوش مصنوعیهای محبوب بازار مانند جمینای گوگل، دیپ سیک و جیپیتی 5، در وظایفی شامل درک مطلب، تحلیل صوتی و فهم بصری عملکرد مناسب و رقابتی داشته است. بنظر میرسد که این هوش مصنوعی چینی توانسته در حوزههای تشخیص نوری کاراکترها و پاسخ به سؤال از روی اسناد عملکرد بهتری از رقبا داشته باشد.
