به گزارش تجارت نیوز، «امروز صبح با جمینای در کروم، جدیدترین ادغام دستیار هوش مصنوعی گوگل، وقت گذراندم. این دستیار به صورت مستقیم در مرورگر شما قرار دارد و نیازی به مراجعه به اپلیکیشن وب آن نیست. با کلیک روی دکمه جدید جمینای در گوشه بالای سمت راست کروم، میتوانید مکالمهای را آغاز کنید. نکته جالب اینجاست که دستیار داخلی مرورگر میتواند «ببیند» چه چیزی روی صفحه شماست در حالی که در وب جستوجو میکنید.»
جمینای، قدمی به سوی هوش مصنوعی خودمختار
به نظر میرسد ادغام جمینای در کروم تنها آغاز مأموریت گوگل برای تبدیل کردن هوش مصنوعی خود به یک ابزار «خودمختار» باشد. در حال حاضر، تنها کاربران اشتراکی AI Pro یا AI Ultra میتوانند از نسخه اولیه جمینای در کروم استفاده کنند و باید یکی از نسخههای بتا، توسعهدهنده یا کاناری کروم را در اختیار داشته باشند.
«در اولین تجربه خود با جمینای، از آن خواستم برخی از مقالات در وبسایت «ورج» را خلاصه و همچنین اخبار مربوط به بازیها را در صفحه اصلی پیدا کند. جمینای بهخوبی توانست بازیهای جدید Game Boy که نینتندو به سرویس Switch Online خود اضافه کرده بود، فیلم اقتباسی از بازی Elden Ring و بهروزرسانی بزرگ Steam Deck از Valve را معرفی کند.»
عملکرد در صفحات مختلف
اما جمینای تنها میتواند آنچه را که به طور مستقیم روی صفحه است «ببیند». بنابراین اگر بخواهید بخشهایی مانند بخش نظرات «ورج» را خلاصه کند، باید آن را باز کنید تا دستیار بتواند پاسخ دهد. جمینای همچنین میتواند شما را در زمان تغییر تبها دنبال کند، اما تنها قادر است اطلاعات یک تب را استخراج کند.
اگر نمیخواهید تایپ کنید، جمینای در کروم به شما این امکان را میدهد که با انتخاب دکمهای در گوشه پایین سمت راست کادر گفتوگو به ویژگی «زنده» آن سوییچ کنید. از آنجا میتوانید بهسادگی یک سوال را با صدای بلند بپرسید و جمینای به شما پاسخ میدهد.
کاربردهای جمینای در ویدئوها
این ویژگی بهویژه در کنار ویدئوهای یوتیوب بسیار کاربردی است. من یکی از ویدئوهای بازسازی حمام را پخش کردم و از جمینای پرسیدم: «او از چه ابزاری استفاده میکند؟» جمینای پاسخ داد: «به نظر میرسد او از یک میخکوب برای اتصال قطعات چوبی استفاده میکند.» در یک ویدئوی دیگر، جمینای بهدرستی یک خازن روی مادربورد را شناسایی و همچنین انبرک و ابزار هوای داغی را که یوتیوبر برای برداشتن آن استفاده کرده بود معرفی کرد. این دستیار میتواند ویدئوها را خلاصه کند و در مورد قسمتهای خاصی که هنوز مشاهده نکردهاید، اطلاعاتی ارائه دهد، اما اگر ویدئو دارای فصلبندی مشخصی نباشد، این اطلاعات همیشه دقیق نیست.
یکی از کاربردهای مورد علاقه من در این ادغام، استخراج دستور پختها از ویدئوهای یوتیوب بود، به طوری که نیازی به نوشتن دستور پختها یا جستوجوی لینک در توضیحات نبود. همچنین هنگامی که از او خواستم تا کیسههای ضدآب را در صفحه جستوجوی آمازون شناسایی کند، کارآمد بود.
جمینای در کروم همچنین میتواند دستور پختها را از ویدئوهای یوتیوب استخراج کند و بله، آن را با دستور واقعی تطبیق داد.
چالشهای پیش روی جمینای
با وجود این، جمینای همیشه نتایج یکسانی ارائه نمیدهد. وقتی از جمینای پرسیدم که آقای بیست در کجا قرار دارد، در ویدئویی که او در حال کاوش در شهرهای باستانی مایا بود، پاسخ داد: «من به اطلاعات زمان واقعی دسترسی ندارم، بنابراین نمیتوانم مکان دقیق آقای بیست را مشخص کنم.» وقتی دوباره از او پرسیدم، جمینای بنا بر مکانی که در توضیحات ویدئو ذکر شده بود، یعنی مکزیک، پاسخ داد. بار دیگر خواستم لینکی برای خرید یک جفت انبر خاص که در ویدئو نشان داده شده بود، ارائه دهد، اما جمینای دوباره پاسخ داد به اطلاعات زمان واقعی دسترسی ندارد.
در برخی مواقع، احساس کردم پاسخهای جمینای برای یک پنجره کوچک در کروم بسیار طولانی است. میتوانید آن را گسترش دهید، اما فضای زیادی روی نمایشگر ۱۳ اینچی مکبوک ایر من باقی نمیگذارد. یکی از ویژگیهای اصلی هوش مصنوعی این است که به شما کمک کند با ارائه پاسخهای سریع و مختصر در زمان صرفهجویی کنید، که گاهی به این هدف نمیرسد مگر اینکه به طور خاص از او بخواهم.
با وجود این چالشها، بهوضوح میتوانم ببینم که گوگل ادغام جمینای در کروم را فراتر از پرسشها و پاسخهای ساده توسعه میدهد. گوگل میخواهد هوش مصنوعیاش به یک ابزار «خودمختار» تبدیل شود، به این معنی که میتواند وظایفی را به نمایندگی از شما انجام دهد. برای مثال، پس از درخواست از جمینای برای خلاصه کردن منوی یک رستوران، حتی به این فکر کردم که از او بخواهم یک سفارش برداشت کند- یک وظیفه خودمختار که هنوز نمیتواند انجام دهد. میتوانم تصور کنم که در آینده، این دستیار صفحات مرتبط با تحقیق سفر را برای من نشانهگذاری کند یا حتی ویدئوهای یوتیوب از دستور پختهای مختلف را به لیست «مشاهده بعدی» من بیفزاید.
به نظر میرسد گوگل با معرفی «حالت عامل» در اپلیکیشن جمینای، که به آن اجازه میدهد حداکثر ۱۰ وظیفه را همزمان مدیریت و وب را برای شما جستوجو کند، به تحقق این هدف نزدیکتر میشود. شاید روزی این قابلیتها به جمینای در کروم نیز اضافه شود.