تاریخ انتشار: ۲۹ آذر ۱۴۰۲ - ۱۳:۰۰

جمینی هوش مصنوعی گوگل واقعا شاهکار است؟ | واقعیت‌هایی درباره دموی جمینی

هوش مصنوعی گوگل با نام «جمینی» ادعا کرده که از همه نمونه‌ها بهتر است، اما آیا چنین حرفی درست است؟

به گزارش همشهری آنلاین و به نقل از اسپکتروم، پرده‌برداری از «جمینی» توسط گوگل، یک مدل هوش مصنوعی که برای از بین بردن شکاف بین غول موتورهای جست‌وجو و OpenAI ساخته شده است، توجه‌ها را جلب کرد. بنچ‌مارک قوی، نسخه نمایشی ویدیویی پر زرق و برق و در دسترس بودن (هرچند برای یک نسخه کات بک) بسیار امیدوارکننده بود. اما وقتی مهندسان و علاقه‌مندان به هوش مصنوعی جزئیات را بررسی کردند و ایراداتی پیدا کردند، این رویکرد مثبت از بین رفت. جمینی تازه‌واردی است که امکان دارد در نهایت سلطه GPT-4 را از بین ببرد، اما رفتار محتاطانه گوگل باعث شده است که آنها دفاعی بازی کنند.

مشکلات نسخه دموی گوگل

نسخه دموی جمینی گوگل انتقاداتی را به‌دنبال داشته است و توسعه‌دهندگان هوش مصنوعی متوجه ناهماهنگی‌هایی شدند. دموی مورد بحث «Hands-on with Gemini» نام دارد و در کنار نمایش جمینی در یوتیوب راه‌اندازی شده است. سریع، دوستانه، سرگرم‌کننده و مملو از نمونه‌های بصری قابل درک است. یکی از نمایندگان گوگل می‌گوید این نسخه نمایشی «اعلان‌ها و خروجی‌های واقعی جمینی را نشان می‌دهد». اما ویرایش ویدیو برخی از جزئیات را حذف می‌کند. تبادل با جمینی از طریق متن انجام شد، نه صدا، و مشکلات بصری که هوش مصنوعی حل کرد، به‌عنوان ورودی تصویر بود، نه یک فید ویدیوی زنده. وبلاگ گوگل همچنین درخواست‌هایی را که در نسخه نمایشی نشان داده نمی‌شوند، توضیح می‌دهد. هنگامی که از جمینی خواسته شد تا یک بازی سنگ، کاغذ، قیچی را بر اساس حرکات دست شناسایی کند، به او گفته شد که «این یک بازی است». اما نسخه دمو آن اشاره را حذف می‌کند.

این تازه شروع مشکلات گوگل است. توسعه‌دهندگان هوش مصنوعی به سرعت متوجه شدند که قابلیت‌های جمینی کمتر از آنچه در ابتدا به‌نظر می‌رسید انقلابی و پیشرو است. اگر به قابلیت‌های GPT-4 Vision نگاه کنید و رابط مناسبی برای آن بسازید، شبیه جمینی می‌شود.

در ۱۱ دسامبر، تنها پنج روز پس از پرده‌برداری از جمینی، یک توسعه‌دهنده هوش مصنوعی به نام گرگ سادتسکی، نسخه دموی جمینی را با GPT-4 Vision تولید کرد.

بیشتر بخوانید:

کشتی هوایی بنیان‌گذار گوگل برای پرواز آماده می‌شود

جمینی اولترا، بزرگ‌ترین مدل از سه مدل این خانواده، ادعا می‌کند که GPT-4 را در موارد مختلف شکست می‌دهد. گوگل برای اندازه گیری عملکرد جمینی از روش های متفاوتی نسبت به سایرین استفاده کرد. روشی که کاربر از یک مدل هوش مصنوعی درخواست می‌کند می‌تواند بر عملکرد آن تاثیر بگذارد و نتایج فقط زمانی قابل مقایسه هستند که از استراتژی یکسان و سریع استفاده شود.

مقاله گوگل در مورد جمینی طیف وسیعی از مقایسه‌ها را ارائه می‌دهد، اما تیم بازاریابی آن استراتژی‌های مختلف را مقایسه می‌کند تا نتایج خود را بهتر نشان دهد. همچنین کاملا روی جمینی اولترا تمرکز دارد که هنوز در دسترس عموم قرار نگرفته است. جمینی پرو، تنها نسخه موجود در حال حاضر، نتایج کمتر قابل توجهی را ارائه می‌دهد.

البته اگربازاریابی غیر صادقانه را کنار بگذاریم، جمینی یک شاهکار چشم‌گیر است.

مشکلات ارائه Gemini بر اعلام آن سایه انداخته است. با این حال، بازاریابی غیر صادقانه را پشت سر بگذارید و Gemini همچنان یک شاهکار چشمگیر است. سرنوشت جمینی هنوز مشخص نیست و به دتاریخ انتشار جمینی اولترا و GPT-5 OpenAI بستگی دارد. در حالی که کاربران در حال حاضر می‌توانند جمینی پرو را امتحان کنند، برادر بزرگتر آن تا سال ۲۰۲۴ منتشر نخواهد شد. سرعت سریع توسعه هوش مصنوعی باعث می‌شود که نتوان گفت که اولترا پس از ورود چگونه خواهد بود، و به OpenAI زمان کافی برای پاسخگویی با یک نسخه جی‌پی‌تی جدید می‌دهد.

منبع: همشهری آنلاین