به گزارش همشهری آنلاین و به نقل از اسپکتروم، پردهبرداری از «جمینی» توسط گوگل، یک مدل هوش مصنوعی که برای از بین بردن شکاف بین غول موتورهای جستوجو و OpenAI ساخته شده است، توجهها را جلب کرد. بنچمارک قوی، نسخه نمایشی ویدیویی پر زرق و برق و در دسترس بودن (هرچند برای یک نسخه کات بک) بسیار امیدوارکننده بود. اما وقتی مهندسان و علاقهمندان به هوش مصنوعی جزئیات را بررسی کردند و ایراداتی پیدا کردند، این رویکرد مثبت از بین رفت. جمینی تازهواردی است که امکان دارد در نهایت سلطه GPT-4 را از بین ببرد، اما رفتار محتاطانه گوگل باعث شده است که آنها دفاعی بازی کنند.
مشکلات نسخه دموی گوگل
نسخه دموی جمینی گوگل انتقاداتی را بهدنبال داشته است و توسعهدهندگان هوش مصنوعی متوجه ناهماهنگیهایی شدند. دموی مورد بحث «Hands-on with Gemini» نام دارد و در کنار نمایش جمینی در یوتیوب راهاندازی شده است. سریع، دوستانه، سرگرمکننده و مملو از نمونههای بصری قابل درک است. یکی از نمایندگان گوگل میگوید این نسخه نمایشی «اعلانها و خروجیهای واقعی جمینی را نشان میدهد». اما ویرایش ویدیو برخی از جزئیات را حذف میکند. تبادل با جمینی از طریق متن انجام شد، نه صدا، و مشکلات بصری که هوش مصنوعی حل کرد، بهعنوان ورودی تصویر بود، نه یک فید ویدیوی زنده. وبلاگ گوگل همچنین درخواستهایی را که در نسخه نمایشی نشان داده نمیشوند، توضیح میدهد. هنگامی که از جمینی خواسته شد تا یک بازی سنگ، کاغذ، قیچی را بر اساس حرکات دست شناسایی کند، به او گفته شد که «این یک بازی است». اما نسخه دمو آن اشاره را حذف میکند.
این تازه شروع مشکلات گوگل است. توسعهدهندگان هوش مصنوعی به سرعت متوجه شدند که قابلیتهای جمینی کمتر از آنچه در ابتدا بهنظر میرسید انقلابی و پیشرو است. اگر به قابلیتهای GPT-4 Vision نگاه کنید و رابط مناسبی برای آن بسازید، شبیه جمینی میشود.
در ۱۱ دسامبر، تنها پنج روز پس از پردهبرداری از جمینی، یک توسعهدهنده هوش مصنوعی به نام گرگ سادتسکی، نسخه دموی جمینی را با GPT-4 Vision تولید کرد.
بیشتر بخوانید:
جمینی اولترا، بزرگترین مدل از سه مدل این خانواده، ادعا میکند که GPT-4 را در موارد مختلف شکست میدهد. گوگل برای اندازه گیری عملکرد جمینی از روش های متفاوتی نسبت به سایرین استفاده کرد. روشی که کاربر از یک مدل هوش مصنوعی درخواست میکند میتواند بر عملکرد آن تاثیر بگذارد و نتایج فقط زمانی قابل مقایسه هستند که از استراتژی یکسان و سریع استفاده شود.
مقاله گوگل در مورد جمینی طیف وسیعی از مقایسهها را ارائه میدهد، اما تیم بازاریابی آن استراتژیهای مختلف را مقایسه میکند تا نتایج خود را بهتر نشان دهد. همچنین کاملا روی جمینی اولترا تمرکز دارد که هنوز در دسترس عموم قرار نگرفته است. جمینی پرو، تنها نسخه موجود در حال حاضر، نتایج کمتر قابل توجهی را ارائه میدهد.
البته اگربازاریابی غیر صادقانه را کنار بگذاریم، جمینی یک شاهکار چشمگیر است.
مشکلات ارائه Gemini بر اعلام آن سایه انداخته است. با این حال، بازاریابی غیر صادقانه را پشت سر بگذارید و Gemini همچنان یک شاهکار چشمگیر است. سرنوشت جمینی هنوز مشخص نیست و به دتاریخ انتشار جمینی اولترا و GPT-5 OpenAI بستگی دارد. در حالی که کاربران در حال حاضر میتوانند جمینی پرو را امتحان کنند، برادر بزرگتر آن تا سال ۲۰۲۴ منتشر نخواهد شد. سرعت سریع توسعه هوش مصنوعی باعث میشود که نتوان گفت که اولترا پس از ورود چگونه خواهد بود، و به OpenAI زمان کافی برای پاسخگویی با یک نسخه جیپیتی جدید میدهد.
نظر شما