به گزارش همشهری آنلاین و به نقل از تکناک، گوگل برای اولینبار در ماه ژوئن، Gemma ۲، نسل بعدی مدلهای زبانی منبعبازی را رونمایی کرد که براساس معماری جدیدی برای عملکرد و کارایی بالا طراحی شده است. پیشازاین، Gemma ۲ در دو اندازهی ۹ میلیارد (۹B) و ۲۷ میلیارد (۲۷B) پارامتر دردسترس بود. حالا گوگل با معرفی Gemma ۲ ۲B با ۲ میلیارد پارامتر، خانوادهی Gemma ۲ را گسترش داده است.
بهنقل از نئووین، مدل Gemma ۲ ۲B جدید ادعا میکند که بهترین عملکرد را ارائه میدهد و حتی در Chatbot Arena با کسب امتیاز ۱,۱۲۶ همهی مدلهای GPT-۳.۵ را شکست داده است. این مدل با سختافزارهای مختلف ازجمله کامپیوترهای شخصی و دستگاههای لبه تا استقرارهای ابری روی Google Cloud Vertex AI نیز بهخوبی سازگار است.
گوگل مدل Gemma ۲ ۲B را با کتابخانهی TensorRT-LLM انویدیا بهینه کرده است و توسعهدهندگان میتوانند از آن بهعنوان NIM (Nvidia Inference Microservices) انویدیا استفاده کنند.
ازآنجاکه این مدل برای کتابخانهی TensorRT-LLM انویدیا بهینه شده است، روی پلتفرمهای مختلف با استفاده از پردازندههای گرافیکی جیفورس RTX و ماژولهای Jetson انویدیا میتواند اجرا شود. علاوهبراین، Gemma ۲ ۲B با Keras و JAX و Hugging Face و NVIDIA NeMo و Ollama و Gemma.cpp و بهزودی با MediaPipe برای توسعهی آسان ادغام میشود.
وزنهای مدل Gemma ۲ برای دانلود از Kaggle و Hugging Face و Vertex AI Model Garden دردسترس هستند. برخلاف مدلهای گوگل جمنای، Gemma ۲ تحتمجوز تجاری دوستانه دردسترس است. گوگل همراه با Gemma ۲، مدلهای طبقهبندیکنندهی محتوای ایمنی ShieldGemma و ابزار تفسیر مدل Gemma Scope را نیز معرفی کرد.
در ماه آوریل، مایکروسافت خانوادهی مدلهای زبانی Phi-۳ را رونمایی کرد که بهطور مستقیم با خانواده مدلهای Gemma گوگل رقابت میکند. خانوادهی Phi-۳ از سه مدل تشکیل شده است:
Phi-۳-mini مدل زبانی ۳.۸B است که در دو نوع طول متن ۴K و ۱۲۸K توکن دردسترس است.
Phi-۳-Small مدل زبانی ۷B است که در دو نوع طول متن ۸K و ۱۲۸K توکن دردسترس است.
Phi-۳-medium مدل زبانی ۱۴B است که در همان دو نوع طول متن دردسترس است.
ظهور مدلهای زبان کوچکتر، اما قدرتمند مانند Gemma ۲ ۲B گوگل و خانوادهی Phi-۳ مایکروسافت نشاندهندهی روندی روبهرشد در صنعت هوش مصنوعی است. این تغییر بهسمت مدلهای کوچکتر به دسترسی و کارایی اولویت میدهد و امکان استقرار در طیف گستردهتری از دستگاهها و کاهش هزینههای محاسباتی را فراهم میکند.