Command Palette
Search for a command to run...
جيميني: عائلة من النماذج متعددة الأوضاع ذات القدرات العالية
جيميني: عائلة من النماذج متعددة الأوضاع ذات القدرات العالية
Gemini Team
الملخص
تُقدِّم هذه الدراسة عائلةً جديدةً من النماذج متعددة الوسائط، تُسمَّى جيميني (Gemini)، والتي تظهر قدراتٍ ملحوظةً في فهم الصور والصوت والفيديو والنص. تتكون عائلة جيميني من أحجام ثلاثة: فوق الممتاز (Ultra) والممتاز (Pro) والصغير (Nano)، وهي مناسبة لتطبيقات تتراوح بين المهام المعقدة للتفكير إلى الحالات التي تحتاج إلى استخدام ذاكرة محدودة على الأجهزة. أظهر التقييم الذي تم على مجموعة واسعة من المقاييس أن نموذج جيميني فوق الممتاز الأكثر كفاءة قد تقدم في 30 من أصل 32 مقاييس هذه - وهو أول نموذج يحقق أداءً يعادل أداء الخبراء البشريين في مقاييس الاختبار الشهير MMLU، وتحسين الحالة الفنية في كل واحد من العشرين مقاييس متعددة الوسائط التي درسناها. نعتقد أن القدرات الجديدة لعائلة جيميني في التفكير عبر الوسائط وفهم اللغة ستتيح مجموعة واسعة من الحالات الاستخدامية. نناقش نهجنا نحو التدريب ما بعد التكوين وإطلاق نماذج جيميني بمسؤولية للمستخدمين عبر خدمات مثل جيميني وجيميني المتقدم وجوجل استوديو للذكاء الاصطناعي وCloud Vertex AI.