Gemini تتصدر تصنيفات نماذج التضمين بينما تضيق الفجوة بفضل البديل المفتوح المصدر من علي بابا
تلخيص المقال تاريخ النشر: 18 يوليو 2025 الصورة: VentureBeat مع Imagen-4 ملخص المقال: في خطوة استراتيجية مهمة، أعلنت شركة جوجل رسمياً عن توفر نموذج التضمين الجديد "Gemini Embedding" بشكل عام، والذي حاز على المركز الأول في مقياس "Massive Text Embedding Benchmark" (MTEB)، وهو أحد المقاييس المرموقة في مجال التعلم العميق والذكاء الاصطناعي. يعتبر هذا النموذج جزءاً أساسياً من "Gemini API" و"Vertex AI"، مما يتيح للمطورين بناء تطبيقات متطورة مثل البحث الدلالي وأنظمة التوليد المعززة بالاسترجاع (RAG). ما تحت الغطاء في نموذج التضمين Gemini من جوجل: الغرض الأساسي للتضمين هو تحويل البيانات النصية (أو أنواع أخرى من البيانات) إلى قوائم عددية تلتقط الخصائص الرئيسية للمدخلات. تتميز هذه القوائم العددية بأنها تجمع بين البيانات ذات المعنى الدلالي المتشابه، مما يسهم في بناء تطبيقات ذكية تتجاوز التطابق البسيط للكلمات المفتاحية. يمكن تطبيق التضمين على وسائط أخرى مثل الصور والفيديو والصوت، مما يوفر إمكانات واسعة في مجالات مثل التجارة الإلكترونية، حيث يمكن استخدام النماذج متعددة الوسائط لتوليد تمثيلات عددية موحدة للمنتجات تشمل كلاً من الوصف النصي والصور. بالنسبة للشركات، يمكن أن يدعم نموذج التضمين Gemini العديد من التطبيقات المهمة، مثل محركات البحث الداخلية الدقيقة، تصنيف واستعراض الوثائق، تحليل المشاعر، وكشف الأخطاء الغريبة. كما أصبح التضمين عنصراً حاسماً في التطبيقات الوكيلة، حيث يجب على الذكاء الاصطناعي استرجاع وتطابق أنواع مختلفة من الوثائق والتحفيزات. من بين الخصائص الرئيسية لنموذج Gemini هي مرونته الكبيرة. تم تدريبه باستخدام تقنية "Matryoshka Representation Learning" (MRL)، والتي تسمح للمطورين بحصولهم على تضمين تفصيلي بحجم 3072 بعد، ويمكن تقليله إلى أحجام أصغر مثل 1536 أو 768 مع الحفاظ على ميزاته الأكثر أهمية. هذا النوع من المرونة يمكن الشركات من تحقيق توازن بين دقة النموذج، الأداء، وتكلفة التخزين، وهي عناصر حاسمة لتطوير التطبيقات بكفاءة. تضع جوجل نموذج Gemini كنموذج موحد يعمل بكفاءة عالية في مجالات متنوعة مثل المالية والقانونية والهندسية دون الحاجة إلى التعديل الدقيق. يدعم النموذج أكثر من 100 لغة ويتميز بسعر تنافسي يبلغ 0.15 دولار أمريكي لكل مليون رمز مدخل، مما يجعله متاحًا على نطاق واسع. المنافسة بين النماذج الخاصة والمفتوحة المصدر: رغم حصول Gemini على المركز الأول، فإن الفجوة بينه وبين منافسيه ضيقة. يواجه نموذج جوجل منافسة شديدة من نماذج موثوقة مثل تلك التي تقدمها OpenAI، بالإضافة إلى نماذج متخصصة مثل Mistral، التي تركز على استرجاع الكود البرمجي. شركة Cohere، وهي منافس آخر، تستهدف الشركات مباشرة بنمذجها "Embed 4". بينما تتنافس النماذج الأخرى على المقاييس العامة، تؤكد Cohere على قدرة نموذجها في التعامل مع البيانات غير المنظمة والمتعددة الأخطاء الشائعة في الوثائق المؤسسية، مثل الأخطاء الإملائية والمشاكل في التنسيق وحتى الكتابة اليدوية المسحوبة. تقدم الشركة أيضاً خيارات نشر على السحابة الخاصة أو داخل البنية التحتية للشركة، مما يعزز مستوى الأمن للبيانات في الصناعات الخاضعة للتنظيم مثل المالية والرعاية الصحية. أبرز التهديدات لسيطرة النماذج الخاصة يأتي من المجتمع المفتوح المصدر. نموذج Qwen3-Embedding من Alibaba يحتل المركز الثاني في MTEB ويتوفر بموجب ترخيص Apache 2.0، مما يجعله متاحًا للأغراض التجارية. بالنسبة للشركات التي تركز على تطوير البرمجيات، يقدم Qodo نموذجاً مفتوح المصدر آخر يدعى Qodo-Embed-1-1.5B، وهو مصمم خصيصاً للكود البرمجي ويُدَّعى أنه يتفوق على نماذج أكبر في المقاييس الخاصة بالقطاع. تقييم الحدث من قبل المختصين: يشير الخبراء إلى أن تفوق Gemini في المركز الأول يعد إنجازاً كبيراً لجوجل، ولكنه لا يقوض أهمية النماذج المفتوحة المصدر التي تقدم حلولاً متفوقة في بعض المهام المتخصصة. يوفر التوازن بين النماذج الخاصة والمفتوحة المصدر للشركات خيارات أكثر مرونة وتحكمًا في البيانات وأمانها. النماذج المفتوحة المصدر تمنح الشركات القدرة على التعديل والتحسين حسب احتياجاتها الخاصة، مما يجعلها جذابة بشكل خاص للشركات التي تهتم بسيادة البيانات وتريد التحكم الكامل في بنيتها التحتية. معلومات إضافية عن جوجل: جوجل هي واحدة من أكبر الشركات التقنية في العالم، وتعد من الرواد في مجال الذكاء الاصطناعي والتعلم العميق. من خلال نموذج Gemini Embedding، تسعى الشركة إلى ترسيخ مكانتها في السوق وتقديم حلول متكاملة للمطورين والشركات. تتميز جوجل ببنية تحتية قوية ودعم فني متميز، مما يجعل نموذجها جذابًا للغاية للشركات التي تبحث عن حلول موثوقة ومستدامة.