HyperAIHyperAI
منذ 17 أيام

SGPT: تضمين الجملة GPT للبحث الدلالي

Niklas Muennighoff
SGPT: تضمين الجملة GPT للبحث الدلالي
الملخص

استمرت نماذج التحويل (decoder transformers) في التوسع بحجمها، حيث وصلت إلى مئات المليارات من المعلمات. وبسبب حجمها الكبير، تحقق هذه النماذج القيمة القصوى في مجموعة متنوعة من المهام اللغوية من خلال التحفيز (prompting) أو التخصيص الدقيق (fine-tuning). ومع ذلك، تبقى هذه النماذج الكبيرة الأساسية غير قابلة للاستخدام في المجالات المرتبطة بالبحث الدلالي (semantic search) وتمثيل الجمل (sentence embeddings). هذا يمنع إمكانية تحقيق نتائج جديدة تُعدّ الأفضل على الإطلاق، ويُجبر المؤسسات على تدريب وصيانة نماذج منفصلة. ولحل هذه المشكلة، نقترح نموذج SGPT الذي يستخدم النماذج المُحَوِّلة (decoders) لتمثيل الجمل والبحث الدلالي من خلال التحفيز أو التخصيص الدقيق. وبمقدار 5.8 مليار معلمة، يتفوّق SGPT على أفضل تمثيل جملة سابق بنسبة 7%، ويتفوق على منهجية متزامنة تمتلك 175 مليار معلمة عند قياس أدائها على معيار BEIR للبحث. يُتاح الكود والنماذج وملفات النتائج مجانًا عبر الرابط: https://github.com/Muennighoff/sgpt.

SGPT: تضمين الجملة GPT للبحث الدلالي | أحدث الأوراق البحثية | HyperAI