HyperAIHyperAI

Command Palette

Search for a command to run...

SocialGPT: تحفيز النماذج اللغوية الكبيرة للاستدلال بالعلاقات الاجتماعية من خلال التحسين الجشّاع للقطع

Wanhua Li Zibin Meng Jiawei Zhou Donglai Wei Chuang Gan Hanspeter Pfister

الملخص

يهدف التحليل المنطقي للعلاقات الاجتماعية إلى تحديد فئات العلاقات مثل الأصدقاء، والأزواج، والزملاء من الصور. بينما تعتمد الأساليب الحالية على نموذج تدريب شبكات مكرسة من البداية إلى النهاية باستخدام بيانات الصور المصنفة، فإنها محدودة فيما يتعلق بالقابلية للتعميم والتفسير. لمعالجة هذه القضايا، نقدم أولاً إطارًا بسيطًا ومعقدًا يُسمى {ame}، والذي يجمع بين قدرة نماذج الأساس البصري (VFMs) على الإدراك وقدرة النماذج اللغوية الكبيرة (LLMs) على التحليل المنطقي في إطار قابل للتقسيم، مما يوفر نقطة بداية قوية للاعتراف بالعلاقات الاجتماعية.وبشكل خاص، نوجه نماذج الأساس البصري (VFMs) لترجمة محتوى الصورة إلى قصة اجتماعية نصية، ثم نستفيد من النماذج اللغوية الكبيرة (LLMs) للتحليل المنطقي القائم على النص. يقدم {ame} مبادئ تصميم منهجية لتكييف نماذج الأساس البصري (VFMs) والنماذج اللغوية الكبيرة (LLMs) بشكل منفصل وإغلاق الفجوات بينهما. بدون أي تدريب إضافي للنموذج، يتمكن من تحقيق نتائج تنافسية في حالة عدم وجود بيانات تدريبية مسبقة على قاعدة بياناتين معروضتين، مع تقديم إجابات قابلة للتفسير، حيث يمكن لنماذج اللغة الكبيرة (LLMs) توليد شروحات قائمة على اللغة للأحكام.عملية تصميم الدوافع اليدوية لنماذج اللغة الكبيرة (LLMs) في مرحلة التحليل المنطقي تكون مرهقة ومكلفة، ولذا يتطلب الأمر طريقة تحسين دوافع آلية. بما أننا نحول جوهريًا مهمة تصنيف بصري إلى مهمة توليدية لنماذج اللغة الكبيرة (LLMs)، فإن تحسين الدوافع الآلية يواجه مشكلة فريدة وهي تحسين الدوافع الطويلة. لمعالجة هذه المشكلة، نقترح طريقة البحث الجشع عن دوافع المقاطع (GSPO)، والتي تقوم ببحث جشعي باستخدام المعلومات التدرجية على مستوى المقاطع. تظهر النتائج التجريبية أن GSPO يحسن الأداء بشكل كبير، وأن طرقتنا تتعمم أيضًا إلى أساليب صورية مختلفة.الكود متاح في: https://github.com/Mengzibin/SocialGPT.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
SocialGPT: تحفيز النماذج اللغوية الكبيرة للاستدلال بالعلاقات الاجتماعية من خلال التحسين الجشّاع للقطع | مستندات | HyperAI