HyperAIHyperAI

Command Palette

Search for a command to run...

هل يمكن للنماذج اللغوية الكبيرة الاستفادة الفعالة من المعلومات الهيكلية للرسوم البيانية من خلال المدخلات، ولماذا؟

Jin Huang Xingjian Zhang Qiaozhu Mei Jiaqi Ma

الملخص

تكتسب النماذج اللغوية الكبيرة (LLMs) اهتمامًا متزايدًا بفضل قدرتها على معالجة الرسوم البيانية التي تحتوي على سمات نصية غنية، وخاصة بطريقة الصفر-مُحاكاة (zero-shot). تُظهر الدراسات الحديثة أن النماذج اللغوية الكبيرة تحقق أداءً جيدًا في تصنيف النصوص على مجموعات بيانات شائعة للرسوم البيانية الغنية بالنصوص، ويمكن تحسين هذا الأداء عن طريق إضافة معلومات بنائية مُشفّرة على شكل لغة طبيعية إلى النصوص (prompts). نهدف إلى فهم سبب تحسين دمج المعلومات البنائية المتأصلة في بيانات الرسوم البيانية لأداء النماذج اللغوية الكبيرة في التنبؤ. أولاً، نستبعد مخاوف التسريب البيانات من خلال إعداد مجموعة بيانات جديدة خالية من التسريبات، وإجراء تحليل مقارن مع مجموعة بيانات كانت شائعة سابقًا. ثانيًا، نظرًا لأن الدراسات السابقة كانت تُشفر الرسم البياني للعقدة المركزية (ego-graph) من خلال وصف هيكل الرسم البياني بلغة طبيعية، نطرح السؤال التالي: هل تفهم النماذج اللغوية الكبيرة هيكل الرسم البياني وفقًا لنية مصممي النصوص (prompts)؟ ثالثًا، نستكشف سبب تحسن أداء النماذج اللغوية الكبيرة بعد دمج المعلومات البنائية. تُظهر استكشافاتنا لهذه الأسئلة أن (أ) لا يوجد دليل ملموس على أن أداء النماذج اللغوية الكبيرة يُعزى بشكل كبير إلى تسريب البيانات؛ (ب) بدلًا من فهم النصوص كهيكل رسم بياني كما كان مقصودًا من مصممي النصوص، تميل النماذج إلى معالجة هذه النصوص كفقرات سياقية؛ (ج) فإن العناصر الأكثر فعالية في الجوار المحلي المضمنة في النصوص هي العبارات المرتبطة بعلامة العقدة، وليس هيكل الرسم البياني نفسه.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
هل يمكن للنماذج اللغوية الكبيرة الاستفادة الفعالة من المعلومات الهيكلية للرسوم البيانية من خلال المدخلات، ولماذا؟ | مستندات | HyperAI