InstructERC: إعادة صياغة التعرف على العواطف في المحادثة باستخدام نماذج اللغة الكبيرة المعززة بالاسترجاع متعددة المهام

حقل التعرف على العواطف في المحادثات (ERC) ركز بشكل أساسي على فصل ترميز خصائص الجملة ونمذجة السياق، مع نقص في استكشاف النماذج التوليدية القائمة على التصميمات الموحدة. في هذه الدراسة، نقترح منهجًا جديدًا يُسمى InstructERC لإعادة صياغة مهمة ERC من إطار تمييزي إلى إطار توليدي يستند إلى نماذج اللغات الكبيرة (LLMs). يقدم InstructERC ثلاثة مساهمات مهمة: (1) يُدخل وحدة قالب استرجاع بسيطة ولكنها فعالة، مما يساعد النموذج على دمج المعلومات الرقابية للحوار بوضوح وبمستويات متعددة. (2) نقدم مهامين إضافيتين للتوفيق بين العواطف، وهما تحديد المتحدث وتوقع العواطف، لنمذجة العلاقات بين أدوار الحوار والميل العاطفي المستقبلي في المحادثات بشكل ضمني. (3) لأول مرة، نوحد علامات العواطف عبر الدوريات الشعورية لتناسب السيناريوهات التطبيقية الحقيقية. لا يزال InstructERC يؤدي أداءً ممتازًا على هذاASET الموحد. الإطار الملحق القائم على LLM الخاص بنا يتفوق بشكل كبير على جميع النماذج السابقة ويحقق أفضل الأداء الشامل (SOTA) على ثلاثة من أشهر مجموعات البيانات المستخدمة في ERC. تحليل شامل للتجارب ذات الكفاءة المعلمية وتوسيع البيانات يوفر إرشادات تجريبية لتطبيقه في السيناريوهات العملية.请注意,"ASET" 是 "dataset" 的缩写,这里可能需要根据上下文进行调整。以下是修正后的版本:حقل التعرف على العواطف في المحادثات (ERC) ركز بشكل أساسي على فصل ترميز خصائص الجملة ونمذجة السياق، مع نقص في استكشاف النماذج التوليدية القائمة على التصميمات الموحدة. في هذه الدراسة، نقترح منهجًا جديدًا يُسمى InstructERC لإعادة صياغة مهمة ERC من إطار تمييزي إلى إطار توليدي يستند إلى نماذج اللغات الكبيرة (LLMs). يقدم InstructERC ثلاثة مساهمات مهمة: (1) يُدخل وحدة قالب استرجاع بسيطة ولكنها فعالة، مما يساعد النموذج على دمج المعلومات الرقابية للحوار بوضوح وبمستويات متعددة. (2) نقدم مهامين إضافيتين للتوفيق بين العواطف، وهما تحديد المتحدث وتوقع العواطف، لنمذجة العلاقات بين أدوار الحوار والميل العاطفي المستقبلي في المحادثات بشكل ضمني. (3) لأول مرة، نوحد علامات العواطف عبر الدورة الشعورية (Feeling Wheel) لتناسب السيناريوهات التطبيقية الحقيقية. لا يزال InstructERC يؤدي أداءً ممتازًا على هذا مجموعة البيانات الموحدة. الإطار الملحق القائم على LLM الخاص بنا يتفوق بشكل كبير على جميع النماذج السابقة ويحقق أفضل الأداء الشامل (SOTA) على ثلاثة من أشهر مجموعات البيانات المستخدمة في ERC. تحليل شامل للتجارب ذات الكفاءة المعلمية وتوسيع البيانات يوفر إرشادات تجريبية لتطبيقه في السيناريوهات العملية.