HyperAIHyperAI
منذ 17 أيام

العينة الموجهة بالمواضيع للكشف الفعّال عن البيانات في الكشف متعدد المجالات عن الموقف

Erik Arakelyan, Arnav Arora, Isabelle Augenstein
العينة الموجهة بالمواضيع للكشف الفعّال عن البيانات في الكشف متعدد المجالات عن الموقف
الملخص

يُعنى كشف الموقف (Stance Detection) بتحديد المواقف التي يعبّر عنها الكاتب تجاه هدف معين. ويمتد هذا المهمة عبر مجموعة متنوعة من المجالات، بدءًا من تحديد الآراء في وسائل التواصل الاجتماعي وصولاً إلى اكتشاف الموقف تجاه مطالبة قانونية. ومع ذلك، يختلف سياق هذه المهمة ضمن هذه المجالات من حيث بروتوكولات جمع البيانات، وقاموس العلامات، وعدد التسميات المتاحة. علاوةً على ذلك، تكون التسميات الخاصة بالمواقف متوازنة بشكل كبير من حيث التوازن بين المواضيع وداخل كل موضوع. ويُعد هذا التحدي عاملًا صعبًا في كشف الموقف عبر مجالات متعددة، مما يتطلب توحيدًا وتكيفًا بين المجالات. وللتغلب على هذا التحدي، نقترح نموذجًا يُسمى $\textbf{T}$opic $\textbf{E}$fficient $\textbf{St}$anc$\textbf{E}$ $\textbf{D}$etection (TESTED)، والذي يتألف من تقنية عينة متنوعة موجهة بالمواضيع، ووظيفة تباينية تُستخدم في تحسين نموذج كشف الموقف. وقد قُمنا بتقييم هذه الطريقة على معيار موجود يتضمن 16 مجموعة بيانات، من خلال تجارب داخل المجال (أي جميع المواضيع المعروفة) وخارج المجال (أي المواضيع غير المعروفة). وأظهرت النتائج أن طريقتنا تتفوق على أفضل الأداء الحالي، بزيادة متوسطة قدرها 3.5 نقطة في معامل F1 داخل المجال، وتحقيق تحسين متوسط قدره 10.2 نقطة في معامل F1 عند التقييم خارج المجال، مع استخدام ما لا يزيد عن 10% من بيانات التدريب. كما أظهرنا أن تقنية العينة المُقترحة تخفف من التوازن غير المتكافئ بين الفئات داخل الموضوعات، وكذلك بين المواضيع. وأخيرًا، تبين من التحليل أن دالة التعلم التبايني تُمكّن النموذج من تمييز أوضح للعينات ذات التسميات المختلفة.