توليد تعزيز البيانات لتنبؤ رباعيات مشاعر الجوانب

تحليل رؤى الجوانب الأربعة (ASQP) يحلل مصطلحات الجوانب، ومصطلحات الرأي، واتجاه المشاعر، وفئات الجوانب في النص. أحد التحديات في هذه المهمة يكمن في ندرة البيانات نتيجة تكلفة التصنيف العالية. تُستخدم تقنيات تضخيم البيانات بشكل شائع للتعامل مع هذه المشكلة. ومع ذلك، فإن النهج الحالية تقوم ببساطة بإعادة صياغة النصوص في بيانات التدريب، مما يحد من تنوع المعاني في البيانات المولدة ويؤثر سلبًا على جودتها بسبب عدم التوافق بين النص والرباعيات. لمعالجة هذه القيود، نقوم بتوسيع الرباعيات ونُدرّب نموذجًا يحول الرباعيات إلى نصوص لتوليد النصوص المقابلة. علاوةً على ذلك، طوّرنا استراتيجيات جديدة لتصفية البيانات منخفضة الجودة وموازنة توزيع صعوبة العينات في مجموعة البيانات الموسعة. أظهرت الدراسات التجريبية على مجموعتي بيانات ASQP أن منهجنا يتفوق على طرق تضخيم البيانات الأخرى ويحقق أداءً متقدمًا على المستويات المعيارية.