نقل من مجال وكالة الأنباء الرسمية باستخدام Hypernet لتصنيف العلامات النحوية في تويتر

حصل التصنيف الصرفي (POS) للمنشورات على تويتر على اهتمام كبير في السنوات الأخيرة. وبما أن معظم طرق التصنيف الصرفي تعتمد على النماذج المراقبة، فإنها تتطلب عادةً كميات كبيرة من البيانات المُعلَّمة لتدريب النموذج. ومع ذلك، فإن المجموعات المُعلَّمة الحالية المتاحة لمنشورات تويتر أصغر بكثير من تلك المتوفرة للنصوص الصحفية. وبالتالي، لمساعدة التصنيف الصرفي على تويتر، تسعى معظم طرق التكييف بين المجالات إلى استغلال مجموعات بيانات الصحف من خلال تعلُّم الخصائص المشتركة بين المجالين. ولكن من منظور لغوي، يميل مستخدمو تويتر ليس فقط إلى تقليد التعبيرات الرسمية للوسائط التقليدية مثل الصحف، بل يبدون أيضًا في تطوير أساليب لغوية غير رسمية. لذلك، يمكن تعلُّم التصنيف الصرفي في السياقات الرسمية لتويتر مع مجموعة بيانات الصحف، في حين ينبغي تعلُّم التصنيف الصرفي في السياقات غير الرسمية لتويتر بشكل منفصل. لتحقيق هذه المهمة، نقترح في هذا العمل طريقة تعتمد على الشبكة الفائقة (hypernetwork) لإنشاء معلمات مختلفة، تُستخدم لتمثيل السياقات المختلفة التي تختلف في أساليب التعبير. وأظهرت النتائج التجريبية على ثلاث مجموعات بيانات مختلفة أن منهجنا يحقق أداءً أفضل من أحدث الطرق المُقدمة في معظم الحالات.