مزيد من التضمينات، مُعلّقات تسلسل أفضل؟

تُقترح في الدراسات الحديثة عائلة من التضمينات السياقية التي تُحسّن بشكل ملحوظ دقة مُصنّفات التسلسل مقارنة بالتضمينات غير السياقية. ومع ذلك، لا توجد استنتاجات حاسمة حول إمكانية بناء مُصنّفات تسلسل أكثر فاعلية من خلال دمج أنواع مختلفة من التضمينات في سياقات متنوعة. في هذا البحث، نُجري تجارب واسعة النطاق على 3 مهام عبر 18 مجموعة بيانات و8 لغات لدراسة دقة تصنيف التسلسل باستخدام مختلف طرق دمج التضمينات، ونستنتج ثلاث ملاحظات: (1) يؤدي دمج المزيد من أنواع التضمينات إلى تحسين الدقة في السياقات الغنية بالموارد والمتعددة المجالات، وكذلك في بعض الظروف الخاصة بالسياقات منخفضة الموارد؛ (2) يؤدي دمج التضمينات السياقية الجزئية (sub-word) الإضافية مع التضمينات السياقية الحرفية إلى تدهور الدقة في السياقات الشديدة الندرة؛ (3) بناءً على الاستنتاج الأول، لا يؤدي دمج تضمينات سياقية مماثلة إضافية إلى تحسينات إضافية. نأمل أن تساعد هذه الاستنتاجات البشريّة في بناء مُصنّفات تسلسل أقوى في مختلف السياقات.