وحدة برزما لفصل المعنى في التعرف على الكيانات الاسمية

لقد عانى معالجة اللغة الطبيعية لسنوات عديدة من المشكلة التي تتمثل في احتواء الكلمة على معاني متعددة، حتى مع استخدام السياق. ولحل هذه المشكلة، نقترح وحدة مُنشِّطة (Prism Module) لفصل الجوانب المعنوية للكلمات وتقليل الضوضاء في طبقة الإدخال للنموذج. في هذه الوحدة، يتم استبدال بعض الكلمات بشكل انتقائي بجوانب معنوية مرتبطة بالمهمة، ثم تُستخدم تمثيلات الكلمات المنقية من الضوضاء لغرض تغذية المهام اللاحقة، مما يجعلها أسهل في المعالجة. بالإضافة إلى ذلك، نُقدِّم هيكلًا لتدريب هذه الوحدة بشكل مشترك مع النموذج اللاحق دون الحاجة إلى بيانات إضافية. يمكن دمج هذه الوحدة بسهولة في النموذج اللاحق، وتحسّن بشكل ملحوظ أداء النماذج الأساسية في مهمة التعرف على الكيانات المحددة (NER). كما تُظهر التحليلات التبادلية معقولية المنهج. كعائد ثانوي، تُقدِّم الطريقة المقترحة وسيلة لتمثيل بصري لمساهمة كل كلمة.