HyperAIHyperAI
منذ 11 أيام

التعرف المضمن على الكيانات الاسمية باستخدام TreeCRFs ذات الملاحظة الجزئية

Yao Fu, Chuanqi Tan, Mosha Chen, Songfang Huang, Fei Huang
التعرف المضمن على الكيانات الاسمية باستخدام TreeCRFs ذات الملاحظة الجزئية
الملخص

تم تناول مهمة التعرف على الكيانات المُسمّاة (NER) بشكل واسع في مجال معالجة اللغة الطبيعية. ومع ذلك، فإن الإطار الشائع المستخدم المبني على التسمية التسلسلية يواجه صعوبة في اكتشاف الكيانات ذات الهياكل المُتداخلة. في هذا العمل، ننظر إلى NER المُتداخلة على أنها تحليل تركيبي مع أشجار جزئيًا مُلاحظة، ونُمَثّلها باستخدام نماذج TreeCRF الجزئيًا المُلاحظة. بشكل خاص، ننظر إلى جميع الفترات المُسمّاة كعُقد مُلاحظة في شجرة تركيبية، بينما نعتبر الفترات الأخرى كعُقد خفية. وباستخدام TreeCRF، نحقق طريقة موحدة لتمثيل العُقد المُلاحظة والخفية معًا. ولحساب احتمال الأشجار الجزئية باستخدام التجميع الجزئي، نقترح نسخة معدلة من خوارزمية Inside، تُسمى خوارزمية \textsc{Masked Inside}، التي تدعم عمليات استنتاج مختلفة للعُقد المختلفة (التقييم للعُقد المُلاحظة، التجميع الجزئي للعُقد الخفية، والرفض للعُقد غير المتوافقة مع العُقد المُلاحظة)، مع تنفيذ متوازٍ كفؤ، مما يُسرّع بشكل كبير عملية التدريب والاستنتاج. تُظهر التجارب أن نهجنا يحقق أفضل أداء (SOTA) في مؤشر F1 على مجموعتي بيانات ACE2004 وACE2005، كما يُظهر أداءً مُComparable مع النماذج الأفضل في مجموعة بيانات GENIA. تم تنفيذ النهج المُقترح في: \url{https://github.com/FranxYao/Partially-Observed-TreeCRFs}.

التعرف المضمن على الكيانات الاسمية باستخدام TreeCRFs ذات الملاحظة الجزئية | أحدث الأوراق البحثية | HyperAI