HyperAIHyperAI
منذ 11 أيام

تحسين العبارات القابلة للتفسير من الناحية الدلالية باستخدام تمثيلات الكلمات المُدرّبة مسبقًا

Rohan Kumar Yadav, Lei Jiao, Ole-Christoffer Granmo, Morten Goodwin
تحسين العبارات القابلة للتفسير من الناحية الدلالية باستخدام تمثيلات الكلمات المُدرّبة مسبقًا
الملخص

آلة تسيتلين (TM) هي خوارزمية للتعرف على الأنماط قابلة للتفسير تعتمد على المنطق الجبري، وقد أظهرت أداءً تنافسيًا في العديد من مهام معالجة اللغة الطبيعية (NLP)، بما في ذلك تحليل المشاعر، وتصنيف النصوص، وتحديد معنى الكلمات (Word Sense Disambiguation). ولتحقيق قابلية تفسير تصل إلى مستوى الإنسان، تعتمد الآلة التقليدية على ميزات إدخال منطقية ثنائية (Boolean)، مثل تمثيل "مجموعة الكلمات" (Bag-of-Words - BOW). ومع ذلك، فإن تمثيل BOW يجعل من الصعب استخدام أي معلومات مُدرَّبة مسبقًا، مثل تمثيلات الكلمات المُدرَّبة مسبقًا (word2vec وGloVe). وقد قيد هذا التقييد أداء آلة تسيتلين مقارنةً بالشبكات العصبية العميقة (DNNs) في مجال معالجة اللغة الطبيعية. ولتقليل الفجوة في الأداء، نقترح في هذه الورقة طريقة جديدة لاستخدام تمثيلات الكلمات المُدرَّبة مسبقًا في آلة تسيتلين. وتحقيقًا لهذا الهدف، نُحسّن بشكل كبير من أداء وقابلية التفسير لآلة تسيتلين من خلال استخلاص كلمات ذات صلة دلالية من تمثيلات الكلمات المُدرَّبة مسبقًا، وتحويلها إلى ميزات إدخال لآلة تسيتلين. وتشير نتائج تجاربنا إلى أن دقة النهج المقترح أعلى بشكل ملحوظ مقارنةً بآلة تسيتلين القائمة على BOW، وبلغت مستوى النماذج القائمة على الشبكات العصبية العميقة.

تحسين العبارات القابلة للتفسير من الناحية الدلالية باستخدام تمثيلات الكلمات المُدرّبة مسبقًا | أحدث الأوراق البحثية | HyperAI