HyperAIHyperAI
منذ 2 أشهر

ShotgunWSD: خوارزمية غير مراقبة للتفريق بين معاني الكلمات العالمية مستوحاة من تسلسل الحمض النووي الريبي

Andrei M. Butnaru; Radu Tudor Ionescu; Florentina Hristea
ShotgunWSD: خوارزمية غير مراقبة للتفريق بين معاني الكلمات العالمية مستوحاة من تسلسل الحمض النووي الريبي
الملخص

في هذا البحث، نقدم خوارزمية جديدة غير مراقبة لتحديد معنى الكلمة (WSD) على مستوى الوثيقة. تلقت الخوارزمية المقترحة إلهامها من أسلوب شائع في مجال الوراثة يستخدم للترميز الجينوم بأكمله، المعروف بتقنية الترميز بالرشاش (Shotgun sequencing). تعتمد الخوارزمية المقترحة على ثلاثة خطوات رئيسية. أولاً، يتم تطبيق خوارزمية WSD قوية القوة على نوافذ سياق قصيرة (حتى 10 كلمات) تم اختيارها من الوثيقة لإنشاء قائمة قصيرة من التكوينات المحتملة للمعنى لكل نافذة. في الخطوة الثانية، يتم جمع هذه التكوينات المحلية للمعنى في تكوينات مركبة أطول بناءً على مطابقة النهايات والبدايات. يتم تصنيف التكوينات الناتجة حسب طولها، ويتم اختيار معنى كل كلمة بناءً على نظام تصويت يأخذ بعين الاعتبار فقط أفضل k تكوين يظهر فيها الكلمة. نقارن خوارزميتنا مع خوارزميات WSD غير المراقبة الأخرى التي تعتبر من أفضل ما هو متاح حالياً ونثبت أنها تحقق أداءً أفضل، وأحياناً بهامش كبير جداً. كما نظهر أن خوارزميتنا يمكن أن تتفوق على أساس Most Common Sense (MCS) في مجموعة بيانات واحدة. بالإضافة إلى ذلك، تحتوي خوارزميتنا على عدد صغير جداً من المعلمات، وهي مقاومة للتuning المعلمة، وعلى عكس الأساليب البيولوجية الأخرى، فإنها توفر حلًا حاسمًا (لا تتضمن اختيارات عشوائية).

ShotgunWSD: خوارزمية غير مراقبة للتفريق بين معاني الكلمات العالمية مستوحاة من تسلسل الحمض النووي الريبي | أحدث الأوراق البحثية | HyperAI