HyperAIHyperAI

Command Palette

Search for a command to run...

ShotgunWSD: خوارزمية غير مراقبة للتفريق بين معاني الكلمات العالمية مستوحاة من تسلسل الحمض النووي الريبي

Andrei M. Butnaru Radu Tudor Ionescu Florentina Hristea

الملخص

في هذا البحث، نقدم خوارزمية جديدة غير مراقبة لتحديد معنى الكلمة (WSD) على مستوى الوثيقة. تلقت الخوارزمية المقترحة إلهامها من أسلوب شائع في مجال الوراثة يستخدم للترميز الجينوم بأكمله، المعروف بتقنية الترميز بالرشاش (Shotgun sequencing). تعتمد الخوارزمية المقترحة على ثلاثة خطوات رئيسية. أولاً، يتم تطبيق خوارزمية WSD قوية القوة على نوافذ سياق قصيرة (حتى 10 كلمات) تم اختيارها من الوثيقة لإنشاء قائمة قصيرة من التكوينات المحتملة للمعنى لكل نافذة. في الخطوة الثانية، يتم جمع هذه التكوينات المحلية للمعنى في تكوينات مركبة أطول بناءً على مطابقة النهايات والبدايات. يتم تصنيف التكوينات الناتجة حسب طولها، ويتم اختيار معنى كل كلمة بناءً على نظام تصويت يأخذ بعين الاعتبار فقط أفضل k تكوين يظهر فيها الكلمة. نقارن خوارزميتنا مع خوارزميات WSD غير المراقبة الأخرى التي تعتبر من أفضل ما هو متاح حالياً ونثبت أنها تحقق أداءً أفضل، وأحياناً بهامش كبير جداً. كما نظهر أن خوارزميتنا يمكن أن تتفوق على أساس Most Common Sense (MCS) في مجموعة بيانات واحدة. بالإضافة إلى ذلك، تحتوي خوارزميتنا على عدد صغير جداً من المعلمات، وهي مقاومة للتuning المعلمة، وعلى عكس الأساليب البيولوجية الأخرى، فإنها توفر حلًا حاسمًا (لا تتضمن اختيارات عشوائية).


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp