HyperAIHyperAI

Command Palette

Search for a command to run...

منذ 4 أشهر

نهج التدريب الذاتي لترميز النصوص القصيرة

{Chris Develder Thomas Demeester Lucas Sterckx Amir Hadifar}

نهج التدريب الذاتي لترميز النصوص القصيرة

الملخص

تُعد تجميع النصوص القصيرة مشكلة صعبة عند استخدام تمثيلات "حقيبة الكلمات" التقليدية أو TF-IDF، لأن هذه التمثيلات تؤدي إلى تمثيلات متجهية نادرة للنصوص القصيرة. يمكن للتمثيلات المستمرة ذات الأبعاد المنخفضة أو التضمينات (embeddings) التغلب على هذه المشكلة الناتجة عن الندرة، حيث تُستغل قوتها التمثيلية العالية في خوارزميات التجميع العميقة. وعلى الرغم من الدراسات الواسعة التي أُجريت حول التجميع العميقة في مجال الرؤية الحاسوبية، إلا أن قليلاً من الأعمال ركزت على مجال معالجة اللغة الطبيعية (NLP). يقترحُنا طريقة تتعلم خصائص تمييزية من خلال مُشفّر تلقائي (autoencoder) وتمثيل جملة (sentence embedding)، ثم تستخدم تخصيصات من خوارزمية تجميع كملاحظات لتحسين أوزان شبكة المشفر (encoder). وقد أثبتت التجارب على ثلاث مجموعات بيانات للنصوص القصيرة فعالية طريقة العمل بشكل تجريبي.

المعايير القياسية

معيار قياسيالمنهجيةالمقاييس
short-text-clustering-on-searchsnippetsSIF + Aut., Self-Train.
Acc: 77.1

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة المشتركة بالذكاء الاصطناعي
وحدات معالجة رسومات جاهزة
أفضل الأسعار
ابدأ الآن

Hyper Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
نهج التدريب الذاتي لترميز النصوص القصيرة | الأوراق البحثية | HyperAI