HyperAIHyperAI

Command Palette

Search for a command to run...

تمثيلات ذات ذيول ثقيلة، تصنيف قطب النص، وتعزيز البيانات

Hamid Jalalzai Pierre Colombo Chloé Clavel Eric Gaussier Giovanna Varni Emmanuel Vignon Anne Sabourin

الملخص

تستند الطرق السائدة لتمثيل النصوص في اللغة الطبيعية على تعلم التضمينات (embeddings) على مجموعات ضخمة من البيانات، والتي تتميز بخصائص مفيدة مثل التراكب (compositionality) وحفظ المسافات (distance preservation). في هذه الورقة، نطور طريقة جديدة لتعلم تضمينات ذات توزيعات ذات ذيول ثقيلة (heavy-tailed embeddings) وتتمتع بخصائص منتظمة مرغوبة فيما يتعلق بذوائل التوزيع، مما يسمح بتحليل النقاط البعيدة عن جسم التوزيع باستخدام إطار نظرية القيم المتطرفة متعددة المتغيرات (multivariate extreme value theory). وبشكل خاص، نحصل على تصنيف خاص بالذوائل في التضمين المقترح، حيث تتفوق أداؤه على النموذج الأساسي (baseline). ويُظهر هذا الفاصل خاصية التحول المقياسية (scale invariance)، والتي نستفيد منها من خلال تقديم طريقة جديدة لتحرير النصوص تهدف إلى توسيع مجموعة البيانات مع الحفاظ على التسميات (label preserving dataset augmentation). وتُظهر التجارب العددية على بيانات نصية مُصَنَّعة وواقعية صلة الإطار المقترح، وتوثّق أن هذه الطريقة تُنتج جملًا ذات معنى وقابلة للتحكم في سماتها، مثل المشاعر الإيجابية أو السلبية.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
تمثيلات ذات ذيول ثقيلة، تصنيف قطب النص، وتعزيز البيانات | مستندات | HyperAI