HyperAIHyperAI

Command Palette

Search for a command to run...

تقييم تصنيف النص غير المشرف: نهج الصفر والتشابه

Tim Schopf Daniel Braun Florian Matthes

الملخص

تصنيف النصوص للفئات غير المعروفة هو مهمة صعبة في معالجة اللغة الطبيعية وتحاول تنفيذها بشكل أساسي من خلال نوعين مختلفين من الأساليب. تسعى الأساليب القائمة على التشابه إلى تصنيف الحالات بناءً على التشابه بين تمثيلات الوثائق النصية وتمثيلات وصف الفئة. أما أساليب تصنيف النصوص بدون أمثلة (Zero-shot) فتهدف إلى تعميم المعرفة المستفادة من مهمة التدريب عن طريق تعيين العلامات المناسبة للفئات غير المعروفة إلى الوثائق النصية. رغم أن الدراسات السابقة قد بحثت بالفعل الأساليب الفردية لهذه الفئات، فإن التجارب المذكورة في الأدب العلمي لا توفر مقارنة متسقة. يعالج هذا البحث هذه الثغرة من خلال إجراء تقييم منهجي للأساليب المختلفة القائمة على التشابه وأساليب التصنيف بدون أمثلة لتصنيف النصوص للفئات غير المعروفة. يتم اختبار أحدث الأساليب على أربع مجموعات بيانات لتصنيف النصوص، بما في ذلك مجموعة بيانات جديدة من مجال الرعاية الصحية. بالإضافة إلى ذلك، تم اقتراح خطوط أساس جديدة تعتمد على SimCSE و SBERT، حيث أن الخطوط الأساسية الأخرى المستخدمة في الأعمال الحالية تعطي نتائج تصنيف ضعيفة وتُتفوق عليها بسهولة. وأخيرًا، تم تقديم أسلوب Lbl2TransformerVec القائم على التشابه، والذي يتفوق على الأساليب الحديثة السابقة في تصنيف النصوص الغير مشرف عليه. تظهر تجاربنا أن الأساليب القائمة على التشابه تتفوق بشكل كبير على أساليب التصنيف بدون أمثلة في معظم الحالات. بالإضافة إلى ذلك، استخدام تمثيلات SimCSE أو SBERT بدلاً من تمثيلات النص البسيطة يزيد من نتائج تصنيف النصوص القائمة على التشابه بشكل أكبر.请注意,我已将“Zero-shot”翻译为“بدون أمثلة”,这是在阿拉伯语中较为常见的译法。同时,对于不常见的术语如“SimCSE”和“SBERT”,我在其后添加了括号标注原文,以确保信息的完整性。希望这个翻译符合您的要求。


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
تقييم تصنيف النص غير المشرف: نهج الصفر والتشابه | مستندات | HyperAI