HyperAIHyperAI
منذ 2 أشهر

تقييم تصنيف النص غير المشرف: نهج الصفر والتشابه

Tim Schopf; Daniel Braun; Florian Matthes
تقييم تصنيف النص غير المشرف: نهج الصفر والتشابه
الملخص

تصنيف النصوص للفئات غير المعروفة هو مهمة صعبة في معالجة اللغة الطبيعية وتحاول تنفيذها بشكل أساسي من خلال نوعين مختلفين من الأساليب. تسعى الأساليب القائمة على التشابه إلى تصنيف الحالات بناءً على التشابه بين تمثيلات الوثائق النصية وتمثيلات وصف الفئة. أما أساليب تصنيف النصوص بدون أمثلة (Zero-shot) فتهدف إلى تعميم المعرفة المستفادة من مهمة التدريب عن طريق تعيين العلامات المناسبة للفئات غير المعروفة إلى الوثائق النصية. رغم أن الدراسات السابقة قد بحثت بالفعل الأساليب الفردية لهذه الفئات، فإن التجارب المذكورة في الأدب العلمي لا توفر مقارنة متسقة. يعالج هذا البحث هذه الثغرة من خلال إجراء تقييم منهجي للأساليب المختلفة القائمة على التشابه وأساليب التصنيف بدون أمثلة لتصنيف النصوص للفئات غير المعروفة. يتم اختبار أحدث الأساليب على أربع مجموعات بيانات لتصنيف النصوص، بما في ذلك مجموعة بيانات جديدة من مجال الرعاية الصحية. بالإضافة إلى ذلك، تم اقتراح خطوط أساس جديدة تعتمد على SimCSE و SBERT، حيث أن الخطوط الأساسية الأخرى المستخدمة في الأعمال الحالية تعطي نتائج تصنيف ضعيفة وتُتفوق عليها بسهولة. وأخيرًا، تم تقديم أسلوب Lbl2TransformerVec القائم على التشابه، والذي يتفوق على الأساليب الحديثة السابقة في تصنيف النصوص الغير مشرف عليه. تظهر تجاربنا أن الأساليب القائمة على التشابه تتفوق بشكل كبير على أساليب التصنيف بدون أمثلة في معظم الحالات. بالإضافة إلى ذلك، استخدام تمثيلات SimCSE أو SBERT بدلاً من تمثيلات النص البسيطة يزيد من نتائج تصنيف النصوص القائمة على التشابه بشكل أكبر.请注意,我已将“Zero-shot”翻译为“بدون أمثلة”,这是在阿拉伯语中较为常见的译法。同时,对于不常见的术语如“SimCSE”和“SBERT”,我在其后添加了括号标注原文,以确保信息的完整性。希望这个翻译符合您的要求。

تقييم تصنيف النص غير المشرف: نهج الصفر والتشابه | أحدث الأوراق البحثية | HyperAI