التفصيل العالمي بمستوى تجزئة عشوائي بواسطة تعليمات اللغة

يهدف هذا البحث إلى تحقيق تقسيم شامل لمستوى دلالي عشوائي. على الرغم من التقدم الملحوظ في السنوات الأخيرة، فإن نماذج التقسيم المتخصصة محدودة بمهام معينة وتوزيع البيانات. إعادة تدريب نموذج جديد للتكيف مع سيناريوهات أو إعدادات جديدة تتطلب حسابات باهظة وتكلفة زمنية، مما يثير الحاجة إلى نموذج تقسيم متعدد الاستخدامات وشامل يمكنه تلبية مختلف المستويات الدلالية. رغم أن بعض المحاولات قد تم بذلها لتحقيق توحيد مهام التقسيم المختلفة أو التعميم على سيناريوهات متنوعة، فإن القيود في تعريف النماذج ومجالات الإدخال والإخراج تجعل من الصعب تحقيق فهم دقيق للمحتوى على مستوى دلالي عشوائي. بهدف ذلك، نقدم UniLSeg (يوني إل سيغ)، وهو نموذج تقسيم شامل يمكنه تنفيذ التقسيم على أي مستوى دلالي بإرشاد تعليمات اللغة. لتدريب UniLSeg، قمنا بإعادة تنظيم مجموعة من المهام من التوزيعات المتنوعة الأصلية إلى صيغة بيانات موحدة، حيث تكون الصور مع النصوص التي تصف أهداف التقسيم كمدخلات والقناعات المقابلة كخرج. بالاشتراك مع محرك شرح آلي يستخدم كمية كبيرة من البيانات غير المصنفة، حقق UniLSeg أداءً ممتازًا في مختلف المهام والإعدادات، متفوقًا على كل من النماذج المتخصصة والنماذج الموحدة.