HyperAIHyperAI
منذ 2 أشهر

من تقسيم النص إلى التبويب الذكي للفصول: معيار جديد لتنظيم نسخ الفيديو

Fabian Retkowski; Alexander Waibel
من تقسيم النص إلى التبويب الذكي للفصول: معيار جديد لتنظيم نسخ الفيديو
الملخص

تقطيع النص هو مهمة أساسية في معالجة اللغة الطبيعية، حيث يتم تقسيم الوثائق إلى أقسام متصلة. ومع ذلك، كانت الأبحاث السابقة في هذا المجال مقيدة بقواعد بيانات محدودة، إما بسبب صغر حجمها أو أنها مصنعة أو تحتوي فقط على وثائق منظمة بشكل جيد. في هذه الورقة البحثية، نعالج هذه القيود من خلال تقديم معيار جديد يسمى YTSeg (يُتِسَج) يركز على المحتوى المنطوق الذي يكون بطبيعته أكثر عدم تنظيم وأكثر تنوعًا من الناحيتين الموضوعية والهيكلية. كجزء من هذا العمل، نقدم نموذج تقطيع هرمي فعال يُسمى MiniSeg (مينيسِج)، والذي يتفوق على أفضل النماذج الأساسية الحالية. وأخيرًا، نوسع مفهوم تقطيع النص ليشمل مهمة أكثر عملية تُعرف بـ "الفصل الذكي" التي تتضمن تقطيع المحتوى غير المنظم وإنشاء عناوين قطاعات ذات معنى، بالإضافة إلى تطبيق محتمل للنماذج في الوقت الحقيقي.

من تقسيم النص إلى التبويب الذكي للفصول: معيار جديد لتنظيم نسخ الفيديو | أحدث الأوراق البحثية | HyperAI