BARTpho: نماذج مسبقة التدريب للتوالي إلى التوالي للغة الفيتنامية

نقدم نموذجي BARTpho، وهما BARTpho-الصوت (syllable) وBARTpho-الكلمة (word)، وهما أول نماذج تسلسلية أحادية اللغة مسبقة التدريب على نطاق واسع للغة الفيتنامية. يستخدم BARTpho الهندسة المعمارية "الكبيرة" ومخطط التدريب المسبق للنموذج التحليلي للتسلسلات بترتيبي BART، مما يجعله مناسبًا بشكل خاص للمهام اللغوية المعالجة الطبيعية الإنتاجية (NLP). نجري تجارب لمقارنة نموذجنا BARTpho مع منافسه mBART في مهمة تلخيص النصوص الفيتنامية اللاحقة، ونظهر أن: في كل من التقييمات الآلية والبشرية، يتفوق BARTpho على الأساس القوي mBART ويحسن الحالة الرائدة في هذا المجال. كما قمنا بتقييم ومقارنة BARTpho وmBART في مهام استعادة رأس الجملة والنقطة في اللغة الفيتنامية، وقد اكتشفنا أيضًا أن BARTpho أكثر فعالية من mBART在这两个任务上。我们公开发布BARTpho以促进未来生成性越南语自然语言处理任务的研究和应用。我们的BARTpho模型可在https://github.com/VinAIResearch/BARTpho获取。为了确保句子结构更符合阿拉伯语的表达习惯,我将对最后一段进行调整:كما قمنا بتقييم ومقارنة BARTpho وmBART في مهام استعادة رأس الجملة والنقطة في اللغة الفيتنامية، وقد اكتشفنا أيضًا أن BARTpho أكثر فعالية من mBART في هذين المهمتين. نقوم بإصدار BARTpho بشكل عام لتسهيل البحث المستقبلي والتطبيقات المتعلقة بالمهام اللغوية المعالجة الطبيعية الإنتاجية للغة الفيتنامية. يمكن الحصول على نماذجنا من BARTpho من الرابط https://github.com/VinAIResearch/B ARTpho.