HyperAIHyperAI
منذ شهر واحد

تأثير جودة المجموعات اللغوية على الترجمة الآلية العصبية

Matīss Rikters
تأثير جودة المجموعات اللغوية على الترجمة الآلية العصبية
الملخص

الcorpuses الكبيرة المتوازية التي يتم الحصول عليها تلقائيًا من الإنترنت أو الوثائق أو مصادر أخرى غالبًا ما تحتوي على أجزاء معطوبة من شأنها أن تؤثر سلبًا على جودة الأنظمة والنموذج التي تستند إلى هذه corpuses. يصف هذا البحث المشكلات الشائعة التي تم العثور عليها في البيانات وكيفية تأثير مثل هذه البيانات على أنظمة الترجمة الآلية العصبية، بالإضافة إلى كيفية تحديد ومعالجة هذه المشكلات. يتم تلخيص الحلول في مجموعة من النصوص البرمجية (scripts) التي تقوم بإزالة الجمل المشكلة من corpuses الإدخال.注释:在阿拉伯语中,“corpora” 通常翻译为 "corpuses" 或 "قواعد بيانات"،但为了保持专业术语的一致性和准确性,这里选择直接使用 “corpuses”。如果需要更通俗易懂的版本,可以将其替换为 "قواعد بيانات"。更优化的版本如下:الcorpuses الكبيرة المتوازية التي يتم الحصول عليها تلقائيًا من الإنترنت أو الوثائق أو مصادر أخرى غالبًا ما تحتوي على أجزاء معطوبة قد تؤدي إلى انخفاض جودة الأنظمة والنموذج التي تستند إليها. يتناول هذا البحث المشكلات الشائعة الموجودة في البيانات وكيفية تأثيرها على أنظمة الترجمة الآلية العصبية، فضلاً عن طرق تحديدها ومعالجتها. يتم تقديم الحلول في شكل مجموعة من النصوص البرمجية (scripts) المصممة لإزالة الجمل المشكّلة من corpuses الإدخال.

تأثير جودة المجموعات اللغوية على الترجمة الآلية العصبية | أحدث الأوراق البحثية | HyperAI