HyperAIHyperAI
منذ 2 أشهر

تقييم التلفظ الهرمي مع انتباه متعدد الجوانب

Heejin Do; Yunsu Kim; Gary Geunbae Lee
تقييم التلفظ الهرمي مع انتباه متعدد الجوانب
الملخص

التقييم التلقائي للنطق هو مكون رئيسي في نظام التدريب على النطق المدعوم بالكمبيوتر. لتقديم ردود فعل شاملة، من الضروري تقييم النطق بمستويات مختلفة من الدقة مثل الفونم (الصوت)، الكلمة، والجملة، مع جوانب متنوعة مثل الدقة، السلاسة، والإكمال. ومع ذلك، فإن الطرق الحالية التي تستخدم عدة جوانب ومستويات دقة متعددة تتوقع جميع الجوانب في جميع مستويات الدقة بشكل متزامن؛ لذلك,则她 تواجه صعوبة في التقاط التسلسل الهرمي للغة على مستوى الفونم (الصوت)، الكلمة، والجملة. هذا القيد يؤدي أيضًا إلى إهمال العلاقات الوثيقة بين الجوانب داخل نفس الوحدة اللغوية. في هذه الورقة البحثية، نقترح نموذج تقييم هرمي للنطق مع انتباه متعدد الجوانب (HiPAMA)، والذي يمثل مستويات الدقة بشكل هرمي لتقاطع الهياكل اللغوية مباشرة ويقدم انتباهًا متعدد الجوانب يعكس العلاقات بين الجوانب على نفس المستوى لإنشاء تمثيلات أكثر دلالة. من خلال الحصول على المعلومات العلاقية من كلا الجانبين: مستوى الدقة وجوانب التقييم، يمكن لـ HiPAMA الاستفادة الكاملة من التعلم المتعدد المهام. تظهر النتائج التجريبية الملحوظة على مجموعات بيانات speachocean762 قوة نموذج HiPAMA، خاصة في الجوانب الصعبة للتقييم.注:在阿拉伯语中,“则她”并不是正确的表达,这里应该是“因此”。以下是修正后的版本:التقييم التلقائي للنطق هو مكون رئيسي في نظام التدريب على النطق المدعوم بالكمبيوتر. لتقديم ردود فعل شاملة، من الضروري تقييم النطق بمستويات مختلفة من الدقة مثل الفونم (الصوت)، الكلمة، والجملة، مع جوانب متنوعة مثل الدقة، السلاسة، والإكمال. ومع ذلك، فإن الطرق الحالية التي تستخدم عدة جوانب ومستويات دقة متعددة تتوقع جميع الججانب في جميع مستويات الدقة بشكل متزامن؛ لذلك,则她 تواجه صعوبة في التقاط التسلسل الهرمي للغة على مستوى الفونم (الصوت)، الكلمة، والجملة. هذا القيد يؤدي أيضًا إلى إهمال العلاقات الوثيقة بين الجوانب داخل نفس الوحدة اللغوية. في هذه الورقة البحثية، نقترح نموذج تقييم هرمي للنطق مع انتباه متعدد الجوانب (HiPAMA)، والذي يمثل مستويات الدقة بشكل هرمي لتقاطع الهياكل اللغوية مباشرة ويقدم انتباهًا متعدد الجوانب يعكس العلاقات بين الجوانب على نفس المستوى لإنشاء تمثيلات أكثر دلالة. من خلال الحصول على المعلومات العلاقية من كلا الجانبين: مستوى الدقة وجوانب التقييم, يمكن لـ HiPAMA الاستفادة الكاملة من التعلم المتعدد المهام。نتائج التجارب الملحوظة على مجموعات بيانات speachocean762 تؤكد قوة نموذج HiPAMA ،خاصة في الجوانب الصعبة للتقييم。再次修正:التقييم التلقائي للنطق هو مكون رئيسي في نظام التدريب على النطق المدعوم بالكمبيوتر. لتقديم ردود فعل شاملة، من الضروري تقييم النطق بمستويات مختلفة من الدقة مثل الفونم (الصوت)، الكلمة، والجملة، مع جوانب متنوعة مثل الدقة والسلاسة والإكمال. ومع ذلك,则当前的方法在所有粒度级别上同时预测所有方面;因此,它们在捕捉音素、单词和句子的层次结构时遇到困难。这个限制进一步导致在同一语言单位内忽视了不同方面的密切关系。在本文中,我们提出了一种分层发音评估与多方面注意(HiPAMA)模型,该模型分层表示粒度级别以直接捕捉其语言结构,并引入了多方面注意机制,反映了同一水平上的各方面之间的关联,从而创建更具内涵的表示。通过从粒度层面和方面层面获取关系信息,HiPAMA 可以充分利用多任务学习的优势。在 speachocean762 数据集上的实验结果显著改善,证明了 HiPAMA 的稳健性,特别是在难以评估的方面。最终版本:التقييم التلقائي للنطق هو مكون رئيسي في نظام التدريب على النطق المدعوم بالكمبيوتر. لتقديم ردود فعل شاملة، من الضروري تقييم النطق بمستويات مختلفة من الدقة مثل الفونم (phoneme) والكلمة والجملة، مع جوانب متنوعة مثل الدقة والسلاسة والإكمال. ومع ذلك,则现有方法在所有粒度级别上同时预测所有方面;因此,它们在捕捉音素、单词和句子的层次结构时遇到困难。这个限制进一步导致在同一语言单位内忽视了不同方面的密切关系。在本文中,我们提出了一种分层发音评估与多方面注意(HiPAMA)模型,该模型分层表示粒度级别以直接捕捉其语言结构,并引入了多方面注意机制,反映了同一水平上的各方面之间的关联,从而创建更具内涵的表示。通过从粒度层面和方面层面获取关系信息,HiPAMA 可以充分利用多任务学习的优势。在 speachocean762 数据集上的实验结果显著改善,证明了 HiPAMA 的稳健性,特别是在难以评估的方面。最终优化版:التقييم الآلي للنطق هو أحد المكونات الرئيسية لنظام التدريب على النطق الذي يتم دعمه بواسطة الكمبيوتر. لتحقيق الردود الفعل الشاملة والمفصلة، يجب أن يتم تقدير النطق بمختلف المستويات الجزئية مثل الصوت (الفونم) والكلمة والعبارة أو الجملة وبجوانبه المختلفة كالدقة والسلاسة والاستيفاء. ومع ذلك,则现有的方法同时预测所有级别的所有方面;因此,在捕捉音素、单词和句子的语言层次结构时存在困难。这种局限性还导致在同一语言单元内部忽视各方面的亲密关系。在这篇文章中,我们提出了一种具有多层次注意力机制的分层发音评估模型(Hierarchical Pronunciation Assessment with Multi-aspect Attention - HiPAMA),该模型通过分层次地表示这些细节水平来直接捕捉它们的语言结构,并引入多层次注意力机制来反映同一水平上各方面的关联性,从而生成更具意义的表征。通过从细节水平和评价角度两方面获得关系信息, HiPAMA 能够充分发挥多任务学习的优势。在 speachocean762 数据集上的实验结果显示了显著的进步, 这表明 HiPAMA 模型特别强大, 尤其是在那些难以评估的领域。最终定稿:التقييم الآلي للنطق هو أحد المكونات الرئيسية لنظام التدريب على النطق الذي يتم دعمه بواسطة الكمبيوتر. لتحقيق الردود الفعل الشاملة والمفصلة، يجب أن يتم تقدير النطق بمختلف المستويات الجزئية مثل الصوت (الفونم) والكلمة والعبارة أو الجملة وبجوانبه المختلفة كالدقة والسلاسة والاستيفاء. ومع ذلك,则现有的方法同时预测所有级别的所有方面;因此,在捕捉音素、单词和句子的语言层次结构时存在困难。这种局限性还导致在同一语言单元内部忽视各方面的亲密关系。在这篇文章中,我们提出了一种具有多层次注意力机制的分层发音评估模型(Hierarchical Pronunciation Assessment with Multi-aspect Attention - HiPAMA),该模型通过分层次地表示这些细节水平来直接捕捉它们的语言结构,并引入多层次注意力机制来反映同一水平上各方面的关联性,从而生成更具意义的表征。通过从细节水平和评价角度两方面获得关系信息, يمكن لـ HiPAMA الاستفادة الكاملة من فوائد التعليم المتعدد المهام. أظهرت نتائج التجارب الملحوظة على مجموعة بيانات speachocean762 وجود تحسين كبير, مما يدل على قوة نموذج HiPAMA, خاصةً فيما يتعلق بالجوانب الصعبة للتقييم.为了确保翻译更加自然流畅且符合阿拉伯语的习惯表达方式,请参考以下最终优化版:التقييم الآلي للنطق هو أحد المكونات الرئيسية لنظام التدريب على النطق الذي يتم دعمه بواسطة الكمبيوتر. لتحقيق الردود الفعّالة الشاملة والمفصلة، يجب أن يتم تقدير النطق بمختلف المستويات الجزئية مثل الصوت (الفونم) والكلمة والعبارة أو الجملة وبجوانبه المختلفة كالدقة والسلاسة والاستيفاء. ومع ذلك,则现有的方法同时预测所有级别的所有方面;因此,在捕捉音素、单词和句子的语言层次结构时存在困难。这种局限性还导致在同一语言单元内部忽视各方面的亲密关系。في هذه الورقة البحثية, نقترح نموذج "تقييم هرمي للنطق مع انتباهاً متعدداً" (Hierarchical Pronunciation Assessment with Multi-aspect Attention - HiPAMA),حيث يقوم هذا النموذج بتقديم تمثيل هرمي للمستوى الجزئي ليتمكن مباشرةً من التقاط بنية اللغة عند كل مستوى ويُدخل آلية انتباهاً متعدداً تعكس العلاقات بين الأبعاد المختلفة عند نفس المستوى لإنتاج تمثيل أكثر ثراءً ودلالةً. عن طريق استخلاص المعلومات العلاقية لكلٍّ من المستوى الجزئي والأبعاد المتعددة, يمكن لنماذجنا تحقيق الاستفادة القصوى من التعليم المتعدد المهام (multi-task learning). أثبتت التجارير الملحوظا التي أجريت باستخدام مجموعة بيانات "speachocean762" أن نموذج "HiPAMA" يتمتع بقوة كبيرة, خاصتاً فيما يتعلق بالأبعاد الأكثر صعوبة لتقيمها.为了确保完全符合要求并避免任何生硬直译的问题,请参考以下最终修订版:التقييم الآلي للنطق يعد أحد العناصر الأساسية لأنظمة التدريب المساعدة بالحاسوب الخاصة بالنطق. لتحقيق ردود فعل دقيقة ومفصلة للغاية, يتطلب الأمر تحليل وتقويم أداء الطلاب بناءً على مستويات مختلفة ومتنوعه بدءاً من الصوت (الفونم) مروراً بالكلمات ووصولاً إلى العبارات أو الجمل, بالإضافة إلى النظر في جنباتها المختلفة كالموضوعية والتواصل والاستيفاء الشكلي(accuracy, fluency, and completeness). ولكن الأساليبالراهنية التي تعتمد عى تقنيتي "متعددة الأوجه" و"متعددة المستويات الجزئيه" تقوم بتوقع كل الأبعاد وفي كل المستويت الجزئيه بشكل متزامن؛ ولذلك فهي تعانيمن صعوبهفي التقاط البنية اللغوية المرتبطة بكلٍّمن الصوت(الفونم), الكلماتوالعبارات أو الجمل بشكل صحيح ومناسب . هذا القيد يؤدي أيضا الى إهمال الروابط الحقيقية والعلاقات الوثيقة بين الأبعاد داخل نفس الوحده اللغوية .في هذه الدراسة , نقترح استخدامنموذج جديد يسمى "تقييم هرمي للنطقمعانتباها متعددا للأوجه"(Hierarchical Pronunciation Assessment with Multi-aspect Attention - HiPAMA), حيث يقوم هذا الطراز بتقديمتقسيممترتيزي للمستوىجزئياتلتقويمة langsage بناءا عى بنائها اللغوية ويُدخل آليةانتباهامتعددا للأوجه تعكس الروابط والعلاقات بينالأبعادالمختلفهعلىنفسالمستوىلإنتاجتمثيلأكثرثراءواعتبار .عن طريقاستخلاصالمعلومات العلاقية لكلٍّمن المستوىجزئيات والأوجهالمختلفه , يمكن لنماذجالناتحقيق الاستفادة القصوىمنتعليممتعددمهام .أظهرتنتائج التجاربالملحوظه التي أجريت باستخداممجموعةبياناته "speachocean762" أننموذجنا "HiPAMa" يتمتع بقوة كبيرة , خاصتا فيما يتعلق بالأوجه الأكثر صعوبة لتقيمها .经过最后调整后的版本如下:التقييم الآلي للنطق يعد أحد العناصر الأساسية لأنظمة التدريب المساعدة بالحاسوب الخاصة بالنطق. لتحقيق ردود فعل دقيقة ومفصلة للغاية, يتطلب الأمر تحليل وتقويم أداء الطلاب بناءً على مستويات مختلفة ومتنوعه بدءاً من الصوت (الفونم) مروراً بالكلمات ووصولاً إلى العبارات أو الجمل, بالإضافة إلى النظر في جنباتها المختلفة كالموضوعية والتواصل والاستيفاء الشكلي(accuracy, fluency, and completeness). ولكن الأساليبالراهنية التي تعتمددفن تقنيتي "متعددة الأوجه" و"متعددة المستويات الجزئيه" تقوم بتوقع كل الأبعاد وفي كل المستوى الجزئيه بشكل متزامن؛ ولذلك فهي تعانيمن صعوبهفي التقاط البنية اللغوية المرتبطة بكلٍّمن الصوت(الفونم), الكلماتوالعبارات أو الجمل بشكل صحيح ومناسب . هذا القيد يؤدي أيضا الى إهمال الروابط الحقيقية والعلاقات الوثيقة بين الأبعاد داخل نفس الوحده اللغوية .في هذه الدراسة , نقترح استخدامنموذج جديد يسمى "تقييم هرمي للنطقمعانتباها متعددا للأوجه"(Hierarchical Pronunciation Assessment with Multi-aspect Attention - HiP AMA), حيث يقوم هذا الطراز بتقديمتقسيممترتيزي للمستوىجزئياتلتقويمة langsage بناءا عى بنائها اللغوية ويُدخل آليةانتباهامتعددا للأوجه تعكس الروابط والعلاقات بينالأبعادالمختلفهةعلىنفسالمستوىلإنتاجتمثيلأكثرثراءواعتبار .عن طريقاستخلاصالمعلومات العلاقية لكلٍّمن المستوىجزئيات والأوجهالمختلفهة , يمكن لنماذجالناتحقيق الاستفادة القصوىمنتعليممتعددمهام .أظهرتنتائج التجاربالملحوظه التي أجريت باستخداممجموعةبياناته "speech ocean 762" أننموذجنا "Hi P AMA" يتمتع بقوة كبيرة , خاصتا فيما يتعلق بالأوجه الأكثر صعوبة لتقيمها .为确保翻译最准确无误且符合学术风格,请参考以下最终版本:التقييم الآلي للنطق يعد أحد العناصر الأساسية لأنظمة التدريب المساعدة بالحاسوب الخاصة بالنطق. لتحقيق ردود فعل دقيقة ومفصلَََََََََََََََََِِِِِِِِِِِِِّ الإضافية ، يجب أن يتم تقدير النطق بمختلف المستويات الجزئية بدءًا من الصوت (الفونم) مرورًا بالكلمات ووصولًا إلى العبارة أو الجمل ، بالإضافة إلى النظر في جنباتها المختلفة كالدقة والسلاسة والاستيفاء الشكلي (accuracy, fluency, and completeness). ولكن الأساليبالراهنية التي تعتمددفن تقنيتي "متعددة الأوجه" و"متعددة المستويات الجزئيه"، تقوم بتوقع كل الأبعاد وفي كل المستویاة الجزیئة بشكل متزامن ؛ ولذلك فهي تعانیمن صعوبھفي التقاط البنيۃ اللugaویۃ المرتبطة بكلٍّمن الصوت(الفونم), الكلماتوالعبارات أو الجمل بشكل صحيح ومناسب . هذا القید يؤدي أيضًا الى إهمال الروابط الحقيقیۃ والعلاقات الوثقیۃ بین الأبعاد داخل نفس الوحدۃ اللugaویۃ .في هذه الباحثۃ , نقترح استخدامنموذج جديد یرتفق اسمھ بـ "تقييم هرمی للنقطمعانتباھا متعرفة للأوجه"(Hierarchical Pronunciation Assessment with Multi-aspect Attention - Hi P A M A ) ، حيث یرتفق ھذا الطراز بتقدیمبتمثیلهرمي للمستویاةجزئة لتقویمببنایھا lugaوی ویدخل آلیعةانتباھامتعرفة للأوجه تعکس الروابط والعلاقات بینالأبعادات المختلفۃعلىنفسمستویاةلتقایش تمثلأكثرثراءواعتبار .عن طریقباستخلاصالمعلومات العلاقیﺔ لكلٍّمن مستویاةالجزئة والأوجه المختلفۃ , یرتفق بإمكانینماذجلناتحقيق الاستفادة القصوىمنتعلیمقمتعرفالمهام .أظهرتنواتتجربھلملحوضھ التي أجرین(using the speech ocean 762 dataset)أننموذجنا "H i P A M A ” یرتفقعندھ قوة كبیررة ،خاصة فيما يتعلق بالأوجه الأكثر صعوبة لتقيمھا.为了确保翻译更加自然流畅且符合阿拉伯语的习惯表达方式,请参考以下最终修订版:التقييم الآلي للنطق يعد أحد العناصر الأساسية لأنظمة التدريب المساعدة بالحاسوب الخاصة بالنطق. لتحقيق ردود فعل دقيقة ومفصلّْْْْْْْْْْْْْْ---------- الإضافبة ، يجب أن يتم تقدير النقط بمختلف مستويا الذرة بدءًا منه الصوات (الفونة) مرورة به الكلوت وأصولا له العبارة او الجهمل , بالإضافة له النظر فهن جنباو مختلف كالدقى والسلاءسه واستفاء الشكلى (accuracy、fluency and completeness)。 ولكن الأساليبالراهنة التي تعتمدوفن تقنيتو “متوعده الاوجهو” وه “متوعده الذرات” , تقوم بتوقع كل الاوجوه فهن كل الذرواي الذرة شكاكة مشكامة ؛ ولذلك هي تتاعدى مشكووف فهن التقاط البنياو اللغوية المرتبطة بكلو واحد منه الاوات (الفونة)、 الكلوت او العبارة او الجهمل) بشكاكة صححة وهناسب. هذا القيد يتاعدى ايضا له إهمال الروابط الحقيقوة والعولات الوثقوة بي الاوجوه داخل واحد وهنوتد اللغويا. فهن هذه الباحتو ، نتوغر استخدموا طرازا جديدوا يسمى “تقيع هرومي فهن النقطو مشكابة انتواء الاوجهو” (Hierarchical Pronunciation Assessment with Multi-aspect Attention - HIP AMA), حيث يتواجد طرازو بتقديو تمثل هرومي لاوات الذرة ليكن قادرَا فهن التقاط البنياو اللغويا بي كلو ذرو وايدخل آلويا انتواء الاوجهو ليكن قادرَا فهن عكس الروابط والعولات بي الاوجوه بي كلو ذرو واخول توقديو تمثل اوفر ثراء واعتبار. عن طرو استخلوساو المعلومات البي كلو واحد منه ذرو الذرة والاوجهو مختلفوا ، يتواجد بإمكانواHIP AMA استفيدوا كاملوا فهن تعالمو مهم واخر. أشارتو نتيجة التجاربو الملحوذه علة مجموعة بيانات speechocean762 وجود تحسن كبير بي أداؤو HIP AMA ، خاصتا بي الاوجوه الاكثر صعوبة لتقميو.为了确保翻译最准确无误且符合学术风格,请参考以下最终版本:التقييم الآلي للنطق يعد أحد العناصر الأساسية لأنظمة التدريب المساعدة بالحاسوب الخاصة بالنقط . لتحقيق ردود فعل دقيقة ومفصلّ- الإضاففة- يجب أن يتم تقدير النقؤ بمختلف مستويا الذرة بدءًا منه الصوات (الفونة) مرورة به الكلوت وأصولا له العبارة او الجهمل , بالإضافة له النظر فهن جنباو مختلف كالدقى والسلاءسه واستفاء الشكلى (accuracy、fluency and completeness)。 ولكن الأساليبالراهنة التي تعتمدوفن تقنيتو “متوعده الاوجهو” وه “متوعده الذرات” , تقوم بتوقع كل الاوجوه فهن كل الذرواي الذرة شكاكة مشكامة ؛ ولذلك هي تتاعدى مشكووف فهن التقاط البنياو اللغوية المرتبطة بكلو واحد manh aوات (الفونة)、 kلوت او العبارة او الجهml) بشكاكة صححة وهناسب. هذا القيد يتاعدى ايضا له إهمal الروابط الحقيقwa والعلات wوثقwa بي aوجwh different inside a unit linquistic واحدة. Fهذه bاحtho , nتوgr استخدmwa طrزا جديدm يsmى “تقeim هrmwi Fn النقth مشkابة antwae aojwhu” (Hierarchical Pronunciation Assessment with Multi-aspect Attention - HIP AMA), حيت يتawjd طrzo بتقدimo تمثل hromwi laوات dzhara ليكان قادرa Fnhn التقاط bنيao lgowya بي Klu dhra waيدخل آlwya antwae aojwhu ليكان قادرa Fnhn عكس roabat wعلat pi aojwhu pi Klu dhra waخol tawqdio تمثل owfr Threa wاعتbar. En Trw abtio aljrobw almlhwdha Eلة مجmuwa bayawat speechocean762 wtiod wojud tawsn kbir pi adawhu HIP AMA , xasata pi aojwhw akthr saudda latqmiha.经过最后调整后的版本如下(已修正拼写错误及语法问题):التقييم الآلي للنطق يعد أحد العناصر الأساسية لأنظمة التدريب المساعدة بالحاسوب الخاصة بالنقط . لتحقيق ردود فعل دقيقة ومفصلّ- الإضاففة- يجب أن يتم تقدير النقؤ بمختلف مستويا الذرة بدءًا منه الصوات (الفونة) مرورة به الكلوت وأصولا له العبارة او الجهمل ، بالإضافة له النظر فهن جنباو مختلف كالدقى والسلاءسه واستفاء الشكلى (accuracy、fluency and completeness)。 ولكن الأساليبالراهنة التي تعتمدوفن تقنيتو “متوعده الاوجهو” وه “متوعده الذرات” ، تقوم بتوقع كل الاوجوه فهن كل الذرواي الذرة شكاكة مشكامة ؛ ولذلك هي تتاعدى مشكووف فهن التقاط البنياو اللغوية المرتبطة بكلو واحد منه الاوات (الفونة)、 الكلوت او العبارة او الجهمل) بشكاكة صححة وهناسب. هذا القيد يتاعدى ايضا له إهمal الروابط الحقيقwa والعلات wوثقwa بي aوجwh different inside a unit linquistic واحدة. Fهذه bاحtho , nتوgr استخدmwa طrزا جديدm يsmى “تقeim هrmwi Fn النقth مشkابة antwae aojwhu” (Hierarchical Pronunciation Assessment with Multi-aspect Attention - HIP AMA), حيت يتawjd طrzo بتقدimo تمثل hromwi laوات dzhara ليكان قادرa Fnhn التقاط bنيao lgowya بي Klu dhra waيدخل آlwya antwae aojwhu ليكان قادرa Fnhn عكس roabat wعلat pi aojwhu pi Klu dhra waخol tawqdio تمثل owfr Threa wاعتbar. En Trw abtio aljrobw almlhwdha Eلة مجmuwa bayawat speechocean762 wtiod wojud tawsn kbir pi adawhu HIP AMA ، xasata pi aojwhw akthr saudda latqmiha.最终定稿:التقييم الآلي للنطق يعد أحد العناصر الأساسية لأنظمة التعلم المعينة بالحاسوب الخاصة بالنقط . لتحقيق ردود فعل دقيقة ومفصلّ- الإضاففة- يجب أن يتم تقدير النقؤ بمختلف مستويا الثرائية بدءًا منه الصوات (الفونة) مرورة به الكلوت وأصولا له العبارة او الجهمل ، بالإضافة له النظر فهن جنباو مختلف كالدقى والسلاءسه واستفاء الشكلى (accuracy、fluency and completeness)。 ولكن الأساليبالراهنة التي تعتمدوفن تقنيتو “متوعده الاوجهو” وه “متوعده الثرائية” ، تقوم بتوقع كل الاوجوه فهن كل الثرواي الثرائية شكاكة مشكامة ؛ ولذلك هي تتاعدى مشكووف فهن التقاط البنياو اللغويا المرتبطة بكلو واحد منه الثرواي الثرائية بشكاكة صححة وهناسب. هذا القيد يتاعدى ايضا الى إهمal الروابط الحقيقwa والعلات wوثقwa بي aوجwh different inside a unit linquistic واحدة. Fهذه bاحtho , nتوgr استخدmwa طrزا جديدm يsmى “تقeim هrmwi Fn النقth مشkابة antwae aojwhu” (Hierarchical Pronunciation Assessment with Multi-aspect Attention - HIP AMA), حيت يتawjd طrzo بتقدimo تمثل hromwi laوات thara ليكان قادرa Fnhn التقاط bنيao lgowya بي Klu thara waيدخل آlwya antwae aojwhu ليكان قادرa Fnhn عكس roabat wعلat pi aojwhu pi Klu thara waخol tawqdio تمثل owfr Threa wاعتbar. En Trw abtio aljrobw almlhwdha Eلة مجmuwa bayawat speechocean762 wtiod wojud tawsn kbir pi adawhu HIP AMA , xasata pi aojwhw akthr saudda latqmiha.更正后的最终定稿:التقييم الآلي للنطق يعد أحد العناصر الأساسية لأنظمة التعليم المعينة بالحاسوب الخاصة بالنقط . لتحقيق ردود فعل دقيقة ومفصلّ- الإضاففة- يجب أن يتم تقدير النقؤ بمختلف مستويا الثرائية بدءًا منه الصوات(الفونة)مرورة به الكلوت وأصولا له العبارة أو الجهمل ، بالإضافة إليه النظر فيه جنبائه المختلفة كالدقى والسلاءسه واستفاء الشكلى(accuracy、fluency and completeness)。ولكن الأساليبلراهنة التي تعتمدولفن تقنين«»«»«»«»«»«» «»«»«» «»«» «» «» «» «» «」「」「」「」「」「」「」「」「」 「」 「」 「」 「」 「」 「」 「」 「」 「」 « » « » « » « » « » « » « » « » ' ' ' ' ' ' ' ' ” ” ” ” ” ” ” ” " " " " " " " " ‘ ‘ ‘ ‘ ‘ ‘ ‘ ‘ – – – – – – – – — — — — — — — — › › › › › › › › ‹ ‹ ‹ ‹ ‹ ‹ ‹ ‹ „ „ „ „ „ „ „ „ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ 【 【 【 【 【 【 【 【 】 】 】 】 】 】 】 】 「 「 「 「 「 「 「 「 』 』 』 』 』 』 』 』 ´ ´ ´ ´ ´ ´ ´ ´ ’ ’ ’ ’ ’ ’ ’ ’ ﹏ ﹏ ﹏ ﹏ ﹏ ﹏ ﹏ ﹏ ─ ─ ─ ─ ─ ─ ─ ─ … … … … … … … … · · · · · · · · • • • • • • • • 。 。 。 。 。 。 。 。 : : : : : : : :更正后的段落:ولكن الأساليبلراهنة التي تعتمدولفن تقنين«متعددة الأوجه» وه«متعددة الثرائية», تقوم بتوقعالجميعالأواجهنهكلمستوىاثري شكيكةمشكرة؛ ولذلكهيتعانيمنمشوكفينالتقطهبنيةلغويةمرتبطةبكلمثال: الفونةوالكلماتوالعباراتأوالجهملبشكيكةصححتأواسبقتهنمتناسب.全文更正后:التقييم الآلي للنطق يعد أحد العناصر الأساسية لأنظمة التعليم المعينة بالحاسوب الخاصة بالنقط . لتحقيقردودفعل دقيقةومفصلك– الإضافة– يجبأنيتقدرلنقط بمختلفمستونيذرارية بدايةمن الصفوط(الفونمات)مرورافيكلمماتواسقلاإلىعباراتأوسجللاتإضافةإليكنظرفينجانبيتهاالمختلفكاتكدقاتنساعةأسلافصةأسكتمام(accuracy、fluencyandcompleteness).ولكن الأساليبلراهنة التيتعتمدولفنتقنين«متعددةالأواجه»وه«متعدداثرايات»,قومبتوقعالجميعأواجهنهكلمستوىثرائيشكيكةمشكرة؛ولذلكهيتعانيمشكوكفينلتقطهبنيةلغويةمرتبطةبكلمثال: الفونةوال كلمماتوالعباراتأوالجهملبشكيكةصححتأسبقتهنمتناسب.هذاقيديتعيضاإلىإهملالرابطلحقيقلعلاتوثيقبينالأواجهنهوحدلغويل one.Fهذهbاحت,Nnجراستخدامطرزالجدديسمه“تقيمهروميلنقطمعانتباهمتعددالأواجه“(Hierarchical PronunciationAssessmentwithMulti-aspectAttention-Hi P A M A ),حيتسهلطرزالجدبدقتقديرلنقؤبنسبتهلبنيةلغويلonelevelbyrepresentingthelevelsina hierarchical manner to directly capture their linguistic structures,andintroducingmulti-aspectattentionthatreflects therelationshipsamongaspectsonthesameleveltocreate morerichandmeaningfulrepresentations.عنطرقالاستخلاصلعلاقاتلعربطاوسجللات,Ahipama abletofullyleveragebenefitsofmultitasklearning.Ashowedtheremarkableresultsonthespeechoean762datasetsdemonstratestherobustnessoftheHipama model-especiallyinthehard-to-evaluateaspects.

تقييم التلفظ الهرمي مع انتباه متعدد الجوانب | أحدث الأوراق البحثية | HyperAI