HyperAIHyperAI

Command Palette

Search for a command to run...

多面的かつ多粒度の発音評価のための階層的な文脈認識モデルアプローチ

Fu-An Chao¹, Tien-Hong Lo¹,², Tzu-I Wu¹,², Yao-Ting Sung³, Berlin Chen²

概要

自動発音評価(Automatic Pronunciation Assessment: APA)は、コンピュータ支援発音訓練(Computer-assisted Pronunciation Training: CAPT)において第二言語(L2)学習者の話す能力を評価する上で重要な役割を果たします。しかし、現行の大多数の方法には、異なる音声粒度間の階層的および局所的な文脈関係を考慮せずにモデリングプロセスを並列化するという明らかな欠点があります。本稿では、これを踏まえて、多面的かつ多粒度のAPAのために新しい階層的手法を提案します。具体的には、まず超音素(sup-phonemes)という概念を導入し、L2話者のより微妙な意味論的特性を探ります。次に、深さ方向分離畳み込み層(depth-wise separable convolution layer)を使用して、単語未満のレベルでの局所的な文脈情報をより効果的に抽出します。最後に、スコア制約注意プーリング機構(score-restraint attention pooling mechanism)を用いて文レベルのスコアを予測し、マルチタスク学習(Multitask Learning: MTL)フレームワークで構成モデルを最適化します。公開されているベンチマークデータセットであるSpeechocean762で実施された広範な実験により、当手法が最先端の基準モデルと比較して有効性が示されました。


AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています