HyperAIHyperAI

Command Palette

Search for a command to run...

注意モデルによる発音特徴検出

Ievgen Karaulov; Dmytro Tkanov

概要

発音特徴量および音韻記述は、音声関連タスクにおいて重要な役割を果たしています。これらのタスクには、コンピュータ支援発音練習、テキストから音声への変換(Text-to-Speech, TTS)、音声生成メカニズムの研究、低リソース言語の音声認識などが含まれます。近年、エンドツーエンドアプローチが音声関連タスクで大きな注目を集めています。本研究では、Listen, Attend and Spell (LAS) \cite{Chan-LAS2016} アーキテクチャを小さな訓練データセット(例:TIMIT \cite{TIMIT-1992})上の電話素認識に適用します。また、新たなデコーディング技術を導入し、注意モデルを使用して発音部位と発音方法検出器をエンドツーエンドで学習できるようにしました。さらに、マルチタスク学習設定における電話素認識と発音特徴量検出の同時処理についても考察します。


AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています