要約
本稿では、未十分にリソースが整備されていない新言語(Fongbe語)向け音声認識システム(ASR)の開発に向けた取り組みについて報告する。本研究の目的は、Fongbe語における連続音声のデコードに向けた音響モデルおよび言語モデルの構築である。Fongbe語は、ベニン、トーゴ、ナイジェリアなどで話されているアフリカ語に属するが、現時点では音声認識システム用の言語リソースが一切存在しないという課題を抱えている。本研究の一環として、以下のセクションで詳述するように、Fongbe語のテキストおよび音声コーパスを収集した。音響モデルの構築は、音節記号レベル(graphemic level)で実施した。また、性能比較の目的で2種類の言語モデルを構築した。さらに、音声モデルへの影響を検証するため、母音の簡略化として、声調の変化を示す記号(トーンダイアクリティック)を除去する処理を実施した。