
要約
自動音声感情認識は、人間-コンピュータインタラクションおよび感情計算(アフェクティブコンピューティング)における重要な研究課題である。南米全域で1,000万人以上がクエチャワ語を話しているが、その中でも特に知られている方言の一つがコラオクエチャワ語である。しかし、この言語は機械による感情認識において低リソース言語と見なされ、クエチャワ語話者がこの技術を利用することを阻む障壁となっている。したがって、本研究の貢献は、クエチャワ語コラオ版の15時間に及ぶ音声コーパスの構築であり、これを研究コミュニティに公開するものである。このコーパスは、本研究目的のために明示的に収集された単語および文から構成されており、9つのカテゴリカルな感情(喜び、悲しみ、退屈、恐怖、眠気、平静、興奮、怒り、ニュートラル)に分類されている。感情のラベル付けは、感情の3次元(価値性(valence)、覚醒度(arousal)、支配性(dominance))に基づき、5段階の離散尺度で行われた。このコーパスの有用性を示すために、機械学習手法およびニューラルネットワークを用いた音声感情認識の実験を実施した。