2ヶ月前
g2pW: マンダリン中国語の多音字解消のための条件付き重み付けソフトマックスBERT
Yi-Chang Chen; Yu-Chuan Chang; Yen-Cheng Chang; Yi-Ren Yeh

要約
多音字の曖昧性解消は、中国語の文字から音素への変換(Grapheme-to-Phoneme, g2p)において最も重要な課題である。従来の研究では、事前学習済み言語モデル、制約付き出力、および品詞タギング(Part-Of-Speech, POS)からの追加情報を使用してこの問題に取り組んできた。これらの戦略に着想を得て、私たちは新しいアプローチであるg2pWを提案する。g2pWは、学習可能なソフトマックス重みを適応させることで、対象となる多音字とそのPOSタグに基づいてBERTの出力を条件付けます。従来の手法とは異なり、ハードマスクではなく候補となる音素に対するソフトウェイト関数を学習することで性能が向上することが実験で示されている。さらに、私たちが提案するg2pWは統一エンコーダーとともにPOSタギングモデルを同時学習するため、追加の事前学習済みPOSタギングモデルを必要としない。実験結果は、公開データセットCPPにおいてg2pWが既存の手法を上回っていることを示している。本研究で使用したすべてのコード、モデルの重みパラメータ、およびユーザーフレンドリーなパッケージが公開されている。