HyperAIHyperAI

Command Palette

Search for a command to run...

g2pW: マンダリン中国語の多音字解消のための条件付き重み付けソフトマックスBERT

Yi-Chang Chen Yu-Chuan Chang Yen-Cheng Chang Yi-Ren Yeh

概要

多音字の曖昧性解消は、中国語の文字から音素への変換(Grapheme-to-Phoneme, g2p)において最も重要な課題である。従来の研究では、事前学習済み言語モデル、制約付き出力、および品詞タギング(Part-Of-Speech, POS)からの追加情報を使用してこの問題に取り組んできた。これらの戦略に着想を得て、私たちは新しいアプローチであるg2pWを提案する。g2pWは、学習可能なソフトマックス重みを適応させることで、対象となる多音字とそのPOSタグに基づいてBERTの出力を条件付けます。従来の手法とは異なり、ハードマスクではなく候補となる音素に対するソフトウェイト関数を学習することで性能が向上することが実験で示されている。さらに、私たちが提案するg2pWは統一エンコーダーとともにPOSタギングモデルを同時学習するため、追加の事前学習済みPOSタギングモデルを必要としない。実験結果は、公開データセットCPPにおいてg2pWが既存の手法を上回っていることを示している。本研究で使用したすべてのコード、モデルの重みパラメータ、およびユーザーフレンドリーなパッケージが公開されている。


AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています