HyperAIHyperAI

Command Palette

Search for a command to run...

PHMOSpell:音韻論および語彙論的知識を活用した中国語綴りチェック

Jing Xiao Shaojun Wang Minchuan Chen ZhiYu Zhang Weiwei Jiang Junjie Li Li Huang

概要

中国語の綴りチェック(CSC)は、漢字の複雑な特徴により、困難なタスクである。統計によれば、中国語の綴りミスの多くは音声的誤りまたは視覚的誤りに起因している。しかし、従来の手法は漢字の音声的・形態論的知識を十分に活用せず、あるいは外部リソースに依存して類似性をモデル化する傾向にあった。上記の課題に対処するため、本研究ではマルチモーダル情報を利用することでCSCの性能を向上させる、新たなエンドツーエンド学習可能なモデルPHMOSpellを提案する。具体的には、音声モダリティからピンイン表現、視覚モダリティから字形(glyph)表現をそれぞれ抽出し、適切に設計された適応型ゲート機構を通じて事前学習済み言語モデルに統合する。有効性の検証のため、包括的な実験およびアブレーションテストを実施した。3つの共有ベンチマークにおける実験結果から、本モデルが従来の最先端モデルを一貫して上回ることを示した。


AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています