16日前

CLUZH が SIGMORPHON 2022 共同タスクにおける語素分割および活用生成への参加

{Peter Makarov, Simon Clematide, Silvan Wehrli}
CLUZH が SIGMORPHON 2022 共同タスクにおける語素分割および活用生成への参加
要約

本稿では、チューリッヒ大学計算言語学部門のチームがSIGMORPHON 2022共通課題「語素分割」と「活用生成」への提出成果について述べる。本チームの提出手法は、従来の編集操作(edit actions)を用いる文字レベルのニューラルトランシューダーに基づいている。このモデルは低リソース環境において特に効果的であることが知られているが、大規模なデータに対して適用する際には困難が伴ってきた。従来の実装ではGPU並列処理の利点を十分に活かせず、ミニバッチ学習の効率も不十分であった。特に遷移ベースのシステムにおいては、ミニバッチ処理の実装は技術的に難易度が高かった。本年度の提出では、このニューラルトランシューダーをPyTorchに移植し、本格的なミニバッチ学習を実装した。これにより、大規模データへのスケーラビリティを確保し、広範な実験が可能となった。語素分割においては競争力のある結果を報告しており、課題の第2部では並び首位を獲得した。また、文レベルの語素分割を単語レベルの問題に簡略化するアプローチが、シンプルでありながら非常に効果的であることを示した。さらに、活用生成においても強力な成果を達成した(第1部では大規模学習データにおける全体最良結果、第2部では低リソース学習経路において最良結果)。本研究のコードは公開されている。

CLUZH が SIGMORPHON 2022 共同タスクにおける語素分割および活用生成への参加 | 最新論文 | HyperAI超神経