16日前

文字を越えて:部分語素レベルの分割

{Andre F. T. Martins, Ben Peters}
文字を越えて:部分語素レベルの分割
要約

本稿では、SIGMORPHON 2022共通課題「語素分割」へのDeepSPINの参加成果を報告する。我々は、すべてが語レベルのサブタスクに対する3つの提出を行った。まず、entmaxを用いたスパースなシーケンス・トゥ・シーケンスモデルが、従来のsoftmaxベースのモデルに比べて顕著な性能向上を達成することを示す。これは他のタスクにおいても報告されている結果と一致する。次に、語素処理のモデルは文字レベルで学習する必要があるという仮定に挑戦し、ユニグラム言語モデルから導かれるサブワードを用いたシーケンスとして語素を生成するTransformerモデルを構築した。このサブワードベースのTransformerは、すべての文字レベルモデルを上回り、語レベルのサブタスクで優勝を達成した。一方、文レベルのサブタスクには公式の提出を行わなかったが、同様にこのサブワードベースのアプローチが非常に有効であることも示した。

文字を越えて:部分語素レベルの分割 | 最新論文 | HyperAI超神経