HyperAIHyperAI

Command Palette

Search for a command to run...

複数のアテンションを用いた文字ベースのタイ語単語分割

Manabu Okumura Hidetaka Kamigaito Thodsaporn Chay-intr

概要

語彙単位に基づく単語分割モデルは、タイ語を含む接続語彙言語において広く応用されており、高い性能が実証されている。これらのモデルは、文字列から語の境界を推定する。しかし、文字列における文字単位は、語、サブワード、文字クラスタ単位に比べて本質的な意味を持たない。本研究では、文字列から語、サブワード、文字クラスタといった複数の種類の情報を活用するタイ語単語分割モデルを提案する。本モデルは、文字とさまざまな単位タイプ間の重要な関係性を推定することで、複数のアテンション機構を用いて分割推論を精緻化する。実験の結果、本モデルが他の最先端のタイ語単語分割モデルを上回る性能を発揮することを確認した。


AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています