HyperAIHyperAI

Command Palette

Search for a command to run...

日本語の単語分割における長期短期記憶

Yoshiaki Kitagawa Mamoru Komachi

概要

本研究では、日本語の単語分割(Japanese Word Segmentation: JWS)に長期短期記憶(Long Short-Term Memory: LSTM)ニューラルネットワークアプローチを適用することを提案します。中国語の単語分割(Chinese Word Segmentation: CWS)に関する先行研究では、LSTMや門制再帰ユニット(Gated Recurrent Units: GRU)などの再帰ニューラルネットワークを使用することで成功が見られました。しかし、中国語とは異なり、日本語にはひらがな、カタカナ、漢字など複数の文字種があり、これらは表記変異を生み出し、単語分割の難易度を高めています。さらに、JWSタスクにおいては全体的な文脈を考慮することが重要である一方で、従来のJWSアプローチは局所的な特徴に依存していました。この問題に対処するために、本研究ではLSTMに基づくアプローチを採用することを提案します。実験結果は、提案されたモデルがさまざまな日本語コーパスに対して最先端の精度を達成していることを示しています。


AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています