HyperAIHyperAI

Command Palette

Search for a command to run...

堅牢な語彙特徴量を用いたニューラルネットワークの命名実体認識の改善

Abbas Ghaddar Philippe Langlais

概要

名詞エンティティ認識におけるニューラルネットワークアプローチは、慎重に手作業で設計された特徴量の必要性を軽減しています。最新のシステムでは一部の特徴量が依然として使用されていますが、語彙特徴量は Gazetteers(ガゼッター)を除いてほとんど廃棄されています。本研究では、これが不公平であることを示します:実際、語彙特徴量は非常に有用です。私たちは、Wikipedia を用いた遠隔監督によって生成された注釈データから学習した低次元ベクトル空間に単語とエンティティタイプを埋め込む方法を提案します。これにより、各単語を表す特徴量ベクトルをオフラインで計算します。この表現を通常の再帰型ニューラルネットワークモデルと組み合わせると、大幅な改善が見られます。私たちは ONTONOTES 5.0 において新しい最先端の F1 スコア 87.95 を達成し、過度に研究されている CONLL-2003 データセットでは F1 スコア 91.73 で最先端の性能に匹敵する結果を得ました。


AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています
堅牢な語彙特徴量を用いたニューラルネットワークの命名実体認識の改善 | 記事 | HyperAI超神経