17日前
MINER:情報理論的視点からのOoV名前付きエンティティ認識の改善
Xiao Wang, Shihan Dou, Limao Xiong, Yicheng Zou, Qi Zhang, Tao Gui, Liang Qiao, Zhanzhan Cheng, Xuanjing Huang

要約
標準的なNERベンチマークにおいて、NERモデルは有望な性能を達成している。しかし、最近の研究では、従来のアプローチがエンティティの表記情報に過度に依存している可能性が指摘されており、その結果、未知語(OOV)エンティティの認識において劣った性能を示すことがある。本研究では、情報理論的視点からこの問題を解決する新たなNER学習フレームワーク、MINERを提案する。本手法は、二つの相互情報量に基づく学習目的を含む:(i) 汎化情報最大化(generalizing information maximization):文脈およびエンティティの表面表現に対する深い理解を通じて表現を強化する;(ii) 余分な情報最小化(superfluous information minimization):エンティティ名の機械的記憶やデータ内の偏った手がかりの利用を抑制する。さまざまな設定およびデータセットにおける実験により、本手法がOOVエンティティの予測において優れた性能を達成することが示された。