3ヶ月前
MNet-Sim:文の類似度を評価するための多層セマンティック類似度ネットワーク
Manuela Nayantara Jeyaraj, Dharshana Kasthurirathna

要約
類似性は、その評価が対象とする領域によって変化する比較的主観的な尺度である。文書分類、パターン認識、チャットボットの質問応答、センチメント分析などの自然言語処理(NLP)アプリケーションにおいて、文対間の正確な類似性スコアを識別することは、現在極めて重要な研究課題となっている。既存の類似性評価モデルでは、文脈に基づく比較による類似性の効果的な計算の困難さ、中心化理論(centering theory)に起因する局所化の問題、および非意味的テキスト比較の不足が、主要な課題として指摘されてきた。本研究では、ネットワーク科学の原理、隣接節点間の重み付き関係エッジ、および提案する拡張ノード類似性計算式を基盤として、複数の類似性測定法を統合した多層構造の意味的類似性ネットワークモデルを提案する。この提案モデルは、既存の最先端モデルと比較して評価・検証された結果、文の類似性評価において優れた性能を示したことが明らかになった。