7日前

Phraseformer:Transformerおよびグラフ埋め込みを用いたマルチモーダルキーフレーズ抽出

Narjes Nikzad-Khasmakhi, Mohammad-Reza Feizi-Derakhshi, Meysam Asgari-Chenaghlu, Mohammad-Ali Balafar, Ali-Reza Feizi-Derakhshi, Taymaz Rahkar-Farshi, Majid Ramezani, Zoleikha Jahanbakhsh-Nagadeh, Elnaz Zafarani-Moattar, Mehrdad Ranjbar-Khadivi
Phraseformer:Transformerおよびグラフ埋め込みを用いたマルチモーダルキーフレーズ抽出
要約

背景:キーワード抽出は自然言語処理分野において広く研究されているトピックである。キーワードとは、文書内の最も関連性の高い情報を表す語彙的単位を指す。研究者たちが直面している主な課題は、文書からコアとなるキーワードを効率的かつ正確に抽出する方法を確立することである。しかし、従来のキーワード抽出手法はテキスト特徴とグラフ特徴を用いてきたものの、これらの特徴を最適に学習し統合できるモデルの不足が問題視されている。方法:本研究では、Transformerおよびグラフ埋め込み技術を活用して、マルチモーダルなキーフレーズ抽出手法「Phraseformer」を提案する。Phraseformerでは、各キーフレーズ候補が、テキスト表現と構造学習表現の連結によって得られるベクトルとして表現される。この手法は、BERTやExEmといった最新の研究成果を活用し、両方の表現を効果的に保持する。さらに、Phraseformerはキーフレーズ抽出を、分類タスクとして解くことによって定式化されたシーケンスラベリング問題として扱う。結果:本研究では、Inspec、SemEval2010、SemEval2017の3つのデータセットにおいて、F1スコアを用いてPhraseformerの性能を評価した。また、Inspecデータセット上での異なる分類器の性能を比較検証した。実験結果から、Phraseformerは使用された3つのデータセットすべてにおいて優れた性能を発揮することが明らかになった。特に、ランダムフォレスト分類器がすべての分類器の中で最も高いF1スコアを達成した。結論:BERTとExEmの組み合わせは、語の意味をより意味的に豊かに表現できるため、単一モーダル手法に比べてPhraseformerは顕著に優れた性能を示す。このことから、多モーダルな特徴統合がキーワード抽出の精度向上に有効であることが示された。