2ヶ月前
ドキュメント理解のためのメッセージパッシングアテンションネットワーク
Giannis Nikolentzos; Antoine J.-P. Tixier; Michalis Vazirgiannis

要約
グラフニューラルネットワークは、最近、グラフ構造データの処理に非常に効果的なフレームワークとして注目を集めています。これらのモデルは、多くのタスクで最先端の性能を達成しています。大部分のグラフニューラルネットワークは、メッセージ伝播、頂点更新、およびリードアウト関数という観点から説明することができます。本論文では、文書を単語共起ネットワークとして表現し、メッセージ伝播フレームワークを自然言語処理(NLP)に応用する新しい手法である「ドキュメント理解のためのメッセージ伝播アテンションネットワーク(MPAD: Message Passing Attention network for Document understanding)」を提案します。さらに、MPADの階層的な変種もいくつか提案しています。10つの標準的なテキスト分類データセットを用いた実験結果は、我々のアーキテクチャが最先端技術と競争力があることを示しています。アブレーションスタディでは、各コンポーネントが性能に与える影響についてさらなる洞察が得られました。コードは公開されており、以下のURLからアクセスできます: https://github.com/giannisnik/mpad 。