
要約
意味グラフ(セマンティックグラフ)、例えばWordNetは、自然言語を2つの区別可能な層で整理するリソースである。局所的なレベルでは、ハイパーニミー(上位語関係)やメロニミー(部分全体関係)などのシノセット(意味的構成要素)間の個々の関係が、それらの意味を表現するために使用される単語の理解を深める。全体的なレベルでは、ネットワーク全体のグラフ理論的特性の分析により、人間の言語構造全体についての洞察が得られる。本論文では、Max-Margin Markov Graph Models (M3GM)という新しいフレームワークを使用して、意味グラフの全局的特性と局所的特性を組み合わせる。M3GMはExponential Random Graph Model (ERGM) の拡張版であり、大規模な多関係グラフにもスケーリングできる。我々は、このような全局的なモデリングがシノセット間の意味関係予測という局所的なタスクでの性能向上にどのように寄与するかを示し、WN18RRデータセットにおいて新たな最先端の結果を得たことを報告する。WN18RRデータセットは、「簡単」な相互作用例を取り除いたWordNetリンク予測の困難なバージョンである。さらに、M3GMモデルは、整然とした言語学的オントロジーに特徴的な多関係モチーフを特定する。この翻訳では、専門用語や技術的概念を正確に翻訳し、日本語の表現習慣に合わせて自然な文章を作成しました。また、正式かつ客観的な書き方で内容を忠実に再現しています。