2ヶ月前
Grounded Textual Entailment を日本語に翻訳すると以下のようになります: 根拠付き文脈包含
Hoa Trong Vu; Claudio Greco; Aliia Erofeeva; Somayeh Jafaritazehjan; Guido Linders; Marc Tanti; Alberto Testoni; Raffaella Bernardi; Albert Gatt

要約
文章の間の意味関係(例えば、包含関係)を捉えることは、計算論理学にとって長年の課題となっています。論理に基づくモデルは、前提 P が仮説 H を包含するとは、P が真であるすべての「可能世界」(解釈や状況)で H も真である場合と定義します。統計的なモデルはこの関係を確率的に捉え、人間が P から H を推論する可能性について扱います。本稿では、これらの二つの視点を橋渡しすることを目指し、テキスト包含関係タスクの視覚的な根拠を持つバージョンを提唱します。具体的には、前提 P と仮説 H の他に画像(対応する「可能世界」や「状況」)も与えられた場合、モデルの性能が向上するかどうかを検討します。SNLI データセット(Bowman et al., 2015)の多モーダル版を使用し、「盲目」モデルと視覚情報強化型モデルのテキスト包含関係性能を比較しました。結果として、視覚情報が有益であることが示されました。しかし、詳細な誤り分析を行ったところ、現在の多モーダルモデルは最適な「根拠付け」を行っていないことも明らかになりました。注:- 「包含関係」は一般的に「entailment」と訳されます。- 「可能世界」は哲学や論理学でも使用される概念で、「possible worlds」と訳されます。- 「根拠付け」は「grounding」と訳されますが、文脈によっては「接地」という表現も使われます。ここでは「根拠付け」と訳しています。