
要約
ウェブテーブルなどの表形式データの有用性は、その意味論的理解に大きく依存しています。本研究では、メタデータのない表における列タイプ予測に焦点を当てています。従来の語彙照合ベースの手法とは異なり、ハイブリッドニューラルネットワーク(HNN)によって学習された表の局所性特徴や、知識ベース(KB)検索およびクエリ応答アルゴリズムによって学習された列間意味論的特徴を完全に活用できる深層予測モデルを提案します。このモデルは、個々の表セットだけでなく、別の表セットへの転移においても良好な性能を示しています。