2ヶ月前

ColNet: Webテーブルの意味を埋め込む列タイプ予測モデル

Jiaoyan Chen; Ernesto Jimenez-Ruiz; Ian Horrocks; Charles Sutton
ColNet: Webテーブルの意味を埋め込む列タイプ予測モデル
要約

知識ベース(KB)の概念を用いて列のタイプを自動的に注釈付けることは、ウェブテーブルの基本的な理解を得る上で重要なタスクである。現在の方法は、列名などのテーブルメタデータやKB内のセルのエンティティ対応に依存しており、メタ情報が不完全な増大するウェブテーブルに対処できない場合がある。本論文では、ColNetと呼ばれるニューラルネットワークに基づく列タイプ注釈付けフレームワークを提案する。このフレームワークは、KB推論と検索を機械学習と統合し、予測のために自動的に畳み込みニューラルネットワーク(Convolutional Neural Networks, CNN)を訓練できる。予測モデルは、単語表現を使用してセル内のコンテキスト意味を考えるだけでなく、複数のセルから局所特徴を学習することで列全体の意味も埋め込む。本手法はDBPediaおよび2つの異なるウェブテーブルデータセット(一般ウェブからのT2Dv2とWikipediaページからのLimaye)で評価され、最先端のアプローチよりも高い性能を達成した。

ColNet: Webテーブルの意味を埋め込む列タイプ予測モデル | 最新論文 | HyperAI超神経