Command Palette
Search for a command to run...
{Sirko Schindler Nora Abdelmageed}

要約
テーブルは構造化情報の豊富な源である一方で、その中には固有の曖昧性が内在しているため、自動利用がしばしば困難に陥る。単なるタイポから命名規則の不統一、さらには値間の同音異義(homonymy)に至るまで、多様な問題がこの情報源の活用を妨げる大きな障壁となっている。セマンティックウェブはこうした課題の多くを軽減できる可能性を有しているものの、実際のアノテーションプロセスは依然として困難を伴う。新たなアイデアの創出および既存手法の改善を促進するため、2019年から開催されている「テーブルデータから知識グラフへのマッチング(SemTab)」セマンティックウェブチャレンジは、毎年コンペティションを実施し、各システムが自らの現有能力を発揮できる場を提供している。異なる起源と特性を持つ複数のデータセットが、この分野に存在する多様な課題を浮き彫りにしている。本稿では、SemTab2021における自らのシステム「JenTab」の進化過程について報告する。我々はシステムアーキテクチャの再設計を行い、個々のモジュールを最適化するとともに、チャレンジ全体を通じて提示された特定の課題に応じた複数のパイプラインを構築した。JenTabはSemTab2021の第1および第2ラウンドにおいて上位5位以内にランクインした。これらの結果は、JenTabの高い柔軟性および新たな課題に対して迅速に対応できる能力を示している。
ベンチマーク
| ベンチマーク | 方法論 | 指標 |
|---|---|---|
| cell-entity-annotation-on-biodivtab | JenTab | F1 (%): 60.2 |
| cell-entity-annotation-on-toughtables-dbp | JenTab | F1 (%): 60.7 |
| cell-entity-annotation-on-toughtables-wd | JenTab | F1 (%): 45.7 |
| column-type-annotation-on-biodivtab | JenTab | F1 (%): 10.7 |
| column-type-annotation-on-toughtables-dbp | JenTab | F1 (%): 46 |
| column-type-annotation-on-toughtables-wd | JenTab | F1 (%): 69.7 |