Command Palette
Search for a command to run...
WiC-TSV:文脈中の語の意味検証に関する評価ベンチマーク
WiC-TSV:文脈中の語の意味検証に関する評価ベンチマーク
Anna Breit Artem Revenko Kiamehr Rezaee Mohammad Taher Pilehvar Jose Camacho-Collados
概要
我々は、語義あいまいさ解消(Word Sense Disambiguation: WSD)のための新たなマルチドメイン評価ベンチマーク「WiC-TSV」を提案する。具体的には、文脈中の語のターゲット意味検証(Target Sense Verification: TSV)を対象としたフレームワークを導入し、その独自性を二値分類タスクとして定式化することに置いている。このアプローチにより、外部の意味語彙(sense inventory)に依存せず、また多様なドメインをカバーするという特徴を持つ。このため、WiC-TSVは、異なるモデルやシステムのドメイン内およびドメイン間評価において高い柔軟性を発揮する。本データセットは、モデルに提供される入力信号の種類に応じて、3つの異なる評価設定を提供している。最先端の言語モデルを用いて、本データセット上でベースライン性能を設定した。実験結果から、これらのモデルはタスクにおいて一定程度の性能を示すものの、特にドメイン外設定において、機械と人間の性能の間に依然として大きなギャップが存在することが明らかになった。WiC-TSVのデータは、https://competitions.codalab.org/competitions/23683 にて公開されている。