リコール、拡張、および多候補クロスエンコード:高速かつ正確な超微細エンティティタイプ付け

超微実体タイプ付け(Ultra-fine Entity Typing: UFET)は、文脈の中で与えられた実体言及(例:ジョー・バイデン)の非常に自由なタイプ(例:大統領、政治家)を予測する技術です。最先端の手法(State-of-the-art: SOTA)では、クロスエンコーダ(Cross-Encoder: CE)ベースのアーキテクチャが使用されています。CEは、言及とその文脈を各タイプと連結し、これらのペアを事前学習済み言語モデル(Pretrained Language Model: PLM)に投入して、関連性を評価します。これにより、言提及タイプ間でのより深い相互作用が可能となり、性能向上につながりますが、単一の言及に対するタイプ推論にはN回(タイプ集合のサイズ)の順方向パスが必要となります。したがって、タイプ集合が大きい場合(例:UFETではN = 10,000)、CEは推論時に非常に遅くなります。これを解決するために、我々はリコール-拡張-フィルタリング方式による実体タイプ付けを提案します。リコールおよび拡張ステージでは、大きなタイプ集合から各言及に対してK個(通常Kは256未満)の最も関連性の高い候補タイプを選択します。フィルタリングステージでは、新しいモデルであるMCCEを使用して、これらのK個の候補を1回の順方向パスで同時にエンコードおよび評価し、最終的なタイプ予測を行います。我々はMCCEの異なるバリエーションを調査し、広範な実験結果からMCCEが我々のパラダイムにおいて超微実体タイプ付けにおいてSOTA性能に達し、クロスエンコーダよりも数千倍速いことが示されました。また、MCCEは細かい粒度(130種類)や粗い粒度(9種類)の実体タイプ付けでも非常に効果的であることが確認されました。我々のコードは \url{https://github.com/modelscope/AdaSeq/tree/master/examples/MCCE} で公開されています。