2ヶ月前

連続であるか、離散であるか、それらは問いの一部です。

Yiran Wang; Masao Utiyama
連続であるか、離散であるか、それらは問いの一部です。
要約

最近、連続表現と離散表現の間にある新しい表現として、バイナリ表現が提案されています。この表現は、連続入力ベクトルを置き換える際に情報保存能力を大幅に示しています。本論文では、出力側にもこれを導入することの可能性を探り、モデルが出力としてバイナリラベルを生成できるようにすることを目指しています。出力側での構造的情報とラベル情報の両方を保存するため、従来の対照的ハッシュ法を構造的対照的ハッシュ法へと拡張しました。具体的には、CKY(Cocke-Kasami-Younger)アルゴリズムをラベルレベルからビットレベルへとアップグレードし、スパン周辺確率を使用した新しい類似度関数を定義し、慎重に設計されたインスタンス選択戦略を持つ新しい対照的損失関数を導入しました。当モデルは様々な構造予測タスクで競争力のある性能を達成しており、バイナリ表現が深層学習の連続的な性質と自然言語の離散的な内在的特性との間のギャップをさらに埋める新たな表現であることを示しています。