2ヶ月前
ア・ラ・カルト埋め込み:安価かつ効果的な意味特徴ベクトルの誘導
Mikhail Khodak; Nikunj Saunshi; Yingyu Liang; Tengyu Ma; Brandon Stewart; Sanjeev Arora

要約
ドメイン適応、転移学習、特徴学習などの動機が、稀少語や未見語、n-グラム、同義集合(synsets)、その他のテキスト特徴の埋め込みを誘導する関心を高めています。本論文では、a la carte 埋め込みという手法を紹介します。これは、word2vec に基づく一般的なアプローチの代わりとして、GloVe のような埋め込みに関する最近の理論的結果に基づいて構築された単純で汎用的な手法です。当手法は主に事前学習済みの単語ベクトルと線形回帰を使用して効率的に学習可能な線形変換に依存しています。この変換は、将来新しいテキスト特徴や稀少語が現れた際に即座に適用可能であり、たとえ使用例が1つしかない場合でも対応できます。私たちは a la carte メソッドが高品質な埋め込みを学習するために文脈中の単語の使用例をより少ない数で必要とする新たなデータセットを導入し、nonce タスクやいくつかの非監督文書分類タスクにおいて最先端の結果を得ました。