2달 전

A La Carte 임베딩: 저렴하면서 효과적인 의미 특징 벡터 유도 방법

Mikhail Khodak; Nikunj Saunshi; Yingyu Liang; Tengyu Ma; Brandon Stewart; Sanjeev Arora
A La Carte 임베딩: 저렴하면서 효과적인 의미 특징 벡터 유도 방법
초록

도메인 적응, 전이 학습, 특성 학습 등의 동기화가 희귀 단어나 미발견 단어, n-그램, 시넷(synset), 기타 텍스트 특성에 대한 임베딩 유도에 대한 관심을 촉진시켰습니다. 본 논문에서는 이러한 표현을 구축하기 위한 일반적인 word2vec 기반 접근 방식의 대안으로 최근 GloVe와 같은 임베딩에 대한 이론적 결과를 바탕으로 한 a la carte 임베딩을 소개합니다. 우리의 방법은 사전 학습된 단어 벡터와 선형 회귀를 사용하여 효율적으로 학습할 수 있는 선형 변환에 주로 의존합니다. 이 변환은 미래에 새로운 텍스트 특성이나 희귀 단어가 발견될 때 즉시 적용할 수 있으며, 사용 예제가 하나뿐인 경우에도 적용 가능합니다. 우리는 a la carte 방법이 문맥에서 단어의 예제가 적더라도 고품질의 임베딩을 학습하는 데 필요한 예제가 더 적다는 것을 보여주는 새로운 데이터셋을 소개하며, 이 방법을 통해 nonce 작업과 일부 비지도 문서 분류 작업에서 최신 연구 결과를 얻었습니다.

A La Carte 임베딩: 저렴하면서 효과적인 의미 특징 벡터 유도 방법 | 최신 연구 논문 | HyperAI초신경