11일 전

이진 변분 오토인코더를 이용한 해싱

{Ricardo Ñanculef, Francisco Mena}
이진 변분 오토인코더를 이용한 해싱
초록

큰 데이터셋에서 샘플 객체와 유사한 요소를 찾는 것은 컴퓨터 과학에서 핵심적인 문제이다. 해싱 알고리즘은 유사성 보존(binary codes)을 갖는 이진 코드로 데이터를 표현함으로써 이 문제를 해결하며, 이러한 코드는 해시 테이블의 인덱스로 활용될 수 있다. 최근에, 변분 오토인코더(Variational Autoencoders, VAEs)가 비지도 및 반지도 환경에서 이러한 코드를 성공적으로 학습할 수 있음이 입증되었다. 본 논문에서는 이진 잠재 변수를 갖는 변분 오토인코더가 연속형 대응 모델에 비해 더 자연스럽고 효과적인 해싱 알고리즘을 제공함을 보여준다. 이 모델은 연속적 표현 방식에서 발생하는 양자화 오차를 감소시키지만, 여전히 표준 역전파(back-propagation) 기법을 사용하여 학습이 가능하다. 텍스트 검색 작업에 대한 실험을 통해 기존 기술 대비 본 모델의 우수성을 입증하였다.

이진 변분 오토인코더를 이용한 해싱 | 최신 연구 논문 | HyperAI초신경