19일 전

Zero-shot 분류를 위한 하이퍼디멘셔널 컴퓨팅

Samuele Ruffino, Geethan Karunaratne, Michael Hersche, Luca Benini, Abu Sebastian, Abbas Rahimi
Zero-shot 분류를 위한 하이퍼디멘셔널 컴퓨팅
초록

제로샷 학습(ZSL) 기반 분류는 모델이 이전에 어떤 훈련 예제도 보지 않은 새로운 클래스에 대해 입력을 분류할 수 있는 능력을 의미한다. ZSL 기반 분류 과제를 해결하기 위한 선호되는 접근 방식 중 하나는 새로운 클래스를 설명하는 속성(attribute) 집합 형태의 보조 설명자(auxiliary descriptor)를 제공하는 것이다. 본 연구에서는 초차원 컴퓨팅(Hyperdimensional Computing, HDC)의 영감을 받아, 속성 인코더 내부에 기호 유사 분산 표현(symbol-like distributed representations)을 갖는 정적 이진 코드북을 활용하여 계산적으로 간단한 엔드투엔드 훈련 가능한 모델을 컴팩트하게 표현하는 방법을 제안한다. 이를 '초차원 컴퓨팅 제로샷 분류기(Hyperdimensional Computing Zero-shot Classifier, HDC-ZSC)'라 명명한다. HDC-ZSC는 훈련 가능한 이미지 인코더, HDC 기반 속성 인코더, 그리고 유사도 커널(similarity kernel)로 구성된다. 본 연구에서는 HDC-ZSC가 먼저 제로샷 속성 추출 작업을 수행할 수 있으며, 이후 아키텍처의 최소한의 변경과 최소한의 모델 재훈련을 통해 제로샷 분류 작업으로 재사용될 수 있음을 보여준다. CUB-200 데이터셋에서 HDC-ZSC는 단 2,660만 개의 훈련 가능한 파라미터를 사용함으로써 최상위 1위 분류 정확도 63.8%의 파레토 최적(Pareto optimal) 성능을 달성하였다. 두 가지 다른 최신 비생성적 접근 방식과 비교했을 때, HDC-ZSC는 각각 4.3%, 9.9% 높은 정확도를 기록하였으며, 이들 방식은 HDC-ZSC보다 각각 1.85배 이상, 1.72배 이상의 파라미터를 요구한다.

Zero-shot 분류를 위한 하이퍼디멘셔널 컴퓨팅 | 연구 논문 | HyperAI초신경