
주어진 객체 클래스의 의미적 설명을 바탕으로, 제로샷 학습은 훈련 단계에서 예제가 제공되지 않는 미지의 클래스에 속하는 객체를 정확히 인식하는 것을 목표로 합니다. 이를 위해, 이들 미지의 클래스를 라벨이 부여된 예제가 제공되는 알려진 클래스와 연관시키는 방법을 사용합니다. 본 연구에서는 이 문제를 다양체 학습(Manifold Learning) 관점에서 접근하고자 합니다. 우리의 주요 아이디어는 외부 정보에서 유래된 의미 공간을 시각적 특징을 인식하는 모델 공간과 일치시키는 것입니다. 이를 위해, 의미 공간과 모델 공간 모두에 존재하는 좌표를 가진 "환영"(Phantom) 객체 클래스 집합을 도입합니다. 이들은 사전(Dictionary)의 기저(Base) 역할을 하며, 라벨이 부여된 데이터로부터 최적화될 수 있어 합성된 실제 객체 분류기가 최적의 구분 성능을 달성하도록 합니다. 우리는 제로샷 학습을 위한 네 개의 벤치마크 데이터셋,其中包括完整的ImageNet Fall 2011数据集,该数据集包含超过20,000个未见过的类别,在这些数据集上展示了我们方法相较于现有最先进技术的优越准确性。请注意,最后一句中有一部分是中文,我将其翻译为韩文如下:우리는 제로샷 학습을 위한 네 개의 벤치마크 데이터셋,其中包括完整的ImageNet Fall 2011数据集(전체 ImageNet Fall 2011 데이터셋 포함),该数据集包含超过20,000个未见过的类别(이 데이터셋은 20,000개 이상의 미지 클래스를 포함),에서 우리 방법론이 기존 최신 기술보다 우수한 정확성을 보임을 입증하였습니다.整合后的完整翻译如下:주어진 객체 클래스의 의미적 설명을 바탕으로, 제로샷 학습은 훈련 단계에서 예제가 제공되지 않는 미지의 클래스에 속하는 객체를 정확히 인식하는 것을 목표로 합니다. 이를 위해, 이들 미지의 클래스를 라벨이 부여된 예제가 제공되는 알려진 클래스와 연관시키는 방법을 사용합니다. 본 연구에서는 이 문제를 다양체 학습(Manifold Learning) 관점에서 접근하고자 합니다. 우리의 주요 아이디어는 외부 정보에서 유래된 의미 공간을 시각적 특징을 인식하는 모델 공간과 일치시키는 것입니다. 이를 위해, 의미 공간과 모델 공간 모두에 존재하는 좌표를 가진 "환영"(Phantom) 객체 클래스 집합을 도입합니다. 이들은 사전(Dictionary)의 기저(Base) 역할을 하며, 라벨이 부여된 데이터로부터 최적화될 수 있어 합성된 실제 객체 분류기가 최적의 구분 성능을 달성하도록 합니다. 우리는 제로샷 학습을 위한 네 개의 벤치마크 데이터셋, 전체 ImageNet Fall 2011 데이터셋 포함 (이 데이터셋은 20,000개 이상의 미지 클래스를 포함),에서 우리 방법론이 기존 최신 기술보다 우수한 정확성을 보임을 입증하였습니다.