16일 전

대나무: 인간-기계 협업을 통한 거대 규모 시각 데이터셋의 지속적 구축

Yuanhan Zhang, Qinghong Sun, Yichun Zhou, Zexin He, Zhenfei Yin, Kun Wang, Lu Sheng, Yu Qiao, Jing Shao, Ziwei Liu
대나무: 인간-기계 협업을 통한 거대 규모 시각 데이터셋의 지속적 구축
초록

대규모 데이터셋은 컴퓨터 비전 분야에서 핵심적인 역할을 한다. 그러나 현재의 데이터셋은 샘플 간의 차이를 구분하지 않고 무작위로 레이블링되기 때문에 데이터 수집이 비효율적이며 확장성이 결여되어 있다. 이에 대한 열린 질문은 어떻게 실용적인 환경에서 대규모 데이터셋을 능동적으로 구축할 수 있는가이다. 비록 고도화된 능동 학습(active learning) 알고리즘이 이 문제의 해결책이 될 수 있으나, 본 연구에서는 실제 레이블링 환경에서 분포 외(out-of-distribution) 데이터가 다수 존재하는 상황에서 이러한 알고리즘이 한계를 드러낸다는 실험적 결과를 확인하였다. 이에 따라 본 연구는 현실적인 데이터셋 레이블링을 위한 새로운 능동 학습 프레임워크를 제안한다. 본 프레임워크를 기반으로, 우리는 6900만 건의 이미지 분류 레이블(119,000개 카테고리)과 2800만 건의 객체 경계상자(annotation, 809개 카테고리)를 포함하는 고품질 비전 데이터셋인 Bamboo를 구축하였다. 이 데이터셋의 카테고리들은 여러 지식베이스에서 통합된 계층적 분류 체계(hierarchical taxonomy)에 따라 체계화되었다. 분류 데이터는 ImageNet22K보다 4배 이상 크며, 객체 탐지 데이터는 Object365보다 3배 이상 크다. ImageNet22K 및 Object365와 비교했을 때, Bamboo에서 사전 학습된 모델은 다양한 하류 작업에서 우수한 성능을 보였다(분류 과제에서 6.2% 향상, 탐지 과제에서 2.1% 향상). 본 연구는 제안한 능동 학습 프레임워크와 Bamboo 데이터셋이 향후 연구에 필수적인 기반 자산이 될 것이라 확신한다.

대나무: 인간-기계 협업을 통한 거대 규모 시각 데이터셋의 지속적 구축 | 최신 연구 논문 | HyperAI초신경