11일 전

대비 학습을 위한 우수한 시각화는 무엇을 포함하는가?

Yonglong Tian, Chen Sun, Ben Poole, Dilip Krishnan, Cordelia Schmid, Phillip Isola
대비 학습을 위한 우수한 시각화는 무엇을 포함하는가?
초록

다양한 데이터 시각화 간의 대조 학습은 최근 자기지도 학습 기반 표현 학습 분야에서 최첨단 성능을 달성하고 있다. 이러한 성공에도 불구하고, 서로 다른 시각 선택이 모델 성능에 미치는 영향에 대한 연구는 상대적으로 부족한 편이다. 본 논문에서는 이론적 및 실험적 분석을 통해 시각 선택의 중요성을 보다 깊이 이해하고, 서로 다른 시각 간의 상호정보량(Mutual Information, MI)을 최소화하면서도 작업에 관련된 정보는 유지해야 한다고 주장한다. 이 가설을 검증하기 위해, 시각 간의 상호정보량을 줄이기 위해 최적화하는 방식으로 효과적인 시각을 학습하는 비지도 및 반지도 프레임워크를 제안한다. 또한 데이터 증강이 상호정보량을 감소시키는 수단으로 작용할 수 있음을 고려하였으며, 데이터 증강을 늘릴수록 상호정보량이 감소하고, 하류 분류 정확도가 향상됨을 실험적으로 입증한다. 부가적인 효과로, ResNet-50 기반 모델을 사용한 ImageNet 분류에 대한 비지도 사전 학습에서 새로운 최고 성능을 달성하였으며, 선형 리드아웃(top-1) 정확도는 73%에 달한다. 또한, 제안한 모델을 PASCAL VOC 객체 탐지 및 COCO 인스턴스 세그멘테이션에 전이 적용했을 때, 전통적인 지도 학습 기반 사전 학습보다 일관되게 우수한 성능을 보였다. 코드: http://github.com/HobbitLong/PyContrast

대비 학습을 위한 우수한 시각화는 무엇을 포함하는가? | 최신 연구 논문 | HyperAI초신경