2달 전

어떤 백본을 사용할 것인가: 컴퓨터 비전을 위한 효율적인 자원 활용 도메인별 비교

Pranav Jeevan; Amit Sethi
어떤 백본을 사용할 것인가: 컴퓨터 비전을 위한 효율적인 자원 활용 도메인별 비교
초록

현대의 컴퓨터 비전 응용 분야에서, 특히 이미지 분류에서, ImageNet과 같은 대규모 데이터셋에서 사전 학습된 아키텍처 백본은 일반적으로 특징 추출기로 활용됩니다. 이러한 사전 학습된 컨볼루션 신경망(CNN)의 광범위한 사용에도 불구하고, 다양한 도메인과 데이터셋 크기에 따른 다양한 리소스 효율적인 백본의 성능에 대한 이해가 부족한 상태입니다. 본 연구에서는 일관된 학습 설정 하에서 자연 이미지, 의료 이미지, 은하 이미지 및 원격 감측 이미지를 포함하는 다양한 데이터셋을 통해 여러 가지 경량화된 사전 학습된 CNN 백본을 체계적으로 평가합니다. 이 종합적인 분석은 특히 소규모 데이터셋을 다루는 상황에서 사전 학습된 네트워크의 미세 조정(fine-tuning)이 중요한 문제에 대해 가장 적합한 백본을 선택하는 데 기계학습 실무자들에게 도움을 주고자 합니다. 주목할 만한 점은, 어텐션 기반 아키텍처가 인기를 얻고 있지만, 저데이터 미세 조정 작업에서 CNN보다 성능이 낮다는 것입니다. 또한 ConvNeXt, RegNet 및 EfficientNet과 같은 일부 CNN 아키텍처가 다른 아키텍처보다 다양한 도메인에서 일관되게 우수한 성능을 보이는 것을 확인했습니다. 본 연구 결과는 다양한 컴퓨터 비전 도메인에서 모델 선택 시 성능 균형과 효과성에 대한 실행 가능한 통찰력을 제공하여 정보에 입각한 결정을 촉진합니다. 우리의 코드는 다음 링크에서 이용 가능합니다: https://github.com/pranavphoenix/Backbones

어떤 백본을 사용할 것인가: 컴퓨터 비전을 위한 효율적인 자원 활용 도메인별 비교 | 최신 연구 논문 | HyperAI초신경