
컨볼루션 신경망(CNN)의 정확도를 향상시키는 데 기여할 수 있는 수많은 특징들이 존재한다. 이러한 특징들의 조합을 대규모 데이터셋에서 실질적으로 테스트하고, 그 결과에 대한 이론적 근거를 제시하는 작업이 필요하다. 일부 특징은 특정 모델이나 특정 문제에만 적용되거나, 소규모 데이터셋에 한해 유효할 뿐이며, 반면 배치 정규화(Batch Normalization)와 잔여 연결(Residual Connections)과 같은 일부 특징은 대부분의 모델, 작업 및 데이터셋에 적용 가능하다. 본 연구에서는 이러한 보편적인 특징들로 가중치 잔여 연결(Weighted-Residual-Connections, WRC), 단계 간 부분 연결(Cross-Stage-Partial Connections, CSP), 크로스 미니배치 정규화(Cross mini-Batch Normalization, CmBN), 자기 적대적 훈련(Self-adversarial Training, SAT), 그리고 Mish 활성화 함수(Mish-activation)를 포함한다고 가정한다. 본 연구에서는 WRC, CSP, CmBN, SAT, Mish 활성화 함수, 모사 데이터 증강(Mosaic data augmentation), CmBN, DropBlock 정규화, 그리고 CIoU 손실 함수와 같은 새로운 특징들을 도입하고, 이들 중 일부를 조합함으로써 최신 기술 수준의 성능을 달성하였다. 이는 Tesla V100에서 실시간 속도 약 65 FPS로 MS COCO 데이터셋에서 43.5% AP(65.7% AP50)의 성능을 기록한 것이다. 소스 코드는 https://github.com/AlexeyAB/darknet 에서 확인할 수 있다.