
초록
전통적인 컴퓨터 비전 및 기계 학습 방법은 손글씨 숫자나 교통 표지 인식과 같은 작업에서 인간의 성능을 따라잡지 못합니다. 그러나 우리의 생물학적으로 타당한 깊은 인공 신경망 구조는 이를 가능하게 합니다. 합성곱 우승자-전체-패배자 뉴런의 작은(종종 최소한의) 수용 영역은 네트워크의 깊이를 크게 증가시키며, 이로 인해 망막과 시각 피질 사이에 존재하는 포유류의 신경 층 수와 유사한 수의 희소 연결된 신경 층을 생성합니다. 오직 우승 뉴런만 훈련됩니다. 여러 개의 깊은 신경 열이 다양한 방식으로 사전 처리된 입력에 대해 전문가가 되며, 그들의 예측값은 평균화됩니다. 그래픽 카드는 빠른 훈련을 가능하게 합니다. 매우 경쟁력 있는 MNIST 손글씨 벤치마크에서 우리의 방법은 처음으로 인간 수준에 가까운 성능을 달성했습니다. 교통 표지 인식 벤치마크에서는 인간보다 두 배 더 우수한 성능을 보였습니다. 또한 일반적인 이미지 분류 벤치마크에서도 최신 기술을 개선하였습니다.