컨벌루션 트슬린 머신

컨벌루션 신경망(CNNs)은 중요한 패턴 인식 작업에서 놀라운 성공을 거두었지만, 높은 계산 복잡성과 해석 가능성 부족으로 어려움을 겪고 있습니다. 최근 제트린 머신(TM)은 명제 논리의 해석이 쉬운 접합 절(conjunctive clauses)을 사용하여 복잡한 패턴 인식 문제를 해결하려는 시도로 이러한 문제를 해결하고자 합니다. 제트린 머신은 여러 벤치마크에서 경쟁력 있는 정확도를 제공하면서, 해석 가능성이라는 중요한 특성을 유지합니다. 또한 입력, 패턴, 출력이 비트로 표현되고 인식 및 학습이 간단한 비트 조작에 의존하기 때문에 하드웨어 근접 구현을 용이하게 합니다. 본 논문에서는 제트린 머신의 패러다임을 활용하여 CNNs의 해석 가능한 대안인 컨벌루션 제트린 머신(CTM)을 소개합니다.제트린 머신은 각 절을 전체 이미지에 한 번씩 적용하여 이미지를 분류하지만, 컨벌루션 제트린 머신은 각 절을 컨벌루션 필터로 사용합니다. 즉, 각 절은 이미지의 일부인 각 패치마다 한 번씩 평가됩니다. 절이 위치 정보를 인식할 수 있도록 하기 위해, 각 패치는 이미지 내의 좌표와 함께 확장됩니다. 컨벌루션 절의 출력은 각 패치에서 절을 평가한 결과를 OR 연산으로 단순히 결합하여 얻습니다.제트린 머신의 학습 단계에서는 1로 평가된 절들이 입력과 대조됩니다. 반면에 CTM에서는 1로 평가된 패치들 중 하나를 무작위로 선택하여 그 패치와 대조합니다. 따라서 전통적인 제트린 머신에서 사용되는 표준 Type I 및 Type II 피드백이 추가 수정 없이 직접 적용될 수 있습니다. CTM은 MNIST 데이터셋에서 99.4%, Kuzushiji-MNIST 데이터셋에서 96.31%, Fashion-MNIST 데이터셋에서 91.5%, 2D 노이즈 XOR 문제에서 100.0%의 테스트 정확도를 달성하였습니다. 이는 간단한 4층 CNNs, BinaryConnect, 로지스틱 서킷 및 FPGA 가속화된 바이너리 CNNs에서 보고된 결과와 경쟁력을 갖추고 있습니다.