2달 전

구성주의 주의 네트워크를 이용한 기계 추론

Drew A. Hudson; Christopher D. Manning
구성주의 주의 네트워크를 이용한 기계 추론
초록

우리는 명시적이고 표현력 있는 추론을 촉진하기 위해 설계된 새로운 완전 미분 가능한 신경망 구조인 MAC 네트워크를 제시합니다. MAC은 일체형 블랙박스 신경망 아키텍처에서 벗어나 투명성과 유연성을 격려하는 설계로 나아갑니다. 이 모델은 문제를 주의 기반 추론 단계로 분해하여 접근하며, 각 단계는 제어와 메모리 사이에 분리를 유지하는 새로운 반복적인 메모리, 주의, 구성(MAC) 셀이 수행합니다. 셀들을 연결하고 그들의 상호작용을 규제하는 구조적 제약을 부과함으로써, MAC은 데이터로부터 직접적으로 추론되는 엔드투엔드 방식으로 반복적인 추론 과정을 효과적으로 학습합니다. 우리는 시각적 추론에 도전적인 CLEVR 데이터셋에서 모델의 강점, 강인성 및 해석 가능성을 보여주며, 98.9%의 정확도를 달성하여 이전 최고 모델의 오류율을 절반으로 줄였습니다. 더욱 중요한 것은, 이 모델이 계산 효율적이며 데이터 효율적이라는 점입니다. 특히 강력한 결과를 얻기 위해 기존 모델보다 5배 적은 데이터가 필요합니다.

구성주의 주의 네트워크를 이용한 기계 추론 | 최신 연구 논문 | HyperAI초신경