2달 전
관계 추론을 위한 간단한 신경망 모듈
Adam Santoro; David Raposo; David G.T. Barrett; Mateusz Malinowski; Razvan Pascanu; Peter Battaglia; Timothy Lillicrap

초록
관계 추론은 일반적으로 지능적인 행동의 핵심 구성 요소이지만, 신경망이 이를 배우는 것은 어려웠습니다. 본 논문에서는 관계 네트워크(Relation Networks, RN)를 사용하여 관계 추론에 근본적으로 의존하는 문제를 해결하는 간단한 플러그-앤플레이 모듈로 어떻게 활용할 수 있는지 설명합니다. 우리는 RN을 추가한 신경망을 세 가지 작업에서 테스트했습니다: CLEVR라는 도전적인 데이터셋을 사용한 시각적 질문 응답, bAbI 작업 모음집을 사용한 텍스트 기반 질문 응답, 그리고 동적 물리 시스템에 대한 복잡한 추론입니다. 또한, Sort-of-CLEVR라는 정리된 데이터셋을 사용하여 강력한 컨볼루션 네트워크가 관계 질문을 일반적으로 해결할 수 있는 능력을 가지고 있지 않으며, RN을 추가함으로써 이러한 능력을 얻을 수 있음을 보여주었습니다. 우리의 연구는 RN 모듈을 장착한 딥 러닝 아키텍처가 암시적으로 실체와 그들의 관계를 발견하고 학습할 수 있음을 입증합니다.