2달 전

시각적 및 텍스트 질문 응답을 위한 동적 메모리 네트워크

Caiming Xiong; Stephen Merity; Richard Socher
시각적 및 텍스트 질문 응답을 위한 동적 메모리 네트워크
초록

메모리와 주의 메커니즘을 갖춘 신경망 아키텍처는 질문 응답에 필요한 특정 추론 능력을 나타냅니다. 이러한 아키텍처 중 하나인 동적 메모리 네트워크(Dynamic Memory Network, DMN)는 다양한 언어 작업에서 높은 정확도를 달성했습니다. 그러나 훈련 중 지원 사실이 표시되지 않을 때 이 아키텍처가 질문 응답에서 우수한 결과를 얻는지, 또는 이미지와 같은 다른 모달리티에 적용될 수 있는지 여부는 증명되지 않았습니다. DMN에 대한 분석을 바탕으로 우리는 그 메모리 및 입력 모듈에 대한 몇 가지 개선점을 제안합니다. 이러한 변경사항과 함께, 시각적 질문에 답할 수 있도록 이미지를 위한 새로운 입력 모듈을 소개합니다. 우리의 새로운 DMN+ 모델은 지원 사실 감독 없이 Visual Question Answering 데이터셋과 \babi-10k 텍스트 질문-응답 데이터셋에서 기존 최신 기술을 개선했습니다.

시각적 및 텍스트 질문 응답을 위한 동적 메모리 네트워크 | 최신 연구 논문 | HyperAI초신경