2달 전

TallyQA: 복잡한 카운팅 질문에 대한 답변

Manoj Acharya; Kushal Kafle; Christopher Kanan
TallyQA: 복잡한 카운팅 질문에 대한 답변
초록

시각적 질문 응답(VQA) 데이터셋에서 대부분의 개수 질문은 간단하며 객체 검출 이상을 요구하지 않습니다. 그러나 본 연구에서는 객체 간 관계, 속성 식별, 추론 등을 포함하는 복잡한 개수 질문에 대한 알고리즘을 탐구합니다. 이를 위해 우리는 TallyQA라는 세계 최대 규모의 개방형 개수 데이터셋을 생성했습니다. 또한, 영역 제안과 함께 관계 네트워크를 사용하는 새로운 개수 셈 알고리즘을 제안합니다. 이 방법은 고해상도 이미지와 함께 관계 네트워크를 효율적으로 활용할 수 있게 합니다. TallyQA와 HowMany-QA 벤치마크에서 기존 시스템 및 최근 시스템과 비교하여 최고 수준의 결과를 도출하였습니다.

TallyQA: 복잡한 카운팅 질문에 대한 답변 | 최신 연구 논문 | HyperAI초신경