GITQA 다중 모드 그래프 추론 질문 답변 데이터 세트

GITQA는 홍콩과학기술대학교와 남부과학기술대학교가 그래프 구조를 다양한 스타일의 시각적 이미지로 그려 구축한 시각적 그래프가 포함된 최초의 추론 질문 답변 데이터 세트입니다. 이 데이터 세트에는 423,000개 이상의 질문-답변 인스턴스가 포함되어 있으며, 각 인스턴스에는 해당 그래프-텍스트-시각적 정보와 해당 질문-답변 쌍이 포함되어 있습니다.
데이터 세트에는 GITQA-Base와 GITQA-Aug의 두 가지 버전이 포함되어 있으며, GITQA-Base에는 단일 스타일의 시각적 이미지만 포함되어 있습니다. GITQA-8월은 더욱 풍성합니다. 시각적 그래프에서 레이아웃, 점의 모양, 모서리의 너비, 점의 스타일을 변경하는 등 다양한 데이터 증강 프로세스를 수행하여 더욱 다양한 시각적 그래프 표현을 제공합니다. 이 데이터 세트는 그래프 추론 작업에 대한 텍스트 설명 기반 LLM과 다중 모드 MLLM의 성능을 평가하고 그래프 추론에 대한 시각 정보의 영향을 연구하는 데 사용할 수 있습니다.