HyperAIHyperAI

Command Palette

Search for a command to run...

다중 모드 ArXiv 과학적 이해 데이터 세트

Discord에서 논의하기

날짜

2년 전

조직

The University of Hong Kong
Peking University

Paper URL

arxiv.org

멀티모달 ArXiv는 2024년 홍콩대학교와 베이징대학교에서 출시되었습니다. 관련 논문은 "멀티모달 ArXiv: 대규모 시각 언어 모델의 과학적 이해력 향상을 위한 데이터 세트", ACL 2024에 의해 승인되었습니다. 이 데이터 세트는 LVLM에 대한 과학적 이해를 높이기 위해 ArXivCap과 ArXivQA로 구성되어 있습니다. ArXivCap은 다양한 과학 분야를 포괄하는 572,000개의 ArXiv 논문에서 발췌한 640만 개의 이미지와 390만 개의 캡션을 포함하는 그림 캡션 데이터 세트입니다. 연구팀은 ArXivCap을 활용해 GPT-4V가 프롬프트를 통해 과학적 그래프를 기반으로 생성한 질의응답 데이터 세트인 ArXivQA를 소개했습니다. ArXivQA는 오픈 소스 LVLM의 수학적 추론 기능을 크게 향상시켜 다중 모드 수학적 추론 벤치마크에서 절대 정확도가 10.4% 향상되었습니다.

AI로 AI 구축

아이디어에서 출시까지 — 무료 AI 코코딩, 즉시 사용 가능한 환경, 최적의 GPU 가격으로 AI 개발을 가속화하세요.

AI 협업 코딩
바로 사용 가능한 GPU
최적의 가격

HyperAI Newsletters

최신 정보 구독하기
한국 시간 매주 월요일 오전 9시 에 이번 주의 최신 업데이트를 메일로 발송합니다
이메일 서비스 제공: MailChimp