Command Palette

Search for a command to run...

문서 Haystack 멀티모달 문서 벤치마크 데이터 세트

날짜

3달 전

크기

14.6 GB

기관

아마존

논문 URL

2507.15882

Document Haystack은 Amazon AGI가 2025년에 발표한 다중 모드 문서 벤치마크 데이터 세트입니다. 관련 논문 결과는 다음과 같습니다.문서 건초더미: 긴 맥락의 다중 모달 이미지/문서 이해 비전 LLM 벤치마크"는 장문의 복잡한 문서에서 시각 언어 모델(VLM)의 정보 검색 및 이해 능력을 평가하는 것을 목표로 합니다.

이 데이터 세트는 5페이지에서 200페이지에 이르는 실제 문서를 포함하는 400개의 문서 변형과 8,250개의 검색 질문을 포함합니다. 데이터 형식은 원본 PDF, 200 DPI 페이지 이미지, 그리고 일반 텍스트 파싱 파일을 포함하며, 질의응답 및 시각적 질의응답과 같은 작업에 적합합니다.

document-haystack.torrent
시딩 1다운로드 중 0완료됨 34총 다운로드 횟수 85
  • document-haystack/
    • README.md
      1.38 KB
    • README.txt
      2.76 KB
      • data/
        • document-haystack.zip
          14.6 GB

AI로 AI 구축

아이디어에서 출시까지 — 무료 AI 공동 코딩, 즉시 사용 가능한 환경, 최적 가격 GPU로 AI 개발을 가속화하세요.

AI 공동 코딩
즉시 사용 가능한 GPU
최적 가격
시작하기

Hyper Newsletters

최신 정보 구독하기
한국 시간 매주 월요일 오전 9시 에 이번 주의 최신 업데이트를 메일로 발송합니다
이메일 서비스 제공: MailChimp