Command Palette
Search for a command to run...
문서 Haystack 멀티모달 문서 벤치마크 데이터 세트
Document Haystack은 Amazon AGI가 2025년에 발표한 다중 모드 문서 벤치마크 데이터 세트입니다. 관련 논문 결과는 다음과 같습니다.문서 건초더미: 긴 맥락의 다중 모달 이미지/문서 이해 비전 LLM 벤치마크"는 장문의 복잡한 문서에서 시각 언어 모델(VLM)의 정보 검색 및 이해 능력을 평가하는 것을 목표로 합니다.
이 데이터 세트는 5페이지에서 200페이지에 이르는 실제 문서를 포함하는 400개의 문서 변형과 8,250개의 검색 질문을 포함합니다. 데이터 형식은 원본 PDF, 200 DPI 페이지 이미지, 그리고 일반 텍스트 파싱 파일을 포함하며, 질의응답 및 시각적 질의응답과 같은 작업에 적합합니다.
document-haystack.torrent
시딩 1다운로드 중 0완료됨 34총 다운로드 횟수 85