HyperAIHyperAI

Command Palette

Search for a command to run...

DeepSearchQA 다단계 정보 검색 질문 답변 데이터셋

날짜

5달 전

조직

Google

게시 URL

www.kaggle.com

Paper URL

DeepSearchQA

라이선스

Apache 2.0

DeepSearchQA는 대규모 언어 모델 및 지능형 에이전트를 위한 정보 검색 및 사실 평가 데이터셋으로, Google DeepMind에서 2025년에 공개했습니다. 관련 연구 논문은 다음과 같습니다... DeepSearchQA: 심층 연구 에이전트의 포괄성 격차 해소본 연구의 목적은 복잡하고 다단계적인 정보 검색 작업에서 모델의 계획 능력, 맥락 보존 능력, 그리고 개방형 네트워크 정보의 종합적인 활용 능력을 평가하는 것이다. 이 데이터셋은 17개 영역에 걸쳐 수동으로 설계된 900개의 평가 샘플을 포함합니다. 각 샘플은 질문 프롬프트, 해당 질문 영역 범주, 평가를 위한 표준 답변, 그리고 답변 유형 레이블로 구성됩니다. 답변 유형은 단일 답변과 세트 답변으로 구분되며, 약 651개의 TP3T 질문은 모델이 완전한 답변 세트를 제공해야 합니다. 모든 질문은 "인과 관계" 형식으로 설계되어 있어, 후속 정보 검색은 이전 단계의 검색 결과에 의존하므로 모델은 다단계 검색 계획을 실행하고 장기적인 맥락적 일관성을 유지해야 합니다. 모든 작업은 개방형 네트워크를 기반으로 하므로 객관적이고 검증 가능한 답변을 보장합니다. 이 데이터셋은 주로 네트워크 검색 기능을 갖춘 대규모 언어 모델이나 지능형 에이전트 시스템을 평가하는 데 사용됩니다.

AI로 AI 구축

아이디어에서 출시까지 — 무료 AI 코코딩, 즉시 사용 가능한 환경, 최적의 GPU 가격으로 AI 개발을 가속화하세요.

AI 협업 코딩
바로 사용 가능한 GPU
최적의 가격

HyperAI Newsletters

최신 정보 구독하기
한국 시간 매주 월요일 오전 9시 에 이번 주의 최신 업데이트를 메일로 발송합니다
이메일 서비스 제공: MailChimp