HyperAIHyperAI

Command Palette

Search for a command to run...

MedQA 의료 텍스트 질의응답 데이터세트

날짜

일 년 전

크기

125.64 MB

조직

MIT
华中科技大学

게시 URL

github.com

Paper URL

arxiv.org

태그

MedQA 데이터 세트는 미국 의사 면허 시험(USMLE)의 스타일을 시뮬레이션한 의료 분야의 질의응답 데이터 세트입니다. 2020년 MIT와 화중과학기술대학교 연구팀이 발표했습니다. 관련 논문 결과는 다음과 같습니다.이 환자는 어떤 질병을 앓고 있나요? 의료 검진에서 얻은 대규모 오픈 도메인 질문 답변 데이터 세트". 이 데이터 세트는 전문 의료 검진에서 수집되었으며, 영어, 간체 중국어, 번체 중국어를 포함하고 있으며, 각각 12,723개, 34,251개, 14,123개의 질문이 포함되어 있습니다. 이는 모델의 의학 지식 이해도 및 적용 능력을 평가하기 위한 것입니다. MedQA 데이터 세트는 전문 의료 면허 시험을 기반으로 구축되었으며, 질문의 높은 품질과 전문성을 보장합니다. 질문 데이터 외에도 대규모 의학 교과서 코퍼스를 수집하여 공개하였는데, 이를 통해 독해 모델은 질문에 답하는 데 필요한 지식을 습득할 수 있습니다. 데이터 세트는 모델 학습, 검증, 테스트에 각각 사용되는 학습 세트, 개발 세트, 테스트 세트로 나뉩니다.

데이터셋 분할, 질문 및 답변 길이 통계
데이터셋 분할, 질문 및 답변 길이 통계

MedQA.torrent
시딩 1다운로드 중 0완료됨 296총 다운로드 수 1,155
  • MedQA/
    • README.md
      1.75 KB
    • README.txt
      3.5 KB
      • data/
        • data_clean.zip
          125.64 MB

AI로 AI 구축

아이디어에서 출시까지 — 무료 AI 코코딩, 즉시 사용 가능한 환경, 최적의 GPU 가격으로 AI 개발을 가속화하세요.

AI 협업 코딩
바로 사용 가능한 GPU
최적의 가격

HyperAI Newsletters

최신 정보 구독하기
한국 시간 매주 월요일 오전 9시 에 이번 주의 최신 업데이트를 메일로 발송합니다
이메일 서비스 제공: MailChimp