11일 전

MedMCQA: 의료 분야 질문 응답을 위한 대규모 다주제 다지선다 데이터셋

Ankit Pal, Logesh Kumar Umapathi, Malaikannan Sankarasubbu
MedMCQA: 의료 분야 질문 응답을 위한 대규모 다주제 다지선다 데이터셋
초록

이 논문은 실제 의료 입시 시험 문제를 해결하기 위해 설계된 새로운 대규모 다중 선택형 질문-답변(MCQA) 데이터셋인 MedMCQA를 소개한다. 본 데이터셋은 2,400개의 건강 관리 주제와 21개의 의학 분야를 포괄하는 194,000건 이상의 고품질 AIIMS 및 NEET PG 입시 시험 다중 선택 문제를 수집하였으며, 평균 토큰 길이는 12.77이며 주제 다양성이 높다. 각 샘플은 질문, 정답(복수 가능), 그리고 기타 선택지로 구성되어 있으며, 모델이 다양한 의학 분야 및 주제에 걸쳐 10가지 이상의 추론 능력을 요구하는 더 깊은 언어 이해 능력을 검증할 수 있도록 설계되었다. 본 연구에서는 위의 정보 외에도 문제 해결을 위한 자세한 설명을 제공한다.

MedMCQA: 의료 분야 질문 응답을 위한 대규모 다주제 다지선다 데이터셋 | 최신 연구 논문 | HyperAI초신경