* 이 데이터 세트는 온라인 사용을 지원합니다.여기를 클릭하여 이동하세요.
MedCalc-Bench는 대규모 언어 모델(LLM)의 의료 컴퓨팅 역량을 평가하기 위해 특별히 설계된 데이터 세트입니다. 이 책은 미국 국립의학도서관, 미국 국립보건원, 버지니아대학교 등 9개 기관이 공동으로 2024년에 출판했습니다. 관련 논문 결과는 "MEDCALC-BENCH: 의료 계산을 위한 대규모 언어 모델 평가"는 NeurIPS 2024에 수락되었습니다.
이 데이터 세트에는 55개의 다양한 계산 작업을 다루는 10,055개의 교육 인스턴스와 1,047개의 테스트 인스턴스가 포함되어 있습니다. 각 예시에는 환자의 기록, 특정 임상적 가치를 계산하는 질문, 최종 답변 값, 단계별 솔루션이 포함되어 있습니다. MedCalc-Bench의 목적은 의료 환경에서 LLM의 언어적, 계산적 추론 능력을 향상시키는 것입니다.
데이터 세트의 특징으로는 행 번호, 계산기 ID, 계산기 이름, 범주, 출력 유형, 메모 ID, 메모 유형, 환자 메모, 질문, 관련 엔터티, 기준 진실 답변, 하한, 상한, 기준 진실 설명이 포함됩니다. 이러한 특징은 정확한 계산과 추론을 위한 풍부한 맥락적 정보를 모델에 제공합니다. 데이터 세트는 훈련 및 테스트 세트로 나뉘며, 이를 사용하여 LLM을 미세 조정하여 의료 컴퓨팅 작업에서 성능을 개선할 수 있습니다.
MedCalc-Bench.torrent
시딩 1다운로드 중 1완료됨 64총 다운로드 횟수 126