MedTrinity-25M 대규모 다중 모드 의료 데이터 세트
이 데이터 세트는 화중과학기술대학교, 캘리포니아대학교 산타크루즈 캠퍼스, 하버드대학교, 스탠퍼드대학교 연구팀이 2024년에 공동으로 출시한 대규모 다중모달 의료 데이터 세트입니다. 관련 논문 결과는 다음과 같습니다.MedTrinity-25M: 의학을 위한 다세분화 주석이 포함된 대규모 다중 모달 데이터 세트".
MedTrinity-25M에는 10가지 영상 방식을 망라한 2,500만 개 이상의 의료 영상이 포함되어 있으며, 65가지 이상의 질병에 대한 주석이 달려 있습니다. 이 데이터 세트는 풍부한 글로벌 및 로컬 주석을 포함할 뿐만 아니라, 여러 모달리티(예: CT, MRI, X선 등)의 다단계 정보 주석도 통합합니다. 이러한 주석에는 질병이나 병변 유형, 영상 방식, 영역별 설명, 장기 간의 관계가 포함됩니다. 연구팀은 90개가 넘는 다양한 출처의 데이터를 사전 처리하고 통합하여 다단계 시각적, 텍스트 주석을 생성하는 고유한 자동화된 데이터 구축 파이프라인을 개발했습니다. 이 방법은 기존에 이미지와 텍스트를 짝지어 사용하는 방식의 한계를 깨고 자동으로 주석을 생성합니다. 이 데이터 세트는 의료 영상 처리, 보고서 생성, 분류 및 세분화와 같은 다중 모드 작업에 큰 지원을 제공하는 동시에 의료 기반 인공 지능 모델의 사전 학습을 촉진합니다.
