HyperAIHyperAI

Command Palette

Search for a command to run...

Med-Banana-50K: 텍스트 유도 의료 영상 편집을 위한 크로스모달리티 대규모 데이터셋

Zhihui Chen Mengling Feng

초록

의료 영상 편집 기술은 데이터 증강, 모델 해석 가능성, 의료 교육, 치료 시뮬레이션 등 다양한 분야에서 핵심적인 역할을 하며, 급부상하고 있다. 그러나 엄격한 해부학적 및 임상적 제약을 고려한 의료 환경에 특화된 대규모, 고품질, 공개 가능한 데이터셋의 부족으로 인해 이 분야의 발전이 상당히 제한되어 왔다. 이러한 격차를 메우기 위해, 우리는 흉부 X선, 뇌 MRI, 안저 사진을 포함한 23가지 질환에 걸쳐 5만 건 이상의 의료 전문가가 검수한 영상 편집 데이터셋인 Med-Banana-50K를 소개한다. 각 샘플은 병변의 추가 및 제거를 포함한 양방향 편집을 지원하며, 실제 임상 영상을 기반으로 Gemini-2.5-Flash-Image를 활용하여 구성되었다. 본 데이터셋의 주요 차별점은 의료 기반의 품질 관리 프로토콜이다. 우리는 지시사항 준수 여부, 구조적 타당성, 이미지의 사실성, 충실도 유지 등 기준을 바탕으로 LLM-기반의 ‘심사자( Judge)’ 평가 프레임워크를 도입하였으며, 최대 5라운드에 걸친 반복 보정을 통해 품질을 향상시켰다. 또한 Med-Banana-50K에는 약 37,000건의 실패한 편집 시도와 완전한 평가 로그가 포함되어 있어 선호도 학습 및 일치성 연구에 기여할 수 있다. 대규모이며 의료적으로 엄격한 기준을 충족하며, 모든 정보가 완전히 문서화된 본 자료를 통해 Med-Banana-50K는 신뢰할 수 있는 의료 영상 편집 시스템 개발 및 평가를 위한 중요한 기반을 마련한다.


AI로 AI 구축

아이디어에서 출시까지 — 무료 AI 코코딩, 즉시 사용 가능한 환경, 최적의 GPU 가격으로 AI 개발을 가속화하세요.

AI 협업 코딩
바로 사용 가능한 GPU
최적의 가격

HyperAI Newsletters

최신 정보 구독하기
한국 시간 매주 월요일 오전 9시 에 이번 주의 최신 업데이트를 메일로 발송합니다
이메일 서비스 제공: MailChimp
Med-Banana-50K: 텍스트 유도 의료 영상 편집을 위한 크로스모달리티 대규모 데이터셋 | 문서 | HyperAI초신경