
파괴적 기술은 인터넷 오브 씽스(IoT)의 도입에서 머신 러닝(ML) 기법에 이르기까지 보편적 헬스케어의 여러 측면을 파악하는 데 유래 없는 기회를 제공합니다. ML은 강력한 도구로서 환자 중심 헬스케어 솔루션에 널리 적용되어 왔습니다. 환자 관리를 더욱 개선하기 위해 전자 의료 기록(EHRs)은 의료 시설에서 분석 목적으로 일반적으로 사용됩니다. EHRs는 비정형, 불균형, 불완전, 고차원적인 특성을 가지고 있어 예측 및 진단을 위한 AI와 ML의 적용이 중요한 작업입니다. 차원 축소는 이러한 고차원 EHR 데이터를 처리하기 위한 일반적인 데이터 전처리 기법으로, EHR 표현의 특성 수를 줄이면서 후속 데이터 분석(예: 분류)의 성능을 개선하는 것을 목표로 합니다. 본 연구에서는 효율적인 필터 기반 특성 선택 방법인 곡률 기반 특성 선택(Curvature-based Feature Selection, CFS) 방법을 제시합니다. 제안된 CFS는 멩거 곡률(Menger Curvature) 개념을 활용하여 주어진 데이터 세트의 모든 특성의 가중치를 순위화하였습니다. 제안된 CFS의 성능은 자궁경부암 위험 요인(Cervical Cancer Risk Factors Data Set, CCRFDS), 코임브라 유방암(Breast Cancer Coimbra Data Set, BCCDS), 유방 조직(Breast Tissue Data Set, BTDS), 그리고 데브레첸 당뇨병 망막증(Diabetic Retinopathy Debrecen Data Set, DRDDS) 등 널리 알려진 4개의 EHR 데이터 세트에서 평가되었습니다. 실험 결과는 제안된 CFS가 전통적인 PCA와 다른 최신 접근 방식들에 비해 상기 데이터 세트에서 최고 수준의 성능을 달성하였음을 보여주었습니다. 제안된 접근 방식의 소스 코드는 https://github.com/zhemingzuo/CFS에서 공개적으로 이용 가능합니다.