2ヶ月前

曲率に基づく特徴選択とその電子健康記録分類への応用

Zheming Zuo; Jie Li; Han Xu; Noura Al Moubayed
曲率に基づく特徴選択とその電子健康記録分類への応用
要約

破壊的技術は、普遍的な機会を提供し、在宅医療の多くの側面の特定に貢献しています。これは、IoT(Internet of Things)の導入から機械学習(Machine Learning: ML)手法まで及ぶ範囲です。強力なツールとして、MLは患者中心の医療ソリューションに広く応用されています。患者ケアの質をさらに向上させるために、電子健康記録(Electronic Health Records: EHRs)は医療施設で分析のために一般的に採用されています。EHRsは非構造化、非平衡、不完全、かつ高次元的な性質を持つため、AIとMLを用いてこれらのEHRsを予測や診断のために分析することは重要な課題となっています。次元削減は、高次元のEHRデータに対処する一般的なデータ前処理技術であり、EHR表現の特徴量数を削減しながらその後のデータ分析(例:分類)の性能を向上することを目指しています。本研究では、効率的なフィルター型特徴選択法である曲率に基づく特徴選択法(Curvature-based Feature Selection: CFS)が提案されます。提案されたCFSでは、Menger曲率の概念を使用して与えられたデータセット内のすべての特徴量の重みをランキングします。提案されたCFSの性能は、子宮頸癌リスク要因データセット(Cervical Cancer Risk Factors Data Set: CCRFDS)、コインブラ乳癌データセット(Breast Cancer Coimbra Data Set: BCCDS)、乳腺組織データセット(Breast Tissue Data Set: BTDS)、およびデブレチェン糖尿病網膜症データセット(Diabetic Retinopathy Debrecen Data Set: DRDDS)という4つの有名なEHRデータセットで評価されました。実験結果は、提案されたCFSが従来のPCAや他の最新手法に対して上記データセットで最先端の性能を達成したことを示しています。提案手法のソースコードは公開されており、https://github.com/zhemingzuo/CFS から入手可能です。

曲率に基づく特徴選択とその電子健康記録分類への応用 | 最新論文 | HyperAI超神経