Command Palette
Search for a command to run...
肺がんリスク 肺がんリスクデータセット
※本データセットはオンライン利用に対応しておりますが、ここをクリックしてジャンプしてください。
肺がんリスクは、肺がんリスクの予測と健康要因分析のために2025年に公開された表形式のデータセットです。多次元的な特徴を用いて、喫煙習慣、ライフスタイルと肺がんリスクの関連性を探ることを目的としています。
このデータセットには、既知の肺がんリスク要因(ライフスタイル、環境曝露、家族歴など)に基づく5万件の患者プロファイルが含まれています。約25%の陽性症例は、現実世界の肺がんの有病率を反映しています。各サンプルは複数の健康特性と行動特性で構成されており、肺がんリスクモデリング、医療機械学習研究、健康予測システム開発、教育実験に適しています。特に、分類モデリングやリスク評価のシナリオにおいて有用です。
データ構成:
各サンプルには、次のような健康および行動特性の複数の側面が含まれています。
- 基本情報:年齢、性別
- 生活習慣:喫煙状況、飲酒頻度
- 健康要因:慢性疾患(高血圧、糖尿病など)、肺関連の診断
- 環境曝露:ラドン濃度、アスベスト曝露、受動喫煙曝露
- 家族歴:家族に癌や肺疾患の病歴があるかどうか
- 目標変数: 肺がんの診断(有無)