Googleが皮膚科に参入、現役看護師を即死、専門医と競合

皮膚疾患は最も一般的な病気の 1 つですが、専門の医師が不足し、医療資源が偏在しているため、患者は一般開業医に助けを求めることが多く、誤診や診断の見逃しにつながりやすいです。 Google の研究者が開発したディープラーニング システムは、専門の皮膚科医の精度に匹敵し、一部のプライマリ ケアの医師や看護師よりもはるかに優れた精度で、一般的な皮膚疾患を検出できます。
皮膚の問題は、風邪、疲労、頭痛に次いで、世界中で最も一般的な病気の 1 つです。
実際には、次のものがあると推定されています 19億人誰もが、ある時期には皮膚病を発症します。米国だけでも、クリニックを訪れる患者の 10%最大 37% の人が少なくとも 1 つの皮膚の問題を抱えています。しかし、これらの患者の半数以上は皮膚科医以外の医師の診察を受けています。

さまざまな皮膚疾患が多くの人を悩ませています
皮膚科医が世界的に不足しているため、患者は一般開業医を探すことを余儀なくされているが、一般開業医は自分の症状を特定するのが専門医よりも正確ではないことが多い。
これを考慮して、 Google の研究者がプライマリケアで最も一般的な皮膚疾患を特定できる AI システムを開発。
に掲載された論文「皮膚疾患の鑑別診断のためのディープラーニングシステム」(「皮膚疾患の鑑別診断のための深層学習システム」、論文アドレス: https://arxiv.org/pdf/1909.05382.pdf) とそのブログで研究者らは、患者の症例の画像とメタデータが提示されると、システムはできる26 種類の皮膚状態の正確な鑑別診断、米国の認定皮膚科医と同等であると主張しています。
専門の医師より正確な新しい AI 皮膚科医
Google ソフトウェア エンジニアの Yuan Liu 氏と Google Health テクニカル プログラム マネージャーの Peggy Bui 博士は次のように述べています。深層学習システム(DLS) は、プライマリケアで最も一般的な皮膚の問題に対処します。この研究は、追加の専門家の訓練を受けずに一般開業医の診断能力を向上させる DLS の可能性を強調しています。 」

ディープラーニングシステムによる分析後、診断参考となる診断結果が得られます。
彼らの説明によると、皮膚科医はあらゆる皮膚の問題に対して 1 つの診断だけを下すのではなく、考えられる診断のランク付けリスト (鑑別診断) を作成し、その後、追跡検査、画像検査、プログラム、カウンセリングを使用して体系的に範囲を絞り込んでいきます。 Googleの研究者が開発したAIシステムも同様です。
システムは次のようなコンテンツを処理します。皮膚異常の 1 つ以上の臨床画像、および最大 45 種類のメタデータ (例: 病歴の自己申告要素:年齢、性別、症状など)。それぞれのケースで、複数の画像が Inception-v4 ニューラル ネットワーク アーキテクチャを使用して処理され、分類レイヤーで使用するために特徴変換されたメタデータと結合されました。
研究チームは、このモデルは2つの州のデータを使用したと述べた 17のプライマリケアクリニックで17,777人の身元不明の症例、モデルが評価されました。彼らはコーパスを 2 つの部分に分割し、2010 年から 2017 年の記録の一部を AI システムのトレーニングに使用し、2017 年から 2018 年の部分を評価に使用しました。トレーニング中にモデルは以下を利用します 40 名以上の皮膚科医による 50,000 を超える鑑別診断。
システムの診断精度をテストするために、研究者らは 3 人の米国認定皮膚科医の診断を統合し、厳格な参照基準と比較しました。
3750 件のケースを集計することにより、グラウンド トゥルース ラベルが得られました。 AIシステムによる肌トラブルのランキングと皮膚科医の鑑別診断を比較してみましょう。最初と最初の 3 つの診断予測は、それぞれ 71% と 93% の精度に達しました。。

皮膚科医と同等以上のパフォーマンスを発揮する
さらに、検証データセットのセクションでは、システムを 3 つのカテゴリーの臨床医 (皮膚科医、プライマリケア医師、看護師) と比較するときに (臨床医が提供する典型的な鑑別診断には最大 3 つの診断しか含めることができないため、最初の 3 つの予測のみが含まれます) DLS は臨床医と比較されました)。
結果は、システムの上位 3 つの予測が、診断精度は90%で、皮膚科医(75%)と同程度で、プライマリケア医(60%)や看護師(55%)よりも「はるかに高かった」。

肌悩み診断、偏りのないAIシステム
皮膚病は皮膚のタイプとも高い相関があるため、診断には皮膚自体の視覚的評価が重要です。そこで最後に、肌タイプに対する潜在的な偏見を評価するために、チームは フィッツパトリック スキンタイピングはAIシステムの性能をテストしました。皮膚の分類は、タイプ I (「色白、よく火傷する、日焼けしない」) からタイプ VI (「最も濃い茶色、日焼けしない」) までの範囲です。

中央の画像は結合画像で、システムが額の皮膚ではなく脱毛領域に焦点を当てて診断していることを示しています。
彼らは、データの少なくとも 5% を占めるフィッツパトリック II ~ IV の肌タイプに焦点を当て、DLS の精度がこれらのカテゴリ全体で同様であることを発見しました。上位 1 つの診断の精度は 69% ~ 72% の範囲であり、上位 3 つの診断の精度は 91% ~ 94% の範囲でした。。
研究者らは、システムの全体的な精度はトレーニング コーパスのおかげであると考えています。メタデータ、そしてこの研究結果は、彼らのアプローチが、最初の鑑別診断の根拠ではなかった「臨床医に考えられる要因の検討を促すのに役立つ可能性がある」ことを示唆していると述べた。
ただし、トレーニング コーパスは 1 つの遠隔皮膚科サービスのみから取得されたものであることも指摘しました。特定のフィッツパトリック皮膚サブタイプは、有意義なトレーニングや分析を行うにはデータセット内で希少すぎます。また、利用可能なデータ サンプルが不足しているため、そのデータセットは黒色腫などの特定の皮膚状態を正確に検出できません。
「我々は、より多くの生検で確認された皮膚がん症例をトレーニングと検証に含めることで、これらの限界に対処できると信じている」とLiu氏とBui氏は書いている。
テクノロジーの助けで健康な肌も夢じゃない
わが国の皮膚科医の総数は3万人にも満たないが、皮膚科は専門医師の不足に加え、誤診や見逃し、希少疾患に対する知識不足などの問題を抱えており、患者に損失を与えることは間違いない。
実際、皮膚科は形態学的特徴に依存する学問です。ほとんどの診断はパターンの視覚認識に基づいています。皮膚科の場合、AI画像認識機能は補助診断に非常に適しています。
しかし、過去数十年にわたって、皮膚科における人工知能の利用は限定的なままでした。近年まで、人工知能技術の開発と応用に伴い、国内の皮膚科でもAIの応用が徐々に進んできました。

たとえば、2018 年に、襄雅大学第二病院は、Dingxiangyuan および Dana Technology と協力して、初の皮膚疾患向け人工知能診断支援システム、このシステムは現在主にエリテマトーデスや皮膚炎などの一連の疾患を対象としています。認識精度は85%以上と高い。その後、中日友好病院と北京連合医科大学病院もディープラーニング技術に基づく皮膚科向けAI診断システムを導入した。
したがって、AI テクノロジーの支援により、皮膚科が直面するすべての問題が解決されると期待する理由があります。
- 以上 -