HyperAI超神経

北京大学国際病院らは、若手皮膚科医の精度をはるかに上回る精度で、ニキビ病変を検出し、等級付けするディープラーニングアルゴリズムを開発した。

特色图像

ニキビは吹き出物としても知られ、世界中で 80% 以上の青少年と 9.4 % 以上のあらゆる年齢層の人々が罹患している一般的な慢性炎症性皮膚疾患です。ニキビの重症度を正確に評価することは、臨床治療とその後の管理の両方にとって重要です。しかし、従来のニキビのグレーディングは皮膚科医の観察と臨床経験に依存しており、間違いは避けられません。

近年、医療分野における人工知能の継続的な拡大に伴い、人工知能に基づくニキビ画像分析方法が徐々に注目を集めています。  ニキビの重症度評価を自動化する人工知能手法がいくつか開発されていますが、ニキビ画像の取得ソースの多様性とさまざまなアプリケーションシナリオがそのパフォーマンスに影響します。

このような状況の中で、北京大学国際病院皮膚科主任医師のハン・ガンウェン氏と彼のチームは、ニキビ病変を正確に検出し、さまざまな医療シナリオでその重症度を判断できるAcneDGNetと呼ばれるディープラーニングアルゴリズムを開発しました。この結果は、「オンラインおよびオフラインのヘルスケアシナリオにおける中国人を対象としたニキビ病変検出および重症度評価モデルの評価」というタイトルで、ネイチャーの子会社であるサイエンティフィック・リポーツ誌に掲載されました。

前向き評価では、AcneDGNet のディープラーニング アルゴリズムは、ジュニア皮膚科医よりも正確であるだけでなく、精度においてはシニア皮膚科医に匹敵します。  さまざまな医療シナリオでニキビ病変を正確に検出し、その重症度を判断できるため、オンライン相談やオフラインの治療シナリオで皮膚科医と患者がニキビを診断し、管理するのに効果的に役立ちます。

研究のハイライト

* 革新的なモデル設計: ビジュアルトランスフォーマーと畳み込みニューラルネットワークを統合することで、より効率的な階層型特徴テーブルを取得でき、分類の精度が向上します。 * 多様な評価データセット:公開データセットと独自構築データセットの両方を網羅し、2,157枚の顔画像が収集されました。画像取得デバイスは多様で、データはより包括的であり、モデルのトレーニングと評価はより代表的です。 * 複数のシナリオでの総合評価:オンライン相談やオフライン診療のシナリオでモデルのパフォーマンスを総合的に評価します。データセットの異質性を評価するために、遡及的データと将来的データの組み合わせが使用されました。 * 実験データは参照性が高く、データはすべて中国人集団からのものであり、中国のデータセットに適したAGSスケールがグレーディング基準として選択されており、中国の臨床実態にさらに沿っており、国内のニキビ診断と研究に強力なサポートを提供します。

* 高い精度と臨床的価値: 実験結果によると、オンライン シナリオの分類精度は 89.5% に達し、オフライン シナリオの分類精度は 89.8% に達し、カウント エラーはわずかでした。このモデルは、皮膚科医が行うよりもニキビの等級付けの精度が高かった。

用紙のアドレス:

https://www.nature.com/articles/s41598-024-84670-z

オープンソース プロジェクト「awesome-ai4s」は、200 を超える AI4S 論文の解釈をまとめ、膨大なデータ セットとツールを提供します。
https://github.com/hyperai/awesome-ai4s

データセット: 多変量支援モデルのトレーニングとテスト

研究者らは、2 つの公開データセット ACNE04 と AcneSCU、および 3 つの独自構築データセット AcnePA1 (平安優良医師のニキビデータ)、AcnePA2、および AcnePKUIH (北京大学国際病院のニキビデータ) を収集しました。 ACNE04、AcneSCU、AcnePA1 のすべての画像はトレーニング データセットとテスト データセットにランダムに分割されますが、AcnePA2 と AcnePKUIH の画像はテスト データセットとしてのみ使用されます。

トレーニングデータセット:デジタルカメラで撮影された ACNE04 の画像 586 枚、VISIA システム (皮膚検出用デジタル画像システム) で収集された AcneSCU の画像 220 枚、スマートフォンで撮影された AcnePA1 の画像 791 枚が含まれています。

テストデータセット:オンライン相談とオフライン医療という 2 つの異なるアプリケーション シナリオに対して 5 つのデータ セットが選択されました。オンライン相談シナリオのテストデータには、AcnePA1 の画像 118 枚と AcnePA2 の画像 148 枚が含まれており、すべてスマートフォンで撮影されています。病院の医療現場のテストデータには、デジタルカメラで撮影されたACNE04の画像147枚、VISIAシステムで収集されたAcneSCUの画像56枚、カメラで撮影されたAcnePKUIHの画像91枚が含まれています。下記の通りです。

モデル開発と評価のための特定のデータ分割

モデルアーキテクチャ: Visual Transformer と CNN の組み合わせ

「世界疾病負担研究(GBD)2021」のデータによると、世界中の10〜24歳の間でニキビ患者は2億3100万人おり、その数は約3億人で、年齢層の4分の1を占めています。従来のニキビ診断では、医師は主に視覚的な評価によってニキビの重症度を判断します。しかし、この方法は医師の個人的な経験に大きく依存しており、誤差が大きくなります。さらに、医療資源が乏しい地域では、専門の皮膚科医による診断や治療を受けることが困難です。

この研究における AcneDGNet は、Visual Transformer (ViT) と畳み込みニューラル ネットワークを巧みに組み合わせた革新的なディープラーニング アルゴリズムに基づいています。

*Visual Transformer は特徴抽出において独自の利点があり、画像内のより広範囲の特徴関係を捉えることができます。
* 畳み込みニューラル ネットワークは局所的な特徴の処理に優れており、さまざまなニキビ病変を正確に識別できます。

ビジュアル トランスフォーマーは、さまざまなソースから収集されたニキビ画像から特徴を抽出し、強力なグローバル特徴を生成するために使用されます。それから、畳み込みニューラル ネットワークを使用して、ニキビグレーディング システム (AGS) のガイドラインに従って、面皰、丘疹、膿疱、結節/嚢胞の 4 種類のニキビ病変を検出しました。最後に、ニキビの重症度は、全体的な特徴と局所的な病変を認識する特徴を融合して決定されます。

この研究で言及されている AcneDGNet モデルは、特徴抽出モジュール、病変検出モジュール、重症度評価モジュールという 3 つの主要モジュールで構成されています。特徴抽出モジュールは、ビジュアル Transformer アーキテクチャを採用して、より強力なグローバル特徴表現を生成します。病変検出モジュールは、畳み込みニューラル ネットワーク (CNN) を使用して 4 種類のニキビ病変を検出します。重症度評価モジュールは、グローバルおよびローカルの病変認識特徴表現を融合してニキビの重症度を判断します。

AcneDGNet フレームワークを以下に示します。まず、顔画像が特徴抽出モジュールに入力されます。このモジュールには、Swin Transformer アーキテクチャと機能ピラミッド アーキテクチャが含まれています。次に、特徴抽出モジュールによって出力されたマルチスケール特徴マップは、それぞれ病変検出モジュールと重症度グレードモジュールに入力されます。

病変検出モジュールでは、領域提案ネットワーク アーキテクチャを通じてニキビ候補領域の特徴マップを取得し、画像内の各ニキビ病変の位置とカテゴリを予測します。重大度評価モジュールでは、マルチスケール特徴マップのサイズを変更し、病変検出モジュールの局所病変認識特徴マップと組み合わせて、ニキビ画像の重症度グレードを予測します。

AcneDGNet モデル作業フレームワーク

オンライン診療とオフライン診療のシナリオにおけるモデル評価

AcneDGNet モデルの有効性をより包括的に検証するために、研究者らは次の 2 つのアプリケーション シナリオを設計しました。スマートフォンで顔画像を撮影するオンライン診療シナリオや、デジタルカメラやVISIAシステムなどの専門機器で写真を撮るオフライン診療シナリオなどが含まれます。対応する評価には異なるデータセットを選択し、異なる評価方法を採用します。

1. オンライン医療シナリオにおける高い精度

オンライン医療のシナリオでは、研究者はAcnePA1とAcnePA2データセットからテストデータを慎重に選択しました。これらのデータはすべて、下の図に示すように、患者がスマートフォンを使用して撮影してアップロードした画像からのものであり、オンライン医療における画像取得の実際の状況を忠実に反映しています。

オンラインおよびオフラインシナリオにおける AcneDGNet のパフォーマンス評価

実験結果は驚くべきものでした。AcneDGNet はニキビの重症度分類において優れたパフォーマンスを発揮します。全体の精度は89.5%に達しました。AcnePA1データセットの場合、精度は85.6%です。AcnePA2データセットでは、正解率は92.6%と高いです。  つまり、AcneDGNet はニキビの重症度を正確に判断し、医師に信頼できる診断基準を提供できるということです。詳細な評価結果は次の表に示されています。

AcneDGNet ニキビ重症度評価パフォーマンス

AcneDGNet は、グレーディングに加えて、ニキビの状態の変化傾向を検出する強力な機能も実証しました。AcnePA2 データセットのテストでは、患者のニキビレベルが改善されたか、変化がなかったか、悪化したかを 87.8% の精度で正確に識別することができました。74 回のフォローアップ訪問で、以下に示すように 65 件のニキビ傾向を正しく特定しました。

AcnePA2 患者の AcneDGNet 視覚化結果
ニキビの重症度評価の傾向を検出するための混同行列

カウントエラーの点でも、AcneDGNet のパフォーマンスは良好です。さまざまなニキビ病変の総数誤差はわずか 1.91±3.28 でした。下図に示すように、面皰の計数誤差は0.70±1.92、丘疹は1.28±2.01、膿疱は0.07±0.29、結節/嚢胞は0.12±0.38でした。このような低いエラー率は、AcneDGNet がニキビ病変の数を正確に検出し、医師が症状を評価するための正確なデータサポートを提供できることを示しています。

AcneDGNet ニキビカウントエラー統計

(II)オフラインの病院診断実績は、5年以上の経験を持つ医師の実績を上回る

AcneDGNet はオフラインの医療シナリオでも優れたパフォーマンスを発揮します。研究者らは、それぞれACNE04、AcneSCU、AcnePKUIHデータセットに基づいて、遡及的評価と将来的評価を実施しました。以下のように表示されます。

ACNE04データセットにおけるAcneDGNetの検出結果の例
AcneSCUデータセットにおけるAcneDGNetの検出結果の例

遡及的評価では、AcneDGNet は ACNE04 および AcneSCU データセットでテストされました。結果は、全体的な精度が 90.1% に達することを示しています。このうち、ACNE04 データセットの精度は 91.2%、AcneSCU データセットの精度は 87.5% です。詳細な評価結果は下の表に示します。

遡及的評価の全体的な結果

前向き評価では、AcneDGNet を AcnePKUIH データセットでテストし、図に示すように、5 年以上の経験を持つ 2 人の若手皮膚科医 (JD1 と JD2) と 10 年以上の経験を持つ 2 人の上級皮膚科医 (SD1 と SD2) の診断結果と比較しました。

皮膚科医に関するAcnePKUIHとAcneDGNetの精度

結果は驚くべきものでした。AcneDGNet の精度は 89.0% に達し、これはジュニア皮膚科医の 80.8% を上回り、シニア皮膚科医の 90.7% に非常に近い値です。遡及的および将来的な評価結果に基づくと、オフライン シナリオにおける AcneDGNet の全体的な精度は 89.8% に達しました。この成果は、オフライン医療の場面における AcneDGNet の大きな価値を証明しています。ニキビを正確に診断できるだけでなく、経験の浅い医師に強力な支援を提供し、診断の精度を向上させるのに役立ちます。

AIが皮膚診断を強化し、インテリジェントな診断と治療の時代へ

実際、皮膚科における AI の応用はすでに一般的です。 2019年、ロレアルとアリババグループは共同で、ニキビの問題を検知する世界初のモバイル人工知能アプリケーションをリリースしました。——ラ ロッシュ ポゼ エファクラ スポットスキャン。

さらに、2023年5月には、北京協和医学院病院皮膚科の劉傑教授チームと杭州永流科技有限公司が共同で開発した。ニキビ重症度インテリジェント評価システム業界向けにも正式にリリースされます。 1 年間の応用実践と専門医師からのアドバイスのフィードバックを経て、システムは複数のアルゴリズムのアップグレードと機能の最適化を実施しました。 2024年2月、北京協和医学院病院は公式ウェブサイトで科学技術成果の転換に関する発表を正式に発表しました。病院による審査を経て、システムは正式に臨床転換および応用段階に入りました。

2024年7月、テンセントのAIニキビ診断・治療ロボットが正式に市場に投入され、わずか3秒で正確な診断を行い、わずか10秒で治療計画を提供することができます。さらに、テンセントの医療AIシステムは1,300以上の機関に導入されている。臨床試験の結果は驚くべきものでした。嚢胞性ニキビの診断精度は99.7%(人間の医師は82.4%のみ)で、ニキビの発生を6か月前に警告できます(予測感度は91.3%)。治療による瘢痕のリスクは76%減少します(320万回のAIシミュレーションに基づく)。

継続的なアルゴリズムの反復を経て、ニキビ診断は基本的に成熟しました。今後、AIを活用した肌診断は、さらに幅広い分野に拡大していくでしょう。

未来は有望、科学のためのAIは無限の可能性を秘めている

AcneDGNet によるニキビ診断の成功は、医療分野における AI の新たなブレークスルーであり、科学における AI の大きな可能性を示しています。これは、ニキビ患者にとってより正確で便利な診断方法を提供するだけでなく、医療分野における AI の応用に関する貴重な経験と事例も提供します。


AI for Science の影響は医療分野だけに限りません。 AIは、材料科学、物理学、天文学などの他の科学分野でも重要な役割を果たすことができます。科学者が膨大な量のデータを処理・分析し、科学研究の進歩を加速するのに役立ちます。材料科学では、AI は材料の特性をシミュレートして予測することで、科学者がより高性能な材料を設計するのに役立ちます。物理学では、AI は科学者が実験データを分析して新しい物理現象や法則を発見するのに役立ちます。天文学では、AI は天文学者が天文観測データを処理および分析して新しい天体や宇宙現象を発見するのに役立ちます...

AIは未知の科学分野への扉を開くマスターキーのようなものです。将来、AI for Science はさらなるブレークスルーとイノベーションをもたらし、人類の進歩と発展にさらに大きく貢献すると信じています。

参考文献:
1.https://mp.weixin.qq.com/s/vlzUWNQsxYaSVXKSt2dhhQ
2.https://cloud.tencent.com/developer/article/1526199
3.https://mp.weixin.qq.com/s/vN2q