HyperAI초신경

Peking University International Hospital 등은 주니어 피부과 의사보다 훨씬 뛰어난 정확도로 여드름 병변을 탐지하고 등급을 매기는 딥러닝 알고리즘을 개발했습니다.

特色图像

여드름은 뾰루지라고도 불리며, 전 세계적으로 80% 이상의 청소년과 9.4%의 모든 연령대 사람에게 영향을 미치는 흔한 만성 염증성 피부 질환입니다. 여드름의 심각도를 정확하게 평가하는 것은 임상 치료와 그에 따른 관리에 모두 중요합니다.그러나 전통적인 여드름 등급 분류는 피부과 의사의 관찰과 임상 경험에 의존하기 때문에 오류가 불가피합니다.

최근 들어 의료 분야에서 인공지능이 꾸준히 확장되면서 인공지능 기반 여드름 이미지 분석 방법이 점차 주목을 받고 있습니다.  여드름 심각도 등급을 자동화하기 위해 일부 인공지능 방법이 개발되었지만, 여드름 이미지 수집 소스의 다양성과 다양한 응용 시나리오가 이러한 방법의 성능에 영향을 미칩니다.

이러한 맥락에서, 베이징대학 국제병원 피부과 주치의 한강원과 그의 팀은 AcneDGNet이라는 딥러닝 알고리즘을 개발했습니다. 이 알고리즘은 다양한 의료 상황에서 여드름 병변을 정확하게 감지하고 심각도를 판단할 수 있습니다. 해당 연구 결과는 Nature의 자회사인 Scientific Reports에 "온라인 및 오프라인 의료 상황에서 중국인을 대상으로 한 여드름 병변 탐지 및 심각도 등급 모델 평가"라는 제목으로 게재되었습니다.

전향적 평가에서는 다음과 같은 사실이 나타났습니다.AcneDGNet의 딥러닝 알고리즘은 초보 피부과 의사보다 정확도가 높을 뿐만 아니라, 정확도 면에서도 선임 피부과 의사와 비슷합니다.  이 솔루션은 여드름 병변을 정확하게 감지하고 다양한 의료 상황에서 그 심각도를 판단하여 피부과 의사와 환자가 온라인 상담과 오프라인 진료 상황에서 여드름을 진단하고 관리하는 데 효과적으로 도움을 줍니다.

연구 하이라이트

* 혁신적인 모델 설계: 시각적 변환기와 합성 신경망을 통합하여 더욱 효율적인 계층적 특징 테이블을 얻을 수 있어 분류의 정확도가 높아집니다. * 다양한 평가 데이터 세트: 공개 데이터 세트와 자체 구축 데이터 세트를 모두 포함하여 2,157개의 얼굴 이미지가 수집되었습니다. 영상 수집 장치가 다양하고, 데이터가 더 포괄적이며, 모델 학습 및 평가가 더 대표적입니다. * 다양한 시나리오에서의 종합적 평가: 온라인 상담 및 오프라인 의료 치료 시나리오에서 모델 성능을 종합적으로 평가합니다. 회고적 데이터와 미래적 데이터를 결합하여 다양한 성격의 데이터 세트를 사용하여 평가했습니다. * 실험 데이터는 참조성이 매우 높습니다. 데이터는 모두 중국 인구에서 얻은 것이며, 중국 데이터 세트에 적합한 AGS 척도를 등급 기준으로 선택했습니다. 이는 중국의 임상적 현실에 더 부합하며 국내 여드름 진단 및 연구에 강력한 근거를 제공합니다.

* 높은 정확도와 임상적 가치: 실험 결과에 따르면 온라인 시나리오의 분류 정확도는 89.5%에 달하고, 오프라인 시나리오의 분류 정확도는 89.8%에 달하며, 계수 오류가 작습니다. 이 모델은 일반 피부과 의사보다 여드름 등급을 더 정확하게 평가했습니다.

서류 주소:

https://www.nature.com/articles/s41598-024-84670-z

오픈소스 프로젝트인 "awesome-ai4s"는 200개 이상의 AI4S 논문 해석을 모아 방대한 데이터 세트와 도구를 제공합니다.
https://github.com/hyperai/awesome-ai4s

데이터 세트: 다변량 지원 모델 학습 및 테스트

연구진은 두 개의 공개 데이터 세트인 ACNE04와 AcneSCU, 그리고 세 개의 자체 구축 데이터 세트인 AcnePA1(핑안병원 여드름 데이터), AcnePA2, AcnePKUIH(베이징대학교 국제병원 여드름 데이터)를 수집했습니다. ACNE04, AcneSCU, AcnePA1의 모든 이미지는 무작위로 훈련 데이터 세트와 테스트 데이터 세트로 나뉘고, AcnePA2와 AcnePKUIH의 이미지는 테스트 데이터 세트로만 사용됩니다.

훈련 데이터 세트:디지털 카메라로 촬영한 ACNE04의 이미지 586개가 포함되어 있습니다. VISIA 시스템(피부 감지를 위한 디지털 영상 시스템)을 통해 수집된 AcneSCU의 220개 이미지 스마트폰으로 촬영한 AcnePA1의 791개 이미지.

테스트 데이터 세트:두 가지 다른 응용 시나리오(온라인 상담 및 오프라인 의료 치료)에 대해 5개의 데이터 세트가 선택되었습니다. 온라인 상담 시나리오 테스트 데이터에는 AcnePA1의 118개 이미지와 AcnePA2의 148개 이미지가 포함되어 있으며, 모두 스마트폰으로 촬영되었습니다. 병원 의료 현장 테스트 데이터에는 디지털 카메라로 촬영한 ACNE04 이미지 147개, VISIA 시스템으로 수집한 AcneSCU 이미지 56개, 그리고 카메라로 촬영한 AcnePKUIH 이미지 91개가 포함됩니다. 아래와 같이.

모델 개발 및 평가를 위한 특정 데이터 분할

모델 아키텍처: Visual Transformer와 CNN 결합

"세계 질병부담 연구(GBD) 2021" 데이터에 따르면 전 세계 10~24세 연령대 중 여드름 환자는 2억 3,100만 명으로, 이는 약 3억 명에 달하며, 이 연령대의 1/4에 해당합니다! 전통적인 여드름 진단에서는 의사가 주로 시각적 평가를 통해 여드름의 심각성을 판단합니다.하지만 이 방법은 의사의 개인적인 경험에 크게 의존하기 때문에 오류가 큽니다. 게다가 의료 자원이 부족한 지역에서는 사람들이 전문 피부과 의사로부터 진단과 치료를 받는 데 어려움이 있습니다.

이 연구에서 사용된 AcneDGNet은 Visual Transformer(ViT)와 합성곱 신경망을 독창적으로 결합한 혁신적인 딥러닝 알고리즘을 기반으로 합니다.

*Visual Transformer는 특징 추출에 있어서 독보적인 장점을 가지고 있으며, 이미지에서 더 광범위한 특징 관계를 포착할 수 있습니다.
* 합성곱 신경망은 국소적 특징을 처리하는 데 효과적이며 다양한 여드름 병변을 정확하게 식별할 수 있습니다.

시각적 변환기는 다양한 소스에서 수집한 여드름 이미지에서 특징을 추출하고 강력한 글로벌 특징을 생성하는 데 사용됩니다. 그 다음에,합성 신경망은 여드름 등급 시스템(AGS)의 지침에 따라 면포, 丘疹, 농포, 결절/낭종의 4가지 유형의 여드름 병변을 감지하는 데 사용되었습니다.마지막으로, 여드름의 심각도는 전반적인 특징과 국소 병변 인식 특징을 융합하여 결정됩니다.

본 연구에서 언급된 AcneDGNet 모델은 특징 추출 모듈, 병변 감지 모듈, 심각도 등급 모듈의 세 가지 주요 모듈로 구성됩니다.특징 추출 모듈은 시각적 변환기 아키텍처를 채택하여 더 강력한 글로벌 특징 표현을 생성합니다. 병변 감지 모듈은 합성 신경망(CNN)을 사용하여 4가지 유형의 여드름 병변을 감지합니다. 그리고 심각도 등급 모듈은 전역 및 국소 병변 인식 기능 표현을 융합하여 여드름의 심각도를 결정합니다.

AcneDGNet 프레임워크는 아래와 같습니다. 먼저, 얼굴 이미지가 특징 추출 모듈에 입력됩니다.이 모듈에는 Swin Transformer 아키텍처와 기능 피라미드 아키텍처가 포함되어 있습니다.그러면, 특징 추출 모듈에서 출력된 다중 스케일 특징 맵은 각각 병변 탐지 모듈과 심각도 등급 모듈에 입력됩니다.

병변 검출 모듈에서는 영역 제안 네트워크 아키텍처를 통해 여드름 후보 영역의 특징 맵을 얻어 이미지에서 각 여드름 병변의 위치와 범주를 예측합니다. 심각도 평가 모듈에서다중 스케일 특징 맵은 크기가 조정되고 병변 감지 모듈의 지역 병변 인식 특징 맵과 결합되어 여드름 이미지의 심각도 등급을 예측합니다.

AcneDGNet 모델 작업 프레임워크

온라인 상담 및 오프라인 진료 시나리오에서의 모델 평가

AcneDGNet 모델의 효과를 보다 포괄적으로 검증하기 위해 연구진은 두 가지 응용 시나리오를 설계했습니다.여기에는 스마트폰을 이용해 얼굴 이미지를 촬영하는 온라인 상담 시나리오와 디지털 카메라, VISIA 시스템 및 기타 전문 장비를 이용해 사진을 촬영하는 오프라인 진료 상담 시나리오가 포함됩니다.해당 평가에 따라 다양한 데이터 세트를 선택하고 다양한 평가 방법을 채택합니다.

1. 온라인 의료 시나리오에서의 높은 정확도

온라인 의료 시나리오에서 연구자들은 AcnePA1 및 AcnePA2 데이터 세트에서 테스트 데이터를 신중하게 선택했습니다. 이러한 데이터는 모두 아래 그림에서 볼 수 있듯이 환자가 스마트폰을 사용하여 촬영하고 업로드한 이미지에서 나온 것으로, 온라인 의료 서비스에서 이미지 수집의 실제 상황을 정확하게 반영하고 있습니다.

온라인 및 오프라인 시나리오에서 AcneDGNet의 성능 평가

실험 결과는 놀랍습니다. AcneDGNet은 여드름 심각도 분류에서 좋은 성과를 보입니다.전반적인 정확도는 89.5%에 도달했습니다.AcnePA1 데이터 세트의 경우,정확도는 85.6%입니다.AcnePA2 데이터 세트에서정확도는 최대 92.6%입니다.  즉, AcneDGNet은 여드름의 심각도를 정확하게 판단하고 의사에게 신뢰할 수 있는 진단 기준을 제공할 수 있습니다. 자세한 평가 결과는 다음 표에 나와 있습니다.

AcneDGNet 여드름 심각도 등급 성능

AcneDGNet은 등급 평가 외에도 여드름 상태의 변화 추세를 감지하는 데에도 강력한 역량을 보여주었습니다.AcnePA2 데이터 세트를 대상으로 한 테스트에서 환자의 여드름 수치가 상승했는지, 변화가 없었는지, 감소했는지를 정확도 87.8%로 정확하게 식별할 수 있었습니다.74회의 후속 방문에서 아래와 같이 여드름 경향 65건을 정확하게 식별했습니다.

AcnePA2 환자를 위한 AcneDGNet 시각화 결과
여드름 심각도 평가 추세를 감지하기 위한 혼동 행렬

계산 오류 측면에서도 AcneDGNet은 좋은 성과를 보였습니다. 다양한 여드름 병변의 총 계산 오차는 1.91±3.28에 불과했습니다.아래 그림에서 볼 수 있듯이, 면포의 계수 오차는 0.70±1.92, 유두종은 1.28±2.01, 농포는 0.07±0.29, 결절/낭종의 계수 오차는 0.12±0.38이었습니다. 이처럼 오류율이 낮다는 것은 AcneDGNet이 여드름 병변의 수를 정확하게 감지하여 의사가 상태를 평가하는 데 필요한 정확한 데이터 지원을 제공할 수 있음을 나타냅니다.

AcneDGNet 여드름 수 오류 통계

(II) 오프라인 병원 진단 성과는 5년 이상 경력 의사보다 우수

AcneDGNet은 오프라인 의료 시나리오에서도 좋은 성능을 보입니다. 연구자들은 각각 ACNE04, AcneSCU, AcnePKUIH 데이터 세트를 기반으로 후향적 평가와 전향적 평가를 실시했습니다. 아래와 같이 표시됩니다.

ACNE04 데이터 세트에 대한 AcneDGNet 탐지 결과의 예
AcneSCU 데이터 세트에 대한 AcneDGNet 탐지 결과의 예

후향적 평가에서 AcneDGNet은 ACNE04 및 AcneSCU 데이터 세트에서 테스트되었습니다.결과는 전반적인 정확도가 90.1%에 도달한다는 것을 보여줍니다. 그 중 ACNE04 데이터 세트의 정확도는 91.2%이고, AcneSCU 데이터 세트의 정확도는 87.5%입니다.자세한 평가 결과는 아래 표와 같습니다.

후향적 평가의 전반적인 결과

전향적 평가에서 AcneDGNet은 AcnePKUIH 데이터세트에서 테스트되었으며, 그림에서 볼 수 있듯이 5년 이상의 경력을 가진 두 명의 주니어 피부과 의사(JD1 및 JD2)와 10년 이상의 경력을 가진 두 명의 시니어 피부과 의사(SD1 및 SD2)의 진단 결과와 비교되었습니다.

피부과 전문의와 AcneDGNet의 AcnePKUIH 정확도

그 결과는 놀랍습니다.AcneDGNet의 정확도는 89.0%에 도달했는데, 이는 주니어 피부과 의사의 80.8%보다 높고, 시니어 피부과 의사의 90.7%와 매우 가깝습니다. 후향적 및 전향적 평가 결과를 바탕으로, 오프라인 시나리오에서 AcneDGNet의 전반적인 정확도는 89.8%에 도달했습니다.이번 성과는 오프라인 의료 상황에서 AcneDGNet의 엄청난 가치를 의심할 여지 없이 입증했습니다. 여드름을 정확하게 진단할 수 있을 뿐만 아니라, 경험이 부족한 의사에게 강력한 도움을 제공하여 진단의 정확도를 높이는 데 도움이 됩니다.

AI, 피부 진단 강화로 지능형 진단·치료 시대 본격화

실제로 피부과에서 AI를 적용하는 것은 이미 흔해졌습니다. 2019년 로레알과 알리바바 그룹은 여드름 문제를 위한 세계 최초의 모바일 인공지능 감지 애플리케이션을 공동 출시했습니다.——라로슈포제 EFFACLAR SPOTSCAN.

또한 2023년 5월에는 베이징연합의과대학병원 피부과 류지에 교수팀과 항저우 용류과학기술유한공사가 공동으로 개발했다.여드름 심각도 지능형 평가 시스템업계에도 공식적으로 출시되었습니다. 1년간의 적용 연습과 전문 의사의 조언 및 피드백을 거쳐, 시스템은 여러 차례 알고리즘 업그레이드와 기능 최적화를 거쳤습니다. 2024년 2월, 베이징협화의학원병원은 공식 홈페이지에 과학기술 성과 전환 공고를 공식적으로 올렸습니다. 병원의 검토 후, 시스템은 공식적으로 임상적 전환 및 적용 단계에 들어갔습니다.

2024년 7월, 텐센트의 AI 여드름 진단 및 치료 로봇이 공식 출시되었습니다. 단 3초 만에 정확한 진단을 내리고, 단 10초 만에 치료 계획을 제공할 수 있습니다.또한, 텐센트의 의료 AI 시스템은 1,300개 이상의 기관에 구축되었습니다.임상 시험 결과는 놀랍습니다. 낭포성 여드름의 진단 정확도는 99.7%입니다(인간 의사의 진단 정확도는 82.4%에 불과합니다). 여드름 발병은 6개월 전에 경고될 수 있습니다(예측 민감도는 91.3%입니다). 76%는 치료로 인한 흉터 발생 위험을 줄였습니다(320만 건의 AI 시뮬레이션 기반)

알고리즘을 지속적으로 반복한 결과, 여드름 진단은 기본적으로 성숙되었습니다. 다음으로, AI 지원 피부 진단은 더 많은 분야로 확대될 것입니다.

미래는 밝습니다. 과학을 위한 AI는 무한한 가능성을 가지고 있습니다.

여드름 진단에 있어서 AcneDGNet의 성공은 의료 분야에서 AI의 새로운 획기적인 발전으로, 과학 분야에서 AI가 지닌 엄청난 잠재력을 확인할 수 있게 해줍니다. 이는 여드름 환자에게 보다 정확하고 편리한 진단 방법을 제공할 뿐만 아니라, 의료 분야에서 AI를 적용하는 데 귀중한 경험과 사례를 제공합니다.


과학에 대한 AI의 영향은 의학 분야에만 국한되지 않습니다. AI는 재료과학, 물리학, 천문학 등 다른 과학 분야에서도 중요한 역할을 할 수 있습니다. 이는 과학자들이 엄청난 양의 데이터를 처리하고 분석하고 과학 연구의 진행을 가속화하는 데 도움이 될 수 있습니다. 재료 과학에서 AI는 과학자들이 재료의 특성을 시뮬레이션하고 예측함으로써 성능이 더 뛰어난 재료를 설계하는 데 도움을 줄 수 있습니다. 물리학에서는 과학자들이 실험 데이터를 분석하고 새로운 물리적 현상과 법칙을 발견하는 데 도움이 될 수 있습니다. 천문학에서 AI는 천문학자들이 천문 관측 데이터를 처리하고 분석하고 새로운 천체와 우주 현상을 발견하는 데 도움을 줄 수 있습니다.

AI는 알려지지 않은 과학 분야로 통하는 문을 여는 만능 열쇠와 같습니다. 저는 미래에 AI for Science가 더 많은 획기적인 발견과 혁신을 가져올 것이라 믿으며, 인류의 진보와 발전에 더 큰 기여를 할 것이라고 생각합니다!

참고문헌:
1.https://mp.weixin.qq.com/s/vlzUWNQsxYaSVXKSt2dhhQ
2.https://cloud.tencent.com/developer/article/1526199
3.https://mp.weixin.qq.com/s/vN2q