정확도는 97%에 도달했습니다. 호주 팀의 새로운 업적은 두개골 CT를 통해 성별을 식별하는 딥러닝을 기반으로 하며 인간 법의학자를 능가합니다.

최근 몇 년 동안, 서스펜스와 범죄를 소재로 한 TV 드라마가 성공을 거두면서, 법의학이라는 신비로운 주제도 시청자에게 소개되었습니다. 간단히 말해서, 법의학은 어둠 속에 숨어 진실을 찾는 셜록 홈즈와 같습니다. 전문적인 지식과 고도의 기술을 바탕으로 유해와 물적 증거에 담긴 침묵의 증언을 해석하여 뼈를 식별하고 그 원인을 추적하며, 수많은 어려운 사건을 해결하는 방향을 제시합니다. 이는 사법적 정의를 보장하는 튼튼한 토대이며, 그 중요성은 자명합니다.
법의학의 많은 연구 분야 중,유해의 성별을 식별하는 것은 매우 중요한 단계입니다.뼈 더미에 직면했을 때, 이전의 방법들은 주로 경험이 풍부한 법의학자들이 발표된 표준을 기반으로 추론과 평가를 내리는 데 의존했습니다. 그러나 이러한 방법은 일반적으로 주관적인 요인의 영향을 받기 때문에 필연적으로 결과에 편차가 발생합니다. 오늘날 컴퓨터와 딥러닝 기술이 보편화되면서, 과학을 활용해 인간 편견의 영향을 해결하는 방법이 새로운 주제가 되었습니다.
최근, 서호주 대학, 뉴사우스웨일즈 대학, 인도네시아 하사누딘 대학의 팀이성별 판단의 정확도를 높이고 인지적 편견의 영향을 줄이기 위해 딥러닝을 기반으로 한 자동화 프레임워크가 제안되었습니다.
이 연구에서는 인도네시아의 한 병원에서 촬영한 두개골 CT 스캔 200개를 사용하여 딥 러닝 기반 네트워크 구성 3가지를 훈련하고 테스트했습니다. 가장 정확한 딥러닝 프레임워크는 판단을 위해 성별과 두개골 특징을 결합할 수 있었습니다.분류 정확도는 최대 97%에 달할 수 있으며, 이는 인간 관찰자의 82%보다 상당히 높습니다.이 실험은 법의 인류학 분야에서 심층적 응용 프로그램을 위한 심층 학습 프레임워크의 잠재력을 확인시켜 줍니다.
관련 연구 결과는 학술지 Scientific Reports에 "딥 러닝 대 인간 평가자: 3차원 컴퓨터 단층촬영 스캔을 통한 법의학적 성별 추정"이라는 제목으로 게재되었습니다.

서류 주소:
https://www.nature.com/articles/s41598-024-81718-y
오픈소스 프로젝트인 "awesome-ai4s"는 200개 이상의 AI4S 논문 해석을 모아 방대한 데이터 세트와 도구를 제공합니다.
https://github.com/hyperai/awesome-ai4s
AI를 "신뢰할 수 있고 사용 가능하게" 만들기 위해 한 단계 더 나아가다
법의인류학에서는 골격 구조가 성적 특징의 많은 차이점을 숨기고 있으며, 특히 두개골의 경우 더욱 그렇습니다.현대 법의학 실무에서 가장 널리 쓰이는 형태학적 두개골 성별 판별 방법은 필립 L. 워커가 제안한 5가지 두개골 이형성 특징(이하 워커 특징)입니다.즉, 남성과 여성의 두개골의 차이점을 정신적 돌출부(MEN), 눈썹사이(GLA), 눈위 가장자리(SUP), 목덜미능선(NUC), 유양돌기(MAS) 측면에서 관찰하는 것입니다.
예를 들어, 연구에 따르면 남성의 눈썹 사이 간격은 보통 더 눈에 띄고 넓으며, 뚜렷한 융기나 결절이 있을 수 있다고 합니다. 여성의 눈썹 사이 간격은 더 매끄럽고 얇습니다. 남성의 눈구멍은 대부분 정사각형이나 직사각형 모양이며, 모서리가 날카롭고 전반적으로 험상궂어 보입니다. 여성의 눈구멍은 대체로 둥글고, 자연스럽고 부드러운 가장자리를 가지고 있으며, 뚜렷한 가장자리가 없습니다.
그러나 법의인류학 활동이 발전하면서 이 방법을 더 이상 적용할 수 없는 상황도 나타났습니다.한편으로는,이 방법으로 표현되는 식별수단을 분석하여 얻은 데이터 샘플은 모두 물리적 기록에서 나온 것입니다. 즉, 충분한 샘플을 얻으려면 대량의 물리적 뼈를 수집해야 합니다.반면에,이 방법의 표본은 19세기와 20세기에 살았던 영국인, 미국인, 아메리카 원주민으로부터 추출되었으며, 이로 인해 연구 대상의 시간적, 공간적 효과에 일정한 한계가 있습니다.
가상 인류학의 등장은 법의인류학의 실천에 새로운 길을 제공합니다. 데이터 세트 수집 측면에서 워커의 연구에서 사용한 데이터 수집 방법과 달리 컴퓨터 단층촬영(CT)과 같은 임상 디지털 영상 기술을 사용하면 연구자가 충분한 뼈 데이터 세트를 얻을 수 있습니다. 실제 뼈를 수집하는 것보다 임상 영상을 통해 기록한 가상의 뼈 데이터 세트는 의심할 여지 없이 구축하기가 더 쉽습니다. 또한, 현대 의학에서 CT가 널리 사용됨에 따라 이 방법을 통해 얻은 데이터 세트는 현대 인구를 더 잘 대표합니다.
분석 및 처리 측면에서 딥러닝 기반 기술은 법의인류학에도 적용되었습니다. 연구자들은 딥 러닝을 사용하여 대규모 데이터 세트를 처리하고 뼈의 성별을 평가하는 모델을 구축하여 법의 인류학자가 생물학적 평가를 수행하는 데 도움을 줍니다. 예를 들어, Bewes 등이 개발한 GoogleNet이 있습니다. 머리 CT 스캔의 2D 측면 영상으로부터 3D 재구성을 수행하고 이를 기반으로 골격 성별 식별을 수행할 수 있습니다.남성의 경우 96%, 여성의 경우 94%의 구별 정확도가 달성되었습니다.
이러한 방법이 큰 진전을 이루었지만, 기존의 딥러닝 기반 뼈 성별 식별 방법에는 여전히 몇 가지 과제가 있다는 점은 주목할 만합니다.완전 자동화되고 설명 가능합니다.
첫째, 일부 연구에서는 상용 소프트웨어를 사용하여 주변 구조를 제거하고 경험적 값으로 HU(Hounsfield Unit) 임계값을 설정하여 두개골을 추출했습니다. 이는 소프트웨어 접근성, 노이즈, 아티팩트, 원치 않는 뼈 구조, HU 값의 변동성과 같은 문제의 영향을 받을 수 있습니다.
둘째, 두개골의 특징을 식별하는 인간 관찰자와 달리, 딥 러닝 기반 네트워크는 종종 "블랙박스"라고 불리며, 이 경우 숨겨진 계층을 구조화하기 어렵고, 이로 인해 딥 러닝 기반 네트워크의 해석 가능성도 제한됩니다.
다양한 디자인으로 인간을 능가하는 AI 프레임워크를 만들어냅니다.
이 연구에서 연구진은 두개골 CT 스캔을 사용하여 법의학적 성별 식별을 위한 완전 자동화된 AI 프레임워크를 개발하고 Walker가 제안한 특징을 사용하여 모델을 테스트했습니다.
AI 프레임워크는 전처리 단계와 성별 분류 네트워크로 구성됩니다.먼저, 두개골 분할을 위해 사전 훈련된 딥 러닝 네트워크를 사용한 다음, 다양한 입력 구성을 사용하여 다양한 분류 네트워크 구성을 훈련합니다. 이때 멀티태스크 학습을 사용하여 워커 특징 점수를 생성하고 성별 식별을 수행하거나, 단일 태스크 학습을 사용하여 성별 식별을 수행합니다. 구체적인 네트워크 설정은 아래 그림과 같습니다.

* I는 전처리된 CT 이미지입니다.
* (I, S)는 전처리된 CT 이미지와 두개골 마스크를 포함하는 듀얼 채널 입력입니다.
* I∩S는 개별 두개골 영역을 나타냅니다.
* N1과 N2는 결합 손실 함수를 사용하고, N3은 이진 교차 엔트로피 손실 함수를 사용합니다.
N1, N2, N3의 세 가지 딥 러닝 네트워크 변형은 3D 합성곱(Conv3D), 배치 정규화(Batch Norm), 정류 선형 단위(ReLU) 활성화 계층을 포함하여 입력 블록과 세 개의 잔여 블록으로 구성된 ResNet을 기반으로 구축되었습니다. 입력 블록은 32개의 필터로 구성되고, 잔여 블록은 각각 64개, 128개, 256개의 필터를 갖습니다. Conv3D의 커널 크기는 3 x 3 x 3입니다. 다음 그림과 같이:


모든 네트워크는 Python v3.9를 사용하여 Torch 2.0에서 구현되었으며 16GB RAM이 장착된 NVIDIA Tesla P100 GPU에서 학습되었습니다.
이 연구에 사용된 데이터 세트는 인도네시아의 Dr Wahidin Sudirohusodo General Hospital(RSWS)에서 가져온 것으로, 주로 2020년 1월부터 2022년 8월까지 병원에서 방사선 검사를 받은 일부 환자의 다중단면 CT 스캔(MSCT)을 포함합니다.총 200장의 사진이 있으며, 여성 87장과 남성 113장이 포함되어 있습니다.데이터 세트의 166개 이미지는 학습에 사용되고 34개 이미지는 테스트에 사용됩니다.
세 가지 네트워크 아키텍처를 구체적으로 살펴보면, N2의 멀티태스크 구성(워커 두개골 이형 특징 점수와 다양한 분기의 성별 추정)이 다양한 입력에서 가장 높은 AUROC와 정확도를 달성했으며, 성별 식별을 위한 가장 균형 잡힌 모델이었습니다. 두개골 영역을 입력으로 사용하는 경우,N2는 0.97의 가장 높은 정확도와 0.30의 가장 낮은 로그 손실을 달성했습니다.
N1의 다중 작업 구성(워커의 두개골 이형 특징 점수를 순서대로 추정한 다음 성별을 추정)은 두개골 영역을 입력으로 사용합니다.정확도는 0.91입니다.그러나 다양한 입력에 따른 AUROC는 N2와 N3보다 낮고, 대수적 손실은 더 높습니다.
다양한 입력에 따른 단일 작업 네트워크 N3(성별 직접 추정)의 AUROC는 N2와 유사하지만 두개골을 입력으로 사용할 경우정확도는 0.85에 불과합니다.모든 네트워크 중 가장 낮습니다. 구체적인 결과는 아래 그림과 같습니다.

특히, 인간 관찰자의 성능과 비교했을 때, 세 가지 딥 러닝 기반 네트워크 모델 모두 성별 분류에서 인간 관찰자보다 더 높은 정확도를 달성했습니다. 구체적으로,N2는 97%로 가장 높은 성별 식별 정확도를 달성한 반면, 인간 관찰자는 82%에 그쳤습니다.
연구팀은 네트워크 의사결정 과정의 해석성을 개선하기 위해 Gradient-CAM(Gradient-weighted class Activation Mapping)을 사용하여 네트워크에서 식별된 차별적인 두개골 영역을 시각화했습니다. Grad-CAM은 합성곱 신경망의 결정을 설명하는 방법입니다. 핵심 아이디어는 출력 범주의 기울기를 레이어의 출력으로 곱한 다음 평균을 내어 "대략적인" 열 지도를 얻는 것입니다.이 히트맵을 확대하여 원본 이미지 위에 겹쳐놓으면 모델이 분류 시 가장 집중하는 영역을 보여줄 수 있습니다.이 알고리즘의 장점은 구조적 수정이나 재교육 없이 모든 합성 신경망에 사용할 수 있다는 것입니다.
아래 그림은 두개골을 입력으로 사용할 때 네트워크 N1과 N2의 Walker 특징 분기에서 각 특징 예측과 관련된 Grad-CAM 히트 맵을 보여줍니다. 여기서 a, b, c, d, e는 각각 GLA, MAS, MEN, NUC, SUP입니다. 히트맵은 특히 GLA와 NUC를 강조합니다.

아래 그림은 두개골을 입력으로 사용할 때 3개 네트워크의 출력 Grad-CAM 히트맵을 보여줍니다. GLA가 활성화되는 것 외에도 두개골 주변 영역도 활성화되는 것을 관찰할 수 있으며, 특히 N3의 히트맵이 더욱 뚜렷하게 나타납니다. CT 이미지가 균일한 물리적 크기로 사전 처리된다는 점을 감안할 때,이는 모델이 전체 두개골의 형태를 분석하고 있음을 나타낼 수 있습니다.아마도 크기와 모양 때문일 겁니다. 두개골의 크기와 모양은 인간의 성적 이형성을 반영하는 주요 특징인데, 남성의 두개골은 일반적으로 여성의 두개골보다 크고 무겁습니다.

요약하자면, 이 실험은 완전히 자동화된 딥 러닝 기반 AI 프레임워크가 골격 성별 판별의 정확도를 높이는 데 효과적임을 보여주며, 이미 개발된 기본 방법에 비해 훨씬 더 광범위한 법의학적 적용 가능성을 확인시켜 줍니다. 동시에 이 프레임워크는 인간 관찰자를 능가하여 법의인류학이 더욱 지능적이고 자동화되는 데 도움이 될 수 있는 잠재력을 탐구할 수 있는 잠재력을 가지고 있습니다.
또한, Grad-CAM은 두개골을 통해 성별을 식별하는 딥러닝 기반 네트워크 모델의 해석 가능성을 보여주었습니다. 이러한 통합으로 인해 법의인류학에 대한 평가가 보다 표준화되고 객관적으로 이루어졌으며, 인지적 편견과 변동성의 영향이 감소했습니다.
AI, 법의인류학의 새로운 장을 열다
실제로, 법의인류학에서 성별 식별을 강화하기 위해 AI를 활용하는 것에 대한 연구가 많이 있습니다. 우연히도 Scientific Reports에 포함된 관련 논문에서는 많은 획기적인 방법을 공개했습니다.
예를 들어, "사후 컴퓨터 단층촬영에서 얻은 두개골 실루엣 이미지를 이용한 딥러닝을 통한 성별 추정"이라는 제목의 연구에서는 CT 스캔을 사용하여 딥러닝을 위한 2차원 실루엣 이미지를 얻고, 두개골의 윤곽 모양을 향상시킨 다음, 다양한 각도에서 실루엣 이미지를 관찰하고 다수결 투표를 실시하여 성별을 결정했습니다.
서류 주소:
https://www.nature.com/articles/s41598-024-74703-y
쓰촨대학교 컴퓨터과학과와 서중국기초의학법의학원이 공동으로 개발한 딥러닝 기반 두개안면 재구성 방법이 CT 스캔 두개골 데이터에서 두개안면 이미지를 자동으로 복원하는 데 성공했습니다. 연구팀은 두개안면 복원의 기술적 어려움을 극복하고 최초의 두개안면 재건 얼굴 복원 시스템을 개발했다고 언급했습니다. 이 시스템은 두개골 데이터를 기반으로 서로 다른 연령과 성별의 복원된 얼굴을 생성하지만 일관된 신원을 유지합니다. 이를 통해 신원 인식에 미치는 연령이나 변형 변화의 영향을 제거하고, 이를 통해 인식 정확도를 향상시킵니다.
"CR-GAN: 개인 식별을 위한 자동 두개안면 재구성"이라는 제목의 논문은 패턴 인식 분야의 최고 저널인 패턴 인식에 게재되었습니다.
서류 주소:
https://www.sciencedirect.com/science/article/abs/pii/S0031320321005768
물론, 뼈만으로 성별을 식별하는 것은 두개골에만 의존하는 것은 아닙니다. 앞서 언급했듯이, 뼈 구조는 남성과 여성의 특성에 대한 많은 차별화된 정보를 숨깁니다. 예를 들어, 남성과 여성 골반의 서로 다른 생리적 기능으로 인해 골반은 성별 식별에 있어 매우 뚜렷하게 차별화된 특징을 갖습니다. 이러한 특성을 바탕으로 관련된 딥러닝 기반 성별 식별 방법도 동시에 연구되고 있습니다.
요약하자면, AI의 인기는 법의인류학에서 성별 식별 문제에 대한 객관적이고 지속 가능한 해결책을 제공합니다. 또한 이를 통해 이 신비롭고 틈새 시장인 분야는 오래된 식별 방법에서 벗어나 다른 분야와 마찬가지로 지능과 자동화를 점차 수용하게 되었습니다.
참고문헌:
1.https://www.nature.com/articles/s41598-024-81718-y
2.https://www.csiro.au/en/news/All/News/2025/February/CSIRO-develops-AI-tool-for-rapid-identification-in-forensic-investigations
3.https://blog.csdn.net/qq_68308828/article/details/132663304
4.https://mp.weixin.qq.com/s/bpZCZMM5MJRShhZvI2fcsw
마지막으로, 여러분께 학술 생중계를 추천하고 싶습니다! 3월 7일 정오 12시, 최신 Meet AI4S 라이브 방송은 "AI 시대의 그녀의 힘: 하드코어 기술 하의 변화"라는 주제로 진행되었으며,화중과학기술대학교 황홍 준교수, 상하이인공지능연구소 AI과학센터 청년연구원 주동잔, 상하이교통대학교 자연과학연구소 조교수 주빙신개인적 성과를 소개하고 과학 연구 경험을 공유하세요.