HyperAIHyperAI

Command Palette

Search for a command to run...

MIT 연구팀은 2,000개 반도체 재료의 시뮬레이션된 스펙트럼 데이터를 기반으로 6가지 공존 치환 결함을 분석할 수 있는 DefectNet을 제안했습니다.

Featured Image

생물학에서 결함은 일반적으로 해로운 것으로 여겨집니다. 그러나 재료 과학에서는 결함을 의도적으로 설계하여 재료에 새롭고 유용한 특성을 부여할 수 있습니다. 오늘날 원자 수준의 결함은 강철, 반도체, 태양 전지 등의 제품 제조 공정에 정밀하게 도입되어 강도 향상, 전도성 제어, 성능 최적화 등을 실현하고 있습니다. 예를 들어, 실리콘에서는 제어된 도핑을 통해 전하 운반체 농도를 조절할 수 있으며, 마찬가지로 초광대역 밴드갭 반도체에서 결함을 설계하면 차세대 전력 전자 장치에 활용될 가능성을 높일 수 있습니다.

결함 분석은 강력한 도구로 자리 잡았지만, 특히 최종 제품을 절단하거나 손상시키지 않고 완제품에 존재하는 다양한 유형과 농도의 결함을 정확하게 측정하는 것은 여전히 매우 어려운 과제입니다. 재료에 존재하는 결함을 알지 못하는 엔지니어는 성능이 저하되거나 의도하지 않은 특성을 가진 제품을 생산할 수 있습니다. 기존의 다양한 결함 특성화 기술에도 불구하고, 감도, 선택성, 정량화 가능성 및 파괴성 측면에서 상당한 한계가 여전히 존재합니다.

이러한 맥락에서,MIT의 연구팀이 포논 상태 밀도(PDoS)에서 측정된 진동 스펙트럼으로부터 치환 점 결함의 화학적 유형과 농도를 직접 예측할 수 있는 DefectNet이라는 기본적인 기계 학습 모델을 제안했습니다.여러 원소가 존재하는 경우에도 이 모델은 구현 가능합니다. 2,000개 반도체 재료에서 얻은 16,000개 이상의 시뮬레이션 스펙트럼 데이터 포인트로 학습된 이 모델은 맞춤형 어텐션 메커니즘을 사용하여 0.21 TP³T에서 251 TP³T에 이르는 농도를 가진 최대 6개의 서로 다른 결함 원소를 식별합니다. 이 모델은 56개 원소를 포함하는 미지의 결정에서도 우수한 일반화 능력을 보여주며, 실험 데이터를 사용하여 미세 조정할 수 있습니다. SiGe 합금 및 MgB₂ 초전도체의 비탄성 산란 실험 데이터를 사용한 검증을 통해 모델의 정확성과 전이성을 입증했습니다.

"진동 스펙트럼을 이용한 비파괴적 결함 식별을 위한 기초 모델"이라는 제목의 관련 연구 결과는 arXiv에 사전 공개 논문으로 게재되었습니다.

연구 하이라이트:

진동 분광법을 이용한 포논 상태 밀도(PDoS) 측정과 머신 러닝을 결합하는 것은 벌크 재료 내 점 결함을 비파괴적으로 특성화하고 정량화하는 데 유망한 방법입니다.

* 결함이 있는 결정과 완벽한 결정의 포논 스펙트럼이 저농도 조건에서 거의 구별할 수 없다는 문제를 해결하기 위해 스펙트럼 주의 메커니즘을 도입합니다.

밀도범함수 이론(DFT) 기반 포논 시뮬레이션에서 발생하는 높은 계산 비용 문제를 해결하기 위해 기계 학습 기반 원자 간 포텐셜(MLIP)을 소개합니다.

서류 주소:

https://arxiv.org/abs/2506.00725

더 많은 AI 논문을 보려면 여기를 클릭하세요.

https://hyper.ai/cn/papers

데이터셋: 2,000개의 완벽한 결정질 물질을 기반으로 구축된 데이터셋

이 연구는 2,000개의 완벽한 결정질 물질로부터 16,000개의 도핑된 초격자를 포함하는 데이터 세트를 구축했습니다.아래 그림과 같이 이진, 삼진, 사원 및 오진 반도체를 다룹니다.

모화합물은 이원계에서 오원계까지 분류되며, 삼원계 화합물이 가장 흔합니다.

치환 결함은 아래 그림과 같이 주기율표의 첫 56개 원소(비활성 기체 도표 제외) 중에서 선택됩니다. 이러한 결함은 개별적으로 또는 조합하여 실제 공동 도핑 시나리오를 모사하고 향후 고차원 설계 공간에서 결함 엔지니어링을 위한 참고 자료를 제공할 수 있습니다.

생성된 모든 도핑된 초격자에서 도핑 원소의 히스토그램은 화학적 다양성을 보여줍니다.

연구진은 머신러닝 추천 시스템을 활용하여 도펀트 선택을 안내했습니다. 각 구조는 도펀트 추천 시스템을 통해 n형 및 p형 도펀트 후보에 대해 스크리닝되었습니다. 그런 다음 모결정을 433~500개의 원자를 포함하는 초격자로 확장하고, 희석 도핑 농도의 하한값을 약 0.2%로 유지하기 위해 크기를 적응적으로 조정했습니다. 도펀트를 모결정 격자에 치환하고, 각 도핑된 구조는 모든 원자 힘이 0.01 eV/Å 미만으로 수렴할 때까지 구조적 완화 과정을 거쳤습니다. 구조적 완화 후, 유한 변위법을 사용하여 PDoS를 계산하고 진동 특성을 평가하여 DefectNet의 스펙트럼 입력으로 사용했습니다.

* 구조적 이완이란 유리질 물질 내부의 원자 배열이 시간이 지남에 따라 또는 어닐링 과정 동안 점진적으로 더 안정적인 구조로 변형되는 과정을 말합니다.

DefectNet: PDoS 데이터를 이용하여 점결함의 화학적 유형과 농도를 비파괴적으로 직접 식별합니다.

DefectNet은 포논 스펙트럼으로부터 결함의 화학적 원소와 농도를 예측하는 데 사용됩니다. 전체적인 아키텍처는 4개의 모듈로 나눌 수 있습니다.워크플로는 아래 그림에 나와 있습니다. 이 모델의 목표는 손상 없이 PDoS에서 점결함의 화학적 유형과 농도를 직접 식별하는 것입니다.

DefectNet 워크플로우

데이터 생성

데이터 세트를 구축한 후, 연구진은 고정된 포논 형태의 MACE-MP-0 기본 MLIP를 사용하여 완벽한 결정과 도핑된 초격자에 대한 고처리량 구조 완화 및 포논 계산을 수행했습니다. 실험 해상도를 시뮬레이션하기 위해 계산된 PDoS 곡선에도 가우시안 평활화를 적용했습니다.

결함넷 입력

이 모델은 네 가지 유형의 입력을 받습니다. 모체인 완벽한 결정의 구성, 완벽한 결정의 PDoS(부분 결함 상태), 도핑된 시스템의 PDoS, 그리고 가능한 결함 화학에 대한 초기 추측값입니다. 초기 추측값은 사람의 직관이나 기존 지식을 통해 얻을 수도 있고, 가장 가능성이 높은 도핑 원소를 예측하는 확률 모델인 머신러닝 기반 결함 추천기를 통해 자동으로 생성할 수도 있습니다. 훈련 데이터는 시뮬레이션된 것이지만, 이 프레임워크 설계는 실험적인 분광 데이터(예: 비탄성 중성자 산란(INS) 데이터)에 맞게 미세 조정할 수 있습니다.

모델 아키텍처

DefectNet 모델은 PyTorch로 구현되었으며, 네 가지 주요 부분으로 구성된 모듈식 아키텍처를 채택하고 있습니다.

* 1차원 컨볼루션 기반 스펙트럴 인코더:입력은 도핑되지 않은 물질의 PDoS, 도핑된 물질의 PDoS, 그리고 호스트 결정의 조성 벡터라는 세 개의 1차원 신호(길이 100)로 구성됩니다. 이 정보들은 하나의 3채널 입력으로 연결되고, 1차원 컨볼루션 네트워크를 통해 특징이 추출되어 최종적으로 128차원 벡터인 100개의 "스펙트럼 토큰"이 생성됩니다.

* 도펀트 임베딩 모듈:도핑 후보에 대한 초기 추측값은 주어진 샘플에 대해 고려된 도핑 원소를 나타내는 56차원 이진 벡터로 제공됩니다. 이러한 이진 벡터는 완전 연결 계층을 통해 동일한 128차원 잠재 공간으로 투영되어 단일 도핑 임베딩 벡터를 생성합니다. 이 임베딩 벡터는 어텐션 메커니즘의 전역 쿼리 역할을 하며, 모델이 특정 도핑 환경에 따라 스펙트럼 특징 해석을 조정할 수 있도록 합니다.

* 멀티헤드 어텐션 메커니즘:도핑 후보 물질과 진동 특성 간의 상호작용을 모델링하기 위해 DefectNet은 다중 헤드 셀프 어텐션 메커니즘을 사용하며, 도핑 임베딩을 쿼리 Q로, 스펙트럼 특성을 키-값 행렬 V로 사용합니다. 어텐션 메커니즘은 표준 스케일링 내적 공식을 따릅니다.

* 도펀트 마스크 모듈:이 모델은 56개 도핑 원소에 대한 농도 예측값을 출력하지만, "하드 마스킹" 메커니즘을 통해 후보 원소에 대해서만 0이 아닌 출력값을 허용하고 손실 함수는 이러한 원소에 대해서만 계산합니다. 이는 세 가지 이점을 제공합니다. 첫째, 학습 안정성을 향상시키고, 둘째, 관련 없는 범주의 간섭을 방지하며, 셋째, 물리적 사전 정보와의 일관성을 유지합니다.

산출

최종 출력 특징은 초기 결함 추측을 기반으로 하드 마스킹되어 추측 집합에 포함되지 않은 도핑 농도가 제거됩니다. 이 메커니즘은 DefectNet의 예측 결함 농도가 처음에 가정한 결함 집합 내에 제한되도록 보장합니다. 따라서 초기 추측이 누락되었거나 불완전한 경우 모델은 특정 도핑 원소를 복구하지 못할 수 있습니다.

DefectNet은 6개의 공존하는 치환 결함을 해결할 수 있습니다.

DefectNet의 기능을 평가하기 위해 연구원들은 일련의 실험을 설계했으며, 그 결과는 다음과 같습니다.DefectNet은 0.2%만큼 낮은 농도에서도 최대 6개의 공존하는 치환 결함을 구분할 수 있으며, 상세한 원자 구조 정보 없이도 PDoS 데이터를 처리할 수 있습니다.

결함 유형 및 농도 예측에 있어 DefectNet의 적용

연구진은 먼저 일반적인 이원계(SiC, AlAs) 및 삼원계(AgGaS₂, InCuSe₂) 반도체를 모의 PDoS(분산도차지시스템)에서 테스트했습니다.

SiC와 AlAs는 각각 큰 밴드갭으로 인해 고출력 전자 장치 및 이종 구조 설계에서 매우 중요한 소재입니다. 아래 그림은 완벽한 결정과 도핑된 결정의 PDoS(부분 결함률)와 예측된 도핑 농도 및 실제 도핑 농도를 보여줍니다. 낮은 도핑 수준(약 1%)에서도 DefectNet은 미세한 진동 변화를 포착하여 정확한 도핑 농도를 안정적으로 계산할 수 있습니다.

DefectNet을 사용하여 일반적인 반도체(이진 반도체 SiC 및 AlAs에 대한 결과)에 대한 예측 결과를 나타낸 것입니다.

다음으로 연구진은 화학적으로 더 복잡한 3원계 반도체인 AgGaS₂와 InCuSe₂에 DefectNet을 적용했으며, 그 결과는 아래 그림에 나와 있습니다. AgGaS₂는 적외선 비선형 광학에 사용되고, InCuSe₂는 박막 태양광 발전용 유망 소재입니다. 이들 물질은 여러 개의 불균등한 원자 위치와 다양한 진동 모드를 포함하고 있습니다.하지만 DefectNet은 여전히 PDoS의 변화를 추적하고 도핑 농도를 추론할 수 있어 복잡한 구조와 화학 시스템에서도 견고함을 보여줍니다.

DefectNet을 이용한 대표적인 반도체 예측 결과 (삼원계 반도체 AgGaS₂ 및 InCuSe₂에 대한 결과).

연구진은 일반화 능력을 더욱 평가하기 위해 입력 데이터에는 존재하지만 실제로는 존재하지 않는 "간섭" 결함을 포함하여 다양한 도펀트가 공존하는 전체 결함 데이터 세트에서 DefectNet을 테스트했습니다. 아래 그림은 예측된 결함 농도(색깔 있는 점)와 실제 값(검은 점)을 비교한 결과를 평균 제곱 오차(MSE)의 사분위수로 그룹화하여 보여줍니다.

다양한 재료 및 결함 구성에 대한 DefectNet 예측 평가

분포 내(위 그림 a): 모체 결정은 훈련 데이터에 나타났지만 결함 정보는 알려지지 않았습니다.DefectNet은 광범위한 결함 유형 및 농도에 걸쳐 높은 정확도를 보여줍니다. 입력 데이터에 간섭성 결함이 포함되어 있더라도, 이 모델은 실제 도핑을 식별하고 간섭을 제거할 수 있습니다.

분포 외 시나리오(위 그림 b): 모체 결정이 학습 중에 나타나지 않아 예측 정확도가 약간 감소했습니다.하지만 DefectNet은 여전히 주요 도핑 특성을 포착하고 대부분의 간섭 결함에 거의 0에 가까운 농도를 할당할 수 있어 우수한 일반화 능력을 보여줍니다.

실험 데이터를 기반으로 DefectNet을 미세 조정합니다.

DefectNet의 실제 적용 가치를 검증하기 위해 연구진은 실험 데이터를 사용하여 모델을 미세 조정하고 테스트했습니다. 열전 SiGe 합금을 예로 들어, 연구진은 100개의 비정질 Si 초격자로 구성된 훈련 데이터 세트를 구축했습니다. 이 초격자들은 Si-GAP-18 데이터베이스에서 퀜칭 시뮬레이션을 통해 샘플링되었으며, 저에너지 준결정 상태부터 고도로 무질서한 상태까지 다양한 구조적 상태를 포함합니다. 구체적인 결과는 아래 그림에 나와 있습니다.

SiGe 합금의 실험적 검증에서 DefectNet의 미세 조정

무질서도가 증가함에 따라 PDoS 곡선이 넓어지고 60 meV 광학 포논 특성 피크가 억제됩니다(위 그림 a 참조). 이는 모델 미세 조정을 위한 모체 물질을 제공합니다. 이후 연구진은 비정질 Si 초격자에 Ge를 무작위로 치환하여 0%부터 25%까지 다양한 도핑 수준과 무질서도를 포함하는 SiGe 합금을 시뮬레이션했습니다.

미세 조정을 거친 후,DefectNet은 테스트 세트에서 0.019의 제곱근 평균 오차(RMSE)를 달성하여 강력한 예측 성능을 보여주었습니다(위 그림 b 참조).정밀하게 조정된 모델을 Si₁₋ₓGeₓ 합금(x = 5%, 10%, 20%, 위 그림 c)의 실험적 GPDoS 데이터에 적용했습니다. DefectNet은 Ge 농도를 각각 7%, 13%, 22%로 예측했으며, 이는 실험 결과와 매우 일치했습니다(위 그림 d).

비정질 물질의 결함을 정확하게 정량화하는 데 내재된 어려움을 고려할 때, 이 결과는 DefectNet이 실험 데이터에 대해 강력한 예측 능력을 가지고 있음을 보여줍니다. 알루미늄이 도핑된 다중 밴드 초전도체 MgB₂의 경우, 정밀하게 조정된 DefectNet은 최대 251TP⁻³T의 도핑 농도까지 실험적 경향을 재현할 수 있습니다.

결론: 전망은 밝지만, 당면 과제 또한 많습니다.

이 모델은 유망한 전망을 제시하지만, 적용에는 몇 가지 과제가 남아 있습니다. 예를 들어, 극히 낮은 결함 농도에서는 진동 특성이 약하고 노이즈에 쉽게 가려져 모델의 민감도가 저하됩니다. 현재 버전은 치환 도핑에만 적용 가능하며, 다양한 점 결함 유형(예: 격자간 원자, 공공, 프렌켈 쌍, 결함 클러스터)으로 확장하면 적용 범위가 크게 넓어질 것입니다. 시뮬레이션 데이터는 강력한 일반화 능력을 보여주지만, 실험 데이터에 대한 미세 조정은 여전히 필수적이며, 재학습 없이 원래 실험 스펙트럼에 직접 적용할 수 있는 모델을 개발하는 것은 장기적인 목표입니다.

앞으로 DefectNet은 결함 과학 분야에서 통합된 데이터 기반 패러다임을 향한 중요한 진전을 의미합니다. DefectNet의 아키텍처는 다중 모드 스펙트럼 입력과 본질적으로 호환되며, 특정 결함 특성을 가진 재료의 역설계 가능성을 열어줍니다. 물리 기반 표현, 고처리량 시뮬레이션, 확장 가능한 학습 및 실험적 미세 조정을 결합함으로써 DefectNet은 복잡한 실제 재료에서 자동화되고 해석 가능하며 비파괴적인 결함 엔지니어링을 위한 길을 제시합니다.

참고문헌:
1.https://news.mit.edu/2026/mit-researchers-use-ai-uncover-atomic-defects-materials-0330
2.https://arxiv.org/abs/2506.00725