Command Palette
Search for a command to run...
과학자들은 베이지안 최적화 프레임워크를 사용하여 갈륨 함유 물질을 역설계함으로써 독자적으로 새로운 물질을 만들어냈습니다. 최적화 결과는 독창성과 참신성을 보여줍니다.

현대 반도체 산업에서 소재 성능의 한계는 끊임없이 더 높은 차원으로 확장되고 있습니다. 고효율 태양광 발전 장치부터 고휘도 발광 다이오드(LED), 고주파 통신 및 양자 정보 시스템에 이르기까지 거의 모든 핵심 기술은 그 중심에서 핵심적인 성능에 의존합니다.재료의 전자 구조에 대한 정밀한 제어, 특히 밴드갭의 정밀한 설계.하지만 이러한 목표는 전통적인 재료과학 체계에서는 오랫동안 달성하기 어려운 과제였습니다.
그 이유는 물질의 전자적 특성이 단순히 단일 원소에 의해 결정되는 것이 아니라 복잡한 화학 결합, 결정 구조, 전자 궤도 혼성화, 그리고 여러 원소의 시너지 효과에 의해 영향을 받기 때문입니다. 수많은 물질 시스템 중에서 갈륨 기반 반도체는 독특한 위치를 차지합니다.갈륨은 뛰어난 화학적 다양성과 다가 상태 특성 덕분에 넓은 밴드갭에서 좁은 밴드갭에 이르기까지 다양한 전자적 특성을 조절할 수 있습니다.
갈륨 함유 화합물은 고효율 태양 전지, 고휘도 LED, 고주파 통신 장치와 같은 핵심 광전자 및 에너지 변환 기술의 중요한 기반 물질이 되었습니다. 또한 유연하고 생체 적합성이 뛰어나며 이식 가능한 전자 시스템을 위한 잠재적인 후보 물질로도 주목받고 있습니다. 그러나 수십 년간의 연구에도 불구하고 특정 전자적 특성을 목표로 하는 새로운 갈륨 함유 물질의 발견은 여전히 대부분 경험적 탐색에 의존하고 있습니다.이는 주로 부품의 방대한 설계 공간과 기본 원리에 기반한 계산의 높은 계산 비용으로 인해 제한됩니다.
이러한 배경에서 플린더스 대학교가 주도하고 아랍에미리트의 칼리파 대학교와 공동으로 진행한 연구팀은 화학적 합리성을 유지하면서 미리 정의된 전자적 특성을 갖는 갈륨 기반 부품의 역설계를 가능하게 하는 기계 학습 기반 베이지안 최적화(BO) 프레임워크를 제안했습니다.
이 통합 프레임워크를 활용하면,이 시스템은 화학적으로 효과적인 새로운 갈륨 함유 물질을 자율적으로 생성하고 0.5~3.5 eV 범위의 조절 가능한 밴드갭을 구현할 수 있습니다.이 에너지 범위는 태양 에너지, 광자학 및 전력 전자 분야의 응용에 매우 중요합니다. 베이지안 최적화 프로세스는 "원하는 개선"이 가장 높은 영역으로 탐색을 적응적으로 안내할 수 있습니다. 최적화된 분석 결과는 생성된 물질이 훈련 데이터에 비해 100%의 고유성과 참신성을 가지며, 1.5~2.5 eV 밴드갭 범위에서 SMACT 효율성이 크게 향상되었음을 보여줍니다.
"목표 밴드갭을 갖는 갈륨 함유 반도체의 베이지안 최적화 기반 발견"이라는 제목의 관련 연구 결과는 ACS Publications에 게재되었습니다.
연구 하이라이트:
새로운 프레임워크는 현실적인 화학적 제약 조건 하에서 역재료 설계를 가속화할 수 있으며, DFT(밀도 함수 이론) 기반의 기존 스크리닝 방법에 대한 대안을 제공합니다.
* 새로운 프레임워크는 화학적으로 타당한 영역을 효율적으로 포괄할 뿐만 아니라 기존 데이터베이스에 비해 높은 수준의 참신성과 구성 요소 다양성을 유지합니다.
* 본 연구는 기존의 정적 물성 예측의 한계를 뛰어넘어, 반도체 개발을 데이터 기반의 생성적 연구 패러다임으로 이끌어갑니다.

서류 주소:
https://pubs.acs.org/doi/10.1021/acsmaterialslett.5c01482
데이터셋: 실제 재료 데이터베이스를 활용한 화학 학습 공간 구축
본 연구에서는 NOMAD 및 Materials Project 데이터베이스를 사용하여 모델을 학습시켰습니다.데이터에는 재료의 화학적 조성과 그에 상응하는 실험적 밴드갭 값이 포함됩니다.예를 들어 Ga₄P₄, GaAs, GaN, Ga₂O₃ 등이 있습니다. 초기 데이터 세트에는 2,530개의 물질 조성과 해당 밴드갭 기록이 포함되어 있습니다.
데이터 품질을 확보하기 위해 "구성" 또는 "밴드갭" 열에 결측값이 있는 샘플을 제거했습니다. 물리적으로 유효하지 않거나 음수인 밴드갭 데이터도 제거하고 중복 레코드를 삭제하여 최종적으로 모델링에 사용할 수 있는 유효한 구성 요소 1,578개를 남겼습니다. 또한, 화학적으로 동등한 용어를 병합하기 위해 pymatgen 패키지를 사용하여 화학식 문자열을 표준화했습니다. 밴드갭 단위는 줄(J)에서 전자볼트(eV)로 균일하게 변환했습니다. 전처리된 데이터 세트에서 밴드갭은 0.0~5.92eV 범위였으며, 평균은 약 1.8eV, 표준편차는 1.6eV였습니다.
이 연구는 재료 구성을 더욱 선별하여 미리 정의된 원자 번호 집합에 속하는 원소를 포함하는 화합물만 남겨두어 연구가 갈륨 기반 재료 시스템에 집중되도록 했습니다. 또한 다음과 같은 몇 가지 추가 기능도 구축했습니다.
* 각 화학식에 포함된 원소의 수
화학식 문자열의 길이
* 갈륨의 존재 여부를 나타내는 이진 지표
데이터셋은 화학적으로 유사한 화합물이 서로 다른 데이터셋에 동시에 나타나는 것을 방지하기 위해 "성분 수준"에서 무작위로 8:2 비율로 훈련 세트와 테스트 세트로 분할되었습니다. 또한, 5겹 교차 검증을 사용하여 다양한 데이터 분할 조건에서 모델의 견고성을 평가했습니다.
프레임워크: 머신러닝과 베이지안 최적화의 공동 설계
본 연구에서는 화학적 제약 조건을 적용한 베이지안 최적화(BO) 프레임워크를 제안한다.아래 그림에서 보는 바와 같이, 먼저 갈륨 기반 복합 재료 데이터셋으로 학습된 그래디언트 부스팅 회귀 모델을 사용하여 재료의 밴드갭을 예측합니다. 그런 다음 베이지안 최적화를 통해 제한된 조성 공간에서 반복적으로 탐색합니다. 마지막으로, 생성된 후보 재료들을 SMACT 및 pymatgen 도구를 사용하여 화학적 타당성, 참신성 및 고유성을 기준으로 선별함으로써, 이전에 연구되지 않았던 최상의 성능을 가진 갈륨 기반 복합 재료를 식별합니다.

예측 모델 레이어
본 연구에서는 선형 모델, 서포트 벡터 회귀(SVR), 랜덤 포레스트, 그래디언트 부스팅, K-최근접 이웃(KNN)을 포함한 8가지 머신러닝 회귀 알고리즘을 체계적으로 평가하였다. 연구 결과, 비선형 모델이 선형 모델보다 전반적으로 현저히 우수한 성능을 보였으며, 이는 재료 구성과 밴드갭 사이에 강한 비선형적 관계가 있음을 시사한다.KNN 모델이 0.812의 R² 값을 달성하며 최고의 성능을 보였고, 오류 지표 측면에서도 다른 모델들을 능가했습니다.
모든 후보 모델 중에서 KNN이 베이지안 최적화에서 최종적으로 대리 모델로 선택되었습니다.그 이유는 뛰어난 로컬 보간 기능을 갖추고 있으며 다양한 임의 분할 조건에서도 안정적인 성능을 유지하기 때문입니다.트리 기반 앙상블 모델과 달리 KNN은 구성 요소 특징 공간에서 이웃 관계를 보존할 수 있는데, 이는 유사한 비율의 요소를 가진 재료 간의 유사성을 식별하는 데 매우 중요합니다.
베이지안 최적화 시나리오에서 이러한 "국소 보존 능력"은 최적화 탐색이 종종 알려진 고품질 후보 근처의 잠재적 영역에 집중되기 때문에 특히 중요합니다. 따라서 KNN의 비모수적이고 국소적으로 적응적인 특성은 희소하게 샘플링된 재료 공간에서 높은 계산 효율성을 유지하면서 최적화 프로그램에 더욱 부드럽고 신뢰할 수 있는 탐색 지침을 제공할 수 있습니다.
베이지안 최적화 모듈
이 BO 워크플로는 KNN 대체 모델을 활용하여 목표 밴드갭에서 갈륨 함유 성분을 찾는 과정을 안내합니다."예상 개선" 획득 기능을 활용함으로써 "탐색"과 "활용" 사이의 균형을 맞추어 갈륨 중심 조성 공간에서 후보 화학양론을 생성합니다.
이 시스템은 다음과 같은 몇 가지 제약 조건을 설정합니다. 각 구성 요소는 최대 4개의 원소를 포함해야 하며, 후보 물질이 갈륨 기반 연구 주제와 관련성을 유지하도록 최소 갈륨 함량 요건을 충족해야 합니다.
화학적으로 제한된 필터층
생성된 모든 후보 물질은 SMACT 도구를 사용하여 검증해야 하며, 여기에는 전하 균형, 적절한 산화 상태 및 전기음성도 일관성과 같은 제약 조건이 포함되어야 합니다. 이는 생성된 물질이 수학적 공간에서 유효할 뿐만 아니라 화학적으로도 실현 가능한지 확인하기 위한 것입니다.
또한, 이 프레임워크는 SHAP를 활용하여 모델의 결정 논리를 분석하는 설명 가능한 인공지능(XAI) 방법을 통합함으로써 재료 예측을 "블랙박스"에서 "설명 가능한 시스템"으로 전환합니다.
현실적인 화학적 제약 조건 하에서 역재료 설계를 가속화합니다.
연구진은 모델의 성능, 구조적 특징, 해석 가능성 및 화학적 타당성을 평가하고 분석하기 위해 일련의 실험을 설계했습니다.
모델 성능 평가
모델 성능 평가 측면에서 KNN 모델은 교차 검증에서 약 0.60 ± 0.07의 R² 값과 약 1.02 eV의 RMSE 값을 나타내며 안정적인 결과를 보였고, 이는 희소한 화학 공간에서 모델의 일반화 능력이 우수함을 시사합니다.
아래의 특징 중요도 분석에서 볼 수 있듯이, 융점, 전기음성도 범위 및 전기음성도 편차는 밴드갭 예측에 영향을 미치는 핵심 요소이며, 이는 재료의 결합 강도 및 전하 이동 거동과 밀접한 관련이 있습니다. 전기음성도 차이가 커질수록 밴드갭은 감소하는 경향이 있으며, 융점과 응집 에너지가 증가할수록 밴드갭은 커지는 경향을 보입니다. 이는 기존 반도체 물리학과 매우 일치하는 패턴입니다.

데이터를 통해 실제 화학 법칙을 학습하는 능력
생성 단계에서 베이지안 최적화는 1,025개의 갈륨 함유 후보 성분을 제안했는데, 그중 38개만이 SMACT 스크리닝을 통과하여 화학적 타당성 제약 조건이 매우 엄격했음을 나타냅니다.이러한 효과적인 물질들은 주로 2.0~2.5 eV 범위에 집중되어 있는데, 이는 이 영역에서 이온 결합과 공유 결합 특성을 모두 갖는 중간 밴드갭 반도체를 형성하기가 더 용이하다는 것을 의미합니다. 이러한 결과는 Ga₂O₃(≈4.8 eV) 및 Ga₂S₃(≈2.5 eV)와 같은 기존 시스템과 매우 일치합니다.
BO 검색 프로세스는 또한 알려진 갈륨 함유 화학 계열(예: Ga–O, Ga–N, Ga–As/Sb)로 클러스터링되는 경향을 보이며, 이러한 영역에서 Ga₀.₅₁As₀.₁₆N₀.₂₄Sb₀.₁₀, Ga₀.₁₇₁Sb₀.₁₇₅O₀.₃₆₇F₀.₂₈₆와 같은 새로운 중간 화학양론을 제안합니다.
밴드갭이 넓은 물질(>3.0 eV)의 경우, 알고리즘은 강한 Ga-O 결합이 밴드갭을 넓히는 데 도움이 되기 때문에 산소가 풍부한 화합물을 선호합니다. 반면, 밴드갭이 낮은 물질(약 1.5~2.0 eV)은 일반적으로 산소를 황, 셀레늄 또는 인으로 치환하여 더 강한 p-p 상호작용을 도입함으로써 얻어집니다. 이러한 패턴은 기존 실험 관찰 결과와 매우 일치하며, 이는 모델이 데이터로부터 실제 화학적 규칙을 "암묵적으로 학습"할 수 있었음을 나타냅니다.
실제 세계의 "구조-물성 관계"를 포착하는 능력
생성된 갈륨 함유 조성물이 "물리적으로 실현 가능한" 물질에 해당하는지 확인하기 위해, 연구팀은 박 연구팀 등이 개발한 Chemelon-dng 모델을 사용하여 아래 그림과 같이 결정 원형을 예측했습니다.

SMACT로 검증된 후보 물질들은 사면체 및 팔면체 갈륨 중심이 지배적인 화학적으로 타당한 배위 환경을 나타냈으며, 이는 Ga₂O₃, GaN, GaSe와 같은 알려진 결정 원형과 매우 일치합니다. 대리 모델은 경험적으로 일관된 전자 구조 계층 관계, 즉 산화물: 3.5–4.8 eV, 칼코게나이드: 1.8–2.6 eV, A족 질소 화합물: 약 1.2–2.0 eV, 즉 산화물 밴드 갭 > 칼코게나이드 밴드 갭 > A족 질소 밴드 갭을 성공적으로 재현했습니다.
이 결과는 다음을 나타냅니다.이 베이지안 최적화 워크플로는 이제 실제 세계의 "구조-물성 관계"를 효과적으로 포착할 수 있습니다.
검증된 38개의 유효 성분 중 어느 것도 기존에 알려진 물질과 중복되지 않았다는 점은 주목할 만하며, 이는 생성된 결과물이 "독창성"과 "화학적 일관성"을 모두 갖추고 있음을 더욱 입증합니다.
DFT 검증
연구진은 추가적으로 DFT 검증을 수행했습니다. 아래 표는 SMACT 검증을 통과한 10개 구성 요소에 대해 "모델 예측 밴드갭"과 "DFT 계산 밴드갭"의 비교 결과 및 해당 밴드갭 유형을 요약한 것입니다.

전반적으로 평균 절대 오차(MAE)는 0.890 eV, 제곱근 평균 제곱 오차(RMSE)는 1.158 eV, 중앙값 절대 오차는 0.784 eV였습니다. 일부 편향이 존재하지만, 이 결과는 물질 발견의 초기 스크리닝 단계에서 높은 실용적 가치를 지닙니다. 더욱 중요한 것은 검증된 모든 물질이 기존 데이터베이스에 존재하지 않는다는 점으로, 높은 독창성을 입증합니다.
결론
전반적으로, 본 연구는 갈륨 함유 반도체를 위한 새로운 소재 설계 패러다임을 제시합니다. 이는 머신러닝 모델링, 베이지안 최적화 탐색, 화학적 제약 조건 스크리닝의 시너지 효과를 통해 "데이터"에서 "새로운 소재"로 이어지는 자동화된 생성 경로입니다.
산업적 관점에서 볼 때, 이러한 접근 방식은 태양광 소재 설계, 발광 소자 개발, 그리고 광대역 반도체 연구에 잠재적 가치를 지닙니다. 특히 차세대 전력 전자 및 광전자 소자의 급속한 발전 속에서 밴드갭 제어가 가능한 소재에 대한 수요가 빠르게 증가하고 있으며, AI 기반 소재 설계 방법은 이러한 추세를 가속화하는 핵심 도구가 될 것으로 기대됩니다.
더 나아가, 이 프레임워크의 중요성은 갈륨 시스템에만 국한되지 않습니다. 이 방법론은 인듐, 주석, 심지어 무연 반도체 시스템에도 확장될 수 있으며, 복잡한 다성분 화합물의 합리적인 설계를 위한 일반적인 경로를 제공합니다. 이는 재료 과학에 있어 "경험에 기반한 시행착오"에서 "알고리즘 기반 생성"으로의 새로운 전환을 의미하며, 인공지능이 화학적 법칙과 재료 발견을 연결하는 핵심 다리 역할을 하게 됩니다.
참고문헌:
https://techxplore.com/news/2026-05-ai-discovery-gen-chips-electronic.html
https://pubs.acs.org/doi/10.1021/acsmaterialslett.5c01482








