LSTM은 252배의 속도 향상을 통해 스탠포드, UCLA 및 기타 기관에서 2차 비선형 광학 시뮬레이션을 밀리초 단위로 구현하는 데 사용되었습니다.

4일 전

2차 비선형 광학은 비선형 광학에서 가장 중요하고 널리 사용되는 핵심 분야입니다. 이 분야는 강한 레이저가 중심 반전 대칭이 없는 특수한 광학 결정과 상호 작용할 때 2차 비선형 편광률 χ⁽²⁾에 의해 지배되는 광학적 효과를 주로 연구합니다. 간단히 말하면,고강도 레이저 빔이 이러한 종류의 결정에 들어가면 광자는 "에너지 병합 및 주파수 재결합"을 거쳐 완전히 새로운 주파수와 색상의 광선을 직접 생성합니다.이를 통해 2차 고조파 발생(SHG), 합주파수 발생(SFG), 차주파수 발생(DFG)과 같은 고전적인 비선형 변환이 가능해집니다. 현대 광학 연구에서,2차 비선형 광학은 양자 정보, 집적 광자 칩, 생체 영상, 고출력 레이저 시스템과 같은 분야의 핵심적인 물리적 기반입니다.

현재 2차 비선형 광학 과정에 대한 이론적 연구는 상당히 성숙했지만, 실제 엔지니어링 및 실험 구현에는 여전히 상당한 병목 현상이 존재합니다.한편으로, 컴퓨팅 파워 비용은 높습니다.기존의 푸리에 기반 시뮬레이션 알고리즘은 초고속 광장의 진동 변화를 정확하게 계산해야 할 뿐만 아니라, 매질 내에서 빛이 분할되어 전달되는 과정을 시뮬레이션하기 위해 분할 단계 푸리에 방법(SSFM)을 사용해야 합니다. 이로 인해 수치 시뮬레이션에는 막대한 계산 자원이 요구됩니다. 특히 고반복률 레이저 실험과 같은 실시간 시나리오에서는 적응 제어 및 실시간 파라미터 최적화에 대한 요구가 증가함에 따라 이러한 문제가 더욱 두드러지게 나타날 것입니다.

반면에 그 모델은 현실과 동떨어져 있다.기존의 물리 모델은 이상화되어 있어 실험 오차, 환경 잡음, 장비 시스템 드리프트와 같은 실제 불안정 요인을 제대로 반영하지 못합니다. 또한, 실제 환경에 적응할 수 있는 유연성이 부족하여 실험 결과와 실제 응용 분야 간의 괴리를 초래합니다. 더욱이, 광학 디지털 트윈과 다단계 비선형 체인 공동 시뮬레이션 기술의 발전으로 실시간 시뮬레이션과 실험적 연계 기능을 결합한 새로운 도구가 산업계에서 필수적인 요소가 되었습니다.

이에 대한 응답으로, 순환 신경망(RNN)을 광섬유 펄스 전파에 적용한 기존 연구에서 영감을 받아 스탠포드 대학교, UCLA, SLAC 국립 가속기 연구소의 연구팀이 연구를 진행했습니다.본 논문에서는 계산 비용을 크게 줄이면서도 SFG의 출력 광장을 빠르고 정확하게 예측할 수 있는 장단기 메모리(LSTM) 네트워크 기반의 대체 모델을 제안합니다.해당 모델은 SLAC 연구실의 LCLS-II(Linac Coherent Light Source II) 광음극 구동 레이저 엔드링크 모델에서 생성된 SSFM 시뮬레이션 데이터 세트를 사용하여 훈련되었습니다.기존 모델에 비해 계산 속도가 252배 향상되었습니다.이는 레이저 시스템의 실시간 최적화, 데이터 융합 모델링 및 디지털 트윈을 위한 중요한 기술적 기반을 마련했습니다.

"χ⁽²⁾ 비선형 광학을 위한 딥러닝 기반 모델링"이라는 제목의 관련 연구 결과가 Advanced Photonics에 게재되었습니다.

연구 하이라이트:

* 딥러닝 모델을 완전 결합 다중 필드 2차 비선형 광학 편광 동역학 시스템으로 확장함으로써 비선형 광학 모델링의 계산 속도, 유연성 및 적용성을 종합적으로 향상시킬 수 있습니다.

* 단일 NVIDIA A100 GPU에서 배치 크기 200으로 실행했을 때, 단일 샘플 추론 시간은 7.43밀리초로 단축되었으며, 이는 SSFM 모델 대비 252배 향상된 결과입니다.

본 연구는 수치 시뮬레이션과 실제 실험 응용 사이의 간극을 메워 효율적이고 확장 가능하며 지능적인 광자 시스템 설계를 위한 새로운 연구 방향을 제시합니다.

서류 주소:
https://go.hyper.ai/5bLoA

χ⁽²⁾ 비선형 광학을 위한 고정밀 시뮬레이션 데이터 세트 구축

본 연구에 사용된 데이터 세트는 SLAC 연구소의 LCLS-II 선형 가속기에 있는 코히런트 광원의 광음극 구동 레이저 시스템에 대한 전체 프로세스 시뮬레이션 모델을 기반으로 합니다. 이 시스템은 1,035nm 모드 고정 적외선 레이저 광원, 프로그래밍 가능한 스펙트럼 셰이퍼, 처프 펄스 증폭기 및 비선형 주파수 변환 모듈을 포함합니다(그림 a 참조). 다양한 펄스 패턴을 구현하기 위해,본 연구에서는 2차 분산, 3차 분산 및 스펙트럼 진폭 형성 매개변수를 무작위로 샘플링하여 10,000개의 펄스 형성 구성을 생성했습니다.위상 조절만을 사용한 구성은 400개 이상이었다. 각 구성은 SSFM을 이용한 고정밀 시뮬레이션을 거쳤으며, 최종적으로 비선형 결정 내 100개의 투과 슬라이스에서 3개의 결합된 광장 데이터 포인트(SHG1, SFG, SHG2)를 얻었고, 단일 필드 샘플링 포인트 수는 32,768개였다.

데이터 전처리 단계에서 본 연구는 3단계 프로세스를 채택했습니다(위 그림 b 참조). 첫 번째 단계에서는 주파수 영역에서 광장을 잘라내고 다운샘플링하여 SFG 광장을 348개의 복소수 값으로, 두 개의 SHG 광장을 각각 1,892개의 복소수 값으로 줄입니다. 두 번째 단계에서는 각 광장의 실수부와 허수부를 연결하여 8,264개의 요소로 이루어진 고정 길이의 실수 벡터를 생성합니다. 세 번째 단계에서는 전체 데이터 세트의 극값을 기준으로 벡터의 모든 요소를 [0,1] 구간으로 정규화합니다.최종 데이터 세트는 89만 개의 훈련 샘플, 1만 개의 검증 샘플, 그리고 9만 개의 테스트 샘플로 구성되었습니다.

LSTM 기반 시퀀스 프록시 모델 아키텍처 구축

LSTM 모델은 시퀀스 대 시퀀스 아키텍처를 사용하며, 비선형 결정의 각 이산 조각을 시간 단계로 취급합니다.이 네트워크는 2,048개의 은닉 유닛과 그 뒤에 각각 (2048, 4096), (4096, 4096), (4096, 8264) 크기의 세 개의 완전 연결 레이어로 구성됩니다. 세 개의 완전 연결 레이어는 아래 그림과 같이 각각 ReLU, Tanh, Sigmoid 활성화 함수를 사용합니다.

아래 그림에서 보는 바와 같이, LSTM 모델은 Adam 옵티마이저와 가중 평균 제곱 오차(wMSE) 손실 함수를 사용하여 최적화됩니다.

학습 과정에서 LSTM 모델은 10개의 공간 슬라이스 시퀀스를 입력으로 사용하여 다음 슬라이스를 예측합니다. 100개의 슬라이스로 구성된 시뮬레이션 데이터 세트마다, 시퀀스를 가로지르는 윈도우를 슬라이딩하여 100개의 입력-출력 샘플 세트를 생성합니다. 입력 시퀀스의 길이를 균일하게 유지하기 위해 처음 9개의 세트는 입력 시퀀스의 시작 부분에 추가됩니다. 최종 입력 학습 텐서의 형태는 (배치 크기, 10, 8264)이고, 출력 텐서의 형태는 (배치 크기, 8264)입니다.

LSTM 모델은 추론을 위해 자기회귀 방식을 사용합니다.먼저, 초기 슬라이스를 10회 반복하여 첫 번째 입력으로 사용합니다. 그런 다음, LSTM 모델은 다음 슬라이스를 예측하여 입력 시퀀스의 끝에 추가하고, 시퀀스에서 가장 앞쪽의 슬라이스는 제거합니다. 이때 입력 윈도우 길이는 항상 10으로 유지합니다. 이 과정은 100개의 공간 단계 전체에 대해 반복적으로 수행됩니다. 시퀀스 모델의 예측 결과를 이용하여 비선형 결정 내부의 전체 물리량의 변화 과정을 완벽하게 재구성할 수 있습니다.

정확성과 효율성이 모두 향상되었으며, 기준 시뮬레이션 대비 252배의 속도 향상을 달성했습니다.

LSTM 모델의 추론 성능을 평가하기 위해,본 연구에서는 파형 형태와 총 에너지 민감도를 모두 고려한 종합적인 오류 지표를 사용합니다.이 종합 지표는 세 가지 무차원 요소로 구성됩니다. 첫째, 면적으로 정규화된 파형의 코사인 유사도입니다. 이는 파형이 완벽하게 동일할 때 오차가 0이 되도록 반전 및 스케일링됩니다. 둘째, 전체 적분 강도를 기반으로 계산되고 에너지에 비례하는 정규화된 평균 제곱 오차(NMSE)로, 에너지 불일치에 대한 패널티를 부여하는 데 사용됩니다. 셋째, 두 강도 분포 곡선 세트 간의 바서슈타인 거리(Earth Mover's Distance, EMD)로, 강도의 국부적 재분포를 정확하게 감지할 수 있습니다.

파형 재구성 정확도

실험 설정 측면에서, LSTM은 단일 NVIDIA A10G GPU에서 약 180 에포크의 학습 후 수렴했으며, 학습 시간은 약 160시간이었습니다. 최종 학습 손실과 검증 손실은 각각 2.05 x 10⁻⁵와 2.03 x 10⁻⁵에 도달했습니다. 평가 방법은 예측 결과와 SSFM 시뮬레이션 결과 간의 결합 오차 지수를 계산하는 것이었습니다.

실험 결과와 관련하여, 정성적 효과를 시각적으로 나타내기 위해 SFG, SHG1, SHG2에 대한 결합된 시간 강도 오차 지표의 히스토그램과 통계량을 각각 작성하였다. 두 세트의 테스트 데이터셋은 SFG 오차 분포의 4분위수에서 무작위로 선택하였다. 시간 영역과 주파수 영역에서 SFG와 이에 해당하는 SHG1의 예측 강도 곡선과 실제 강도 곡선은 아래 그림과 같이 나타낸다.

아래 두 이미지 세트는 오류 분포의 최상위 사분위수에서 가져온 두 가지 추가 예시를 보여주며, 서로 다른 형상 조건에서 LSTM 모델의 성능을 강조합니다. 결과에 따르면 두 모델의 결합 오류 지수는 각각 0.012와 0.003입니다. 두 조건 모두에서,LSTM 모델은 주파수 영역 또는 시간 영역에서 SFG와 SHG1을 정확하게 재구성할 수 있습니다. 스펙트럼 변조 진폭이 클 때만 SHG1에서 국부적인 편차가 나타납니다.이러한 예시들은 LSTM 모델이 다양한 스펙트럼 형태 조건에서도 우수한 일반화 성능을 달성할 수 있음을 보여줍니다.

*이는 순수 위상 조절이 주된 기능이며 스펙트럼 진폭 변조 정도가 극히 낮은 작동 조건에 해당합니다.*

모델 계산 효율성

아래 그림은 서로 다른 하드웨어 환경에서 LSTM 모델의 추론 시간을 보여줍니다. 기준 시뮬레이션은 SSFM 모델을 기반으로 하며, SSFM은 비선형 전파에 대한 주요 시간 소모 요소를 해결합니다.구체적으로, 단일 코어 CPU에서 전체 시뮬레이션은 1.98초가 걸리는 반면, SSFM 작업은 약 1.875초가 걸립니다. LSTM 모델은 배치 처리 오버헤드 때문에 단일 코어 CPU에서 기준 시뮬레이션과 거의 동일한 시간이 소요됩니다. 그러나 배치 크기가 200인 단일 NVIDIA A100 GPU에서는 단일 샘플 추론 시간이 7.43밀리초에 불과하여 기준 시뮬레이션보다 252배 빠릅니다.

결론

본 연구는 기존 경험을 바탕으로 역코사인 유사도, NMSE, EMD를 결합한 3-in-1 복합 평가 시스템과 같은 혁신적인 아이디어를 도입했습니다. 이 시스템은 다양한 펄스 형태와 에너지 스케일의 시각적 및 실제적 효과 평가에 적합하지 않았던 기존의 단일 지표를 개선하여 실험 결과의 신뢰성과 타당성을 높였습니다.

물론 LSTM의 가장 중요한 핵심 장점은 반복적인 시간-주파수 영역 변환을 필요로 하여 높은 계산 비용을 초래하는 기존 SSFM 모델을 완전히 혁신했다는 점입니다. LSTM은 단순화된 주파수 영역에서 매핑 관계를 직접 학습하기만 하면 되므로, 빈번한 단계별 푸리에 변환이 필요 없고 실시간 계산이 가능합니다. 더욱이, LSTM 모델은 SFG(Short Functional Gradient) 과정 외에도 다양한 2차 비선형 광학 시나리오에 적용될 수 있어 폭넓은 응용 가능성을 지니고 있으며 현재의 실험 및 실제 응용 분야의 요구에 부응합니다.

마지막으로, LSTM 모델의 성공적인 검증은 비선형 광학 시뮬레이션 분야에서 머신러닝 모델이 높은 효율성을 제공할 수 있음을 더욱 분명히 보여주며, 순수 수치 시뮬레이션과 물리적 실험 사이의 장벽을 허물고 효율적이고 대규모의 지능형 광전자 시스템 설계를 위한 새로운 기술 패러다임을 제시합니다.

LSTM은 252배의 속도 향상을 통해 스탠포드, UCLA 및 기타 기관에서 2차 비선형 광학 시뮬레이션을 밀리초 단위로 구현하는 데 사용되었습니다.

4일 전

"χ⁽²⁾ 비선형 광학을 위한 딥러닝 기반 모델링"이라는 제목의 관련 연구 결과가 Advanced Photonics에 게재되었습니다.

연구 하이라이트:

서류 주소:
https://go.hyper.ai/5bLoA

χ⁽²⁾ 비선형 광학을 위한 고정밀 시뮬레이션 데이터 세트 구축

LSTM 기반 시퀀스 프록시 모델 아키텍처 구축

아래 그림에서 보는 바와 같이, LSTM 모델은 Adam 옵티마이저와 가중 평균 제곱 오차(wMSE) 손실 함수를 사용하여 최적화됩니다.

Command Palette

LSTM은 252배의 속도 향상을 통해 스탠포드, UCLA 및 기타 기관에서 2차 비선형 광학 시뮬레이션을 밀리초 단위로 구현하는 데 사용되었습니다.

χ⁽²⁾ 비선형 광학을 위한 고정밀 시뮬레이션 데이터 세트 구축

LSTM 기반 시퀀스 프록시 모델 아키텍처 구축

정확성과 효율성이 모두 향상되었으며, 기준 시뮬레이션 대비 252배의 속도 향상을 달성했습니다.

파형 재구성 정확도

모델 계산 효율성

결론

Command Palette

LSTM은 252배의 속도 향상을 통해 스탠포드, UCLA 및 기타 기관에서 2차 비선형 광학 시뮬레이션을 밀리초 단위로 구현하는 데 사용되었습니다.

χ⁽²⁾ 비선형 광학을 위한 고정밀 시뮬레이션 데이터 세트 구축

LSTM 기반 시퀀스 프록시 모델 아키텍처 구축

정확성과 효율성이 모두 향상되었으며, 기준 시뮬레이션 대비 252배의 속도 향상을 달성했습니다.

파형 재구성 정확도

모델 계산 효율성

결론

관련 뉴스

홍수 예측 성능은 미국 국립기상청과 유사하며, 지식 기반 머신러닝 모델인 FHNN은 실시간 관측 데이터를 결합하여 예측 정확도를 향상시킵니다.

MIT 등이 개발한 GPU 전력 예측 프레임워크인 EnergAIzer는 평균 1.8초 만에 예측을 완료하며, 오차 범위는 약 81 TP3T입니다.

GTC 2026 | 베라 루빈부터 네모클로까지: 엔비디아의 미래는 GPU를 넘어설까?

구글의 글로벌 홍수 예측 시스템이 버전 2로 업그레이드되어, 신뢰할 수 있는 예측 기간이 6일 연장되었고 정확도가 크게 향상되었습니다.

스탠포드 대학교는 25,000건의 임상 데이터를 기반으로 최초의 네이티브 3D 복부 CT 시각 언어 모델인 멀린(Merlin)을 출시했으며, 이 모델은 752개 작업에서 선두를 달리고 있습니다.

논문 모음 | 과학 분야 AI의 주요 성과 100여 가지: 2025년까지의 기술 혁신에 대한 간략한 개요

MIT는 확산 모델에서 샘플링 지연 시간 병목 현상을 극복하기 위해 1.4~3.7배의 추론 속도 향상을 달성하는 DRiffusion을 제안합니다.

코넬 대학교는 전자 현미경 이미지를 2~5분 만에 재료 과학적 통찰력으로 변환할 수 있는 다중 에이전트 플랫폼인 EMSeek을 개발했습니다.

온라인 튜토리얼 | 휴머노이드 로봇, 인간 동작 생성, 확산 모델 미세 조정 등 NVIDIA의 최신 물리 AI 모델을 손쉽게 배포하세요.

Command Palette

LSTM은 252배의 속도 향상을 통해 스탠포드, UCLA 및 기타 기관에서 2차 비선형 광학 시뮬레이션을 밀리초 단위로 구현하는 데 사용되었습니다.

χ⁽²⁾ 비선형 광학을 위한 고정밀 시뮬레이션 데이터 세트 구축

LSTM 기반 시퀀스 프록시 모델 아키텍처 구축

정확성과 효율성이 모두 향상되었으며, 기준 시뮬레이션 대비 252배의 속도 향상을 달성했습니다.

파형 재구성 정확도

모델 계산 효율성

결론

관련 뉴스

홍수 예측 성능은 미국 국립기상청과 유사하며, 지식 기반 머신러닝 모델인 FHNN은 실시간 관측 데이터를 결합하여 예측 정확도를 향상시킵니다.

MIT 등이 개발한 GPU 전력 예측 프레임워크인 EnergAIzer는 평균 1.8초 만에 예측을 완료하며, 오차 범위는 약 81 TP3T입니다.

GTC 2026 | 베라 루빈부터 네모클로까지: 엔비디아의 미래는 GPU를 넘어설까?

구글의 글로벌 홍수 예측 시스템이 버전 2로 업그레이드되어, 신뢰할 수 있는 예측 기간이 6일 연장되었고 정확도가 크게 향상되었습니다.

스탠포드 대학교는 25,000건의 임상 데이터를 기반으로 최초의 네이티브 3D 복부 CT 시각 언어 모델인 멀린(Merlin)을 출시했으며, 이 모델은 752개 작업에서 선두를 달리고 있습니다.

논문 모음 | 과학 분야 AI의 주요 성과 100여 가지: 2025년까지의 기술 혁신에 대한 간략한 개요

MIT는 확산 모델에서 샘플링 지연 시간 병목 현상을 극복하기 위해 1.4~3.7배의 추론 속도 향상을 달성하는 DRiffusion을 제안합니다.

코넬 대학교는 전자 현미경 이미지를 2~5분 만에 재료 과학적 통찰력으로 변환할 수 있는 다중 에이전트 플랫폼인 EMSeek을 개발했습니다.

온라인 튜토리얼 | 휴머노이드 로봇, 인간 동작 생성, 확산 모델 미세 조정 등 NVIDIA의 최신 물리 AI 모델을 손쉽게 배포하세요.

관련 뉴스

홍수 예측 성능은 미국 국립기상청과 유사하며, 지식 기반 머신러닝 모델인 FHNN은 실시간 관측 데이터를 결합하여 예측 정확도를 향상시킵니다.

MIT 등이 개발한 GPU 전력 예측 프레임워크인 EnergAIzer는 평균 1.8초 만에 예측을 완료하며, 오차 범위는 약 81 TP3T입니다.

GTC 2026 | 베라 루빈부터 네모클로까지: 엔비디아의 미래는 GPU를 넘어설까?

구글의 글로벌 홍수 예측 시스템이 버전 2로 업그레이드되어, 신뢰할 수 있는 예측 기간이 6일 연장되었고 정확도가 크게 향상되었습니다.

스탠포드 대학교는 25,000건의 임상 데이터를 기반으로 최초의 네이티브 3D 복부 CT 시각 언어 모델인 멀린(Merlin)을 출시했으며, 이 모델은 752개 작업에서 선두를 달리고 있습니다.

논문 모음 | 과학 분야 AI의 주요 성과 100여 가지: 2025년까지의 기술 혁신에 대한 간략한 개요

MIT는 확산 모델에서 샘플링 지연 시간 병목 현상을 극복하기 위해 1.4~3.7배의 추론 속도 향상을 달성하는 DRiffusion을 제안합니다.

코넬 대학교는 전자 현미경 이미지를 2~5분 만에 재료 과학적 통찰력으로 변환할 수 있는 다중 에이전트 플랫폼인 EMSeek을 개발했습니다.

온라인 튜토리얼 | 휴머노이드 로봇, 인간 동작 생성, 확산 모델 미세 조정 등 NVIDIA의 최신 물리 AI 모델을 손쉽게 배포하세요.

관련 뉴스

홍수 예측 성능은 미국 국립기상청과 유사하며, 지식 기반 머신러닝 모델인 FHNN은 실시간 관측 데이터를 결합하여 예측 정확도를 향상시킵니다.

MIT 등이 개발한 GPU 전력 예측 프레임워크인 EnergAIzer는 평균 1.8초 만에 예측을 완료하며, 오차 범위는 약 81 TP3T입니다.

GTC 2026 | 베라 루빈부터 네모클로까지: 엔비디아의 미래는 GPU를 넘어설까?

구글의 글로벌 홍수 예측 시스템이 버전 2로 업그레이드되어, 신뢰할 수 있는 예측 기간이 6일 연장되었고 정확도가 크게 향상되었습니다.

스탠포드 대학교는 25,000건의 임상 데이터를 기반으로 최초의 네이티브 3D 복부 CT 시각 언어 모델인 멀린(Merlin)을 출시했으며, 이 모델은 752개 작업에서 선두를 달리고 있습니다.

논문 모음 | 과학 분야 AI의 주요 성과 100여 가지: 2025년까지의 기술 혁신에 대한 간략한 개요

MIT는 확산 모델에서 샘플링 지연 시간 병목 현상을 극복하기 위해 1.4~3.7배의 추론 속도 향상을 달성하는 DRiffusion을 제안합니다.

코넬 대학교는 전자 현미경 이미지를 2~5분 만에 재료 과학적 통찰력으로 변환할 수 있는 다중 에이전트 플랫폼인 EMSeek을 개발했습니다.

온라인 튜토리얼 | 휴머노이드 로봇, 인간 동작 생성, 확산 모델 미세 조정 등 NVIDIA의 최신 물리 AI 모델을 손쉽게 배포하세요.