HyperAI초신경

국내 광칩 개발에 큰 혁신이 일어났습니다! 청화대 연구팀은 신경망을 사용하여 최초의 풀포워드 지능형 광 컴퓨팅 훈련 아키텍처를 구축했습니다.

特色图像

2012년 이후 AI 모델 학습에 필요한 컴퓨팅 파워는 3~4개월마다 두 배로 늘어났으며, AI 학습 모델에 필요한 컴퓨팅 파워는 매년 최대 10배씩 증가했습니다. 이는 다음과 같은 과제를 제시합니다.AI를 더 빠르고 효율적으로 만들려면 어떻게 해야 할까? 답은 아마도 빛의 세계에 있을지도 모른다.

광 컴퓨팅,빛의 속도와 속성을 활용해 머신 러닝 애플리케이션에 새로운 수준의 속도와 에너지 효율성을 제공한다고 주장하는, 잠재력이 넘치는 분야입니다. 하지만 이러한 목표를 달성하려면 어려운 문제, 즉 광학 모델을 효율적으로 훈련시키는 방법을 해결해야 합니다. 과거에는 사람들이 광학 시스템을 시뮬레이션하고 훈련하기 위해 디지털 컴퓨터에 의존했지만, 광학 시스템에 필요한 정밀한 모델과 방대한 양의 훈련 데이터로 인해 광학 시스템의 성능은 크게 제한되었습니다. 게다가 시스템의 복잡성이 증가함에 따라 이러한 모델을 구축하고 유지 관리하는 것이 점점 더 어려워지고 있습니다.

최근에,청화대학교의 다이 치옹하이(Dai Qionghai) 원사와 방루(Fang Lu) 교수가 이끄는 연구팀은 광자 전파의 대칭성을 포착하여 신경망 학습에서의 전방 전파와 후방 전파를 빛의 전방 전파와 동일시하고 완전 전방 모드(FFM) 학습 방법을 개발했습니다.FFM 학습을 통해 연구자들은 수백만 개의 매개변수를 갖는 딥 광 신경망(ONN)을 훈련할 수 있을 뿐만 아니라, 초고감도 인식과 효율적인 전광학적 처리를 달성하여 광학 시스템 모델링에 대한 AI의 한계를 완화할 수 있습니다.

"광 신경망을 위한 완전 순방향 모드 학습"이라는 제목의 연구는 최고의 학술지인 네이처에 성공적으로 게재되었습니다.

연구 하이라이트:

* 현장에서 머신 러닝 작업의 효율적인 병렬화를 가능하게 하여 수치 모델링의 한계를 완화합니다.

* 주어진 네트워크 크기에 대한 최첨단 광학 시스템을 도입했으며 FFM 학습을 통해 수백만 개의 매개변수를 갖는 가장 깊은 광학 신경망을 학습하면 이상적인 모델과 비슷한 정확도를 달성할 수 있음을 보여주었습니다.

* FFM 학습은 학습 과정을 엄청나게 빠르게 할 수 있을 뿐만 아니라, 딥 러닝 신경망, 초감각 지각, 위상 광자학의 개발을 앞당길 수도 있습니다.

서류 주소:

https://doi.org/10.1038/s41586-024-07687-4

오픈소스 프로젝트인 "awesome-ai4s"는 100개가 넘는 AI4S 논문 해석을 모아 방대한 데이터 세트와 도구를 제공합니다.

https://github.com/hyperai/awesome-ai4s

7. 다층 분류 실험에서 위상이 0으로 설정된 입력 복합 필드를 생성하기 위한 대규모 데이터 세트 집계

이 연구에서는 총 7개의 데이터세트가 사용되었습니다. 다층 분류 실험에서 각 샘플은 위상이 0으로 설정된 입력 복소수 필드를 생성하는 데 사용되었습니다.

* MNIST 데이터 세트.이 데이터 세트는 10개 카테고리의 손으로 쓴 숫자 모음으로, 60,000개의 훈련 샘플과 10,000개의 테스트 샘플로 구성되어 있습니다.

* 패션-MNIST 데이터 세트.이 데이터 세트에는 10가지의 다양한 패션 제품 카테고리가 포함되어 있으며, 60,000개 샘플의 훈련 세트와 10,000개 샘플의 테스트 세트로 구성됩니다.

* CIFAR-10 데이터 세트.이 데이터 세트는 50,000개의 훈련 이미지와 10,000개의 테스트 이미지를 포함하는 8,000만 개의 작은 이미지 데이터 세트의 하위 집합입니다.

* ImageNet 데이터 세트.이 데이터 세트는 각 노드가 수백 개에서 수천 개의 이미지로 표현되는 WordNet 계층 구조로 구성된 이미지 데이터베이스이며, 총 1억 2천만 개의 이미지가 학습용이고 5만 개의 이미지가 테스트용입니다.

* MWD 데이터 세트.이 데이터 세트에는 야외 풍경의 4가지 날씨 조건(일출, 맑음, 비, 흐림) 이미지가 포함되어 있습니다. 총 1,125개의 샘플이 포함되어 있으며, 그 중 800개는 훈련에 사용되고 325개는 테스트에 사용됩니다.

* 아이리스 꽃 데이터 세트.데이터 세트는 3종의 아이리스 종으로 구성되어 있으며, 각 종에는 50개의 샘플이 있습니다. 데이터 세트의 각 원본 예제에는 아이리스 꽃의 모양을 설명하는 4개의 항목이 포함되어 있습니다. PIC 실험에서는 각 항목을 복제하여 4개의 동일한 데이터 포인트를 생성했고, 그 결과 총 16개의 입력 데이터 채널이 생성되었습니다.

* 크롬 타겟 데이터 세트.데이터 세트는 다양한 영역(반사 및 반투명)을 지닌 유리 크롬 판으로 구성되어 있습니다. 반사 영역은 물리적 장면 자체(문자 표적 T, H, U)를 나타내며, 훈련 중에는 단일 반사 영역이 사용되어 동일한 평면에서 이동하여 9개의 서로 다른 훈련 장면을 생성했습니다.

광학 시스템을 재매개변수화하고 미분 가능한 내장 광자 신경망 FFM을 구축합니다.

전통적으로 광학 관련 인공지능은 아래 그림 a에서 볼 수 있듯이 오프라인 모델링과 최적화를 통해 설계되었는데, 이로 인해 설계 효율성과 시스템 성능이 제한되었습니다. 또한, 다양한 기능을 실현하기 위해 일반적인 광학 시스템은 굴절률의 조정 가능성을 활용합니다.광학 시스템은 변조 영역(짙은 녹색)과 전파 영역(연한 녹색)의 두 가지 영역으로 나뉩니다.아래 그림 b와 같습니다.

전통적인 광학 시스템 설계의 그림

이 연구에서는 맥스웰 방정식으로 제어되는 광학 시스템이 미분 가능한 내장 광자 신경망으로 재매개변수화될 수 있으며, 신경망의 경사 하강 훈련이 이러한 개발을 촉진하는 핵심 요인임을 발견했습니다. 그러므로,본 연구에서 FFM의 머신러닝 원리는 아래 그림 c에 나타나 있다.광학 시스템의 일부를 신경망으로 매핑하고 뉴런에 연결할 수 있으므로 입력과 출력 사이에 차별화 가능한 현장 신경망을 구성할 수 있습니다.

FFM의 머신 러닝 원리

다음으로, 이 연구에서는 공간적 대칭 상호성, 공유된 전방 물리적 전파 및 데이터 측정, 오차 계산을 활용하고, 현장 기울기를 계산하여 설계 영역(그림 c의 오른쪽 위 및 왼쪽 아래 영역)의 굴절률을 업데이트했습니다. 현장 경사 하강을 통해 광학 시스템은 점차 수렴합니다(그림 c의 오른쪽 아래 영역).

객체 분류를 위한 단일 계층 광 신경망 학습, FFM 학습은 이상적인 모델과 비슷한 정확도를 달성합니다.

FFM 학습의 효과를 보여주기 위해 이 연구는 먼저 벤치마크 데이터 세트를 사용하여 객체 분류를 위한 단일 계층 광 신경망을 학습한 다음, 그림 1a에서 FFM 학습을 사용하여 딥 프리 공간에서 광 신경망의 자체 학습 과정을 보여주고, 그림 1b에서 MNIST 데이터 세트에 대한 학습 결과를 시각화했습니다.

단일 레이어 광 신경망 학습 다이어그램

아래 그림 c에 표시된 것처럼,실험적 광장과 이론 광장 사이의 구조적 유사성 지수(SSIM)는 0.97을 초과합니다.이는 높은 수준의 유사성을 나타냅니다. 아래 그림 d에서는 이 연구에서 패션-MNIST 데이터 세트 분류를 위해 다층 광 신경망을 사용하는 방법을 추가로 분석했습니다. 연구진은 층수를 2개에서 8개로 점진적으로 늘려가면서 FFM 학습을 활용함으로써신경망의 성능은 86.5%, 91.0%, 92.3%, 92.5%로 향상될 수 있으며, 이는 이론적인 컴퓨터 시뮬레이션 정확도에 가깝습니다.

다층 광 신경망의 학습 결과

위의 결과를 바탕으로 본 연구에서는 아래 그림 f와 같이 비선형 FFM 학습을 제안하였다. 데이터 전파 중에 출력은 다음 계층으로 들어가기 전에 비선형적으로 활성화되므로 비선형 활성화의 입력을 기록하고 관련 기울기를 계산할 수 있습니다. 전방 전파만 필요하므로 FFM이 제안한 비선형 학습 패러다임은 일반적으로 측정 가능한 비선형 함수에 적용할 수 있으며, 따라서 광전자 및 전광 비선형 광 신경망에 적용할 수 있습니다. 그뿐만 아니라,비선형 광 신경망의 분류 정확도는 90.4%에서 93.0%로 증가했습니다.아래 그림 g와 같습니다.

비선형 FFM 학습의 학습 결과

FFM 학습은 복잡한 광자 시스템의 설계를 단순화하여 동적으로 숨겨진 객체의 모든 광학적 장면 재구성 및 분석을 가능하게 합니다.

연구에서는 또한 다음 사실을 발견했습니다.FFM 학습은 오프라인 수치 모델링으로 인한 한계를 극복하고 복잡한 광자 시스템의 설계를 단순화합니다.예를 들어, 이 연구에서는 각각 아래 그림 a와 b에서 포인트 주사 산란 영상 시스템을 보여주고, 입자군 최적화(PSO)를 사용하여 다양한 고급 최적화 방법을 분석합니다. 결과에 따르면 그래디언트 기반 FFM 학습은 더 높은 효율성을 보였으며, 두 실험 모두에서 25번의 설계 반복 후 수렴했으며, 두 산란 유형에서 각각 1.84와 2.07의 수렴 손실 값을 나타냈습니다. 이와 대조적으로 PSO 방법은 수렴하기 위해 최소 400번의 설계 반복이 필요하며 최종 손실 값은 각각 2.01과 2.15입니다.

포인트 스캐닝 산란 영상 시스템 및 최적화 방법 비교

아래 그림 c에 표시된 것처럼, 이 연구는 FFM 자체 설계의 진화를 분석하여, 처음에는 무작위로 분포되었던 강도 프로파일이 점차 좁은 지점으로 수렴된다는 것을 보여주었습니다. 아래 그림 d에서, 이 연구는 FFM과 PSO를 사용하여 초점 최적화의 반치폭(FWHM)과 최대 신호 대 잡음비(PSNR) 지표를 더욱 비교했습니다. FFM을 사용하는 경우 평균 FWHM은 81.2μm이고 평균 PSNR은 8.46dB입니다.

FFM 자체 설계 진화 분석 및 PSO 최적화 초점 비교

연구에서는 또한 다음 사실을 발견했습니다.현장 FFM 학습은 특히 정확한 모델링이 불가능한 상황에서 비전통적인 이미징 방식을 설계하는 데 귀중한 도구를 제공합니다.예를 들어, 비가시선(NLOS) 임무 및 기타 시나리오입니다. 아래 그림 a에서 보듯이 FFM 학습은 모든 광학적 장면 재구성과 동적인 숨겨진 객체의 분석을 가능하게 합니다. 아래 그림 b는 NLOS 이미징을 보여줍니다. FFM이 설계한 파면은 3개 글자의 모양을 모두 회복하였고, 각 타겟의 구조적 유사도 지수는 1.0에 도달했습니다.

비전통적 이미징 모드와 NLOS 이미징의 예시

FFM 학습 방식은 동적 이미징 기능 외에도 NLOS 영역에서 숨겨진 객체에 대한 완전한 광학 분류를 가능하게 합니다. 본 연구에서는 FFM의 분류 성능을 인공신경망(ANN)의 분류 성능과 비교하였다. 결과는 아래 그림 c에 나타나 있다.충분한 광자의 경우 FFM과 ANN의 성능은 비슷하지만, FFM은 정확한 분류를 위해 더 적은 광자가 필요합니다.

FFM과 ANN의 분류 성능 비교

FFM 학습은 통합 광자 시스템의 자체 설계로 확장될 수 있습니다. 시뮬레이션이 수렴하는 데 약 100사이클이 걸립니다.

이 연구는 FFM 학습 방법이 집적 광자 시스템의 자체 설계로 확장될 수 있음을 발견했습니다. 아래 그림 a에서 보듯이, 이 연구에서는 직렬 및 병렬로 연결된 대칭 광자 코어로 구성된 통합 신경망을 사용하여 FFM 학습을 달성합니다. 행렬의 대칭성으로 인해 오차 전파 행렬과 데이터 전파 행렬이 동등해질 수 있음이 보여집니다.

FFM을 통합 광자 시스템으로 확장

아래 그림 e는 전체 신경망의 오차를 시각화한 것입니다. 결과는 80번째 반복에서 다음과 같습니다.FFM 학습은 컴퓨터 시뮬레이션 학습보다 낮은 기울기 오류를 보입니다.

신경망 오류 시각화

아래 그림 f에 표시된 것처럼 설계 정확도의 진화에서이상적인 시뮬레이션과 FFM 실험 모두 수렴하는 데 약 100사이클이 필요하지만, FFM 방식의 정확도가 가장 좋습니다.

이상 시뮬레이션과 FFM의 설계 정확도 비교

지능형 광 컴퓨팅 산업 체인은 점차 성숙해졌으며 새로운 시대의 문턱에 서 있을 수도 있습니다.

본 논문의 연구 결과를 바탕으로 언급할 가치가 있는 점은 다음과 같습니다.연구팀은 '태극권-II' 광학 훈련 칩을 출시했습니다."태극권-II"의 개발은 이전 세대 "태극권" 개발 후 불과 4개월 만에 이루어졌으며, 관련 연구 결과도 Science에 게재되었습니다. 본 논문의 실험 결과는 다음과 같다.태극권은 엔비디아의 H100보다 에너지 효율이 1,000배 더 높습니다.이 강력한 컴퓨팅 기능은 연구팀이 개척한 분산형 광역 지능형 광 컴퓨팅 아키텍처를 기반으로 합니다.
논문 링크:

https://www.science.org/doi/10.1126/science.adl1203

새로운 Taichi 시리즈 제품의 출시로 지능형 광 컴퓨팅이 다시 한번 업계에 화제를 불러일으키고 있습니다.하지만 실제적인 관점에서 보면, 물리적 하드웨어, 소프트웨어 개발, 응용 프로그램 등 어떤 측면에서든 지능형 광 컴퓨팅은 여전히 추가적인 최적화와 탐색이 필요합니다. 실제로 지능형 광 컴퓨팅 연구 시스템은 점점 더 성숙해지고 있습니다. 베이징대학, 저장대학, 화중과학기술대학 등 많은 기관과 대학이 참여하고 있으며, 관련 학술 교류도 점차 빈번해지고 있습니다. 그러나 구체적인 응용 방향에 있어서는 다양한 대학의 저명한 인사로 구성된 연구팀은 서로 다른 초점을 두고 있습니다. 예를 들어:

* 청화대학교의 Dai Qionghai 원사 팀:이 팀이 이 논문의 저자입니다. 연구진이 개발한 차세대 AI 광전자 융합 칩은 지능형 이미지 인식, 교통 상황 인식, 얼굴 인식 등의 응용 시나리오에서 실험을 완료했습니다. 동일한 정확도로 이 팀의 연구 결과는 기존 GPU의 연산 능력을 3,000배, 에너지 효율을 400만 배 증가시켰으며, 자율주행, 로봇 비전, 모바일 기기 등의 분야에서 기존 컴퓨팅 아이디어를 뒤집을 것으로 기대됩니다.

* 화중과학기술대학 동건지(Dong Jianji) 팀:연구팀이 개발한 광전자 하이브리드 칩은 인간의 표정 인식 응용을 완성했습니다.

* Shanghai Jiao Tong University의 Xu Shaofu 팀:연구팀이 개발한 광전자 융합 칩 시리즈는 인공지능, 신호처리 등의 분야에 응용되었으며, 의료영상 재구성 등의 측면에서 계산실험을 완료했습니다.

좋은 소식은 연구자들의 끊임없는 노력 덕분에 우리나라의 지능형 광 컴퓨팅 칩 개발이 기본적으로 외국과 동등한 수준에 도달했다는 것입니다. 지난 5년 동안 전 세계적으로 광 컴퓨팅에 참여하는 회사의 수는 몇 개에서 수십 개로 급격히 증가했습니다. 해외에서는 세계 최고의 인공지능 슈퍼컴퓨터 구축에 주력하는 루미너스컴퓨팅(Luminous Computing)과 광자기술을 활용해 AI 및 고성능 컴퓨팅 워크로드의 성능과 에너지 절감을 향상시키는 라이트매터(Lightmatter)가 대표적인 기업입니다. 두 회사 모두 1억 달러 이상의 자금을 조달했습니다.

중국에서는 Xizhi Technology와 Photonic Arithmetic 등의 회사도 국제 광컴퓨팅 산업 경쟁에 참여했습니다.이러한 스타트업은 모두 광 컴퓨팅에 초점을 맞추고 있으며, 특히 광 칩을 기반으로 하는 광 컴퓨팅 가속기에 주력하고 있으며, 소프트웨어, 시스템, 원리 기계에 대한 연구 개발 지원도 수행하고 있습니다. 간단히 말해서, 우리나라의 광컴퓨팅 산업 사슬은 점차 성숙해지고 있으며, 관련 산학연 시스템이 효과적이고 효율적으로 운영되고 있습니다. 또한 우리는 이 새로운 시대에 지능형 광 컴퓨팅이 디지털 경제의 발전과 새로운 생산성을 위한 강력한 원동력을 제공할 수 있을 것으로 기대합니다.