코넬 대학교는 초고속 데이터와 무선 통신 신호를 동시에 처리하는 "마이크로파 두뇌" 칩을 개발하여 176밀리와트의 전력에서 75%의 정확도를 달성했습니다.

고대역폭 애플리케이션은 현대 사회의 구조를 눈에 보이지 않지만 심오한 방식으로 변화시키고 있으며, 디지털 경제, 공공 서비스, 산업 업그레이드를 포함한 다양한 분야에 걸쳐 효율적인 운영을 위한 "보이지 않는 네트워크"를 구축하고 있습니다. 간단한 탭으로 즐기는 국경 간 쇼핑부터 몰입형 클라우드 게임까지, 겉보기에 평범해 보이는 이러한 일상 경험은 고속 데이터 센터의 강력한 지원에 의존하며, 효율적인 운영을 보장하는 핵심 요소는 바로 높은 대역폭입니다.
그러나 고대역폭 애플리케이션에 필요한 고성능 컴퓨팅은 점점 더 비용이 많이 들고 있습니다. 필요한 샘플링 및 처리 클록 속도는 반도체 물리 법칙과 전력 제한으로 인해 제한됩니다. 결과적으로 클록 속도가 높을수록 전력 소비와 발열에 대한 부담이 커집니다. 예를 들어, 데이터 센터에서 사용되는 기존의 전자 신호 처리 체인에서는 신호가 손실 매체를 통과할 때 정확한 타이밍과 샘플링이 필요합니다. 이후 복잡한 동기화 회로를 사용하여 전송을 재구성하고 무결성을 복원하여 다음 노드로의 정확한 전달을 보장합니다. 이 프로세스는 광범위하고 전력 소모가 많은 병렬 처리에 의존하기 때문에 효율성 향상을 제한하는 심각한 병목 현상을 야기합니다.
딥러닝 기술은 고대역폭 애플리케이션에 대한 새로운 탐색 방향을 제공합니다.그러나 아날로그 컴퓨팅 모델과 딥 러닝을 결합한 현재 솔루션은 일반적으로 이미지, 음성, 제스처와 같은 저대역폭 애플리케이션만을 대상으로 합니다.고대역폭을 위해 설계된 마이크로파 광자 칩이 개발되었지만, 몇 가지 고정된 데이터 기능에 국한되며 크기가 크고 전력 효율이 낮은 등의 문제가 있습니다.
이러한 딜레마를 해결하기 위해 코넬 대학교 연구팀은 초고속 데이터와 무선 통신 신호를 동시에 처리할 수 있는 집적 회로인 마이크로파 신경망(MNN)을 제안했습니다. MNN은 정보는 희소하지만 대역폭이 넓은 입력 데이터의 특성을 포착하여 스펙트럼 성분을 처리합니다.이 기술의 장점은 메가헤르츠(MHz) 범위에서 저속 제어만 필요하면서도 프로그래밍 가능한 방식으로 수 기가헤르츠(GHz)에 달하는 신호를 처리할 수 있다는 것입니다.결합된 마이크로파 진동의 강한 비선형성을 활용하여 계산된 결과를 좁은 스펙트럼으로 표현하여 전자적으로 쉽게 판독할 수 있도록 합니다. 후처리 과정에서는 선형 회귀 모델을 사용하여 이진 출력으로 매핑할 수 있습니다.

더욱이 MNN은 탁월한 통합 기능을 자랑합니다. 표준 CMOS(Complementary Metal Oxide Semiconductor) 기술을 사용하여 제작되었으며, 칩 면적은 0.088mm²에 불과하고 전력 소모량은 200mW 미만으로 범용 아날로그 프로세서에 직접 통합할 수 있습니다.
관련 연구 결과는 "광대역 계산 및 통신을 위한 통합 마이크로파 신경망"이라는 제목으로 Nature Electronics에 게재되었습니다.
연구 하이라이트:
* 초고속 데이터와 무선통신 신호를 동시에 처리할 수 있는 최초의 저전력 집적회로를 연구·개발·제조하여 기존 디지털 회로의 틀을 깨고 마이크로파 물리 원리를 활용해 컴퓨팅을 실현
디지털 시계에 의존하는 기존 신경망과 달리 MNN은 마이크로파 주파수에서 아날로그, 비선형 동작을 활용하고, 수십 기가헤르츠에서 데이터 스트림을 처리할 수 있으며, 200밀리와트 미만의 전력을 소비하고, 88%의 정확도를 갖습니다.
* 레이더 추적, 휴대용 스마트 기기(스마트 워치 등) 및 기타 다양한 분야를 포함하는 광범위한 응용 시나리오를 통해 고대역폭 응용 프로그램을 위한 저전력, 고성능 및 경량 솔루션을 제공합니다.

서류 주소:
공식 계정을 팔로우하고 "Microwave Neural Network"에 답글을 남겨 전체 PDF를 받아보세요.
더 많은 AI 프런티어 논문:
훈련 데이터 생성: 다양한 작업에 맞춤화
디지털 시뮬레이션 백엔드 학습에서 MNN의 스펙트럼 데이터 출력에는 직접적인 디지털 출력이 아닌 원래 입력에서 추출된 정보가 포함됩니다. 이를 위해 연구진은 선형 회귀 모델을 사용하여 감소된 대역폭 내에서 측정된 625개 주파수를 처리하고 이러한 특징을 최종 출력에 매핑했습니다.
이후, 최적의 매개변수화된 비트스트림을 얻기 위해 연구진은 매개변수화된 비트스트림을 무작위로 선택하여 실험에 적용하였고, 최종적으로 각 작업에 대해 검증 성능/정확도가 가장 우수한 옵션을 선택했습니다. 다음은 특정 작업의 최적화 및 평가를 위한 데이터 설정입니다.
* 선형 탐색 및 조건 알고리즘 시뮬레이션 측면에서,각 매개변수화된 비트스트림에는 무작위로 생성된 500개의 32비트 시퀀스 데이터셋이 포함되어 있습니다. 10겹 교차 검증에서 데이터셋은 10개의 부분으로 나뉘었으며, 9개 부분은 학습에, 1개 부분은 검증에 번갈아 사용되었습니다. sklearn 소프트웨어 패키지의 선형 서포트 벡터 머신(SVM)을 사용했으며, 최대 반복 횟수는 5,000회이고, 제곱 힌지 손실 함수와 C=0.02의 정규화 매개변수를 사용했습니다. 테스트는 40개의 매개변수화된 비트스트림에 대해 수행되었습니다.
* 비트 수,선형 탐색과 유사하지만 반복 횟수가 최대 10,000회이고 하이퍼파라미터 범위가 0.02에서 0.22까지 C로, 선형 탐색 데이터 세트의 레이블을 사용하여 32개 클래스 분류 작업을 구성합니다.
* 기본 비트 연산(AND NOT, XOR 및 NOR)의 관점에서,로지스틱 손실과 L1 정규화 강도 0.3을 적용한 확률적 경사 하강법을 통해 선형 모델을 구축했습니다. 데이터셋은 무작위로 생성된 32비트 시퀀스 500개로 구성되었으며, 그중 16개는 고정 레이블 비트였습니다. 10겹 교차 검증을 사용하여 각 출력 비트에 대해 다중 레이블 분류를 수행하고 120개의 매개변수화된 비트스트림에 대해 테스트하는 과제를 수행했습니다.
* 코딩 분류 측면에서,RadioML2016.10A 데이터셋을 사용하여 훈련 세트와 검증 세트를 8:2 비율로 분할했습니다. 단일 계층 선형 모델은 PyTorch에서 교차 엔트로피 손실을 사용하여 학습한 후 AdamW(학습률 0.05, 가중치 감소 0.03, 배치 크기 128, 감쇠 계수 0.98)를 사용하여 150 에포크 동안 최적화했습니다. 학습 과정에서 데이터는 가우시안 잡음(표준 편차 0.01)을 추가하여 13개의 매개변수화된 비트스트림에서 테스트했습니다.
MNN 레이더 임무 평가에서 연구진은 디지털 신경망 백엔드를 사용하여 목표 비행 패턴을 예측했습니다. 각 캡처는 2GHz 광대역 스펙트럼을 제공했습니다. 각 시나리오의 입력은 (L, S)였으며, 여기서 L = 1000 캡처(해당 시나리오를 포함하는 총 시간 범위)이고 S는 스펙트럼 크기입니다. 그런 다음 연구진은 심층 ResNet 아키텍처를 사용하여 MNN 출력 스펙트럼 데이터를 직접 처리했습니다.
ResNet은 2겹 다운샘플링 풀링 계층과 두 개의 합성곱 계층(커널 크기 3)을 갖는 잔차 분기로 구성됩니다. 합성곱 계층 간에는 배치 정규화, 정류 선형 단위 활성화, 그리고 랜덤 드롭아웃 정규화가 사용됩니다.
모델 학습을 위해 연구진은 비트스트림 검색과 실험 출력으로 학습된 백엔드 신경망을 결합하여 원하는 분류 결과를 도출했습니다. 연구진은 물체 개수 계산 작업에서 가장 높은 정확도를 보이는 비트스트림을 선택하고, 500개의 비행 시나리오에서 실험 데이터를 수집하여 최종 모델을 학습했습니다. 백엔드 학습을 위해 연구진은 교차 엔트로피 손실, 이진 교차 엔트로피 손실, 그리고 평균 제곱 오차 손실을 사용하여 모델을 최적화했습니다.
마지막으로, 일반화 성능을 향상시키기 위해 연구진은 랜덤 시프트, 랜덤 바이어스, 랜덤 노이즈, 랜덤 마스킹을 포함하는 데이터 증강을 사용했습니다. 모든 증강 연산은 각 샘플에 20%의 확률로 적용되었습니다.
모델 아키텍처 및 방법: 비선형 시스템을 통한 순간 계산
MNN 마이크로칩의 전체 구조는 아래 그림과 같습니다. 초고속 데이터와 무선 통신 신호를 모두 처리할 수 있는 저전력, 경량 집적 회로로서, 연구팀은 이를 "뇌를 모델로 한 컴퓨팅 시스템"이라고 부릅니다.코어는 비선형 도파관(A로 표시)과 3개의 선형 도파관(각각 B, C, D로 표시)으로 구성되며, 이득 장치(E로 표시)와 커플러(F로 표시)로 구성됩니다.

구체적으로, MNN은 비선형 시스템입니다(작동 원리는 아래 그림 참조). MNN은 GSGSG(접지-신호-접지-신호-접지) 도파관을 통해 기가헤르츠 신호를 주입합니다. 두 개의 중첩된 금속층으로 구성된 소형 직교 하이브리드 커플러가 이러한 입력 신호의 전력을 개별 도파관에 분배합니다. 구동 신호의 이러한 작은 부분은 도파관에서 반사되어 커플러의 출력 포트에 추가된 후, 또 다른 GSGSG 도파관 세트를 통해 추출됩니다.
그 중 비선형 도파관의 주파수는 입사 마이크로파 구동 신호의 진폭과 위상에 크게 영향을 받지만 선형 도파관은 영향을 받지 않고 안정적인 공진 모드를 제공합니다.

주요 입력 감응 소스는 도파관 A 내의 캐스케이드 결합 비선형 공진기입니다. 이 공진기는 비선형 커패시터와 인덕터의 조합으로 구성됩니다. 반평행 다이오드는 다항식 비선형성을 갖는 커패시턴스를 생성하는 데 사용되며, 그 정도는 바이어스 전압과 마이크로파 신호 강도의 영향을 받습니다. 선형 도파관은 길이 조절이 가능한 전송선로입니다. 도파관의 길이를 따라 설치된 스위치를 통해 왜곡 없이 마이크로파 신호 복귀 경로의 길이를 조절할 수 있습니다.
더 중요한 것은,매개변수적(시간 가변적) 결합은 쌍으로 연결된 도파관 사이에 연결된 한 쌍의 스위치(Spar)에 의해 형성됩니다. 이 스위치들은 N형 금속 산화물 반도체(NMOS) 트랜지스터로 구성됩니다.스위치는 입력 데이터 속도의 100분의 1(150Mbit/s)로 실행되는 비트 스트림에 의해 제어되며, 이 비트 스트림은 세 번째 GSGSG 도파관을 통해 전송됩니다. 이러한 온-오프 매개변수 결합 시퀀스는 다양한 계산 작업을 위해 신경망의 패턴을 동적으로 재프로그래밍하는 데 핵심적입니다.
마지막으로, 고진폭 마이크로파 전송으로 인해 발생하는 회로의 비선형성을 유지하기 위해 얇은 게이트-산화물 전력 증폭기 단계 NMOS 트랜지스터를 사용하는 교차 결합 트랜지스터 쌍을 연구하여 재생 포화 이득을 제공했습니다.
이 설계는 기존 CMOS 발진기, 스펙트럼 분석을 위한 복잡한 펄스 샤프닝 회로, 그리고 수동으로 결합된 고품질 공진기를 통해 협대역 빗살을 생성하는 설계와 다릅니다.이 기술은 상용 CMOS 기술을 활용하여 결합된 광파관을 의도적으로 입력 마이크로파에 노출시키고 공진기 내부의 비선형성과 비대칭성을 활용하여 거의 즉각적인 계산을 달성합니다.
실험 설정 및 결과: 가장 높은 분류 정확도는 88%에 도달할 수 있으며 전력 소모는 200mW 미만입니다.
실험에서는,연구자들은 회로를 가장 기본적인 구성 요소까지 단순화하는 것이 도움이 될 것이라고 생각했습니다.따라서 선형 도파관을 도파관 A의 공칭 진동 주파수에서 크게 벗어나게 함으로써 물리적 회로 매개변수의 수가 감소합니다.
MNN의 비선형 동역학을 모델링할 때, 연구진은 일반화된 결합 모드 이론을 사용하여 MNN 회로 분석을 단순화하고 이를 결합 모드 모델로 축소했습니다. 선형 공진기는 스위치를 사용하여 전송선 길이를 조정함으로써 고유 주파수를 변경하는 LC 탱크 회로로 단순화되었습니다. 비선형 도파관은 다항식 비선형 커패시터로 구성됩니다. 회로의 손실은 시간 가변 결합을 갖는 교차 결합 트랜지스터 쌍으로 구현된 포화 이득 소자에 의해 보상됩니다.
그런 다음 실험 매개변수가 더욱 단순화되었습니다.비선형 분포 공진과 선형 공진기의 상호 작용에 초점을 맞추고, 매개변수로 구동되는 스위치를 조정 가능한 커패시터로 표현합니다.단순화된 회로의 비선형 동역학은 비선형 공진기와 선형 공진기 간의 결합, 내부 손실, 그리고 입력 구동과의 상호작용을 포함하는 일련의 결합 모드로 표현됩니다. 이러한 동역학은 비선형 바이어스 전압 초기 조건, 마이크로파 구동 및 느린 매개변수 비트 스트림의 영향을 받습니다.
회로 시뮬레이션 및 레이아웃을 위해 연구진은 Cadence Virtuoso 환경에서 GlobalFoundries의 45nm RF 실리콘 온 인슐레이터(SI) 공정 기반 트랜지스터 모델을 사용하여 CMOS 칩을 설계하고 시뮬레이션했습니다. Siemens의 Calibre 툴을 사용하여 기생 저항과 커패시턴스를 추출하고, 2.5D EMX 전자기 툴을 사용하여 도파관, 커플러 및 전송선의 레이아웃을 시뮬레이션하여 고주파 성능을 정확하게 모델링했습니다.
마이크로파 회로를 사용하여 고속 디지털 신호를 시뮬레이션하는 작업에서 사각파 신호로 구성된 기가비트 속도 디지털 신호는 본질적으로 스펙트럼이 수십 기가헤르츠에 달하는 아날로그 신호입니다.MNN은 마이크로파 회로의 특성을 이용하여 주파수 영역에서 직접 계산을 수행할 수 있다는 것이 보여졌습니다.이는 시간 영역에서 작동하는 기존 디지털 하드웨어와는 극명한 대조를 이룹니다. 신호를 처리할 때 MNN은 특정 진동 패턴을 가진 좁은 주파수 대역으로 출력을 제공합니다. 이를 통해 시간 영역에서 신호 무결성을 엄격하게 유지할 필요가 없으며, 넓은 대역폭의 입력 신호에서 특징을 포착할 수 있어 단일 계층 디지털 신경망을 학습하는 데 필요한 압축 특징의 수를 줄일 수 있습니다.
아래 그림은 고정 함수 디지털 CMOS 회로에 의존하지 않는 초고속 디지털 계산 시뮬레이션을 보여줍니다. 32비트 비트스트림이 150Mbit/s로 입력되고, 비선형 공진은 빠르게 반응하며, 스펙트럼 분석기는 출력을 기록하고 평균화하여 안정적인 푸리에 변환을 보장합니다. 계산 특성은 10~14GHz 범위(위성 통신용 X-밴드 및 Ku-밴드 주파수에 해당)에 집중되어 있습니다.

결과는 150 Mbit/s 32비트 매개변수 비트스트림의 내용을 조정하고 특정 스펙트럼 특징을 추출하면 8비트 NAND 연산과 같은 디지털 논리 연산에 대해 정확한 결과를 얻을 수 있으며, 손실이 있는 전송 케이블에도 불구하고 최고 측정 정확도는 약 85%에 달함을 보여줍니다. 또한, 수백 개의 논리 게이트로 구성된 총 카운터(입력 비트스트림에서 1의 개수를 세는 회로)는 매개변수화된 비트스트림을 사용하여 이러한 동작을 시뮬레이션하고 선형 계층을 통해 출력을 매핑함으로써 검증 세트에서 81%의 정확도를 달성했습니다.이는 등가 디지털 회로의 복잡성이 증가하더라도 컴퓨팅 능력이 크게 감소하지 않음을 보여줍니다.
또한 MNN은 매우 높은 정확도로 10Gbit/s 데이터 스트림에서 비트 시퀀스 검색을 수행하는 것으로 나타났으며, 이는 기존 통신에 사용되는 고전력 최대 우도 시퀀스 검출(MLSD) 기술에 대한 대안을 제공합니다.MNN은 검색 기능과 기술적 기능을 결합하여 조건부 알고리즘을 성공적으로 시뮬레이션했으며 전력 소모를 200mW(176mW) 이하로 유지하면서 75%의 정확도를 달성했습니다.
레이더 표적 탐지 작업에서 연구자들은 MNN이 미묘한 주파수 변화를 감지하는 능력이 광대역 레이더 응용 분야에 매우 적합하다는 것을 발견했습니다. 본 연구에서는 여러 항공기가 서로 다른 다각형 궤적을 따라 비행하는 공역 시나리오를 시뮬레이션했습니다. 레이더 반사 신호를 기록하여 아날로그 전압 파형으로 변환했습니다. 그런 다음 사각파를 중심 주파수에서 변조하여 MNN에 입력했습니다. 8~10GHz 주파수 범위 내의 평균 출력 응답을 추출하고, 디지털 신경망 백엔드를 사용하여 비행 궤적을 추론했습니다. 이는 아래 그림에 나와 있습니다.

결과는 500개의 비행 시나리오를 시뮬레이션한 후, MNN이 장기간에 걸쳐 포착된 주파수 변화에 대한 다양한 반응을 형성하여 비행 패턴을 학습하고, 이를 통해 목표 비행 패턴을 특성화할 수 있음을 보여줍니다. MNN은 동적 목표의 수를 예측하고, 특정 목표의 움직임을 분리하고, 목표의 속도를 추정할 수 있을 뿐만 아니라,또한 다양한 다각형 비행 궤적을 인식하고 항공기 수가 다른 시나리오에서도 높은 F1 점수를 달성할 수 있습니다.
무선 신호 분류 과제에서 연구진은 MNN의 최저 주파수 신호 처리 능력을 시험하고, 무선 통신 코딩 방식 식별에 대한 응용 가능성을 탐색했습니다. 실험에는 11가지 변조 유형(디지털 9개, 아날로그 2개)을 포함하는 RadioML2016.10A 데이터셋이 사용되었습니다. 다양한 기저대역 신호가 50MHz 반송파를 변조하여 MNN에 입력되었습니다. MNN은 감도를 활용하여 저주파 구동 신호의 과도 변환을 관측 가능한 특징으로 변환했습니다. 8~8.5GHz 범위에서 특징을 추출하여 백엔드 선형 계층을 학습시켰습니다.
결과에 따르면 일부 매개변수를 사용하면 MNN이 변조 분류 작업에서 매우 높은 정확도를 달성할 수 있으며, 무선 신호 분류 작업의 정확도는 디지털 신경망과 일치하는 88%에 도달할 수 있습니다.이는 MNN이 엣지 컴퓨팅에서 딥러닝 가속기로서 중요한 역할을 할 수 있을 뿐만 아니라, 모델 크기를 크게 줄일 수도 있음을 보여줍니다.
딥러닝과 아날로그 컴퓨팅은 엄청난 잠재력을 가지고 있습니다
서두에서 언급했듯이, 딥러닝 기술의 지속적인 발전은 고대역폭 응용 분야의 새로운 길을 열어주었습니다. 본 연구 이전에도 이미 여러 기관에서 이 분야를 탐구하고 수많은 연구 결과를 발표했습니다. 이러한 성과는 아날로그 컴퓨팅과 딥러닝 통합의 지속적인 발전과 혁신을 위한 이론적, 실무적 토대를 마련했습니다.
예를 들어, 코넬 대학 팀과 메릴랜드 대학 팀이 공동으로 발표한 논문 "아날로그 양자 저장소 컴퓨터를 사용한 마이크로파 신호 처리"에서는 다음과 같이 제안했습니다.초전도 마이크로파 회로를 양자 저장소로 사용한 양자 비선형 동역학의 연속 시간 시뮬레이션이 방법은 이산화 없이 아날로그 마이크로파 입력 신호를 직접 처리할 수 있으며, 연속 변수 시스템은 양자 저장소가 더 넓은 힐버트 공간에 접근할 수 있도록 합니다. 디지털 양자 회로에 기반한 기존 실험과 달리, 이 방법은 약한 아날로그 마이크로파 신호를 직접 수신하여 그 특징을 추출함으로써 입력 병목 현상을 극복할 수 있습니다.
서류 주소:
https://www.nature.com/articles/s41467-024-51161-8
또 다른 예로는 옥스퍼드 대학교, 뮌스터 대학교, 엑서터 대학교의 팀이 공동으로 발표한 "연속 시간 데이터가 있는 광자 텐서 코어를 사용한 고차원 처리"라는 제목의 연구가 있습니다.그 중, 연속시간 데이터 표현을 이용하여 공간, 파장, 무선 주파수의 3자유도를 개발하고, 3차원 배열 입력에 대한 행렬-벡터 곱셈(MVM) 계산을 실현하는 방법이 제안되었다.광자 메모리 컴퓨팅은 전기광학적으로 제어되는 광자 텐서 코어와 재구성 가능한 비휘발성 상변화 물질 메모리를 통해 구현됩니다. 시스템 병렬 처리는 최대 100으로, 자유도 2개만 사용하는 기존 구현 방식보다 두 자릿수(order)가 더 높아 광자 메모리 컴퓨팅에 무선 주파수 자유도를 추가하는 것이 가능함을 입증합니다.
서류 주소:
https://www.nature.com/articles/s41566-023-01313-x
코넬 대학이 제안한 MNN은 고대역폭 시나리오에서 아날로그 컴퓨팅과 딥러닝의 통합을 더욱 촉진합니다.이 기술은 디지털 시계에 의존하지 않고 마이크로파 물리학 원리를 사용하여 초고속 신호 처리를 달성합니다.MNN은 기존 디지털 회로의 전력 소비 및 대역폭 한계를 극복할 뿐만 아니라, 복잡한 작업에서 아날로그 컴퓨팅의 잠재력을 보여줍니다. 레이더 궤적 추적부터 무선 신호 분류에 이르기까지, 낮은 전력 소비와 작은 크기라는 장점을 가진 MNN은 엣지 컴퓨팅, 고속 통신 및 기타 분야에 새로운 패러다임을 제시합니다.
앞으로 동적 매개변수 조정, 종단간 공동 훈련 등의 기술이 발전하고 아날로그 컴퓨팅과 딥러닝을 통합하여 대역폭과 효율성의 병목 현상을 더욱 극복하고, 초고속 데이터 처리, 밀리미터파 통신 등 첨단 분야에 보다 폭넓은 응용 분야가 생길 것으로 기대됩니다.2023년부터 2024년까지 AI4S 분야의 고품질 논문과 심층 해석 기사를 클릭 한 번으로 받아보세요⬇️
