L'Université Cornell a Été La Pionnière d'une Puce « Cerveau micro-ondes » Qui Traite Simultanément Des Données À Très Haut Débit Et Des Signaux De Communication Sans Fil, Atteignant Une Précision De 75% À 176 Milliwatts De puissance.

Les applications à haut débit transforment la société moderne de manière invisible mais profonde, construisant un « réseau invisible » d'opérations efficaces dans divers secteurs, notamment l'économie numérique, les services publics et les modernisations industrielles. Des achats transfrontaliers d'un simple clic aux jeux en nuage immersifs, ces expériences quotidiennes apparemment ordinaires reposent sur la robustesse des centres de données à haut débit, et la bande passante élevée est la clé de leur bon fonctionnement.
Cependant, le calcul haute performance requis pour les applications à large bande passante devient de plus en plus coûteux. Les fréquences d'échantillonnage et de traitement requises sont limitées par la physique des semi-conducteurs et les limitations de puissance. Par conséquent, des fréquences plus élevées augmentent la pression sur la consommation d'énergie et la dissipation thermique. Par exemple, dans les chaînes de traitement de signal électroniques traditionnelles utilisées dans les centres de données, les signaux doivent être rythmés et échantillonnés avec précision lorsqu'ils transitent par des supports avec pertes. Des circuits de synchronisation complexes sont ensuite utilisés pour reconstruire la transmission et restaurer l'intégrité afin de garantir une transmission précise au nœud suivant. Ce processus repose sur un traitement parallèle intensif et gourmand en énergie, créant un goulot d'étranglement critique qui limite les gains d'efficacité.
La technologie d’apprentissage profond offre de nouvelles directions d’exploration pour les applications à large bande passante.Cependant, les solutions actuelles qui combinent des modèles informatiques analogiques avec l’apprentissage profond ne ciblent généralement que les applications à faible bande passante telles que les images, la voix ou les gestes.Même si des puces photoniques micro-ondes conçues pour une bande passante élevée ont été développées, elles sont limitées à quelques fonctions de données fixes et présentent des problèmes tels qu'une grande taille et une faible efficacité énergétique.
Pour résoudre ce dilemme, une équipe de l'Université Cornell a proposé un réseau neuronal micro-ondes (MNN), un circuit intégré capable de traiter simultanément des données ultra-rapides et des signaux de communication sans fil. Les MNN traitent les composantes spectrales en capturant les caractéristiques des données d'entrée, peu riches en informations mais à large bande passante.Son avantage est qu'il peut traiter des signaux couvrant plusieurs gigahertz (GHz) de manière programmable tout en ne nécessitant qu'un contrôle à faible vitesse dans la gamme des mégahertz (MHz).La forte non-linéarité des oscillations micro-ondes couplées est ensuite exploitée pour exprimer les résultats calculés dans un spectre étroit facilitant la lecture électronique. En post-traitement, ce résultat peut être converti en sortie binaire à l'aide d'un modèle de régression linéaire.

De plus, le MNN offre des capacités d'intégration inégalées. Fabriqué selon la technologie standard CMOS (semi-conducteur à oxyde métallique complémentaire), il occupe une surface de puce de seulement 0,088 mm² et consomme moins de 200 mW, permettant une intégration directe dans les processeurs analogiques polyvalents.
Les résultats de recherche associés ont été publiés dans Nature Electronics sous le titre « Un réseau neuronal micro-ondes intégré pour le calcul et la communication à large bande ».
Points saillants de la recherche :
* Recherche, développement et fabrication du premier circuit intégré basse consommation capable de traiter simultanément des données à très haut débit et des signaux de communication sans fil, brisant ainsi le cadre traditionnel des circuits numériques et utilisant les principes de la physique des micro-ondes pour réaliser des calculs.
Contrairement aux réseaux neuronaux traditionnels qui s'appuient sur des horloges numériques, les MNN utilisent un comportement analogique et non linéaire à des fréquences micro-ondes, peuvent traiter des flux de données à des dizaines de gigahertz, consomment moins de 200 milliwatts d'énergie et ont une précision de 88%.
* Large gamme de scénarios d'application, couvrant le suivi radar, les appareils intelligents portables (tels que les montres intelligentes) et d'autres domaines divers, offrant des solutions à faible consommation d'énergie, à hautes performances et légères pour les applications à large bande passante

Adresse du document :
Suivez le compte officiel et répondez « Microwave Neural Network » pour obtenir le PDF complet
Autres articles sur les frontières de l'IA :
Génération de données de formation : adaptées à de multiples tâches
Lors de l'entraînement en simulation numérique, les données spectrales produites par le MNN contiennent des informations extraites de l'entrée d'origine plutôt qu'une sortie numérique directe. À cette fin, les chercheurs ont utilisé un modèle de régression linéaire pour traiter les 625 fréquences mesurées dans une bande passante réduite et ont mappé ces caractéristiques sur la sortie finale.
Ensuite, pour obtenir le flux binaire paramétré optimal, les chercheurs ont sélectionné aléatoirement des flux binaires paramétrés et les ont exécutés dans l'expérience, sélectionnant finalement l'option offrant les meilleures performances et précisions de vérification pour chaque tâche. Voici la configuration des données pour l'optimisation et l'évaluation de tâches spécifiques :
* En termes de recherche linéaire et de simulation d'algorithme conditionnel,Chaque flux binaire paramétré contient un ensemble de données de 500 séquences de 32 bits générées aléatoirement. Lors d'une validation croisée en 10 étapes, l'ensemble de données a été divisé en 10 parties, dont 9 utilisées alternativement pour l'apprentissage et 1 pour la validation. Une machine à vecteurs de support linéaire (SVM) du logiciel sklearn a été utilisée avec un maximum de 5 000 itérations, une fonction de perte de charnière au carré et un paramètre de régularisation de C = 0,02. Les tests ont été réalisés sur 40 flux binaires paramétrés.
* Nombre de bits,Similaire à la recherche linéaire, mais avec un maximum de 10 000 itérations et un balayage d'hyperparamètres de C de 0,02 à 0,22, construction d'une tâche de classification de 32 classes avec des étiquettes de l'ensemble de données de recherche linéaire.
* En termes d'opérations binaires de base (AND NOT, XOR et NOR),Un modèle linéaire a été ajusté par descente de gradient stochastique avec une perte logistique et une force de régularisation L1 de 0,3. L'ensemble de données comprenait 500 séquences de 32 bits générées aléatoirement, dont 16 bits à étiquette fixe. À l'aide d'une validation croisée en 10 étapes, la tâche consistait à effectuer une classification multi-étiquettes sur chaque bit de sortie et à tester 120 flux binaires paramétrés.
* En termes de classification de codage,L'ensemble de données RadioML2016.10A a été utilisé, divisé en ensembles d'entraînement et de validation selon un ratio de 8:2. Un modèle linéaire monocouche a été entraîné dans PyTorch par perte d'entropie croisée, puis optimisé pour 150 époques avec AdamW (taux d'apprentissage : 0,05, décroissance pondérale : 0,03, taille de lot : 128 et facteur de décroissance : 0,98). Pendant l'entraînement, les données ont été enrichies d'un bruit gaussien (écart type : 0,01) et testées sur 13 flux binaires paramétrés.
Lors de l'évaluation de la mission radar MNN, les chercheurs ont utilisé un réseau neuronal numérique pour prédire les trajectoires de vol des cibles. Chaque capture a fourni un spectre large bande de 2 GHz. L'entrée pour chaque scénario était (L, S), où L = 1 000 captures (la durée totale du scénario) et S représente la taille du spectre. Les chercheurs ont ensuite utilisé une architecture ResNet profonde pour traiter directement les données spectrales de sortie du MNN.
ResNet se compose d'une couche de pooling à double sous-échantillonnage et d'une branche résiduelle avec deux couches convolutionnelles (taille du noyau : 3). La normalisation par lots, l'activation d'unités linéaires rectifiées et la régularisation des pertes aléatoires sont utilisées entre les convolutions.
Pour entraîner le modèle, les chercheurs ont combiné une recherche par flux binaire avec un réseau neuronal backend entraîné sur des sorties expérimentales afin d'obtenir les résultats de classification souhaités. Ils ont sélectionné les flux binaires présentant la plus grande précision lors de la tâche de comptage d'objets et ont collecté des données expérimentales issues de 500 scénarios de vol pour entraîner le modèle final. Pour entraîner le backend, les chercheurs ont optimisé le modèle en utilisant la perte d'entropie croisée, la perte d'entropie croisée binaire et la perte d'erreur quadratique moyenne.
Enfin, afin d'améliorer les performances de généralisation, les chercheurs ont eu recours à l'augmentation des données, incluant un décalage aléatoire, un biais aléatoire, un bruit aléatoire et un masquage aléatoire. Toutes les opérations d'augmentation ont été appliquées à chaque échantillon avec une probabilité de 20%.
Architecture et méthodes du modèle : calcul instantané via des systèmes non linéaires
La structure globale de la micropuce MNN est illustrée dans la figure ci-dessous. Ce circuit intégré léger et à faible consommation, capable de traiter à la fois des données ultra-rapides et des signaux de communication sans fil, est décrit par l'équipe de recherche comme un « système informatique calqué sur le cerveau ».Son cœur est constitué d'un guide d'ondes non linéaire (marqué A) et de trois guides d'ondes linéaires (marqués respectivement B, C et D), ainsi que d'une unité de gain (marquée E) et d'un coupleur (marqué F).

Plus précisément, le MNN est un système non linéaire (voir la figure ci-dessous pour son fonctionnement). Il injecte des signaux gigahertz via des guides d'ondes GSGSG (ground-signal-ground-signal-ground). Un coupleur hybride miniature en quadrature, constitué de deux couches métalliques superposées, distribue ensuite la puissance de ces signaux d'entrée aux guides d'ondes individuels. Ces petites portions du signal d'attaque sont ensuite réfléchies par les guides d'ondes et ajoutées au port de sortie du coupleur avant d'être extraites via un autre ensemble de guides d'ondes GSGSG.
Parmi eux, la fréquence du guide d'ondes non linéaire est grandement affectée par l'amplitude et la phase du signal d'entraînement micro-onde incident ; le guide d'ondes linéaire n'est pas affecté par cela et fournit un mode résonant stable.

La principale source sensible à l'entrée est constituée des résonateurs non linéaires couplés en cascade du guide d'ondes A. Ces résonateurs sont constitués d'une combinaison de condensateurs et d'inductances non linéaires. Des diodes antiparallèles sont utilisées pour générer une capacité présentant une non-linéarité polynomiale, dont le degré est affecté par la tension de polarisation et l'intensité du signal micro-ondes. Le guide d'ondes linéaire est une ligne de transmission de longueur réglable. Des commutateurs installés sur sa longueur permettent d'ajuster la longueur du trajet de retour du signal micro-ondes sans introduire de distorsion.
Plus important encore,Le couplage paramétrique (variable dans le temps) est établi par une paire de commutateurs (Spar) connectés entre les guides d'ondes appariés. Ces commutateurs sont composés de transistors NMOS (métal-oxyde-semiconducteur) de type N.Les commutateurs sont contrôlés par un flux binaire fonctionnant à un débit centième de celui des données d'entrée (150 Mbit/s), transmis via un troisième guide d'ondes GSGSG. Cette séquence de couplage de paramètres marche/arrêt est essentielle à la reprogrammation dynamique des schémas du réseau neuronal pour diverses tâches de calcul.
Enfin, pour maintenir la non-linéarité dans le circuit causée par la transmission micro-ondes de haute amplitude, une paire de transistors à couplage croisé utilisant des transistors NMOS à étage amplificateur de puissance à oxyde de grille mince est étudiée pour fournir un gain de saturation régénératif.
Cette conception est différente des oscillateurs CMOS traditionnels, des circuits complexes d'affinage des impulsions pour l'analyse spectrale et des conceptions qui génèrent des peignes à bande étroite via des résonateurs de haute qualité couplés passivement.Il utilise la technologie CMOS commerciale, exposant intentionnellement les guides d'ondes couplés aux micro-ondes d'entrée et exploitant les non-linéarités et les asymétries au sein du résonateur pour réaliser des calculs quasi instantanés.
Configuration expérimentale et résultats : La précision de classification la plus élevée peut atteindre 88%, avec une consommation d'énergie inférieure à 200 mW
Dans l'expérience,Les chercheurs ont pensé qu’il pourrait être utile de simplifier les circuits jusqu’à leurs composants les plus basiques.Ainsi, en rendant le guide d'ondes linéaire fortement désaccordé par rapport à la fréquence d'oscillation nominale du guide d'ondes A, le nombre de paramètres physiques du circuit est réduit.
Pour modéliser la dynamique non linéaire dans les MNN, les chercheurs ont utilisé la théorie généralisée des modes couplés afin de simplifier l'analyse du circuit MNN, le réduisant à un modèle en mode couplé. Le résonateur linéaire est simplifié en un circuit LC tank, dont la fréquence naturelle est modifiée en ajustant la longueur de la ligne de transmission à l'aide de commutateurs. Le guide d'ondes non linéaire est constitué de condensateurs non linéaires polynomiaux. Les pertes dans le circuit sont compensées par des éléments de gain saturés mis en œuvre par des paires de transistors à couplage croisé, avec un couplage variable dans le temps.
Les paramètres expérimentaux ont ensuite été encore simplifiés.L'accent est mis sur l'interaction des résonances distribuées non linéaires et des résonateurs linéaires, représentant les commutateurs à commande paramétrique comme des condensateurs accordables.La dynamique non linéaire du circuit simplifié est représentée par un ensemble de modes couplés, incluant le couplage entre le résonateur non linéaire et le résonateur linéaire, les pertes internes et l'interaction avec la commande d'entrée. Cette dynamique est affectée par les conditions initiales de la tension de polarisation non linéaire, la commande micro-ondes et le flux binaire lent.
Pour la simulation et l'agencement des circuits, les chercheurs ont conçu et simulé une puce CMOS à l'aide d'un modèle de transistor basé sur le procédé RF silicium sur isolant 45 nm de GlobalFoundries dans l'environnement Cadence Virtuoso. Ils ont utilisé l'outil Calibre de Siemens pour extraire la résistance et la capacité parasites, ainsi que l'outil électromagnétique EMX 2,5D pour simuler l'agencement des guides d'ondes, des coupleurs et des lignes de transmission afin de modéliser avec précision les performances haute fréquence.
Dans la tâche de simulation de signaux numériques à haut débit à l'aide de circuits micro-ondes, les signaux numériques à débit gigabit composés de signaux d'ondes carrées sont essentiellement des signaux analogiques avec un spectre couvrant des dizaines de gigahertz.Il est démontré que le MNN peut exploiter les caractéristiques des circuits micro-ondes pour effectuer des calculs directement dans le domaine fréquentiel.Cela contraste fortement avec le matériel numérique traditionnel, qui fonctionne dans le domaine temporel. Lors du traitement des signaux, les MNN présentent leurs sorties dans une bande de fréquences étroite avec des schémas d'oscillation spécifiques. Cela élimine la nécessité de maintenir strictement l'intégrité du signal dans le domaine temporel et leur permet de capturer des caractéristiques à partir d'une large bande passante du signal d'entrée, réduisant ainsi le nombre de caractéristiques compressées nécessaires à l'entraînement d'un réseau neuronal numérique monocouche.
La figure ci-dessous illustre la simulation d'un calcul numérique ultra-rapide sans recours à des circuits CMOS numériques à fonction fixe. Un flux binaire de 32 bits est reçu à 150 Mbit/s, la résonance non linéaire réagit rapidement, et l'analyseur de spectre enregistre et moyenne la sortie pour garantir des transformées de Fourier fiables. Les caractéristiques de calcul sont centrées sur la plage de 10 à 14 GHz (correspondant aux fréquences des bandes X et Ku pour les communications par satellite).

Les résultats montrent que l'ajustement du contenu d'un flux binaire paramétré 32 bits à 150 Mbit/s et l'extraction de caractéristiques spectrales spécifiques peuvent produire des résultats corrects pour les opérations logiques numériques, telles que les opérations NAND 8 bits, avec une précision mesurée optimale atteignant environ 85% malgré des câbles de transmission avec pertes. De plus, un compteur total (un circuit comptant le nombre de 1 dans un flux binaire d'entrée) composé de centaines de portes logiques a atteint une précision de 81% sur l'ensemble de validation en simulant ce comportement à l'aide d'un flux binaire paramétré et en mappant la sortie via une couche linéaire.Cela montre que sa puissance de calcul ne diminue pas de manière significative en raison de l’augmentation de la complexité du circuit numérique équivalent.
De plus, il a été démontré que le MNN effectue une recherche de séquences de bits dans des flux de données de 10 Gbit/s avec une très grande précision, ce qui offre une alternative à la technologie de détection de séquence de vraisemblance maximale (MLSD) à haute puissance utilisée dans les communications traditionnelles.Parallèlement, en combinant les fonctions de recherche et techniques, MNN a simulé avec succès un algorithme conditionnel et a atteint la précision du 75% tout en maintenant une consommation d'énergie inférieure à 200 mW (176 mW).
Lors de la détection de cibles radar, les chercheurs ont constaté que la capacité du MNN à détecter de subtils changements de fréquence est particulièrement adaptée aux applications radar à large bande. Cette étude a simulé un espace aérien avec plusieurs avions volant selon différentes trajectoires polygonales. Les signaux de réflexion radar ont été enregistrés et convertis en formes d'onde de tension analogiques. Les ondes carrées ont ensuite été modulées à leur fréquence centrale et transmises au MNN. La réponse de sortie moyenne dans la gamme de fréquences de 8 à 10 GHz a été extraite, et le backend du réseau neuronal numérique a été utilisé pour déduire la trajectoire de vol. Ceci est illustré dans la figure ci-dessous :

Les résultats montrent qu'après la simulation de 500 scénarios de vol, il a été constaté que le MNN peut apprendre des schémas de vol en formant différentes réponses aux changements de fréquence enregistrés sur une longue période, caractérisant ainsi le schéma de vol de la cible. Le MNN peut non seulement prédire le nombre de cibles dynamiques, isoler un mouvement spécifique de la cible et estimer sa vitesse.Il peut également reconnaître une variété de trajectoires de vol polygonales et atteindre des scores F1 élevés dans des scénarios avec différents nombres d'avions.
Lors de la tâche de classification des signaux sans fil, les chercheurs ont testé la capacité du MNN à traiter les signaux de plus basse fréquence, explorant ainsi son application à l'identification de schémas de codage des communications sans fil. L'expérience a utilisé le jeu de données RadioML2016.10A, qui comprend 11 types de modulation (9 numériques et 2 analogiques). Différents signaux en bande de base ont modulé une porteuse de 50 MHz, puis ont été transmis au MNN. Ce dernier a utilisé sa sensibilité pour convertir les transformations transitoires du signal de commande basse fréquence en caractéristiques observables. Ces caractéristiques ont été extraites dans la gamme 8-8,5 GHz pour entraîner la couche linéaire dorsale.
Les résultats montrent que certains paramètres peuvent permettre au MNN d'atteindre une très grande précision dans les tâches de classification de modulation, et la précision des tâches de classification des signaux sans fil peut atteindre 88%, ce qui est comparable aux réseaux neuronaux numériques.Cela montre que le MNN peut jouer un rôle important en tant qu’accélérateur d’apprentissage profond dans l’informatique de pointe, et non seulement cela, il peut également réduire considérablement la taille du modèle.
L'apprentissage profond et l'informatique analogique ont un grand potentiel
Comme mentionné au début, le développement continu des technologies d'apprentissage profond a ouvert une nouvelle voie aux applications à haut débit. Avant cette étude, de nombreuses institutions avaient déjà exploré ce domaine et publié de nombreux résultats de recherche. Ces avancées ont posé les bases théoriques et pratiques de l'évolution et de l'innovation continues de l'intégration de l'informatique analogique et de l'apprentissage profond.
Par exemple, l'article « Traitement du signal micro-ondes à l'aide d'un ordinateur à réservoir quantique analogique » publié conjointement par une équipe de l'Université Cornell et une équipe de l'Université du Maryland proposait queSimulation en temps continu de la dynamique non linéaire quantique utilisant des circuits micro-ondes supraconducteurs comme réservoirs quantiques,Cette méthode permet de traiter directement les signaux d'entrée micro-ondes analogiques sans discrétisation, et le système à variables continues permet au réservoir quantique d'accéder à un espace de Hilbert plus large. Contrairement aux expériences précédentes basées sur des circuits quantiques numériques, cette méthode permet de recevoir directement des signaux micro-ondes analogiques faibles et d'en extraire les caractéristiques, surmontant ainsi le goulot d'étranglement en entrée.
Adresse du document :
https://www.nature.com/articles/s41467-024-51161-8
Un autre exemple est une étude intitulée « Traitement de dimension supérieure utilisant un noyau de tenseur photonique avec des données en temps continu » publiée conjointement par des équipes de l'Université d'Oxford, de l'Université de Münster et de l'Université d'Exeter.Parmi eux, une méthode est proposée pour utiliser la représentation des données en temps continu afin de développer trois degrés de liberté : l'espace, la longueur d'onde et la radiofréquence, et réaliser le calcul de multiplication matrice-vecteur (MVM) de l'entrée d'un tableau tridimensionnel.Le calcul de la mémoire photonique est réalisé grâce à un cœur tenseur photonique à commande électro-optique et à une mémoire reconfigurable à matériau à changement de phase non volatile. Le parallélisme du système atteint 100, soit deux ordres de grandeur de plus que l'implémentation précédente utilisant seulement deux degrés de liberté, ce qui confirme la faisabilité de l'ajout de degrés de liberté radiofréquence au calcul de la mémoire photonique.
Adresse du document :
https://www.nature.com/articles/s41566-023-01313-x
Le MNN proposé par l’Université Cornell favorise davantage l’intégration de l’informatique analogique et de l’apprentissage en profondeur dans des scénarios à large bande passante.Il ne s’appuie pas sur des horloges numériques et utilise les principes de la physique des micro-ondes pour réaliser un traitement du signal à ultra-haute vitesse.Il surmonte non seulement les limites des circuits numériques traditionnels en termes de consommation d'énergie et de bande passante, mais démontre également le potentiel du calcul analogique pour les tâches complexes. Du suivi de trajectoire radar à la classification des signaux sans fil, le MNN, grâce à sa faible consommation d'énergie et à sa petite taille, offre un nouveau paradigme pour l'informatique de pointe, les communications à haut débit et d'autres domaines.
À l'avenir, avec le développement de technologies telles que l'ajustement dynamique des paramètres et la formation conjointe de bout en bout, l'intégration de l'informatique analogique et de l'apprentissage en profondeur devrait permettre de surmonter davantage de goulots d'étranglement en matière de bande passante et d'efficacité, ouvrant ainsi un espace d'application plus large pour des domaines de pointe tels que le traitement de données à très haut débit et les communications par ondes millimétriques.Obtenez des articles de haute qualité et des articles d'interprétation approfondis dans le domaine de l'IA4S de 2023 à 2024 en un seul clic⬇️
