Hardware/Software-Co-Design mit ADC-freier In-Memory-Computing-Hardware für Spiking Neural Networks

Spiking Neural Networks (SNNs) sind biologisch plausiblen Modelle, die großes Potenzial für energieeffiziente Implementierungen sequenzieller Aufgaben auf ressourcenbeschränkten Edge-Geräten bieten. Allerdings sind kommerzielle Edge-Plattformen auf Basis herkömmlicher GPUs nicht auf die Bereitstellung von SNNs optimiert, was zu hohen Energieverbrauch und Latenz führt. Während analoge In-Memory Computing (IMC)-Plattformen als energieeffiziente Inferenz-Engines dienen können, leiden sie unter den erheblichen Energie-, Latenz- und Flächenanforderungen hochpräziser Analog-Digital-Wandler (HP-ADCs), wodurch die Vorteile der In-Memory-Verarbeitung überstrahlt werden. Wir stellen eine Hardware/Software-Co-Design-Methode vor, um SNNs in eine ADC-freie IMC-Architektur zu deployen, indem Sense-Amplifier als 1-Bit-ADCs anstelle herkömmlicher HP-ADCs eingesetzt werden, um die oben genannten Probleme zu lösen. Unser vorgeschlagenes Framework verursacht nur minimale Genauigkeitsverluste durch hardwarebewusstes Training und ist in der Lage, über einfache Bildklassifizierungsaufgaben hinaus auf komplexere sequenzielle Regressionsaufgaben zu skalieren. Experimente zu komplexen Aufgaben wie der optischen Fluss-Schätzung und der Gestenerkennung zeigen, dass eine schrittweise Erhöhung der Hardware-Berücksichtigung während des SNN-Trainings es dem Modell ermöglicht, sich an die Fehler infolge der Nicht-Idealitäten der ADC-freien IMC-Architektur anzupassen und diese zu lernen. Zudem bietet die vorgeschlagene ADC-freie IMC erhebliche Verbesserungen in Energieverbrauch und Latenz – jeweils um den Faktor 2–7 bzw. 8,9–24,6 – abhängig von der SNN-Modellarchitektur und der Arbeitslast, im Vergleich zu IMC-Plattformen mit HP-ADC.