Retards axonaux adaptatifs dans les réseaux neuronaux spiking à feedforward pour une reconnaissance précise des mots parlés

Les réseaux neuronaux à impulsions (SNN) constituent une voie de recherche prometteuse pour la conception de systèmes d’identification automatique de la parole précis et efficace. Les progrès récents dans le codage audio-en-impulsions et les algorithmes d’apprentissage permettent désormais d’appliquer les SNN à des tâches pratiques. Inspirés par le cerveau, les SNN communiquent à l’aide d’événements rares et asynchrones, rendant ainsi le moment de l’impulsion (spike-timing) crucial pour leur performance. Dans cette perspective, la plupart des travaux se concentrent sur l’entraînement des poids synaptiques, tandis que très peu considèrent les délais de transmission des événements, notamment les délais axonaux. Dans ce travail, nous proposons d’introduire un délai axonal apprenable, borné par une valeur maximale, pouvant être ajusté en fonction de la distribution des délais axonaux propre à chaque couche du réseau. Nous démontrons que notre méthode atteint les meilleurs résultats de classification rapportés sur les jeux de données SHD (92,45 %) et NTIDIGITS (95,09 %). Ce travail met en évidence le potentiel de l’apprentissage des délais axonaux pour des tâches présentant des structures temporelles complexes.