15日前
フィードフォワードスパikingニューラルネットワークにおける適応的軸索遅延を用いた高精度な発話単語認識
Pengfei Sun, Ehsan Eqlimi, Yansong Chua, Paul Devos, Dick Botteldooren

要約
スパikingニューラルネットワーク(SNN)は、高精度かつ効率的な自動音声認識システムの構築に向けた有望な研究分野である。音声からスパイクへの符号化技術および学習アルゴリズムの最近の進展により、SNNは実用的なタスクへの応用が可能となっている。生物学的にインスパイアされたSNNは、疎な非同期イベントを用いて情報伝達を行うため、スパイクの発火タイミングがSNNの性能にとって極めて重要である。このような観点から、これまでの多くの研究はシナプス重みの学習に焦点を当てており、イベント伝達における遅延、すなわち軸索遅延(axonal delay)の考慮はほとんど行われていない。本研究では、最大値に制限された学習可能な軸索遅延を導入し、各ネットワーク層における軸索遅延の分布に応じて適応的に調整可能な仕組みを提案する。実験の結果、本手法はSHDデータセット(92.45%)およびNTIDIGITSデータセット(95.09%)において、報告されている最高の分類精度を達成した。本研究は、複雑な時間構造を有するタスクにおいて、軸索遅延の学習が有効である可能性を示している。