HyperAIHyperAI
vor 11 Tagen

CASSOD-Net: Kaskadierte und separable Strukturen der dilatierten Faltung für eingebettete Visionssysteme und Anwendungen

Tse-Wei Chen, Deyu Wang, Wei Tao, Dongchao Wen, Lingxiao Yin, Tadayuki Ito, Kinya Osa, Masami Kato
CASSOD-Net: Kaskadierte und separable Strukturen der dilatierten Faltung für eingebettete Visionssysteme und Anwendungen
Abstract

Der Field of View (FOV) von Faltungsneuralen Netzen steht in enger Beziehung zur Genauigkeit der Inferenz. Dilatierte Faltungen gelten als effektive Lösung für Probleme, die einen großen FOV erfordern. Für allgemeinzweckfähige oder spezialisierte Hardware erfordern dilatierte Faltungen jedoch in der Regel zusätzliche Verarbeitungszeit im Vergleich zu herkömmlichen Faltungen. In diesem Artikel stellen wir ein Netzwerkmodul, die „Cascaded and Separable Structure of Dilated (CASSOD) Convolution“, sowie ein spezielles Hardware-System vor, das CASSOD-Netze effizient verarbeiten kann. Ein CASSOD-Netzwerk umfasst mehrere kaskadierte $2 \times 2$-dilatierte Filter, die traditionelle $3 \times 3$-dilatierte Filter ersetzen können, ohne die Inferenzgenauigkeit zu verringern. Zwei Beispiele, Gesichtserkennung und Bildsegmentierung, wurden mit dilatierten Faltungen sowie den vorgeschlagenen CASSOD-Modulen getestet. Das neue Netzwerk für die Gesichtserkennung erreicht eine höhere Genauigkeit als vorherige Ansätze, wobei lediglich 47 % der Filtergewichte in den dilatierten Faltungsschichten des Kontextmoduls verwendet werden. Darüber hinaus beschleunigt das vorgeschlagene Hardware-System die Berechnungen dilatierter Faltungen und ist bei einer Filtergröße von $3 \times 3$ um das 2,78-fache schneller als herkömmliche Hardware-Systeme.

CASSOD-Net: Kaskadierte und separable Strukturen der dilatierten Faltung für eingebettete Visionssysteme und Anwendungen | Neueste Forschungsarbeiten | HyperAI