Klassifizierung langsequentieller Daten mithilfe von zirkulär dilatierten convolutionalen neuronalen Netzwerken

Die Klassifikation langsequentieller Daten ist eine wichtige Aufgabe im Bereich des maschinellen Lernens und tritt in zahlreichen Anwendungsszenarien auf. Rekurrente neuronale Netze (RNNs), Transformers und Faltungsneuronale Netze (CNNs) sind drei zentrale Ansätze zur Bearbeitung sequenzieller Daten. Unter diesen Methoden haben zeitliche Faltungsnetze (Temporal Convolutional Networks, TCNs), die sich gut auf sehr lange Sequenzen skalieren lassen, beachtliche Fortschritte bei der Zeitreihenregression erzielt. Für die Sequenzklassifikation erreichen TCNs jedoch nicht zufriedenstellende Ergebnisse, da sie ein verzerrtes Verbindungsschema verwenden und die Klassen nur am letzten Position im Sequenzende ausgeben. Diese Asymmetrie beschränkt ihre Leistungsfähigkeit bei der Klassifikation, die auf der vollständigen Sequenz basiert. In dieser Arbeit stellen wir eine symmetrische, mehrskalige Architektur vor, die als Circular Dilated Convolutional Neural Network (CDIL-CNN) bezeichnet wird, bei der jeder Position in der Sequenz gleichermaßen die Möglichkeit gegeben wird, Informationen aus anderen Positionen der vorherigen Schichten zu empfangen. Unser Modell liefert Klassifikationslogits an allen Positionen, sodass eine einfache Ensemble-Lernmethode angewendet werden kann, um eine verbesserte Entscheidung zu treffen. Wir haben CDIL-CNN an verschiedenen Datensätzen mit langen Sequenzen getestet. Die experimentellen Ergebnisse zeigen, dass unsere Methode gegenüber vielen state-of-the-art-Ansätzen eine überlegene Leistung erzielt.