Voice2Series: Umprogrammierung akustischer Modelle für die Zeitreihenklassifikation

Das Lernen zur Klassifikation von Zeitreihen mit begrenzten Daten ist ein praktisch relevantes, jedoch herausforderndes Problem. Aktuelle Ansätze basieren hauptsächlich auf handgezeichneten Regeln zur Merkmalsextraktion oder datenspezifischen Datenverstärkungsmethoden. Ausgehend von den Fortschritten in tiefen Sprachverarbeitungsmodellen und der Tatsache, dass Sprachdaten einvariate zeitliche Signale sind, schlagen wir in diesem Artikel Voice2Series (V2S) vor – einen neuartigen end-to-end-Ansatz, der akustische Modelle für die Klassifikation von Zeitreihen durch Eingabetransformationslernen und Ausgabelabel-Mapping neu programmieren. Unter Verwendung der Repräsentationslernfähigkeit eines großskaligen vortrainierten Sprachverarbeitungsmodells erreichen wir auf 30 unterschiedlichen Zeitreihenaufgaben wettbewerbsfähige Ergebnisse in 19 Klassifikationsaufgaben. Zudem liefern wir eine theoretische Begründung für V2S, indem wir beweisen, dass der Populationsrisiko durch das Quellrisiko und eine Wasserstein-Distanz beschränkt ist, die die Merkmalsausrichtung durch Neuprogrammierung berücksichtigt. Unsere Ergebnisse eröffnen neue und effektive Ansätze für die Klassifikation von Zeitreihen.