HyperAIHyperAI
vor 2 Monaten

Hierarchische Textklassifizierung mit verstärktem Label-Zuordnung

Yuning Mao; Jingjing Tian; Jiawei Han; Xiang Ren
Hierarchische Textklassifizierung mit verstärktem Label-Zuordnung
Abstract

Während bestehende Methoden der hierarchischen Textklassifizierung (HTC) versuchen, Labelhierarchien für das Modelltraining zu erfassen, treffen sie entweder lokale Entscheidungen bezüglich jedes Labels oder ignorieren die Hierarchieinformationen vollständig während der Inferenz. Um die Diskrepanz zwischen Training und Inferenz zu beheben und Labelabhängigkeiten auf principiellere Weise zu modellieren, formulieren wir HTC als einen Markov-Entscheidungsprozess und schlagen vor, eine Labelzuweisungspolitik durch tiefes Reinforcement Learning zu erlernen, um zu bestimmen, wo ein Objekt platziert werden soll und wann der Zuweisungsprozess beendet werden sollte. Die vorgeschlagene Methode, HiLAP, erkundet die Hierarchie sowohl während des Trainings als auch während der Inferenz auf konsistente Weise und trifft interdependente Entscheidungen. Als allgemeines Framework kann HiLAP verschiedene neuronale Encoder als Basismodelle für das end-to-end-Training integrieren. Experimente mit fünf öffentlichen Datensätzen und vier Basismodellen zeigen, dass HiLAP im Vergleich zu flachen Klassifizierern durchschnittlich eine Verbesserung von 33,4 % im Macro-F1-Wert erreicht und deutlich besser als state-of-the-art-Methoden der hierarchischen Textklassifizierung abschneidet. Daten und Code sind unter https://github.com/morningmoni/HiLAP abrufbar.

Hierarchische Textklassifizierung mit verstärktem Label-Zuordnung | Neueste Forschungsarbeiten | HyperAI