HSCNN: Ein hybrider Siamesischer Faltungsneuronaler Netzwerk für extrem unbalancierte Mehrlabels-Textklassifikation

Das Problem der Datenungleichgewichtigkeit stellt eine entscheidende Herausforderung für die mehrfach-label-basierte Textklassifikation dar. Einige bestehende Ansätze versuchen, dieses Problem durch die Einführung von unbalancierten Verlustfunktionen anstelle der herkömmlichen Kreuzentropieverlustfunktion zu lösen, doch ihre Leistung bleibt in Fällen extremer Datenungleichgewichtigkeit begrenzt. Wir schlagen eine hybride Lösung vor, die allgemeine Netzwerke für die häufigen Kategorien (Head-Kategorien) und Few-Shot-Techniken für die seltenen Kategorien (Tail-Kategorien) nutzt. Wir entwickeln ein Hybrid-Siameses neuronales Netzwerk mit zusätzlichen technischen Merkmalen: eine Multi-Task-Architektur auf Basis von Einzel- und Siamese-Netzwerken; eine kategorienspezifische Ähnlichkeitsmessung innerhalb der Siamese-Struktur; sowie eine spezifische Stichprobenmethode zur Trainingsphase des HSCNN. Die Ergebnisse auf zwei Benchmark-Datensätzen und unter Verwendung dreier Verlustfunktionen zeigen, dass unsere Methode die Leistung von Einzelnetzwerken mit unterschiedlichen Verlustfunktionen sowohl für die seltenen als auch für die Gesamtkategorien signifikant verbessert.