HyperAIHyperAI
vor 11 Tagen

Hierarchische Themenmining mittels gemeinsamer sphärischer Baum- und Texteinbettung

Yu Meng, Yunyi Zhang, Jiaxin Huang, Yu Zhang, Chao Zhang, Jiawei Han
Hierarchische Themenmining mittels gemeinsamer sphärischer Baum- und Texteinbettung
Abstract

Die Gewinnung einer hierarchisch organisierten Menge sinnvoller Themen ist intuitiv ansprechend, da Themenkorrelationen in großen Textkorpora allgegenwärtig sind. Um potenzielle hierarchische Themenstrukturen zu berücksichtigen, verallgemeinern hierarchische Themenmodelle flache Themenmodelle, indem sie latente Themenhierarchien in ihren generativen Modellierungsprozess integrieren. Aufgrund ihrer rein unsupervisierten Natur weicht die gelernte Themenhierarchie jedoch häufig von den spezifischen Bedürfnissen oder Interessen der Benutzer ab. Um den Prozess der hierarchischen Themenentdeckung mit minimaler Benutzerunterstützung zu leiten, schlagen wir eine neue Aufgabe vor: Hierarchische Themenmining. Diese Aufgabe erhält einen Kategorienbaum, der lediglich durch Kategorienamen beschrieben wird, und zielt darauf ab, für jede Kategorie eine Menge repräsentativer Begriffe aus einem Textkorpus zu extrahieren, um dem Benutzer bei der Verständnis seiner interessierenden Themen zu helfen. Wir entwickeln eine neuartige Methode zur gemeinsamen Einbettung von Baumstruktur und Text sowie ein konsistentes Optimierungsverfahren, das eine gleichzeitige Modellierung der Kategorienbaumstruktur und des Korpusgenerierungsprozesses im sphärischen Raum ermöglicht, um effektive, kategoriebezogene repräsentative Begriffe zu finden. Unser umfassender experimenteller Vergleich zeigt, dass unser Modell, JoSH genannt, eine hochwertige Menge hierarchischer Themen mit hoher Effizienz extrahiert und schwach überwachten Aufgaben zur hierarchischen Textklassifikation zugutekommt.

Hierarchische Themenmining mittels gemeinsamer sphärischer Baum- und Texteinbettung | Neueste Forschungsarbeiten | HyperAI