HyperAIHyperAI
vor 17 Tagen

N24News: Ein neues Datensatz für die multimodale Nachrichtenklassifizierung

Zhen Wang, Xu Shan, Xiangxie Zhang, Jie Yang
N24News: Ein neues Datensatz für die multimodale Nachrichtenklassifizierung
Abstract

Aktuelle Nachrichten-Datensätze konzentrieren sich lediglich auf textuelle Merkmale der Nachrichten und nutzen selten die Informationen aus Bildern, wodurch zahlreiche für die Klassifikation von Nachrichten entscheidende Merkmale außer Acht gelassen werden. In dieser Arbeit präsentieren wir ein neues Datenset, N24News, das aus Artikeln der New York Times generiert wurde und 24 Kategorien umfasst sowie sowohl textuelle als auch bilddatenbasierte Informationen pro Nachricht enthält. Wir verwenden eine mehrfachaufgabenbasierte multimodale Methode, und die experimentellen Ergebnisse zeigen, dass die multimodale Nachrichtenklassifikation die reine Textklassifikation übertrifft. Je nach Länge des Textes kann die Klassifiziergenauigkeit um bis zu 8,11 % gesteigert werden. Unsere Forschung offenbart die Beziehung zwischen der Leistung eines multimodalen Klassifikators und seinen Teilklassifikatoren sowie mögliche Verbesserungspotenziale bei der Anwendung multimodaler Ansätze in der Nachrichtenklassifikation. N24News zeigt ein großes Potenzial, die Forschung im Bereich der multimodalen Nachrichtenanalyse voranzutreiben.