HyperAIHyperAI

Command Palette

Search for a command to run...

vor 4 Monaten

Clustering von urdu-sprachigen Nachrichten mithilfe von Überschriften

{Kamran Malik Faisal Bukhari Waheed Iqbal Samia Khaliq}

Abstract

Diese Arbeit stellt einen neuen Algorithmus vor und evaluiert dessen Leistung bei der automatischen Clustering von urdu-sprachigen Nachrichten aus verschiedenen Nachrichtenagenturen. Die Aufgabe ist herausfordernd, da für die urdu-sprachige Textverarbeitung derzeit keine geeigneten Sprachverarbeitungsbibliotheken zur Verfügung stehen. Das experimentelle Datenset der Autoren besteht aus Nachrichten renommierter pakistanischer Medienhäuser, darunter Jang, BBC Urdu, Express, UrduPoint sowie Voice of America Urdu (VOA). Der vorgeschlagene Algorithmus nutzt ausschließlich Schlagzeilen zur Clustering-Aufgabe. Die Autoren argumentieren, dass Schlagzeilen eine präzise Zusammenfassung der Nachrichten bieten, was sie motiviert, statt des vollständigen Nachrichtentextes lediglich die Überschriften zu verwenden. Die experimentelle Evaluation zeigt für die Erkennung ähnlicher Nachrichten mittels Schlagzeilen Mikro- und Makro-Durchschnittswerte der Präzision von jeweils 0,45 und 0,48.

Benchmarks

BenchmarkMethodikMetriken
text-clustering-on-urdu-news-headlinesVector Space Model
Related Headlines: 85

KI mit KI entwickeln

Von der Idee bis zum Start — beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und den besten GPU-Preisen.

KI-Co-Coding
Sofort einsatzbereit GPUs
Beste Preise
Jetzt starten

Hyper Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp
Clustering von urdu-sprachigen Nachrichten mithilfe von Überschriften | Forschungsarbeiten | HyperAI