HyperAI

Abstract

Eine Vielzahl etablierter Anwendungen, wie zeitliche Suche, Ereigniserkennung und Trendidentifikation, setzen die Kenntnis des Zeitstempels jedes Dokuments in einer gegebenen Textkollektion voraus. In vielen Fällen sind die erforderlichen Zeitstempel jedoch entweder nicht verfügbar oder mehrdeutig. Ein typisches Beispiel für dieses Problem tritt im Kontext großer Repositorien altgedruckter, digitalisierter Dokumente auf. Für solche Dokumente kann der Zeitstempel während des Digitalisierungsprozesses beschädigt worden sein oder einfach nicht vorhanden sein. In diesem Artikel untersuchen wir die Aufgabe der Approximation des Zeitstempels eines Dokuments, sogenannte Dokumenten-Datierung. Wir stellen eine inhaltbasierte Methode vor und nutzen neuere Fortschritte im Bereich der Begriffsburstiness, die es uns ermöglichen, die Nachteile herkömmlicher Methoden zur Dokumenten-Datierung zu überwinden, beispielsweise die starre Zeitintervallpartitionierung. Wir validieren die Wirksamkeit und Vorteile unserer Methode durch eine umfassende experimentelle Evaluation auf mehreren Datensätzen und zeigen, dass unsere Methode die derzeitigen State-of-the-Art-Verfahren für die Dokumenten-Datierung übertrifft.

Benchmarks

Benchmark	Methodik	Metriken
document-dating-on-apw	BurstySimDater	Accuracy: 45.9
document-dating-on-nyt	BurstySimDater	Accuracy: 38.5

Abstract

Benchmarks

Benchmark	Methodik	Metriken
document-dating-on-apw	BurstySimDater	Accuracy: 45.9
document-dating-on-nyt	BurstySimDater	Accuracy: 38.5

Ein burstiness-bewusster Ansatz zur Dokumenten-Datierung

{Kjetil Nørvåg Nattiya Kanhabua Dimitrios Gunopulos Dimitrios Kotzias Theodoros Lappas Dimitrios Kotsakos}

Abstract

Benchmarks

KI mit KI entwickeln

Hyper Newsletters

Ein burstiness-bewusster Ansatz zur Dokumenten-Datierung

{Kjetil Nørvåg Nattiya Kanhabua Dimitrios Gunopulos Dimitrios Kotzias Theodoros Lappas Dimitrios Kotsakos}

Abstract

Benchmarks

KI mit KI entwickeln

Hyper Newsletters

Command Palette

Ein burstiness-bewusster Ansatz zur Dokumenten-Datierung

{Kjetil Nørvåg Nattiya Kanhabua Dimitrios Gunopulos Dimitrios Kotzias Theodoros Lappas Dimitrios Kotsakos}

Abstract

Benchmarks

KI mit KI entwickeln

Hyper Newsletters

Command Palette

Ein burstiness-bewusster Ansatz zur Dokumenten-Datierung

{Kjetil Nørvåg Nattiya Kanhabua Dimitrios Gunopulos Dimitrios Kotzias Theodoros Lappas Dimitrios Kotsakos}

Abstract

Benchmarks

KI mit KI entwickeln

Hyper Newsletters