HyperAIHyperAI

Command Palette

Search for a command to run...

Console
il y a 4 mois

Une approche consciente de la burstiness pour la datation de documents

{Kjetil Nørvåg Nattiya Kanhabua Dimitrios Gunopulos Dimitrios Kotzias Theodoros Lappas Dimitrios Kotsakos}

Une approche consciente de la burstiness pour la datation de documents

Résumé

Un grand nombre d'applications courantes, telles que la recherche temporelle, la détection d'événements ou l'identification de tendances, supposent la connaissance de l'horodatage de chaque document au sein d'une collection textuelle donnée. Toutefois, dans de nombreux cas, les horodatages requis sont soit indisponibles, soit ambigus. Un exemple caractéristique de ce problème se présente dans le cadre de grandes archives numérisées de documents anciens. Pour ces documents, l'horodatage peut être corrompu au cours du processus de numérisation, ou tout simplement ne pas exister. Dans cet article, nous étudions la tâche d'approximation de l'horodatage d'un document, appelée datation de documents. Nous proposons une méthode fondée sur le contenu et exploitons les avancées récentes dans le domaine de la « burstiness » des termes, ce qui permet de surmonter les limites des méthodes précédentes, notamment la stratégie de partitionnement temporelle fixe. Nous menons une évaluation expérimentale approfondie sur différentes bases de données afin de valider l'efficacité et les avantages de notre approche, démontrant que notre méthode surpasser les méthodes de pointe dans le domaine de la datation de documents.

Benchmarks

BenchmarkMéthodologieMétriques
document-dating-on-apwBurstySimDater
Accuracy: 45.9
document-dating-on-nytBurstySimDater
Accuracy: 38.5

Construire l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec du co-codage IA gratuit, un environnement prêt à l'emploi et les meilleurs prix GPU.

Co-codage IA
GPU prêts à utiliser
Meilleurs prix
Commencer

Hyper Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp
Une approche consciente de la burstiness pour la datation de documents | Articles de recherche | HyperAI