HyperAIHyperAI
il y a 16 jours

Une approche consciente de la burstiness pour la datation de documents

{Kjetil Nørvåg, Nattiya Kanhabua, Dimitrios Gunopulos, Dimitrios Kotzias, Theodoros Lappas, Dimitrios Kotsakos}
Une approche consciente de la burstiness pour la datation de documents
Résumé

Un grand nombre d'applications courantes, telles que la recherche temporelle, la détection d'événements ou l'identification de tendances, supposent la connaissance de l'horodatage de chaque document au sein d'une collection textuelle donnée. Toutefois, dans de nombreux cas, les horodatages requis sont soit indisponibles, soit ambigus. Un exemple caractéristique de ce problème se présente dans le cadre de grandes archives numérisées de documents anciens. Pour ces documents, l'horodatage peut être corrompu au cours du processus de numérisation, ou tout simplement ne pas exister. Dans cet article, nous étudions la tâche d'approximation de l'horodatage d'un document, appelée datation de documents. Nous proposons une méthode fondée sur le contenu et exploitons les avancées récentes dans le domaine de la « burstiness » des termes, ce qui permet de surmonter les limites des méthodes précédentes, notamment la stratégie de partitionnement temporelle fixe. Nous menons une évaluation expérimentale approfondie sur différentes bases de données afin de valider l'efficacité et les avantages de notre approche, démontrant que notre méthode surpasser les méthodes de pointe dans le domaine de la datation de documents.

Une approche consciente de la burstiness pour la datation de documents | Articles de recherche récents | HyperAI