HyperAIHyperAI

Command Palette

Search for a command to run...

Une approche consciente de la burstiness pour la datation de documents

Kjetil Nørvåg Nattiya Kanhabua Dimitrios Gunopulos Dimitrios Kotzias Theodoros Lappas Dimitrios Kotsakos

Résumé

Un grand nombre d'applications courantes, telles que la recherche temporelle, la détection d'événements ou l'identification de tendances, supposent la connaissance de l'horodatage de chaque document au sein d'une collection textuelle donnée. Toutefois, dans de nombreux cas, les horodatages requis sont soit indisponibles, soit ambigus. Un exemple caractéristique de ce problème se présente dans le cadre de grandes archives numérisées de documents anciens. Pour ces documents, l'horodatage peut être corrompu au cours du processus de numérisation, ou tout simplement ne pas exister. Dans cet article, nous étudions la tâche d'approximation de l'horodatage d'un document, appelée datation de documents. Nous proposons une méthode fondée sur le contenu et exploitons les avancées récentes dans le domaine de la « burstiness » des termes, ce qui permet de surmonter les limites des méthodes précédentes, notamment la stratégie de partitionnement temporelle fixe. Nous menons une évaluation expérimentale approfondie sur différentes bases de données afin de valider l'efficacité et les avantages de notre approche, démontrant que notre méthode surpasser les méthodes de pointe dans le domaine de la datation de documents.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp
Une approche consciente de la burstiness pour la datation de documents | Articles | HyperAI