HyperAIHyperAI
vor 2 Monaten

Dokumente datieren mit Graphenkonvolutionnetzwerken

Shikhar Vashishth; Shib Sankar Dasgupta; Swayambhu Nath Ray; Partha Talukdar
Dokumente datieren mit Graphenkonvolutionnetzwerken
Abstract

Das Dokumentdatum ist für viele wichtige Aufgaben wie die Dokumentensuche, Zusammenfassung und Ereigniserkennung essentiell. Obwohl existierende Ansätze für diese Aufgaben von genauen Kenntnissen des Dokumentdatums ausgehen, ist dieses nicht immer verfügbar, insbesondere bei beliebigen Dokumenten aus dem Web. Die Datierung von Dokumenten ist ein herausforderndes Problem, das eine Inferenz über die zeitliche Struktur des Dokuments erfordert. Frühere Systeme zur Datierung von Dokumenten haben sich weitgehend auf manuell erstellte Merkmale gestützt und dabei solche internen Strukturen der Dokumente vernachlässigt. In dieser Arbeit schlagen wir NeuralDater vor, einen auf Graph Convolutional Networks (GCNs) basierenden Ansatz zur Datierung von Dokumenten, der syntaktische und temporale Graphstrukturen des Dokuments präzise gemeinsam nutzt. Nach bestem Wissen ist dies die erste Anwendung tiefen Lernens für das Problem der Datierung von Dokumenten. Durch umfangreiche Experimente mit realen Datensätzen konnten wir feststellen, dass NeuralDater die Stand-of-the-Art-Methoden um 19 Prozentpunkte absolut (45 Prozentpunkte relativ) in Bezug auf Genauigkeit deutlich übertrifft.