Command Palette
Search for a command to run...
Darstellungslernen von Entitäten und Dokumenten aus Wissensbasisbeschreibungen
Darstellungslernen von Entitäten und Dokumenten aus Wissensbasisbeschreibungen
Ikuya Yamada Hiroyuki Shindo Yoshiyasu Takefuji
Zusammenfassung
In dieser Arbeit beschreiben wir TextEnt, ein neuronales Netzwerkmodell, das verteilte Repräsentationen von Entitäten und Dokumenten direkt aus einer Wissensbasis (KB) lernt. Gegeben ein Dokument in einer KB, das aus Wörtern und Entitätsannotierungen besteht, trainieren wir unser Modell, die Entität vorherzusagen, die das Dokument beschreibt, und das Dokument sowie seine Zielentität in einem kontinuierlichen Vektorraum nahe beieinander abzubilden. Unser Modell wird mit einer großen Anzahl von Dokumenten trainiert, die aus Wikipedia extrahiert wurden. Die Leistung des vorgeschlagenen Modells wird anhand zweier Aufgaben evaluiert: der feingranularen Entitätstypisierung und der mehrklassigen Textkategorisierung. Die Ergebnisse zeigen, dass unser Modell den aktuellen Stand der Technik in beiden Aufgaben erreicht. Der Code und die trainierten Repräsentationen werden online zur Verfügung gestellt, um weitere wissenschaftliche Forschungen zu unterstützen.