HyperAIHyperAI
vor 2 Monaten

Wortsinndiskambiguierung mit einem bidirektionalen LSTM

Mikael Kågebäck; Hans Salomonsson
Wortsinndiskambiguierung mit einem bidirektionalen LSTM
Abstract

In dieser Arbeit präsentieren wir ein sauberes, aber dennoch effektives Modell für die Wortsinndisambiguierung. Unser Ansatz nutzt ein bidirektionales Long Short-Term Memory-Netzwerk (LSTM), das von allen Wörtern geteilt wird. Dies ermöglicht es dem Modell, statistische Stärken zu teilen und sich gut mit der Vokabulargröße zu skalieren. Das Modell wird von Anfang bis Ende trainiert, direkt vom rohen Text zu Sinnesetiketten, und macht effektiven Gebrauch von der Wortreihenfolge. Wir evaluieren unseren Ansatz anhand zweier Standarddatensätze unter Verwendung identischer Hyperparameter-Einstellungen, die ihrerseits an einem dritten Datensatz ausgewertet wurden. Wir verwenden keine externen Ressourcen (z.B. Wissensgraphen, Teil-der-Rede-Tagging usw.), sprachspezifischen Merkmale oder manuell erstellten Regeln, erreichen aber dennoch statistisch vergleichbare Ergebnisse wie die besten Systeme des aktuellen Standes der Technik, die solche Einschränkungen nicht aufweisen.

Wortsinndiskambiguierung mit einem bidirektionalen LSTM | Neueste Forschungsarbeiten | HyperAI