HyperAIHyperAI
vor 2 Monaten

Offene Fragebeantwortung mit schwach überwachten Einbettungsmodellen

Antoine Bordes; Jason Weston; Nicolas Usunier
Offene Fragebeantwortung mit schwach überwachten Einbettungsmodellen
Abstract

Das Bau von Computern, die in der Lage sind, Fragen zu jedem Thema zu beantworten, ist ein langjähriges Ziel der Künstlichen Intelligenz. Versprechende Fortschritte wurden kürzlich durch Methoden erzielt, die das Lernen von Abbildungen von Fragen auf logische Formen oder Datenbankabfragen ermöglichen. Solche Ansätze können effektiv sein, aber entweder auf große Mengen menschlich beschrifteter Daten oder auf Lexika und Grammatiken angewendet werden, die von Fachleuten angepasst wurden. In diesem Artikel nehmen wir stattdessen den radikalen Ansatz, das Lernen von Abbildungen von Fragen auf vektorielle Merkmalsrepräsentationen zu untersuchen. Durch das Abbilden von Antworten in denselben Raum kann man jede Wissensbasis unabhängig von ihrem Schema abfragen, ohne eine Grammatik oder ein Lexikon zu benötigen. Unser Verfahren wird mit einem neuen Optimierungsprozess trainiert, der stochastischen Gradientenabstieg kombiniert und durch einen Feinjustierungsschritt unter Verwendung der schwachen Überwachung verfeinert wird, die durch das Mischen automatisch und kollaborativ generierter Ressourcen bereitgestellt wird. Wir zeigen empirisch, dass unser Modell sinnvolle Signale aus seiner verrauschten Überwachung erfassen kann, was zu erheblichen Verbesserungen im Vergleich zu Paralex führt – dem einzigen bisher bekannten Verfahren, das auf vergleichbaren schwach beschrifteten Daten trainiert werden kann.