Kanонische Tensorzerlegung für die Vervollständigung von Wissensbasen

Das Problem der Wissensbasis-Vervollständigung kann als ein Problem der Vervollständigung eines dritten Ordnungs binären Tensors formuliert werden. Aus dieser Perspektive erscheint die kanonische Tensorzerlegung (CP) (Hitchcock, 1927) wie eine natürliche Lösung; jedoch fallen aktuelle Implementierungen von CP bei Standard-Benchmarks für Wissensbasis-Vervollständigung hinter ihre Konkurrenten zurück. In dieser Arbeit versuchen wir, die Grenzen von CP für die Wissensbasis-Vervollständigung zu verstehen. Zunächst motivieren und testen wir einen neuen Regularisierer, der auf den tensoriellen nuklearen $p$-Normen basiert. Anschließend präsentieren wir eine Neufassung des Problems, die es invariant gegenüber willkürlichen Entscheidungen zur Einbeziehung von Prädikaten oder deren Reziproken in den Datensatz macht. Die Kombination dieser beiden Methoden ermöglicht es uns, den aktuellen Stand der Technik auf mehreren Datensätzen mit einer CP-Zerlegung zu übertreffen und noch bessere Ergebnisse mit dem fortschrittlicheren ComplEx-Modell zu erzielen.