Begriffe und Instanzen für Wissensgraphen-Einbettungen differenzieren

Konzepte, die eine Gruppe verschiedener Instanzen mit gemeinsamen Eigenschaften repräsentieren, sind essentielle Informationen in der Wissensrepräsentation. Die meisten herkömmlichen Wissensembedding-Methoden kodieren sowohl Entitäten (Konzepte und Instanzen) als auch Relationen gleichwertig als Vektoren in einem niedrigdimensionalen semantischen Raum, wobei sie den Unterschied zwischen Konzepten und Instanzen ignorieren. In dieser Arbeit schlagen wir ein neues Wissensgraph-Embedding-Modell namens TransC vor, das Konzepte und Instanzen differenziert. Insbesondere kodiert TransC jedes Konzept in einem Wissensgraph als Kugel und jede Instanz als Vektor im gleichen semantischen Raum. Wir nutzen die relativen Positionen, um die Beziehungen zwischen Konzepten und Instanzen (z.B., instanceOf) sowie die Beziehungen zwischen Konzepten und Unter-Konzepten (z.B., subClassOf) zu modellieren. Wir evaluieren unser Modell anhand von Link-Vorhersage- und Tripelklassifikationsaufgaben auf einem Datensatz basierend auf YAGO. Die experimentellen Ergebnisse zeigen, dass TransC den Stand der Technik übertreffen kann und die semantische Transitivität für die Relationen instanceOf und subClassOf erfasst. Unser Code und unsere Datensätze können unter https://github.com/davidlvxin/TransC abgerufen werden.