GTR-LSTM: Ein dreifacher Encoder für die Satzgenerierung aus RDF-Daten
{Rui Zhang Bayu Distiawan Trisedya Jianzhong Qi Wei Wang}

Abstract
Ein Wissensbasis ist eine große Sammlung von Fakten, die hauptsächlich als RDF-Tripel dargestellt werden, wobei jedes Tripel aus einem Subjekt, einem Prädikat (Beziehung) und einem Objekt besteht. Die Darstellung mittels RDF-Tripel bietet eine einfache Schnittstelle für Anwendungen, um auf die Fakten zuzugreifen. Allerdings liegt diese Darstellung nicht in einer natürlichen Sprache vor, was die Verständlichkeit für Menschen erschwert. Um dieses Problem anzugehen, schlagen wir ein System vor, das eine Menge von RDF-Tripeln basierend auf einem Encoder-Decoder-Framework in natürliche Sätze übersetzt. Um möglichst viel Information aus den RDF-Tripeln zu bewahren, entwickeln wir einen neuartigen graphbasierten Tripel-Encoder. Der vorgeschlagene Encoder kodiert nicht nur die Elemente der Tripel, sondern auch die Beziehungen innerhalb eines Tripels sowie zwischen verschiedenen Tripeln. Experimentelle Ergebnisse zeigen, dass der vorgeschlagene Encoder im Vergleich zu Baseline-Modellen eine konsistente Verbesserung erzielt – jeweils um bis zu 17,6 %, 6,0 % und 16,4 % in den drei gängigen Metriken BLEU, METEOR und TER.
Benchmarks
| Benchmark | Methodik | Metriken |
|---|---|---|
| data-to-text-generation-on-webnlg | GTR-LSTM (entity masking) | BLEU: 58.6 |
KI mit KI entwickeln
Von der Idee bis zum Start — beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und den besten GPU-Preisen.