HyperAIHyperAI

Command Palette

Search for a command to run...

GenWiki: Ein Datensatz mit 1,3 Millionen Inhaltsteilungstexten und -graphen für die überwachungsfreie Graph-to-Text-Generierung

Zheng Zhang Xipeng Qiu Qipeng Guo Zhijing Jin

Zusammenfassung

Die Datensammlung für die Generierung von Text aus Wissensgraphen ist kostenaufwendig. Infolgedessen ist in letzter Zeit ein aktiver Forschungsbereich im Bereich unsupervisierter Modelle entstanden. Die meisten dieser unsupervisierten Modelle müssen jedoch nicht-parallele Versionen bestehender kleiner supervisierter Datensätze verwenden, was ihre Potenziale erheblich einschränkt. In diesem Paper stellen wir einen großskaligen, allgemein-domänenübergreifenden Datensatz namens GenWiki vor. Unser unsupervisierter Datensatz umfasst jeweils 1,3 Millionen Text- und Graph-Beispiele. Mit einer menschlich annotierten Testmenge bieten wir diese neue Benchmark-Datensammlung für zukünftige Forschungsarbeiten zur unsupervisierten Textgenerierung aus Wissensgraphen an.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp