ScisummNet: Ein großes annotiertes Korpus und Content-Impact-Modelle für die Zusammenfassung wissenschaftlicher Arbeiten mit Zitiernetzwerken

Die Zusammenfassung wissenschaftlicher Artikel ist herausfordernd: Es gibt keine großen, annotierten Korpora, und die Zusammenfassung sollte idealerweise die Auswirkungen des Artikels auf die Wissenschaftsgemeinschaft berücksichtigen. In dieser Arbeit werden innovative Lösungen für diese beiden Herausforderungen vorgestellt. Wir 1) entwickeln und veröffentlichen den ersten groß angelegten manuell annotierten Korpus für wissenschaftliche Artikel (auf dem Gebiet der Computerlinguistik), indem wir eine schnellere Annotation ermöglichen, und 2) schlagen Zusammenfassungsmethoden vor, die die Original-Highlights der Autoren (Zusammenfassung) und die tatsächlichen Auswirkungen des Artikels auf die Gemeinschaft (Zitate) integrieren, um umfassende, hybride Zusammenfassungen zu erstellen. Wir führen Experimente durch, um die Effektivität unseres Korpus bei der Schulung datengetriebener Modelle für die Zusammenfassung wissenschaftlicher Artikel sowie den Vorteil unserer hybriden Zusammenfassungen gegenüber traditionellen Zusammenfassungen und zitatenbasierten Zusammenfassungen zu demonstrieren. Unser großer annotierter Korpus und unsere hybriden Methoden bieten einen neuen Rahmen für Forschungen zur Zusammenfassung wissenschaftlicher Artikel.