HyperAI

HellaSwag Großer Modell-Datensatz Zum Gesunden Menschenverstand

Datum

vor 10 Monaten

Größe

17.45 MB

Organisation

Allen Institute for Artificial Intelligence
Universität von Washington

Veröffentlichungs-URL

rowanzellers.com

特色图像

*Dieser Datensatz unterstützt die Online-Nutzung.Klicken Sie hier, um zu springen.

Der HellaSwag-Datensatz ist ein neuer Challenge-Datensatz zum Testen der Commonsense-Inferenz natürlicher Sprache (Commonsense NLI). Der Datensatz wurde 2019 von der University of Washington und Allen AI mit dem Ziel veröffentlicht, die Leistungsfähigkeit tief vortrainierter Modelle im Bereich des gesunden Menschenverstands zu untersuchen, indem ein Datensatz erstellt wird, der eine Herausforderung für bestehende hochmoderne Modelle darstellt. Verwandte Artikel und ErgebnisseHellaSwag: Kann eine Maschine Ihren Satz wirklich beenden?" wurde von ACL 2019 angenommen.

Der HellaSwag-Datensatz enthält 70.000 Fragen, die zwar für Menschen sehr einfach zu beantworten sind (Genauigkeit von über 95%), aber selbst modernste Modelle haben Schwierigkeiten, eine Leistung zu erreichen, die dem menschlichen Niveau nahe kommt (Genauigkeit von etwa 48%). Der Datensatz wird mithilfe der Adversarial Filtering (AF)-Methode erstellt. Dabei wird eine Reihe von Diskriminatoren verwendet, um maschinengenerierte falsche Antworten iterativ auszuwählen und so den Schwierigkeitsgrad des Datensatzes zu erhöhen. Die Entwicklung von HellaSwag gibt Aufschluss über die Funktionsweise tiefgreifender, vortrainierter Modelle und bietet eine neue Richtung für die NLP-Forschung, bei der Benchmarks in einer kontroversen Weise gemeinsam mit hochmodernen Modellen weiterentwickelt werden, um anspruchsvollere Aufgaben bereitzustellen.

hellaswag.torrent
Seeding 1Herunterladen 1Abgeschlossen 74Gesamtdownloads 142
  • hellaswag/
    • README.md
      1.88 KB
    • README.txt
      3.76 KB
      • data/
        • hellaswag.zip
          17.45 MB