HyperAI

E-KAR Chinesische Version Des Interpretierbaren Wissensintensiven Benchmarks Für Analoges Denken

E-KAR steht für Benchmark for Explainable Knowledge-intensive Analogical Reasoning, ein Benchmark für erklärbares wissensintensives analoges Denken.

Die Fähigkeit, Analogien zu erkennen, ist grundlegend für die menschliche Wahrnehmung. Vorhandene Benchmarks für Wortanalogietests geben keinen Aufschluss über den zugrunde liegenden Prozess des analogen Denkens in neuronalen Modellen. Aus der Überzeugung heraus, dass Modelle mit Argumentationskraft auf guten Gründen basieren sollten,Wir schlagen den ersten Benchmark für sachkundiges, interpretierbares analoges Denken (E-KAR) vor.

Unser Benchmark-Datensatz besteht aus 1.655 (auf Chinesisch) und 1.251 (auf Englisch) Fragen aus der Beamtenprüfung.  Die Lösung dieser Probleme erfordert umfangreiches Hintergrundwissen. Wir haben ein Freitext-Erklärungsschema entwickelt, um zu erläutern, ob analoges Denken angewendet werden sollte, und jede Frage und jede Kandidatenantwort manuell kommentiert.

Empirische Ergebnisse zeigen, dass für einige moderne ModelleDieser Benchmark-Datensatz stellt sowohl für die Erklärungsgenerierung als auch für die Beantwortung von Analogiefragen eine große Herausforderung dar.  Dies führte zu weiteren Untersuchungen.

E-KAR.torrent
Seeding 0Herunterladen 3Abgeschlossen 103Gesamtdownloads 244
  • E-KAR/
    • README.md
      1.7 KB
    • README.txt
      3.39 KB
      • data/
        • README.md
          8.77 KB
        • README.md:Zone.Identifier
          8.96 KB
        • gitattributes.txt
          10.49 KB
        • gitattributes.txt:Zone.Identifier
          10.68 KB
        • gitignore.txt
          10.69 KB
        • gitignore.txt:Zone.Identifier
          10.87 KB
        • test_blind.json
          98.36 KB
        • test_blind.json:Zone.Identifier
          98.55 KB
        • test_easy_blind.json
          218.39 KB
        • test_easy_blind.json:Zone.Identifier
          218.59 KB
        • train.json
          1.2 MB
        • train.json:Zone.Identifier
          1.2 MB
        • validation.json
          1.34 MB
        • validation.json:Zone.Identifier
          1.34 MB