HyperAIHyperAI

Command Palette

Search for a command to run...

E-KAR Chinesische Version Des Interpretierbaren Wissensintensiven Benchmarks Für Analoges Denken

Datum

vor 2 Jahren

Größe

1.34 MB

Organisation

Fudan-Universität

Paper-URL

arxiv.org

E-KAR steht für Benchmark for Explainable Knowledge-intensive Analogical Reasoning, ein Benchmark für erklärbares wissensintensives analoges Denken.

Die Fähigkeit, Analogien zu erkennen, ist grundlegend für die menschliche Wahrnehmung. Vorhandene Benchmarks für Wortanalogietests geben keinen Aufschluss über den zugrunde liegenden Prozess des analogen Denkens in neuronalen Modellen. Aus der Überzeugung heraus, dass Modelle mit Argumentationskraft auf guten Gründen basieren sollten,Wir schlagen den ersten Benchmark für sachkundiges, interpretierbares analoges Denken (E-KAR) vor.

Unser Benchmark-Datensatz besteht aus 1.655 (auf Chinesisch) und 1.251 (auf Englisch) Fragen aus der Beamtenprüfung.  Die Lösung dieser Probleme erfordert umfangreiches Hintergrundwissen. Wir haben ein Freitext-Erklärungsschema entwickelt, um zu erläutern, ob analoges Denken angewendet werden sollte, und jede Frage und jede Kandidatenantwort manuell kommentiert.

Empirische Ergebnisse zeigen, dass für einige moderne ModelleDieser Benchmark-Datensatz stellt sowohl für die Erklärungsgenerierung als auch für die Beantwortung von Analogiefragen eine große Herausforderung dar.  Dies führte zu weiteren Untersuchungen.

E-KAR.torrent
Seeding 0Herunterladen 4Abgeschlossen 237Gesamtdownloads 352
  • E-KAR/
    • README.md
      1.7 KB
    • README.txt
      3.39 KB
      • data/
        • README.md
          8.77 KB
        • README.md:Zone.Identifier
          8.96 KB
        • gitattributes.txt
          10.49 KB
        • gitattributes.txt:Zone.Identifier
          10.68 KB
        • gitignore.txt
          10.69 KB
        • gitignore.txt:Zone.Identifier
          10.87 KB
        • test_blind.json
          98.36 KB
        • test_blind.json:Zone.Identifier
          98.55 KB
        • test_easy_blind.json
          218.39 KB
        • test_easy_blind.json:Zone.Identifier
          218.59 KB
        • train.json
          1.2 MB
        • train.json:Zone.Identifier
          1.2 MB
        • validation.json
          1.34 MB
        • validation.json:Zone.Identifier
          1.34 MB

KI mit KI entwickeln

Von der Idee bis zum Start — beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und den besten GPU-Preisen.

KI-Co-Coding
Sofort einsatzbereit GPUs
Beste Preise
Jetzt starten

Hyper Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp
E-KAR Chinesische Version Des Interpretierbaren Wissensintensiven Benchmarks Für Analoges Denken | Datensätze | HyperAI