Command Palette

Search for a command to run...

E-KAR 해석 가능한 지식 집약적 유추 추론 벤치마크의 중국어 버전

날짜

2년 전

크기

1.34 MB

기관

복단대학교

논문 URL

arxiv.org

E-KAR는 Benchmark for Explainable Knowledge-intensive Analogical Reasoning의 약자로, 설명 가능한 지식 집약적 유추 추론을 위한 벤치마크입니다.

유추를 인식하는 능력은 인간 인지의 기본입니다. 기존의 단어 유추 테스트 벤치마크는 신경 모델에서의 유추적 추론의 기본 과정을 보여주지 않습니다. 추론 능력이 있는 모델은 좋은 이유에 기반해야 한다는 믿음에서,우리는 지식이 있고 해석 가능한 유추 추론(E-KAR)에 대한 최초의 벤치마크를 제안합니다.

우리의 벤치마크 데이터 세트는 공무원 시험에서 출제된 1,655개(중국어) 문제와 1,251개(영어) 문제로 구성되어 있습니다.  이러한 문제를 해결하려면 심도 있는 배경 지식이 필요합니다. 우리는 유추적 추론을 수행해야 하는지 여부를 설명하기 위해 자유 텍스트 설명 체계를 설계하고 각 질문과 후보 답변에 수동으로 주석을 달았습니다.

경험적 결과는 일부 최신 모델의 경우이 벤치마크 데이터 세트는 설명 생성과 유추 질의 응답 작업 모두에 매우 까다롭습니다.  이로 인해 추가 연구가 진행되었습니다.

E-KAR.torrent
시딩 0다운로드 중 4완료됨 237총 다운로드 횟수 352
  • E-KAR/
    • README.md
      1.7 KB
    • README.txt
      3.39 KB
      • data/
        • README.md
          8.77 KB
        • README.md:Zone.Identifier
          8.96 KB
        • gitattributes.txt
          10.49 KB
        • gitattributes.txt:Zone.Identifier
          10.68 KB
        • gitignore.txt
          10.69 KB
        • gitignore.txt:Zone.Identifier
          10.87 KB
        • test_blind.json
          98.36 KB
        • test_blind.json:Zone.Identifier
          98.55 KB
        • test_easy_blind.json
          218.39 KB
        • test_easy_blind.json:Zone.Identifier
          218.59 KB
        • train.json
          1.2 MB
        • train.json:Zone.Identifier
          1.2 MB
        • validation.json
          1.34 MB
        • validation.json:Zone.Identifier
          1.34 MB

AI로 AI 구축

아이디어에서 출시까지 — 무료 AI 공동 코딩, 즉시 사용 가능한 환경, 최적 가격 GPU로 AI 개발을 가속화하세요.

AI 공동 코딩
즉시 사용 가능한 GPU
최적 가격
시작하기

Hyper Newsletters

최신 정보 구독하기
한국 시간 매주 월요일 오전 9시 에 이번 주의 최신 업데이트를 메일로 발송합니다
이메일 서비스 제공: MailChimp
E-KAR 해석 가능한 지식 집약적 유추 추론 벤치마크의 중국어 버전 | 데이터셋 | HyperAI초신경