HyperAI초신경

ODSQA 오픈 도메인 음성 질의응답 데이터 세트

날짜

2년 전

크기

52.24 MB

기관

코넬대학교

발행 주소

github.com

ODSQA(오픈 도메인 음성 질의응답 데이터 세트) 에서 ODSQA: 오픈 도메인 음성 질의응답 데이터 세트 . 이것은 중국 데이터세트입니다. 또한 영어 데이터 세트 Spoken-SQuAD도 제공됩니다.여기나타나다.

스포큰-SQuAD  이는 Google의 텍스트-음성(TTS) 시스템을 통해 SQuAD 데이터 세트에서 생성된 음성 질의-응답 코퍼스입니다. Spoken-SQuAD는 최첨단 지능형 질의응답 모델을 훈련할 만큼 충분히 크지만, 인공적으로 생성되었기 때문에 실제 음성 질의응답과 아직 차이가 있습니다. 그래서 연구자들은 3천 개가 넘는 질문을 담은 SQA 데이터 세트인 ODSQA를 공개했습니다. 현재 추출 기반 지능형 질의응답 작업을 위한 가장 큰 실제 SQA 데이터 세트입니다.

ODSQA.torrent
시딩 2다운로드 중 0완료됨 213총 다운로드 횟수 414
  • ODSQA/
    • DRCD-TTS.json
      10.15 MB
    • DRCD-backtrans.json
      23.2 MB
    • ODSQA_spokenq_test-v1.1.json
      25.05 MB
    • ODSQA_textq_test-v1.1.json
      26.11 MB
    • README.md
      26.12 MB
    • README.txt
      26.12 MB
      • data/
        • DRCD-TTS.json
          36.27 MB
        • DRCD-backtrans.json
          49.32 MB
        • ODSQA_spokenq_test-v1.1.json
          51.17 MB
        • ODSQA_textq_test-v1.1.json
          52.23 MB
        • README.md
          52.24 MB
        • download.sh
          52.24 MB
    • download.sh
      52.24 MB