HyperAI

ODSQA Open Domain-Datensatz Zum Beantworten Mündlicher Fragen

Datum

vor 2 Jahren

Größe

52.24 MB

Organisation

Cornell Universität

Veröffentlichungs-URL

github.com

ODSQA (Open-Domain-Datensatz zum Beantworten gesprochener Fragen) Aus ODSQA: Open-Domain-Datensatz zum Beantworten mündlicher Fragen . Dies ist ein chinesischer Datensatz. Darüber hinaus wird auch ein englischer Datensatz Spoken-SQuAD bereitgestellt.Hierauftauchen.

Gesprochen-SQuAD  Es handelt sich um ein gesprochenes Frage-Antwort-Korpus, das aus dem SQuAD-Datensatz über das Text-to-Speech-System (TTS) von Google generiert wurde. Obwohl Spoken-SQuAD groß genug ist, um hochmoderne intelligente Frage-Antwort-Modelle zu trainieren, wird es künstlich generiert und weist daher immer noch eine gewisse Lücke zur echten gesprochenen Frage-Antwort auf. Daher veröffentlichten die Forscher einen SQA-Datensatz mit mehr als dreitausend Fragen namens ODSQA. Es handelt sich derzeit um den größten realen SQA-Datensatz für extraktionsbasierte intelligente Frage- und Antwortaufgaben.

ODSQA.torrent
Seeding 2Herunterladen 0Abgeschlossen 213Gesamtdownloads 414
  • ODSQA/
    • DRCD-TTS.json
      10.15 MB
    • DRCD-backtrans.json
      23.2 MB
    • ODSQA_spokenq_test-v1.1.json
      25.05 MB
    • ODSQA_textq_test-v1.1.json
      26.11 MB
    • README.md
      26.12 MB
    • README.txt
      26.12 MB
      • data/
        • DRCD-TTS.json
          36.27 MB
        • DRCD-backtrans.json
          49.32 MB
        • ODSQA_spokenq_test-v1.1.json
          51.17 MB
        • ODSQA_textq_test-v1.1.json
          52.23 MB
        • README.md
          52.24 MB
        • download.sh
          52.24 MB
    • download.sh
      52.24 MB