ODSQA Open Domain-Datensatz Zum Beantworten Mündlicher Fragen
Datum
Größe
Veröffentlichungs-URL
ODSQA (Open-Domain-Datensatz zum Beantworten gesprochener Fragen) Aus ODSQA: Open-Domain-Datensatz zum Beantworten mündlicher Fragen . Dies ist ein chinesischer Datensatz. Darüber hinaus wird auch ein englischer Datensatz Spoken-SQuAD bereitgestellt.Hierauftauchen.
Gesprochen-SQuAD Es handelt sich um ein gesprochenes Frage-Antwort-Korpus, das aus dem SQuAD-Datensatz über das Text-to-Speech-System (TTS) von Google generiert wurde. Obwohl Spoken-SQuAD groß genug ist, um hochmoderne intelligente Frage-Antwort-Modelle zu trainieren, wird es künstlich generiert und weist daher immer noch eine gewisse Lücke zur echten gesprochenen Frage-Antwort auf. Daher veröffentlichten die Forscher einen SQA-Datensatz mit mehr als dreitausend Fragen namens ODSQA. Es handelt sich derzeit um den größten realen SQA-Datensatz für extraktionsbasierte intelligente Frage- und Antwortaufgaben.