MSMARCO-Datensatz Zum Maschinellen Leseverständnis
Datum
vor 6 Jahren
Größe
259.55 MB
Veröffentlichungs-URL
Kategorien
MSMARCO ist ein Datensatz zum maschinellen Leseverständnis, der 1.010.916 anonyme Fragen aus den Suchanfrageprotokollen von Bing enthält, die KI-generierte Antworten und 182.669 von Menschen umgeschriebene Antworten enthalten. Der Datensatz enthält außerdem 8.841.823 Absätze, die aus 3.563.535 Dokumenten extrahiert wurden.
Der MSMARCO-Datensatz wurde 2016 von Microsoft veröffentlicht und 2018 aktualisiert. Darüber hinaus verfügt der Datensatz über einen entsprechenden Ranking-Wettbewerb.
MSMARCO.torrent
Seeding 2Herunterladen 0Abgeschlossen 1,064Gesamtdownloads 1,423