HyperAI

MSMARCO-Datensatz Zum Maschinellen Leseverständnis

Datum

vor 6 Jahren

Größe

259.55 MB

Organisation

Microsoft

Veröffentlichungs-URL

www.msmarco.org

MSMARCO ist ein Datensatz zum maschinellen Leseverständnis, der 1.010.916 anonyme Fragen aus den Suchanfrageprotokollen von Bing enthält, die KI-generierte Antworten und 182.669 von Menschen umgeschriebene Antworten enthalten. Der Datensatz enthält außerdem 8.841.823 Absätze, die aus 3.563.535 Dokumenten extrahiert wurden.

Der MSMARCO-Datensatz wurde 2016 von Microsoft veröffentlicht und 2018 aktualisiert. Darüber hinaus verfügt der Datensatz über einen entsprechenden Ranking-Wettbewerb.

MSMARCO.torrent
Seeding 2Herunterladen 0Abgeschlossen 1,064Gesamtdownloads 1,423
  • MSMARCO/
    • README.md
      1.03 KB
    • README.txt
      2.06 KB
      • data/
        • dev_v2.1.json.gz
          131.9 MB
        • eval_v2.1_public.json.gz
          259.55 MB