HyperAIHyperAI

Command Palette

Search for a command to run...

LongCite-45k-Datensatz Zur Feinverbesserung Großer Modelle

Datum

vor einem Jahr

Größe

1.7 GB

Organisation

Tsinghua-Universität

Veröffentlichungs-URL

github.com

Paper-URL

arxiv.org

LongCite-45k ist ein Open-Source-Datensatz, der 2024 von der Tsinghua-Universität veröffentlicht wurde. Ziel ist es, die Glaubwürdigkeit und Überprüfbarkeit großer Sprachmodelle (LLMs) bei Fragen-Antwort-Aufgaben mit langen Texten zu verbessern. Die relevanten Papierergebnisse sindLongCite: Ermöglicht LLMs die Generierung detaillierter Zitate in der Langzeit-QA".

Der Datensatz enthält 44.600 hochwertige Frage-Antwort-Daten mit Zitaten auf Satzebene, unterstützt die Verarbeitung langer Texte mit einer maximalen Länge von 128.000 Token und ermöglicht es Benutzern, die Genauigkeit der Antworten des Modells durch die Generierung feinkörniger Zitate auf Satzebene zu überprüfen.

LongCite-45k.torrent
Seeding 1Herunterladen 0Abgeschlossen 159Gesamtdownloads 201
  • LongCite-45k/
    • README.md
      1.22 KB
    • README.txt
      2.45 KB
      • data/
        • LongCite-45k.zip
          1.7 GB

KI mit KI entwickeln

Von der Idee bis zum Start — beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und den besten GPU-Preisen.

KI-Co-Coding
Sofort einsatzbereit GPUs
Beste Preise
Jetzt starten

Hyper Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp