Command Palette
Search for a command to run...
LongCite-45k-Datensatz Zur Feinverbesserung Großer Modelle
Datum
Größe
Veröffentlichungs-URL
Paper-URL
Tags
LongCite-45k ist ein Open-Source-Datensatz, der 2024 von der Tsinghua-Universität veröffentlicht wurde. Ziel ist es, die Glaubwürdigkeit und Überprüfbarkeit großer Sprachmodelle (LLMs) bei Fragen-Antwort-Aufgaben mit langen Texten zu verbessern. Die relevanten Papierergebnisse sindLongCite: Ermöglicht LLMs die Generierung detaillierter Zitate in der Langzeit-QA".
Der Datensatz enthält 44.600 hochwertige Frage-Antwort-Daten mit Zitaten auf Satzebene, unterstützt die Verarbeitung langer Texte mit einer maximalen Länge von 128.000 Token und ermöglicht es Benutzern, die Genauigkeit der Antworten des Modells durch die Generierung feinkörniger Zitate auf Satzebene zu überprüfen.

KI mit KI entwickeln
Von der Idee bis zum Start — beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und den besten GPU-Preisen.