Command Palette
Search for a command to run...
LongCite-45k-Datensatz Zur Feinverbesserung Großer Modelle
Date
Size
Publish URL
Paper URL
LongCite-45k ist ein Open-Source-Datensatz, der 2024 von der Tsinghua-Universität veröffentlicht wurde. Ziel ist es, die Glaubwürdigkeit und Überprüfbarkeit großer Sprachmodelle (LLMs) bei Fragen-Antwort-Aufgaben mit langen Texten zu verbessern. Die relevanten Papierergebnisse sindLongCite: Ermöglicht LLMs die Generierung detaillierter Zitate in der Langzeit-QA".
Der Datensatz enthält 44.600 hochwertige Frage-Antwort-Daten mit Zitaten auf Satzebene, unterstützt die Verarbeitung langer Texte mit einer maximalen Länge von 128.000 Token und ermöglicht es Benutzern, die Genauigkeit der Antworten des Modells durch die Generierung feinkörniger Zitate auf Satzebene zu überprüfen.

Build AI with AI
From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.