HyperAI

Alpaca-Cleaned-Befehls-Feinabstimmungsdatensatz

Datum

vor 9 Monaten

Größe

13.98 MB

Veröffentlichungs-URL

huggingface.co

Der Alpaca-Cleaned-Datensatz ist eine bereinigte Version des ursprünglichen Alpaca-Datensatzes, der 2024 von der Stanford University veröffentlicht wurde. Der ursprüngliche Alpaca ist ein Datensatz mit 52.000 Anweisungen und Demonstrationen, die von der Engine von OpenAI (text-davinci-003) generiert wurden. Diese Anweisungsdaten können verwendet werden, um Anweisungsanpassungen am Sprachmodell vorzunehmen, sodass das Sprachmodell den Anweisungen besser folgt.

Dieser Datensatz behebt einige Probleme des ursprünglichen Alpaca, wie etwa halluzinatorische Antworten, zusammengeführte Anweisungen, leere Ausgaben und inkonsistente Eingabefelder, und verbessert so die Qualität und Konsistenz der Daten. Der Alpaca-Cleaned-Datensatz verfügt über verschiedene Anwendungsszenarien, darunter Textgenerierung, Frage-Antwort-Systeme, Verständnis natürlicher Sprache sowie Verständnis und Generierung von Code. Zu seinen Funktionen gehören Qualitätsoptimierung, Leistungsverbesserung, umfangreiche Modellressourcen, Open-Source-Code und Community-Support. Es fördert die Beteiligung der Community, kontinuierliche Aktualisierung und Verbesserung und fördert die Entwicklung des NLP-Bereichs.

Alpaca-Cleaned.torrent
Seeding 2Herunterladen 0Abgeschlossen 107Gesamtdownloads 114
  • Alpaca-Cleaned/
    • README.md
      1.57 KB
    • README.txt
      3.15 KB
      • data/
        • Alpaca-Cleaned.zip
          13.98 MB