HyperAIHyperAI

Command Palette

Search for a command to run...

Inkrementeller Vortrainingsdatensatz Für Firefly Chinese Llama2

Der Datensatz ist Firefly-LLaMA2-Chinesisches Projekt Die inkrementellen Vortrainingsdaten umfassen insgesamt etwa 22 GB Text und umfassen hauptsächlich Open-Source-Datensätze wie CLUE, ThucNews, CNews, COIG, Wikipedia sowie alte Gedichte, Prosa, klassisches Chinesisch usw., die vom Forschungsteam gesammelt wurden. Die Datenverteilung ist in der folgenden Abbildung dargestellt.

firefly-pretrain-dataset.torrent
Seeding 1Downloading 0Completed 161Total Downloads 255
  • firefly-pretrain-dataset/
    • README.md
      1.04 KB
    • README.txt
      2.09 KB
      • data/
        • firefly-pretrain-dataset.zip
          9.02 GB

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp