HyperAIHyperAI

Command Palette

Search for a command to run...

ShareGPT 90.000 Chinesischer Und Englischer Zweisprachiger Mensch-Maschine-Frage-Antwort-Datensatz

Date

vor 2 Jahren

Size

730.58 MB

ShareGPT-Chinese-English-90k ist ein hochwertiger Mensch-Maschine-Frage-Antwort-Datensatz parallel in Chinesisch und Englisch, der Benutzerfragen in realen und komplexen Szenarien abdeckt. Damit können hochwertige Konversationsmodelle trainiert werden (die bei der Befehlsverteilung robuster sind als Daten, die durch wiederholtes Aufrufen von API-Schnittstellen zur Simulation maschinengenerierter Fragen und Antworten generiert werden).

Die Merkmale dieses Datensatzes sind:

  • Gleichzeitig bietet es chinesische und englische Parallelvergleichskorpora mit genau derselben Bedeutung, die für das Training zweisprachiger Dialogmodelle verwendet werden können.
  • Bei allen Fragen handelt es sich nicht um künstlich erfundene oder durch API-Abfragen (wie etwa Moss) erstellte Fake-Daten, sondern sie entsprechen eher der Befehlsverteilung und Fragestellung realer Benutzerszenarien.
  • Der Sharegpt-Datensatz wird durch spontanes Teilen durch Internetnutzer gesammelt, was einer sehr natürlichen Filterung (durch den menschlichen Verstand) entspricht, bei der die meisten Gespräche mit schlechten Erfahrungen herausgefiltert werden.
ShareGPT-Chinese-English-90k.torrent
Seeding 1Downloading 0Completed 301Total Downloads 774
  • ShareGPT-Chinese-English-90k/
    • README.md
      1.5 KB
    • README.txt
      2.99 KB
      • data/
        • sharegpt-ec.zip
          730.58 MB

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp