Datum

vor 2 Jahren

Größe

80.22 MB

Organisation

Veröffentlichungs-URL

github.com

Paper-URL

arxiv.org

* Dieser Datensatz unterstützt die Online-Nutzung.Klicken Sie hier, um zu springen.

Der DISC-Law-SFT-Datensatz ist ein hochwertiger, überwachter Feinabstimmungsdatensatz (SFT), der 2023 vom Data Intelligence and Social Computing Laboratory der Fudan University (Fudan-DISC) erstellt wurde. Er wird zum Trainieren und Verbessern der Anwendungsfähigkeiten großer Sprachmodelle (LLMs) im Rechtsbereich verwendet und enthält fast 300.000 Trainingsdaten. Dieser Datensatz wurde speziell für den chinesischen Rechtsbereich entwickelt und zielt darauf ab, die Fähigkeiten des Modells bei der Verarbeitung juristischer Texte, beim juristischen Denken sowie bei der Wissensabfrage und -einhaltung im Rechtsbereich zu verbessern. Das entsprechende Papier istDISC-LawLLM: Feinabstimmung großer Sprachmodelle für intelligente Rechtsdienstleistungen" Der Datensatz enthält zwei Teilmengen: DISC-Law-SFT-Pair und DISC-Law-SFT-Triplet. Die Teilmenge DISC-Law-SFT-Pair führt juristische Argumentationsfähigkeiten durch die Methode der Anweisungspaarkonstruktion des juristischen Syllogismus ein, während die Teilmenge DISC-Law-SFT-Triplett die Fähigkeit des Modells verbessert, externes Wissen zu nutzen, indem sie Tripel konstruiert, die Eingabe-, Ausgabe- und Referenzinformationen enthalten. Die Datenquellen des Datensatzes umfassen hauptsächlich drei Teile: öffentliche Datensätze zu NLP-Rechtsaufgaben im Zusammenhang mit chinesischem Recht, Originalrechtstexte aus der realen Welt und allgemeine Open-Source-Datensätze. Solche Datenquellen gewährleisten die Vielfalt und Reichhaltigkeit des Datensatzes.

DISC-Law-SFT.torrent

Seeding 1Wird heruntergeladen 0Abgeschlossen 226Gesamtdownloads 821

DISC-Law-SFT/
- README.md
  1.88 KB
- README.txt
  3.77 KB

Dieser Datensatz wurde von Community-Nutzern beigesteuert und dient ausschließlich Bildungs- und Informationszwecken. Falls Inhalte eine Urheberrechtsverletzung darstellen, kontaktieren Sie uns bitte unter [email protected] zur umgehenden Prüfung und Entfernung.

Zugehörige Datensätze

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

HyperAI

Diesen Datensatz verwenden

Auf Discord diskutieren

Datum

vor 2 Jahren

Größe

80.22 MB

Organisation

Veröffentlichungs-URL

github.com

Paper-URL

arxiv.org

* Dieser Datensatz unterstützt die Online-Nutzung.Klicken Sie hier, um zu springen.

DISC-Law-SFT.torrent

Seeding 1Wird heruntergeladen 0Abgeschlossen 226Gesamtdownloads 821

DISC-Law-SFT/
- README.md
  1.88 KB
- README.txt
  3.77 KB

Zugehörige Datensätze

zh-meme-sft-8k Chinesischer Internet-Meme-Kultur-Datensatz

vor 2 Monaten

Groundsource Global Flood Events Dataset

vor 3 Monaten

RubricHub_v1 Multi-Domain Generative Task Dataset

vor 4 Monaten

GroundingME-Datensatz Zur Evaluierung Des Verständnisses Komplexer Szenen

vor 5 Monaten

TxT360-3efforts Multi-Task Inference Dataset

vor 5 Monaten

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

Command Palette

DISC-Law-SFT Hochwertiger Feinabstimmungsdatensatz Zur Chinesischen Rechtsaufsicht

* Dieser Datensatz unterstützt die Online-Nutzung.Klicken Sie hier, um zu springen.

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

DISC-Law-SFT Hochwertiger Feinabstimmungsdatensatz Zur Chinesischen Rechtsaufsicht

* Dieser Datensatz unterstützt die Online-Nutzung.Klicken Sie hier, um zu springen.

Zugehörige Datensätze

zh-meme-sft-8k Chinesischer Internet-Meme-Kultur-Datensatz

Groundsource Global Flood Events Dataset

RubricHub_v1 Multi-Domain Generative Task Dataset

GroundingME-Datensatz Zur Evaluierung Des Verständnisses Komplexer Szenen

TxT360-3efforts Multi-Task Inference Dataset

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

DISC-Law-SFT Hochwertiger Feinabstimmungsdatensatz Zur Chinesischen Rechtsaufsicht

* Dieser Datensatz unterstützt die Online-Nutzung.Klicken Sie hier, um zu springen.

Zugehörige Datensätze

zh-meme-sft-8k Chinesischer Internet-Meme-Kultur-Datensatz

Groundsource Global Flood Events Dataset

RubricHub_v1 Multi-Domain Generative Task Dataset

GroundingME-Datensatz Zur Evaluierung Des Verständnisses Komplexer Szenen

TxT360-3efforts Multi-Task Inference Dataset

KI mit KI entwickeln

HyperAI Newsletters

Zugehörige Datensätze

zh-meme-sft-8k Chinesischer Internet-Meme-Kultur-Datensatz

Groundsource Global Flood Events Dataset

RubricHub_v1 Multi-Domain Generative Task Dataset

GroundingME-Datensatz Zur Evaluierung Des Verständnisses Komplexer Szenen

TxT360-3efforts Multi-Task Inference Dataset

Zugehörige Datensätze

zh-meme-sft-8k Chinesischer Internet-Meme-Kultur-Datensatz

Groundsource Global Flood Events Dataset

RubricHub_v1 Multi-Domain Generative Task Dataset

GroundingME-Datensatz Zur Evaluierung Des Verständnisses Komplexer Szenen

TxT360-3efforts Multi-Task Inference Dataset