HyperAI

Ensemble De Données De Haute Qualité Sur Le Perfectionnement De La Surveillance Juridique Chinoise DISC-Law-SFT

Date

il y a 9 mois

Taille

80.22 MB

Organisation

Université Fudan

URL de publication

github.com

* Cet ensemble de données prend en charge l'utilisation en ligne.Cliquez ici pour sauter.

L'ensemble de données DISC-Law-SFT est un ensemble de données de réglage fin supervisé (SFT) de haute qualité construit par le laboratoire d'intelligence des données et d'informatique sociale de l'université Fudan (Fudan-DISC) en 2023. Il est utilisé pour former et améliorer les capacités d'application des grands modèles de langage (LLM) dans le domaine juridique et contient près de 300 000 données de formation. Cet ensemble de données est conçu spécifiquement pour le domaine juridique chinois, dans le but d'améliorer les capacités du modèle en matière de traitement de textes juridiques, de raisonnement juridique et de recherche et de conformité des connaissances dans le domaine judiciaire. Le document pertinent estDISC-LawLLM : Affiner les modèles linguistiques volumineux pour des services juridiques intelligents"

L'ensemble de données contient deux sous-ensembles : DISC-Law-SFT-Pair et DISC-Law-SFT-Triplet. Le sous-ensemble DISC-Law-SFT-Pair introduit des capacités de raisonnement juridique via la méthode de construction de paires d'instructions du syllogisme juridique, tandis que le sous-ensemble DISC-Law-SFT-Triplet améliore la capacité du modèle à utiliser des connaissances externes en construisant des triplets contenant des informations d'entrée, de sortie et de référence.

Les sources de données de l'ensemble de données comprennent principalement trois parties : des ensembles de données publics sur les tâches judiciaires du traitement du langage naturel (NLP) liées au droit chinois, des textes juridiques originaux du monde réel et des ensembles de données open source généraux. De telles sources de données garantissent la diversité et la richesse de l’ensemble de données.

DISC-Law-SFT.torrent
Partage 2Téléchargement 1Terminés 132Téléchargements totaux 431
  • DISC-Law-SFT/
    • README.md
      1.88 KB
    • README.txt
      3.77 KB
      • data/
        • DISC-Law-SFT.zip
          80.22 MB