HyperAIHyperAI

Command Palette

Search for a command to run...

LawInstruct: Der Erste Groß Angelegte Datensatz Mit Rechtsanweisungen

Datum

vor einem Jahr

Größe

9.84 GB

Organisation

Stanford Universität

Paper-URL

arxiv.org

LawInstruct ist der erste groß angelegte Anweisungsdatensatz für den Rechtsbereich. Dieser Datensatz wurde gemeinsam von der Stanford University, der Johns Hopkins University und anderen Institutionen erstellt und im April 2024 veröffentlicht. LawInstruct wurde entwickelt, um Lücken in vorhandenen Datensätzen für juristische Aufgaben zu schließen und die Entwicklung von Modellen im Rechtsbereich zu beschleunigen.

  1. Datensatzmerkmale:
    • Abdeckung: LawInstruct deckt 17 Rechtsräume und 24 Sprachen ab und gewährleistet so eine breite Anwendbarkeit und Vielfalt des Datensatzes.
    • Umfang und Vielfalt: Enthält 12 Millionen Trainingsbeispiele, die eine Vielzahl juristischer Aufgaben abdecken, wie z. B. Beantwortung von Fragen, Implikation, Zusammenfassung und Informationsextraktion.
  2. Datensatzstruktur:
    • Jedes Beispiel wird in einem angepassten Anweisungsformat präsentiert, um Datenkonsistenz und Bedienbarkeit sicherzustellen.
    • Es integriert 58 hochwertig annotierte Datensätze aus unterschiedlichen juristischen Aufgaben- und Berufsfeldern.
  3. Technische Umsetzung:
    • Wir haben MultiLegalPile verwendet, ein 689 GB großes mehrsprachiges Rechtskorpus, um umfangreiches Vortrainingsmaterial für das Modell bereitzustellen.
  4. Leistungsverbesserungen:
    • Durch die Anpassung der Anweisungen in LawInstruct wird die ausgewogene Genauigkeit des Flan-T5 XL-Modells in LegalBench erheblich verbessert, was den positiven Einfluss des Datensatzes auf die Modellleistung bestätigt.
  5. Forschung und Veröffentlichungen:
LawInstruct.torrent
Seeding 1Herunterladen 0Abgeschlossen 163Gesamtdownloads 386
  • LawInstruct/
    • README.md
      2.09 KB
    • README.txt
      4.18 KB
      • data/
        • lawinstruct.zip
          9.84 GB

KI mit KI entwickeln

Von der Idee bis zum Start — beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und den besten GPU-Preisen.

KI-Co-Coding
Sofort einsatzbereit GPUs
Beste Preise
Jetzt starten

Hyper Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp
LawInstruct: Der Erste Groß Angelegte Datensatz Mit Rechtsanweisungen | Datensätze | HyperAI