HyperAIHyperAI

Command Palette

Search for a command to run...

LawInstruct: Der Erste Groß Angelegte Datensatz Mit Rechtsanweisungen

Date

vor 2 Jahren

Size

9.84 GB

Organization

Stanford Universität

Paper URL

arxiv.org

LawInstruct ist der erste groß angelegte Anweisungsdatensatz für den Rechtsbereich. Dieser Datensatz wurde gemeinsam von der Stanford University, der Johns Hopkins University und anderen Institutionen erstellt und im April 2024 veröffentlicht. LawInstruct wurde entwickelt, um Lücken in vorhandenen Datensätzen für juristische Aufgaben zu schließen und die Entwicklung von Modellen im Rechtsbereich zu beschleunigen.

  1. Datensatzmerkmale:
    • Abdeckung: LawInstruct deckt 17 Rechtsräume und 24 Sprachen ab und gewährleistet so eine breite Anwendbarkeit und Vielfalt des Datensatzes.
    • Umfang und Vielfalt: Enthält 12 Millionen Trainingsbeispiele, die eine Vielzahl juristischer Aufgaben abdecken, wie z. B. Beantwortung von Fragen, Implikation, Zusammenfassung und Informationsextraktion.
  2. Datensatzstruktur:
    • Jedes Beispiel wird in einem angepassten Anweisungsformat präsentiert, um Datenkonsistenz und Bedienbarkeit sicherzustellen.
    • Es integriert 58 hochwertig annotierte Datensätze aus unterschiedlichen juristischen Aufgaben- und Berufsfeldern.
  3. Technische Umsetzung:
    • Wir haben MultiLegalPile verwendet, ein 689 GB großes mehrsprachiges Rechtskorpus, um umfangreiches Vortrainingsmaterial für das Modell bereitzustellen.
  4. Leistungsverbesserungen:
    • Durch die Anpassung der Anweisungen in LawInstruct wird die ausgewogene Genauigkeit des Flan-T5 XL-Modells in LegalBench erheblich verbessert, was den positiven Einfluss des Datensatzes auf die Modellleistung bestätigt.
  5. Forschung und Veröffentlichungen:
LawInstruct.torrent
Seeding 1Downloading 0Completed 172Total Downloads 425
  • LawInstruct/
    • README.md
      2.09 KB
    • README.txt
      4.18 KB
      • data/
        • lawinstruct.zip
          9.84 GB

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp