HyperAIHyperAI

Command Palette

Search for a command to run...

LawInstruct、初の大規模な法的指導データセット

Date

2年前

Size

9.84 GB

Organization

スタンフォード大学

Paper URL

arxiv.org

LawInstruct は、法律分野における初の大規模な指示データセットです。このデータセットはスタンフォード大学、ジョンズ・ホプキンス大学などが共同で作成したもので、2024年4月に公開される予定だ。 LawInstruct は、既存の法務タスク データセットのギャップを埋め、法的領域におけるモデルの開発を加速するために作成されました。

  1. データセットの特性:
    • 対象範囲: LawInstruct は 17 の管轄区域と 24 の言語をカバーしており、データセットの幅広い適用性と多様性を確保しています。
    • 規模と多様性: 質問応答、含意、要約、情報抽出などのさまざまな法務タスクをカバーする 1,200 万件のトレーニング例が含まれています。
  2. データセットの構造:
    • 各例はカスタマイズされた指示形式で表示され、データの一貫性と操作性が保証されます。
    • さまざまな法律業務や専門分野から得られた 58 個の高品質の注釈付きデータ セットが統合されています。
  3. 技術的な実装:
    • MultiLegalPile は 689 GB の多言語法的コーパスであり、モデルに豊富な事前トレーニング資料を提供します。
  4. パフォーマンスの向上:
    • LawInstruct の命令を調整することで、LegalBench 上の Flan-T5 XL モデルのバランスの取れた精度が大幅に向上し、モデルのパフォーマンスに対するデータセットのプラスの影響が実証されました。
  5. 研究と論文:
LawInstruct.torrent
Seeding 1Downloading 0Completed 172Total Downloads 425
  • LawInstruct/
    • README.md
      2.09 KB
    • README.txt
      4.18 KB
      • data/
        • lawinstruct.zip
          9.84 GB

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています