日付

2年前

サイズ

80.22 MB

データセット構成

公開URL

Paper URL

タグ

※本データセットはオンライン利用に対応しておりますが、ここをクリックしてジャンプしてください。

DISC-Law-SFT データセットは、2023 年に復旦大学のデータインテリジェンスおよびソーシャルコンピューティング研究所 (Fudan-DISC) によって構築された高品質の教師ありファインチューニング (SFT) データセットです。大規模なデータセットのトレーニングと改善に使用されます。法務分野のモデル (LLM) のアプリケーション機能には、約 300,000 個のトレーニングデータが含まれています。このデータセットは中国の法律分野向けに特別に設計されており、法文処理、法的推論思考、司法分野の知識の検索とコンプライアンスにおけるモデルの機能を向上させることを目的としています。関連論文は「DISC-LawLLM: インテリジェントな法律サービスのための大規模言語モデルの微調整」データセットには、DISC-Law-SFT-Pair と DISC-Law-SFT-Triplet の 2 つのサブセットが含まれています。 DISC-Law-SFT-Pair サブセットは、法的三段論法の命令ペア構築方法を通じて法的推論機能を導入します。一方、DISC-Law-SFT-Triplet サブセットは、入力、出力、および参照情報を含むトリプルを構築することによってモデルを強化します。外部の知識を活用します。データセットのデータソースには主に 3 つの部分が含まれています。中国法に関連する NLP 司法タスク公開データセット、現実世界の法律関連の原文、および一般的なオープンソースデータセットです。このようなデータソースにより、データセットの多様性と豊富さが保証されます。

DISC-Law-SFT.torrent

シーディング 1ダウンロード中 0完了 226総ダウンロード数 821

DISC-Law-SFT/
- README.md
  1.88 KB
- README.txt
  3.77 KB

このデータセットはコミュニティユーザーによって提供されており、教育および情報提供のみを目的としています。著作権侵害に関わるコンテンツがある場合は、[email protected]までご連絡ください。速やかに確認し、削除いたします。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

HyperAI

このデータセットを使用

Discordで議論

日付

2年前

サイズ

80.22 MB

データセット構成

公開URL

Paper URL

タグ

※本データセットはオンライン利用に対応しておりますが、ここをクリックしてジャンプしてください。

DISC-Law-SFT.torrent

シーディング 1ダウンロード中 0完了 226総ダウンロード数 821

DISC-Law-SFT/
- README.md
  1.88 KB
- README.txt
  3.77 KB

zh-meme-sft-8k 中国インターネットミーム文化データセット

3ヶ月前

地上情報源による世界洪水イベントデータセット

3ヶ月前

RubricHub_v1 マルチドメイン生成タスクデータセット

5ヶ月前

GroundingME 複雑シーン理解評価データセット

6ヶ月前

TxT360-3efforts マルチタスク推論データセット

6ヶ月前

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

※本データセットはオンライン利用に対応しておりますが、ここをクリックしてジャンプしてください。

AIでAIを構築

HyperAI Newsletters

※本データセットはオンライン利用に対応しておりますが、ここをクリックしてジャンプしてください。

関連データセット

zh-meme-sft-8k 中国インターネットミーム文化データセット

地上情報源による世界洪水イベントデータセット

RubricHub_v1 マルチドメイン生成タスクデータセット

GroundingME 複雑シーン理解評価データセット

TxT360-3efforts マルチタスク推論データセット

AIでAIを構築

HyperAI Newsletters

※本データセットはオンライン利用に対応しておりますが、ここをクリックしてジャンプしてください。

関連データセット

zh-meme-sft-8k 中国インターネットミーム文化データセット

地上情報源による世界洪水イベントデータセット

RubricHub_v1 マルチドメイン生成タスクデータセット

GroundingME 複雑シーン理解評価データセット

TxT360-3efforts マルチタスク推論データセット

AIでAIを構築

HyperAI Newsletters

関連データセット

zh-meme-sft-8k 中国インターネットミーム文化データセット

地上情報源による世界洪水イベントデータセット

RubricHub_v1 マルチドメイン生成タスクデータセット

GroundingME 複雑シーン理解評価データセット

TxT360-3efforts マルチタスク推論データセット

関連データセット

zh-meme-sft-8k 中国インターネットミーム文化データセット

地上情報源による世界洪水イベントデータセット

RubricHub_v1 マルチドメイン生成タスクデータセット

GroundingME 複雑シーン理解評価データセット

TxT360-3efforts マルチタスク推論データセット

Command Palette

DISC-Law-SFT 高品質の中国法務監督微調整データセット

※本データセットはオンライン利用に対応しておりますが、ここをクリックしてジャンプしてください。

AIでAIを構築

HyperAI Newsletters

Command Palette

DISC-Law-SFT 高品質の中国法務監督微調整データセット

※本データセットはオンライン利用に対応しておりますが、ここをクリックしてジャンプしてください。

関連データセット

zh-meme-sft-8k 中国インターネットミーム文化データセット

地上情報源による世界洪水イベントデータセット

RubricHub_v1 マルチドメイン生成タスクデータセット

GroundingME 複雑シーン理解評価データセット

TxT360-3efforts マルチタスク推論データセット

AIでAIを構築

HyperAI Newsletters

Command Palette

DISC-Law-SFT 高品質の中国法務監督微調整データセット

※本データセットはオンライン利用に対応しておりますが、ここをクリックしてジャンプしてください。

関連データセット

zh-meme-sft-8k 中国インターネットミーム文化データセット

地上情報源による世界洪水イベントデータセット

RubricHub_v1 マルチドメイン生成タスクデータセット

GroundingME 複雑シーン理解評価データセット

TxT360-3efforts マルチタスク推論データセット

AIでAIを構築

HyperAI Newsletters

関連データセット

zh-meme-sft-8k 中国インターネットミーム文化データセット

地上情報源による世界洪水イベントデータセット

RubricHub_v1 マルチドメイン生成タスクデータセット

GroundingME 複雑シーン理解評価データセット

TxT360-3efforts マルチタスク推論データセット

関連データセット

zh-meme-sft-8k 中国インターネットミーム文化データセット

地上情報源による世界洪水イベントデータセット

RubricHub_v1 マルチドメイン生成タスクデータセット

GroundingME 複雑シーン理解評価データセット

TxT360-3efforts マルチタスク推論データセット