HyperAIHyperAI

Command Palette

Search for a command to run...

MedQA 医療テキストの質問と回答のデータ セット

Date

1年前

Size

125.64 MB

Organization

マサチューセッツ工科大学
華中科学技術大学

Publish URL

github.com

Paper URL

arxiv.org

Tags

MedQA データセットは、米国医師免許試験 (USMLE) のスタイルをシミュレートした医療分野向けの質問と回答のデータセットで、MIT と華中科技大学の研究チームによって 2020 年にリリースされました。関連する論文結果は「この患者はどのような病気を患っていますか? 健康診断からの大規模なオープンドメイン質問回答データセット「」。このデータセットは専門的な健康診断から収集されたもので、英語、中国語(簡体字)、中国語(繁体字)をカバーし、それぞれ 12,723、34,251、14,123 の質問が含まれており、モデルの理解と医学知識の応用を評価することを目的としています。 。

MedQA データセットの構築は専門医師免許試験に基づいており、問題の高品質と専門性が保証されています。質問データに加えて、医学教科書の大規模なコーパスが収集および公開されており、読解モデルはそこから質問に答えるために必要な知識を取得できます。データセットはトレーニングセット、開発セット、テストセットに分かれており、それぞれモデルのトレーニング、検証、テストに使用されます。

データセットのパーティション、質問と回答の長さの統計
MedQA.torrent
Seeding 1Downloading 0Completed 262Total Downloads 1,024
  • MedQA/
    • README.md
      1.75 KB
    • README.txt
      3.5 KB
      • data/
        • data_clean.zip
          125.64 MB

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています