HyperAI超神経

302 件の希少疾患症例データセット

日付

2ヶ月前

公開URL

github.com

ライセンス

非商业用途

ダウンロードヘルプ

※本データセットはオンライン利用に対応しておりますが、ここをクリックしてジャンプしてください

このデータセットは論文です。マルチエージェント会話型大規模言語モデルによる診断能力の強化「この研究で使用されたテストセットはNature誌に受け入れられました。

このデータセットには 302 の希少疾患が含まれており、各カテゴリから 1 ~ 9 個の希少疾患がランダムに選択されています。これらの希少疾患は、欧州委員会が共同出資する包括的な希少疾患データベースである Orphanet データベースの 33 種類、7,000 件以上の希少疾患から選択されました。希少疾患は種類によって分布が異なるため、バランスのとれた代表性を確保するために、正規化された加重ランダムサンプリング法を使用して選択されました。サンプリング重みは、各タイプの疾患数に合わせて調整され、自然対数変換によって調整されました。