HyperAIHyperAI

Command Palette

Search for a command to run...

302 例罕见病病例数据集

Use this DatasetDiscuss on Discord

Date

9 个月前

Publish URL

github.com

License

Non-Commercial

该数据集为论文「Enhancing diagnostic capability with multi-agents conversational large language models」所用测试集,该研究已被 nature 接受。

该数据集包含 302 种罕见病,每个类别随机选取 1 至 9 种罕见病。这些罕见病是从 Orphanet 数据库中 33 种类型的 7k+ 种罕见病中选出的,Orphanet 数据库是欧盟委员会共同资助的综合罕见病数据库。由于罕见病在不同类型的分布不同,因此采用归一化加权随机抽样方法进行选择,以确保均衡的代表性。根据每种类型的疾病数量调整抽样权重,并通过自然对数变换进行调整。

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

HyperAI Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供