ReasonMed-Datensatz Für Medizinisches Denken
Datum
Größe
Veröffentlichungs-URL
ReasonMed ist derzeit der größte Open-Source-Datensatz für medizinisches Denken. Die zugehörigen Ergebnisse der Studie lauten:ReasonMed: Ein 370.000 KB großer, von mehreren Agenten generierter Datensatz zur Weiterentwicklung der medizinischen Argumentation“, dessen Ziel darin besteht, Modelle für Aufgaben wie die Beantwortung medizinischer Fragen und die Textgenerierung zu trainieren und zu evaluieren.
Der Datensatz enthält 370.000 hochwertige Frage-Antwort-Beispiele aus mehreren Bereichen, wie etwa klinisches Wissen, Anatomie, Genetik usw. Die Daten werden aus 1,75 Millionen anfänglichen Argumentationspfaden extrahiert, die von drei großen Sprachmodellen (Qwen-2.5-72B, DeepSeek-R1-Distill-Llama-70B und HuatuoGPT-o1-70B) generiert wurden, und durch einen rigorosen Validierungs- und Optimierungsprozess mit mehreren Agenten verfeinert.