MedMCQA: Ein großskaliges mehrstoffliches Multiple-Choice-Datensatz für die Fragebeantwortung im medizinischen Bereich

Diese Arbeit stellt MedMCQA vor, einen neuen, großskaligen Datensatz für Multiple-Choice-Fragen (MCQA), der darauf abzielt, echte Prüfungsfragen aus medizinischen Aufnahmeprüfungen abzubilden. Es wurden über 194.000 hochwertige MCQs aus den Aufnahmeprüfungen AIIMS und NEET PG gesammelt, die 2.400 Gesundheitsthemen und 21 medizinische Fachgebiete abdecken, mit einer durchschnittlichen Token-Länge von 12,77 und einer hohen thematischen Vielfalt. Jeder Datensatz enthält eine Frage, die korrekte Antwort bzw. die korrekten Antworten sowie mehrere Antwortalternativen, wodurch eine tiefere Sprachverarbeitung erforderlich ist, da die Modellleistung auf über 10 unterschiedliche Schlussfolgerungsfähigkeiten über ein breites Spektrum medizinischer Themen und Fachgebiete getestet wird. In dieser Studie wird zudem eine detaillierte Erklärung der Lösung zusammen mit den oben genannten Informationen bereitgestellt.