KI erkennt menschliche Bewertung bei Wirtschaftsprüfungen genau
Künstliche Intelligenz (KI) hat sich bei der Bewertung von freitextbasierten Antworten in Makroökonomie-Prüfungen als ebenbürtig gegenüber menschlichen Korrektoren erwiesen. Studierende müssen bei solchen Fragen nicht nur fachliches Wissen nachweisen, sondern auch wirtschaftliche Argumente strukturiert und kritisch entwickeln – eine Fähigkeit, die schwer automatisiert zu bewerten ist. Dennoch zeigte eine kürzlich durchgeführte Studie, dass moderne KI-Modelle, insbesondere auf Basis großer Sprachmodelle, in der Lage sind, Antworten mit hoher Genauigkeit und Konsistenz zu bewerten. Die KI wurde anhand von Hunderten von Studienarbeiten trainiert, die von menschlichen Dozenten bereits bewertet worden waren, und konnte anschließend die Leistung der Prüflinge in Bezug auf inhaltliche Tiefe, logische Struktur und wirtschaftliche Korrektheit vergleichbar mit menschlichen Korrektoren beurteilen. Die Studie, die an mehreren deutschen Universitäten durchgeführt wurde, zeigte, dass die Übereinstimmung zwischen KI und menschlichen Bewertern bei der Gesamtpunktzahl und der Beurteilung einzelner Kriterien wie Argumentationskraft, Anwendung von Begriffen und kritischer Analyse nahezu identisch war. Besonders bemerkenswert war, dass die KI auch bei komplexen, mehrschichtigen Antworten – etwa zu der Frage, wie hohe Bevölkerungswachstumsraten das Bruttoinlandsprodukt beeinflussen – konsistente und sinnvolle Bewertungen abgab. Dabei berücksichtigte sie Faktoren wie die Wirkung auf die Arbeitskraft, die Belastung öffentlicher Infrastruktur, die Investitionen in Bildung und die langfristige Wachstumstheorie. Die Einführung von KI in die Prüfungsbeurteilung könnte die Arbeitsbelastung von Universitätsassistenten erheblich verringern, die bisher oft über 100 Prüfungen pro Semester bewerten müssen. Zudem ermöglicht die automatisierte Bewertung eine schnellere Rückmeldung an Studierende, was das Lernergebnis positiv beeinflussen kann. KI-Systeme können zudem die Transparenz und Objektivität der Bewertung erhöhen, da sie standardisierte Kriterien anwenden und subjektive Abweichungen minimieren. Industrielle Experten sehen in der Entwicklung eine bedeutende Fortschrittsstufe für die digitale Transformation im Bildungswesen. „Die Fähigkeit der KI, nicht nur Fakten, sondern auch argumentative Strukturen und wirtschaftliche Denkweisen zu erfassen, ist ein Meilenstein“, sagt Dr. Lena Weber, Experte für KI in der Bildung an der TU Berlin. „Es ist nicht mehr nur um die Erkennung von Stichworten, sondern um die Verständnisfähigkeit von komplexen wirtschaftlichen Zusammenhängen.“ Unternehmen wie OpenAI, Google und IBM arbeiten bereits an spezialisierten KI-Modellen für akademische Bewertung, die auf ethischen und transparenten Prinzipien basieren. Die Technologie ist jedoch noch nicht überall bereit für den breiten Einsatz – Fragen der Datensicherheit, der Bias-Vermeidung und der menschlichen Aufsicht bleiben zentrale Herausforderungen. Dennoch markiert die Studie einen entscheidenden Schritt hin zu einer effizienteren, gerechteren und datenbasierten Prüfungspraxis in der Hochschulbildung.
