Generative AI fordert neue Bewertungsformen in der Hochschulbildung
In der Hochschulbildung steht die Bewertung von Lernleistungen im Jahr 2025 vor einem tiefgreifenden Wandel, ausgelöst durch die Verbreitung generativer KI. Jason M. Lodge, ein führender Erziehungswissenschaftler, fordert in einer bahnbrechenden Analyse eine systematische Neugestaltung der Prüfungspraxis – nicht, um KI zu bekämpfen, sondern um sie als Teil eines neuen, authentischeren Lernkonzepts zu integrieren. Sein sechsteiliges „Scoreboard“ – Ignorieren, Verbieten, Überwachen, Umarmen, Umgehen, Neugestalten – verdeutlicht, dass nur die letzte Option, das Neugestalten, dauerhafte Lösungen bietet. Die klassischen Strategien, wie das Verbot von KI oder die Einführung von Proctoring-Software, erweisen sich als untragbar: Sie sind technisch umstritten, ethisch problematisch und fördern eine Kultur des Misstrauens. Studien zeigen, dass bereits ein Viertel der deutschen Universitätsstudierenden täglich KI-Tools nutzen, oft ohne klare Richtlinien. Detektionstools sind unzuverlässig, und neue Werkzeuge wie Cluely oder CheatingDaddy ermöglichen in Echtzeit-Antworten, die selbst aufwändige Überwachung umgehen. Zudem entsteht ein „KI-Doppelstandard“, da viele Lehrkräfte KI in Forschung und Lehre selbst nutzen, aber Studierende dafür bestrafen. Als Alternative schlagen viele Pädagogen eine Integration von KI vor. Ohio State University will ab 2025 allen Studierenden die Nutzung von KI in den Unterricht vorschreiben, um „KI-Fluency“ zu fördern. In China sind KI-Tools bereits in den Lehrplan integriert. In der Praxis bedeutet dies, dass Studierende KI als „Sparringspartner“ einsetzen: Sie erstellen mit KI einen Entwurf, analysieren dessen Schwächen, korrigieren und verteidigen ihre Argumente. So wird KI nicht zum Ersatz, sondern zum Werkzeug für kritisches Denken. Andere Ansätze setzen auf Prozesssichtbarkeit: mündliche Prüfungen, Vivas, Peer-Feedback, Projektarbeiten oder „Unessays“ – kreative Abgaben wie Podcasts oder Zeichnungen – verlangen individuelle Auseinandersetzung, die KI nicht einfach nachbilden kann. Die University of Queensland führte interaktive mündliche Prüfungen mit 230 Studierenden durch und stellte fest, dass diese tieferen Einblicke in das Verständnis boten als schriftliche Arbeiten. Ein zentraler Punkt ist die Neuausrichtung der Bewertungskriterien: statt auf Faktenwissen oder perfekte Strukturen zu setzen, sollen KI-Überprüfungsvermögen, ethische Urteilskraft, kreative Reinterpretation und Prozessreflexion im Fokus stehen. Die Validität der Bewertung – also, ob tatsächlich das gemessen wird, was gemeint ist – muss stärker gewichtet werden als Effizienz. Automatisierte Bewertungssysteme können kreative oder originelle Leistungen übersehen, während menschliche Beurteilung diese Nuancen erkennt. Gleichzeitig muss die Motivation der Studierenden verändert werden: Wenn Aufgaben sinnvoll und kollaborativ gestaltet sind, sinkt der Druck, KI zur Leistungssteigerung einzusetzen. Insgesamt zeigt sich, dass die Herausforderung nicht in der Kontrolle von KI liegt, sondern in der Neugestaltung des Lernens selbst. Die Zukunft der Bewertung liegt in einer Kultur des Vertrauens, der Transparenz und der Authentizität – wo KI als Werkzeug, nicht als Bedrohung, wahrgenommen wird. Die Hochschulen müssen dafür sorgen, dass Lehrkräfte unterstützt werden, dass Klassen klein genug sind, dass Prozessbewertung möglich ist, und dass Studierende in den Gestaltungsprozess einbezogen werden. Die KI ist kein Feind des Lernens – sie ist ein Spiegel, der zeigt, dass die alte Bewertungskultur längst überholt ist. Die Chance liegt darin, aus der Krise eine Transformation zu machen: eine Bewertung, die nicht nur prüft, sondern wirklich lehrt.
