Wie ChatGPT im Stillen das studentische Schreiben verändert, nicht die Noten

Eine neue Studie mit fast 5,000 studentischen Berichten zeigt, dass die schriftlichen Arbeiten seit dem Start von ChatGPT eleganter, formeller und positiver geworden sind, obwohl die Noten unverändert geblieben sind. Die Ergebnisse werfen neue Fragen zum Thema Ausdrucksfähigkeit, kritisches Denken und zur Frage auf, wie Universitäten das Schreiben in einer KI-geprägten Welt lehren sollten.

Seit der Einführung von ChatGPT sind die studentischen Texte ausgefeilter, formeller und positiver geworden – die Noten haben sich jedoch kaum verändert, wie eine neue Studie unter der Leitung der Universität Warwick zeigt.

Die Forscher analysierten fast 5,000 von Studierenden verfasste Berichte über einen Zeitraum von zehn Jahren und stellten fest, dass sich die von Studierenden verwendete Sprache seit Ende 2022, als generative KI-Tools wie ChatGPT weit verbreitet wurden, merklich verändert hat. Ihre Arbeit, veröffentlicht In der Fachzeitschrift Computers and Education: Artificial Intelligence wird angedeutet, dass KI subtil die Art und Weise verändert, wie Schüler schreiben, auch wenn sie noch nicht verändert hat, was sie argumentieren oder erklären können.

Das Team untersuchte 4,820 empirische Berichte mit insgesamt rund 17 Millionen Wörtern, die von Studierenden über einen Zeitraum von zehn Jahren eingereicht wurden. Anstatt mithilfe von KI einzelne Studierende zu identifizieren, analysierten die Forschenden übergreifende Muster in Stil, Tonfall und Wortschatz auf Kohortenebene vor und nach der Einführung von ChatGPT.

Sie stellten fest, dass die Schülertexte ab 2022 positiver, formeller und wortreicher wurden. Diese Veränderungen zeigten sich in allen Berichten unabhängig vom Thema und deuten auf einen allgemeinen Wandel in der Art und Weise hin, wie Schüler schreiben.

Der Erstautor Matthew Mak, Assistenzprofessor für Psychologie an der Universität Warwick, sagte, der Tonfall der studentischen Arbeiten ähnele mittlerweile stark dem Standardstil gängiger KI-Tools.

„Der Ton der studentischen Texte erscheint positiver, im Einklang mit den Ergebnissen von ChatGPT, was an sich weder gut noch schlecht ist, aber Bedenken hinsichtlich der Möglichkeit aufwirft, dass KI-Tools die Stimmen der Studenten vereinheitlichen könnten“, sagte Mak in einer Pressemitteilung.

Viele generative KI-Systeme sind so konzipiert, dass sie höflich, konstruktiv und positiv klingen, unter anderem um anstößige oder schädliche Inhalte zu vermeiden. Diese standardmäßige positive Einstellung kann sich auf Schüler auswirken, die diese Tools zum Brainstorming, Umformulieren oder Überarbeiten ihrer Aufgaben nutzen.

Mak und seine Kollegen weisen darauf hin, dass psychologische Studien einen Zusammenhang zwischen positiver Stimmung und geringerer kritischer Auseinandersetzung belegen. Wenn Studierende ständig mit KI-generierten Texten mit einem durchweg optimistischen Tonfall konfrontiert werden, argumentieren die Forscher, müssen Universitäten verstehen, wie sich dies langfristig auf das kritische Denken und die akademische Ausdrucksfähigkeit der Studierenden auswirken kann.

Die Studie stellte außerdem einen deutlichen Anstieg des Formalismus und des Wortschatzumfangs nach dem Start von ChatGPT fest. Solche stilistischen Verbesserungen treten typischerweise erst nach jahrelanger Schreibpraxis auf, weshalb es unwahrscheinlich ist, dass sie einen plötzlichen Sprung in den zugrundeliegenden Fähigkeiten der Lernenden widerspiegeln.

Mit anderen Worten: Die Essays mögen oberflächlich betrachtet anspruchsvoller wirken, das bedeutet aber nicht unbedingt, dass die Schüler im tieferen Sinne bessere Schreiber geworden sind, die Argumente besser strukturieren, Beweise besser abwägen oder Daten besser interpretieren.

Um den Einfluss von KI direkter zu untersuchen, nahmen die Forscher Berichte, die vor 2022 verfasst worden waren, und baten ChatGPT, diese umzuschreiben. Die KI-generierten Überarbeitungen wiesen dieselben Veränderungen in Ton und Stil auf wie die studentischen Arbeiten, die nach der Einführung von ChatGPT eingereicht wurden. Dieses parallele Muster bestärkt die Annahme, dass generative KI ein wesentlicher Treiber der vom Team beobachteten Veränderungen ist.

Die Forscher untersuchten auch die Verwendung von Wörtern, die häufig mit KI-generierten Texten in Verbindung gebracht werden. Einige dieser Begriffe erfreuten sich bis 2024 eines starken Anstiegs ihrer Beliebtheit, der 2025 jedoch rapide abnahm. Dieses Muster deutet darauf hin, dass Studierende möglicherweise vorsichtiger geworden sind, nicht wie ein Chatbot zu klingen, möglicherweise aufgrund des wachsenden Bewusstseins für KI-Erkennungstools oder sich ändernder Hochschulrichtlinien.

Trotz all dieser stilistischen Veränderungen blieb eines unverändert: die Noten.

Im gesamten zehnjährigen Datensatz zeigten sich keine entsprechenden Sprünge bei den Noten oder im Feedback der Prüfer, die auf eine allgemeine Verbesserung der Qualität des studentischen Denkens oder der Analysefähigkeit hindeuten würden. Die Autoren argumentieren, dass diese Stabilität ein Zeichen dafür ist, dass grundlegende akademische Fähigkeiten nach wie vor von größter Bedeutung sind.

In einer detaillierten Zusammenfassung der Ergebnisse schrieb das Forschungsteam: „Trotz der stilistischen Veränderungen blieben die Noten und das Feedback der Studierenden relativ stabil. Dies deutet darauf hin, dass sich die stilistischen Veränderungen nicht unbedingt in höheren Punktzahlen niederschlagen und dass unsere Prüfer Faktoren wie analytische Tiefe und Dateninterpretation gegenüber oberflächlicher Sprache priorisieren.“

Diese Erkenntnis mag für Pädagogen, die befürchteten, KI würde die Leistungsbewertung grundlegend verändern, eine Erleichterung sein. Gleichzeitig verdeutlicht sie die wachsende Diskrepanz zwischen dem Erscheinungsbild von Schülerarbeiten und dem, was diese tatsächlich über den Lernerfolg aussagen.

Die Studie erscheint zu einem Zeitpunkt, an dem der Einsatz von generativer KI auf dem Campus weiterhin stark zunimmt. Eine kürzlich durchgeführte branchenweite Umfrage, auf die sich das Team der Universität Warwick bezieht, ergab, dass bis zu 88 % der Studierenden ChatGPT für Prüfungsleistungen nutzen. Die Anwendungsbereiche reichen von der Ideenfindung und Gliederung bis hin zu vollständigen Entwürfen und deren Überarbeitung.

Für die Universitäten, so die Forscher aus Warwick, stellen die neuen Daten sowohl eine Warnung als auch eine Chance dar.

Ihre Analyse verdeutlicht, dass KI bereits die Qualität studentischer Texte verändert, selbst wenn sie die Noten nicht dramatisch beeinflusst. Diese Tatsache, so argumentieren sie, sollte Hochschulen dazu veranlassen, ihre Aufgabenstellungen, die Vermittlung von Schreibkompetenzen und die Kommunikation mit Studierenden über den verantwortungsvollen Umgang mit KI zu überdenken.

In ihrer Diskussion der Implikationen betonten die Autoren, dass „zentrale akademische Kompetenzen – wie kritisches Denken, Interpretation und Argumentation – weiterhin für die Leistungsbewertung von zentraler Bedeutung sind“ und dass diese „zumindest noch nicht“ durch stilistische Veränderungen in den Hintergrund gedrängt wurden. Dies eröffnet Lehrenden die Möglichkeit, die Vermittlung dieser tiefergehenden Kompetenzen zu intensivieren und gleichzeitig Schülerinnen und Schüler dabei zu unterstützen, in einer KI-geprägten Umgebung eine authentische Ausdrucksweise zu entwickeln.

Die Ergebnisse legen zudem nahe, dass oberflächliche Überprüfungen – wie die Suche nach bestimmten Schlagwörtern oder einem durchweg positiven Tonfall – nicht ausreichen, um zu verstehen, ob und wie Studierende KI nutzen. Stattdessen sollten Lehrende sich stärker auf den Prozess konzentrieren: wie Studierende planen, Entwürfe erstellen und überarbeiten und wie sie ihre eigenen Gedankengänge artikulieren können.

Die Autoren argumentieren, dass Institutionen nun die Chance haben, sich einen Wettbewerbsvorteil zu verschaffen, indem sie Erkenntnisse wie diese nutzen, um ihre Politik zu steuern, anstatt nur stückweise auf jedes neue Werkzeug zu reagieren. Dies könnte klarere Richtlinien für die Akzeptanz von KI, transparentere Gespräche über akademische Integrität und neue Prüfungsformen bedeuten, die mündliche Verteidigung, schriftliche Arbeiten im Unterricht oder iteratives Feedback stärker in den Vordergrund stellen.

Da generative KI in vielen Bereichen zum Standard in der Wissensarbeit wird, stellt sich für die Hochschulbildung nicht mehr die Frage, ob Studierende diese Werkzeuge nutzen werden, sondern wie. Die Studie der Universität Warwick legt nahe, dass KI bisher eher das Erscheinungsbild studentischer Texte verändert als deren Inhalt – und dass die weiteren Schritte der Universitäten darüber entscheiden werden, ob diese Veränderungen letztlich die Fähigkeit der Studierenden zum selbstständigen Denken und Kommunizieren stärken oder schwächen.

Quelle: University of Warwick