Anzeige
Anzeige
Anzeige
Lesedauer 3 Min.

KI löst spielend fast alle Prüfungsaufgaben

Generative künstliche Intelligenz (GenKI) wie ChatGPT könnte so manche Prüfung an Hochschulen bestehen, so Antoine Bosselut von der Eidgenössischen Technischen Hochschule Lausanne (EPFL).
© (Quelle: ETHZ)

Sein Team hat den GenKI-Varianten GPT 3.5 und GPT 4 Prüfungsfragen aus 50 Kursen vorgelegt, die ein breites Spektrum an MINT-Disziplinen abdecken, darunter Informatik, Mathematik, Biologie, Chemie, Physik und Materialwissenschaften.

Trefferquote bei 65,8 Prozent

Die Forscher haben festgestellt, dass GPT 4 im Schnitt 65,8 Prozent der Fragen richtig beantwortete, wenn sie jemand stellt, der von der Technik nichts versteht, die hinter der KI steckt. Die besser Informierten kamen auf eine Erfolgsquote von bis zu 85,1 Prozent.

"Wir waren von den Ergebnissen überrascht. Niemand hatte erwartet, dass die KI-Assistenten in so vielen Kursen einen so hohen Prozentsatz an richtigen Antworten erzielen würden", sagt Anna Sotnikova, Postdoc im Natural Language Processing Laboratory der EPFL.

Studenten vertrauen auf GenKI

Im Hochschulbereich setzen Studenten zunehmend KI-Assistenten ein, um Aufgaben zu lösen und zu lernen. Diese Tools bieten zwar Möglichkeiten für eine verbesserte Lehre und Ausbildung, stellen aber auch eine grosse Herausforderung für die Bewertung und die Lernergebnisse dar.

Bislang gibt es kaum Studien über potenzielle Folgen auf Bewertungsmethoden, die Hochschulen anwenden. Gute Arbeiten können durchaus von Studenten abgeliefert werden, die gar nichts verstehen. Es ist nicht ausgeschlossen, dass die Sprachmodelle Bachelor- oder noch anspruchsvollere Prüfungen bestehen.

"Wir hatten das Glück, dass uns ein grosses Konsortium von EPFL-Professoren, Lehrern und Lehrassistenten dabei half, den bisher grössten Datensatz an Kursmaterialien, Bewertungen und Prüfungen zu sammeln, um eine Vielzahl von Materialien für unsere Studiengänge zu erhalten", so Bosselut.

Und weiter: "Diese Daten brachten wir in ein Format, von dem wir annehmen, dass es der Art und Weise am ehesten ähnelt, wie Studenten diese Informationen tatsächlich an grosse Sprachmodelle weitergeben. Anschliessend generierten wir Antworten von den Modellen und sahen, wie gut sie antworteten."

Strengere Bewertungen in Anflug

Kurzfristig spricht sich Bosselut für strengere Bewertungen aus - nicht im Sinne der Schwierigkeit der Fragen, sondern im Sinne der Komplexität der Bewertung selbst, bei der mehrere Fähigkeiten aus verschiedenen Konzepten, die im Laufe des Semesters erlernt werden und in einer ganzheitlichen Bewertung zusammengeführt werden, berücksichtigt werden müssen.

"Die Modelle sind noch nicht wirklich darauf ausgelegt, auf diese Art und Weise zu planen und zu arbeiten, und letztendlich sind wir der Meinung, dass dieses projektbasierte Lernen für die Studierenden ohnehin besser ist", unterstreicht Bosselut abschliessend. (pressetext.com)

Kommentare

Künstliche Intelligenz KI & Trends
Anzeige
Anzeige

Neueste Beiträge

Videos zum Test vom Mähroboter Mova LiDAX Ultra 1000
Der PCtipp hat den Mähroboter Mova LiDAX Ultra 1000 einem ausführlichen Test unterzogen. Hier noch zwei Videos dazu.
2 Minuten
11. Jun 2026
Digitalstudie: Junge Nutzer wollen weniger online sein
Die Deutschen verbringen weiterhin mehr als 67 Stunden pro Woche im Internet. Vor allem bei den unter 40-Jährigen zeichnet sich jedoch ein gegenläufiger Trend ab: Viele wollen ihre Online-Zeit bewusst reduzieren, insbesondere bei Social Media und Messenger-Diensten.
3 Minuten
11. Jun 2026
Prüfung des Einsatzes von Linked Data Services
Linked Data Service (LINDAS) ist eine IT-Dienstleistung des Bundesarchivs (BAR). Mit LINDAS können Bund, Kantone und Gemeinden frei verfügbare, sogenannte offene Verwaltungsdaten (Open Government Data – OGD) vernetzen und publizieren.
2 Minuten
11. Jun 2026

Das könnte Sie auch interessieren

NFC-Angriffe auf Android verdreifacht
Cyberkriminelle nutzen zunehmend NFC-Technologie, um Bankdaten von Android-Nutzern zu stehlen. Die Angriffszahlen sind in wenigen Monaten dramatisch gestiegen.
2 Minuten
28. Mai 2026
Radios können Gesuche einreichen
BAKOM publiziert UKW-Frequenzen
Das Bundesamt für Kommunikation BAKOM hat am 28. Mai 2026 die Frequenzpakete für die Verbreitung von UKW publiziert.
2 Minuten
29. Mai 2026
Schweizer Geoportal zeigt die Schweiz aus 1000 Perspektiven
Das vom Bundesamt für Landestopografie swisstopo betriebene Geoportal umfasst seit Mai 2026 schon 1000 Datensätze zu unterschiedlichsten Themen wie Gesellschaft, Umwelt, Energie bis hin zu historischen Karten, Landschaftsmodellen und Luftbildern.
3 Minuten
19. Mai 2026
Anzeige
Anzeige
Anzeige
Anzeige
Anzeige
Anzeige

Kommentare