De opmars van ChatGPT ging ongekend snel en taalmodellen werden opeens een onderwerp van gesprek in het onderwijs. Hoe staan we er nu voor en hoe draagt kennis over taalmodellen bij aan het ontwikkelen van bewuste digitale geletterdheid?
De opmars van ChatGPT ging eind 2022 ongekend snel. Binnen enkele dagen waren er meer dan een miljoen gebruikers en ook scholieren hadden snel de weg naar deze AI-tool gevonden. Het was dan ook onvermijdelijk dat ChatGPT en andere zogenoemde taalmodellen, zoals Bard van Google en LLaMA van Meta, een onderwerp van gesprek zouden worden in het onderwijs. Dat docenten in hun onderwijs ermee te maken zouden krijgen, daar leek weinig twijfel over. Inmiddels zijn we een jaar verder en kunnen we voorzichtig de balans opmaken: wat heeft het gesprek over taalmodellen inmiddels opgeleverd voor het onderwijs, en het schoolvak Nederlands in het bijzonder?
Wetenschappelijk onderzoek: de stand van zaken
Onderzoek naar de effecten van taalmodellen op de taalvaardigheid en het taalonderwijs is schaars. Er is immers nog weinig tijd geweest om gedegen empirische studies op te zetten en uit te voeren. Er zijn wel veel wetenschappelijke publicaties verschenen die beargumenteren hoe taalmodellen in theorie het taalonderwijs zouden kunnen versterken (o.a. Kasneci et al., 2023; Trust et al., 2023). Docenten kunnen ze inzetten om bijvoorbeeld feedback op schrijfproducten te genereren en leerlingen zouden ze kunnen gebruiken als hulp bij het schrijven van een betoog.
Wat een gemene deler is in publicaties over de effecten van taalmodellen op het onderwijs, is de roep om voorzichtigheid. Er zijn namelijk beperkingen (zie o.a. Yan et al., 2023): veel techbedrijven die deze modellen ontwikkelen zijn niet transparant over de data waarmee de modellen zijn getraind en in sommige gevallen is auteursrecht geschonden. De taalmodellen worden getraind met internetdata, en Engelstalig materiaal afkomstig uit westerse landen is daarin dominant. Modellen werken daarom nog steeds het beste in het Engels en hebben een beperkt referentiekader. Vooroordelen die in de trainingsdata aanwezig zijn – denk bijvoorbeeld aan stereotiepe aannames over genderrollen – kunnen doorwerken in de gegenereerde output.
De beperking die echter het nadrukkelijkst aanwezig is in onderwijsdiscussies over ChatGPT en andere taalmodellen, is het feit dat de output niet altijd correcte informatie geeft, oftewel: een taalmodel hallucineert nog weleens. Dat is natuurlijk problematisch en een taalmodel gebruiken als zoekmachine is dan ook geenszins aan te raden, want een taalmodel werkt echt anders dan een zoekmachine zoals Google. Terug naar schrijven met pen en papier dan maar? Sceptici pleiten hiervoor, maar of dat leidt tot leerlingen die digitaal geletterd zijn is de vraag. Daarom is het belangrijker om na te denken over hoe we deze technologie op een verantwoorde wijze kunnen implementeren in het taalonderwijs om digitale geletterdheid te stimuleren.
Taalmodellen: stochastic parrots of toch niet?
In een inmiddels beroemd paper van Bender et al. (2021) komen we de metafoor tegen van taalmodellen als stochastic parrots: een taalmodel papegaait na wat het in de trainingsdata tegenkomt, maar heeft geen enkel besef van wat het zelf zegt. Het voorspelt namelijk door middel van complexe statische berekeningen wat het meest waarschijnlijke woord moet zijn dat volgt op het voorafgaande en genereert zo coherente output. Volgens Bender et al. (2021) produceert het model taal zonder betekenis, want het kan niet refereren naar de wereld om zich heen. In tegenstelling tot mensen die bij het horen of lezen van het woord ‘appel’ denken aan een sappige, ronde vrucht, heeft een taalmodel nog nooit een appel gegeten. Onze taal is belichaamd (Glenberg & Kaschak, 2002): wij weten hoe appels eruitzien, hoe ze aanvoelen en hoe ze smaken. Een taalmodel heeft als enige input taal, maar kan zich dus niks concreets voorstellen bij het woord ‘appel’. Het zoekt enkel naar verbindingen tussen semantisch verwante woorden in de trainingsdata en reproduceert die; bij het woord ‘appel’ kun je dan denken aan woorden als ‘banaan’ of ‘peer’. In veel gevallen is het model in staat om de juiste woorden met elkaar te verbinden, maar soms slaat het inhoudelijk de plank volledig mis. Hierin schuilt volgens Bender et al. (2021) meteen het gevaar: een taalmodel kan zomaar misinformatie de wereld in helpen die op het eerste oog plausibel klinkt, maar waar je met kennis van zaken vraagtekens bij kunt zetten.
Het is goed om ons bewust te zijn van dit soort risico’s en om hier in het onderwijs aandacht voor te hebben, maar het idee van een taalmodel dat loze woorden produceert doet niet helemaal recht aan hoe wij zo’n model ervaren. Gebruikers ervaren de output wel degelijk als betekenisvol en het is niet voor niets dat taalmodellen in zo’n korte tijd zoveel gebruikers aan zich hebben weten te binden. Is het dan wel terecht om een taalmodel af te doen als een stochastic parrot die niet in staat is betekenisvolle taal te produceren? Dat op deze metafoor het een en ander aan te merken valt, laat bijvoorbeeld Rees (2022) zien in zijn betoog over de taal die computers produceren. Als we taal, zoals hij betoogt, opvatten als een logisch systeem van tekens (langue) dat betekenisvol kan zijn los van de taalgebruiker (parole) – zoals ook de beroemde taalkundige Ferdinand de Saussure voorstelde – dan kan een machine die in staat is tot coherente taalproductie betekenisvolle taal produceren. En daar kun je zeker enige mate van betrouwbaarheid aan toekennen. Deze benadering is meer in lijn met de gebruikerservaring, en met voldoende kennis en vaardigheden kan een taalmodel van groot nut zijn, bijvoorbeeld ook voor docenten die het in kunnen zetten om bepaalde onderwijstaken efficiënter uit te voeren (zoals het maken van lesplannen, PowerPoints of zelfs toetsen).
Bewuste digitale geletterdheid ontwikkelen
Bovenstaande wetenschappelijke inzichten kunnen we goed gebruiken wanneer we de vertaalslag naar het onderwijs maken. Aandacht voor de mogelijkheden én beperkingen die taalmodellen bieden is cruciaal. Met elkaar nadenken over de implicaties van het gebruik ervan en een kritische reflectie daarop, zal zich uiteindelijk vertalen naar effectief onderwijs in digitale geletterdheid. De eerste lesmethodes rondom ChatGPT zijn al verschenen, en in het onderwijs zelf worden taalmodellen al op allerlei manieren ingezet. Ook wordt er, in tegenstelling tot andere vormen van digitale media, al vanaf de introductie van taalmodellen gesproken over ethische bezwaren. De eerste stap is gezet en vanaf hier kunnen we nadenken over vervolgstappen. Welke kennis en vaardigheden hebben leerlingen nodig om op een verantwoorde wijze gebruik te maken van taalmodellen? En welke kritische houding is daarbij nodig? Vooral over die laatste vraag mag nog nadrukkelijker worden gesproken, en taalmodellen enkel afdoen als onbetrouwbare bronnen is te simplistisch – het ligt veel genuanceerder dan dat.
Wat docenten nodig hebben is een goed antwoord op de vraag waarom leerlingen zelf moeten leren lezen en schrijven, ook als een taalmodel bepaalde taken in een mum van tijd voor hen kan doen. We moeten in kaart brengen welke vaardigheden leerlingen nodig hebben om een taalmodel verantwoord te gebruiken. Vanwege het talige aspect dat hier onvermijdelijk bij komt kijken, is er bij uitstek een rol weggelegd voor het schoolvak Nederlands om leerlingen hierin wegwijs te maken. De wisselwerking met traditioneel lees- en schrijfvaardigheidsonderwijs is daarbij cruciaal, wat bijvoorbeeld naar voren komt in de conceptkerndoelen voor Nederlands en digitale geletterdheid. Het wetenschappelijk onderzoek naar taalmodellen in het onderwijs staat nog in de kinderschoenen, maar in de komende jaren zullen uitkomsten uit onderzoek docenten kunnen ondersteunen in hun omgang met taalmodellen in de klas. Leren werken met taalmodellen draagt bij aan het ontwikkelen van bewuste digitale geletterdheid en bereidt leerlingen uiteindelijk beter voor op een toekomst waarin digitale media een al maar grotere rol zullen spelen.
Referenties
Bender, E. M., Gebru, T., McMillan-Major, A., & Shmitchell, S. (2021). On the Dangers of Stochastic Parrots: Can Language Models Be Too Big? 🦜. Proceedings of the 2021 ACM Conference on Fairness, Accountability, and Transparency, 610–623. https://doi.org/10.1145/3442188.3445922
Glenberg, A. M., & Kaschak, M. P. (2002). Grounding language in action. Psychonomic Bulletin & Review, 9(3), 558–565.
Jeon, J., & Lee, S. (2023). Large language models in education: A focus on the complementary relationship between human teachers and ChatGPT. Education and Information Technologies. https://doi.org/10.1007/s10639-023-11834-1
Kasneci, E., Sessler, K., Küchemann, S., Bannert, M., Dementieva, D., Fischer, F., Gasser, U., Groh, G., Günnemann, S., Hüllermeier, E., Krusche, S., Kutyniok, G., Michaeli, T., Nerdel, C., Pfeffer, J., Poquet, O., Sailer, M., Schmidt, A., Seidel, T., … Kasneci, G. (2023). ChatGPT for good? On opportunities and challenges of large language models for education. Learning and Individual Differences, 103, 102274. https://doi.org/10.1016/j.lindif.2023.102274
Rees, T. (2022). Non-Human Words: On GPT-3 as a Philosophical Laboratory. Daedalus, 151(2), 168–182. https://doi.org/10.1162/daed_a_01908
Trust, T., Whalen, J., & Mouza, C. (2023). Editorial: ChatGPT: Challenges, Opportunities, and Implications for Teacher Education. Contemporary Issues in Technology and Teacher Education, 23(1), 1–23.
Yan, L., Sha, L., Zhao, L., Li, Y., Martinez‐Maldonado, R., Chen, G., Li, X., Jin, Y., & Gašević, D. (2023). Practical and ethical challenges of large language models in education: A systematic scoping review. British Journal of Educational Technology, bjet.13370. https://doi.org/10.1111/bjet.13370
Graag als volgt naar deze bijdrage verwijzen: Stevens, E. (2024). Bewuste digitale geletterdheid in het onderwijs: taalmodellen onder de loep. In WODN Werkgroep Onderzoek Didactiek Nederlands (Ed.), Handboek Didactiek Nederlands. Levende Talen. Geraadpleegd [datum] via: https://didactieknederlands.nl/handboek/2024/03/bewuste-digitale-geletterdheid-in-het-onderwijs-taalmodellen-onder-de-loep/
Auteurs:
Emmy Stevens
Emmy Stevens werkt als promovendus bij het Tilburg Center of the Learning Sciences van Tilburg University. Zij doet onderzoek naar de effecten van generatieve AI op het schoolvak Nederlands, waarbij zij enerzijds opvattingen van docenten Nederlands ten aanzien van generatieve AI in kaart brengt en anderzijds leermiddelen ontwikkelt voor het gebruik van generatieve AI in verschillende deelgebieden van het schoolvak.