Symen van der Zee, lector Vernieuwend Onderwijs Saxion
Door de komst van AI kan je tegenwoordig rechtstreeks je medische vragen aan een chatbot stellen. Maar hoe goed werkt dat? Andrikyan en collega’s (2024) keken in hun studie bijvoorbeeld naar de leesbaarheid, volledigheid en nauwkeurigheid van de antwoorden van Bing Copilot – een zoekmachine met AI-chatbot-functies – op vragen over de 50 meest voorgeschreven medicijnen in 2020. Uit de analyses blijkt dat de antwoorden lastig te begrijpen zijn, maar een groot deel van de antwoorden wel in overeenstemming is met de wetenschappelijke consensus. Een chatbot-dokter kan nuttig zijn, is de conclusie, maar je kan er niet blind op vertrouwen. Hoe zit dat met de inzet van een AI-tutor in onderwijs? Geeft die leerlingen goede hulp? Kunnen we daar veel van verwachten in 2025?
Daar lijkt het wel op. Onderzoekers hebben 194 studenten onderverdeeld in twee groepen (Kestin et al., 2024). De eerste groep heeft gedurende twee weken twee lessen per week gevolgd, waarin zij actief aan de slag gingen met leerinhoud op het gebied van de discipline natuurkunde. De tweede groep maakte gebruik van een AI-tutor die gebaseerd was op GPT-4 technologie. Vooraf aan een les maakten studenten een pre-test, na afloop een post-test. Ook kregen ze stellingen over betrokkenheid en motivatie. Studenten in de AI-groep behaalden hogere scores vergeleken met de controlegroep. Verder gaven studenten in de AI-groep aan zich significant meer betrokken en gemotiveerd te voelen. Om een idee te krijgen van wat al mogelijk is, scan de QR-code.
Toch zijn de bevindingen niet louter positief. Bastani et al. (2024) tonen dat AI het leren lijkt te helpen, maar er tegelijkertijd minder wordt geleerd. Op een middelbare school in Turkije bij meer dan 1000 leerlingen werd het gebruik van twee GPT-gebaseerde tutors getest tijdens wiskundelessen: GTP Base en GPT Tutor. De resultaten laten zien dat GPT-4 de prestaties tijdens oefensessies aanzienlijk kan verbeteren. In de GPT Base conditie zorgde het voor 48 procent verbetering ten opzichte van de controle conditie, in de GPT-tutor conditie was er zelfs sprake van een verbetering van 127 procent. Dat de oefening verbetert, betekent echter niet dat de uiteindelijke prestatie op de toets ook hoger is. Leerlingen in de GPT Base conditie presteerden juist slechter op examens dan leerlingen in de controle conditie. ChatGPT had teveel het werk voor ze gedaan. Dit negatieve effect was echter afwezig bij de GPT Tutor conditie. Een ChatGPT tutor kan dus nuttig zijn, maar dan moet deze wel didactisch kundig zijn.
Bastani en collega’s (2024) merken aan het eind van het artikel op dat ChatGPT onjuiste antwoorden kan geven en leerlingen niet de juistheid van een antwoord kunnen en willen controleren. En dus blijft begeleiding van de leerkracht nodig. Tegelijkertijd laat onderzoek van Holstein en Aleven (2020) zien hoe technologie die begeleiding kan optimaliseren. Ze vroegen leraren wat voor onderwijs-superkrachten ze zouden wensen. De wens bovenaan het lijstje: direct kunnen zien hoe het er met het leren voorstaat. Meteen weten wat goed en minder goed gaat, zodat tijdig en adequaat ondersteund kan worden. Deze wens lieten Holstein en Aleven vervolgens in vervulling gaan. Ze ontwikkelden een bril met mixed-reality. Met deze bril kijken naar de klas levert de leerkracht direct inzicht op in waar leerlingen als geheel en individueel staan.
De vraag is natuurlijk of het dragen van zo’n bril daadwerkelijk leidt tot meer en beter leren. In een gerandomiseerd experiment werden 343 leerlingen in het voortgezet onderwijs verdeeld over 3 condities. Conditie 1: lesgeven met een mixed-reality bril met learning analytics. Conditie 2: lesgeven met een bril zonder learning analytics. Conditie 3: gewoon lesgeven zoals normaal (leerkrachten hadden geen bril). Het onderwijs had betrekking op het oplossen van lineaire vergelijkingen. Aan het begin werd een toets afgenomen, aan het eind van de lessenreeks weer. Aan het begin waren er geen verschillen tussen de condities, aan het einde wel. Leerlingen in de ‘Glasses + Analytics’ condities scoren het hoogst! In de grafiek de bevindingen in een notendop.
Dit was echter niet de enige bevinding. Het bleek namelijk dat leerkrachten in de ‘Glasses + Analytics” conditie veel meer tijd en aandacht hadden besteed aan leerlingen met de minste voorkennis. In de andere condities was de aandacht veel meer verdeeld. Als gevolg hiervan gingen de leerlingen die op de begintoets het laagste hadden gescoord, het meeste vooruit. Holstein en Aleven (2020) concluderen daarvoor dat de mixed-reality bril met analytics bijdraagt aan meer kansengelijkheid in onderwijs.
Het is zeer wel denkbaar dat leerlingen over enkele jaren over hun geheel eigen AI leraar beschikken, die ze zelf kunnen ‘customizen’ en die door ermee te werken wordt getraind om je optimaal te begeleiden. De AI leraar leert je kennen, doorgronden en kan het leeraanbod precies aanpassen op wat jij nodig hebt. En als de AI toch nog even niet slim genoeg is, dan kan je als montessori leerkracht dankzij de mixed-reality bril met analytics meteen bijspringen en ondersteunen. Meer effectiviteit, meer kansengelijkheid. Wat willen we nog meer. Toch? En was het niet Maria Montessori zelf die zei: “Waar mogelijk wordt mechanische apparatuur geïntroduceerd voor ieder onderdeel van het praktische leven, zodat onze kinderen goed toegerust zijn om deel te nemen aan een beschaving die geheel op machines is gebaseerd.”
De vraag is: had Montessori gelijk en moeten we volop mee in de technologie van deze tijd? Hoe zien we de balans tussen effectiviteit en wenselijkheid? Wat kan met behulp van technologie en wat vereist juist menselijke interactie en activiteit. Bezitten we de vereiste digitale geletterdheid om hierover te besluiten? Het is belangrijk om als vereniging visie op dit soort vraagstukken te ontwikkelen. Het gaat om de afwegingen van de mogelijkheden in het licht van de wenselijkheid en effectiviteit ervan, en natuurlijk in het licht van het oorspronkelijke gedachtegoed van Montessori. Gezamenlijk koers hierop bepalen is een mooie uitdaging voor 2025.
Literatuur:
Holstein & Aleven (2020): https://onlinelibrary.wiley.com/doi/epdf/10.1002/aaai.12058
Andrikyan et al. (2024): https://qualitysafety.bmj.com/content/qhc/early/2024/09/18/bmjqs-2024-017476.full.pdf
Kestin et al. (2024): https://www.researchsquare.com/article/rs-4243877/v1
Bastani et al. (2024): https://papers.ssrn.com/sol3/papers.cfm?abstract_id=4895486