"ChatGPT maakt je dom", "AI beschadigt je hersenen", "MIT-onderzoek: kunstmatige intelligentie veroorzaakt cognitieve achteruitgang". De afgelopen maanden domineerden dit soort alarmerende koppen de algemene media en voedden ze ongegronde angsten over het gebruik van kunstmatige intelligentie in het onderwijs en op het werk. Maar wat zegt de wetenschap hier echt over? Een kritische analyse van de literatuur onthult een veel complexere en vooral optimistischer realiteit.
De studie van het MIT Media Lab "Your Brain on ChatGPT" heeft een golf van alarmerende berichtgeving in de media teweeggebracht, vaak gebaseerd op een verkeerde interpretatie van de resultaten. De studie, die als preprint (dus niet peer-reviewed) is gepubliceerd, omvatte slechts 54 deelnemers uit de omgeving van Boston, waarvan er slechts 18 de cruciale sessie hebben voltooid.
Onvoldoende steekproef: Met in totaal 54 deelnemers mist het onderzoek de statistische kracht die nodig is om algemene conclusies te trekken. Zoals de onderzoekers zelf toegeven, is de steekproef klein en homogeen: mensen in de omgeving van het MIT zijn zeker niet representatief voor de verdeling van mensen over de wereld.
Problematisch experimenteel ontwerp: Deelnemers moesten SAT-essays schrijven in slechts 20 minuten – een kunstmatige beperking die natuurlijk aanzet tot kopiëren en plakken in plaats van tot reflectieve integratie. Dit ontwerp "bootst de natuurlijke beperkingen van het echte leven goed na", zoals "de deadline is morgen" of "ik speel liever videogames", maar het is geen pedagogisch verantwoord gebruik van AI.
Verwarring door het vertrouwdheidseffect: De groep 'alleen hersenen' liet in de eerste drie sessies geleidelijke verbeteringen zien, simpelweg door meer vertrouwd te raken met de taak. Toen de AI-groep in de vierde sessie zonder hulp moest schrijven, voerde ze de taak voor het eerst uit zonder het voordeel van oefening.
Terwijl de media zich concentreerden op de alarmerende resultaten van het MIT, leverde veel rigoureuzer onderzoek radicaal andere resultaten op.
Een onderzoek uitgevoerd aan de Kwame Nkrumah University of Science and Technology volgde 125 universiteitsstudenten in een gerandomiseerd gecontroleerd ontwerp gedurende een volledig semester. De resultaten zijn in tegenspraak met de conclusies van het MIT:
Kritisch denken: Studenten die ChatGPT gebruikten, verbeterden hun score van 28,4 naar 39,2 punten (+38%) en presteerden daarmee aanzienlijk beter dan de controlegroep (van 24,9 naar 30,6, +23%).
Creatief denken: Nog dramatischer stijgingen, van 57,2 naar 92,0 punten (+61%) voor de ChatGPT-groep, met verbeteringen op alle zes gemeten dimensies: moed, innovatief onderzoek, nieuwsgierigheid, zelfdiscipline, twijfel en flexibiliteit.
Reflectief denken: Aanzienlijke verbeteringen van 35,1 naar 56,6 punten (+61%), wat wijst op een groter vermogen tot zelfreflectie en metacognitie.
Cruciale methodologische verschillen: De studie in Ghana maakte gebruik van gevalideerde schalen (Cronbach α > 0,89), bevestigende factoranalyse, ANCOVA-controles voor pretestscores en – cruciaal – integreerde ChatGPT in een echte onderwijssituatie met passende pedagogische ondersteuning.
Het meest rigoureuze onderzoek dat beschikbaar is, betrof 758 consultants van Boston Consulting Group in een vooraf geregistreerd en gecontroleerd experiment. De resultaten waren ondubbelzinnig:
Zoals Ethan Mollick, medeauteur van het onderzoek, benadrukt: "De adviseurs die ChatGPT gebruikten, presteerden aanzienlijk beter dan degenen die dat niet deden. Op elk vlak. Op elke manier waarop we de prestaties hebben gemeten."
Een systematische evaluatie van onderzoek naar AI in het hoger onderwijs heeft aanzienlijke voordelen aan het licht gebracht:
Een multinationaal onderzoek onder 401 Chinese universiteitsstudenten met behulp van structurele vergelijkingsmodellen heeft bevestigd dat "zowel AI als sociale media een positieve invloed hebben op academische prestaties en geestelijk welzijn".
De berichtgeving in de media over het MIT-onderzoek is een sprekend voorbeeld van hoe sensatiezucht het publieke begrip van wetenschap kan verstoren.
Typische kop: "MIT-onderzoek toont aan dat ChatGPT dom maakt"
Realiteit: Voorlopig, niet-peer-reviewed onderzoek met 54 deelnemers vindt verschillen in neurale connectiviteit bij kunstmatige taken.
Typische kop: "AI beschadigt de hersenen"
Realiteit: EEG toont verschillende activeringspatronen, die eerder als neurale efficiëntie dan als schade kunnen worden geïnterpreteerd.
Typische kop: "ChatGPT veroorzaakt cognitieve achteruitgang"
Realiteit: Een studie met ernstige methodologische beperkingen die wordt tegengesproken door meer rigoureuze onderzoeken.
De hoofdonderzoeker van MIT, Nataliya Kosmyna, gaf toe dat ze "valstrikken" in het artikel had geplaatst om te voorkomen dat LLM's het nauwkeurig zouden samenvatten. Ironisch genoeg gebruikten veel gebruikers op sociale media vervolgens juist LLM's om de studie samen te vatten en te delen, waarmee ze onbedoeld het praktische nut van deze tools aantoonden.
Serieus onderzoek naar AI in het onderwijs ontkent niet dat er uitdagingen zijn, maar kadert deze op een meer genuanceerde manier. Het concept van de 'gekartelde technologische grens' uit de Harvard-studie illustreert dat AI uitblinkt in bepaalde taken, terwijl het in andere, ogenschijnlijk vergelijkbare taken problemen kan opleveren.
Timing van de introductie: Er zijn aanwijzingen dat het ontwikkelen van basisvaardigheden vóór de introductie van AI de voordelen kan maximaliseren. Zoals de MIT-studie zelf opmerkt, vertoonden de deelnemers aan "Brain-to-LLM een beter geheugen en een grotere activering van de occipito-pariëtale en prefrontale gebieden".
Pedagogisch ontwerp: Het onderzoek in Ghana toont het belang aan van de integratie van AI met passende educatieve ondersteuning, goed ontworpen prompts en duidelijke leerdoelen.
Belangrijke context: Het gebruik van AI in echte onderwijssituaties, in plaats van in kunstmatige taken, levert dramatisch andere resultaten op.

Vertekende berichtgeving in de media is niet alleen een academisch probleem – het heeft ook reële gevolgen voor de acceptatie van potentieel nuttige technologieën.
Zoals Kosmyna zelf toegeeft: "Wat mij motiveerde om het nu te publiceren, zonder te wachten op een volledige peer review, is dat ik bang ben dat er over zes tot acht maanden een beleidsmaker zal zijn die besluit: 'Laten we GPT-opvang invoeren'. Ik denk dat dat absoluut negatief en schadelijk zou zijn."
Deze verklaring onthult een motivatie voor belangenbehartiging die rode vlaggen zou moeten doen rijzen over de wetenschappelijke neutraliteit van het onderzoek.
Uit onderzoek onder 28.698 software-ingenieurs bleek dat slechts 41% AI-tools had geprobeerd, met een nog lagere acceptatie onder vrouwen (31%) en ingenieurs boven de 40 (39%). Sensatiegerichte krantenkoppen dragen bij aan deze vooroordelen, waardoor veel werknemers mogelijk de bewezen voordelen van AI mislopen.
AI-bedrijven moeten hun enthousiasme voor de technologie in evenwicht brengen met eerlijke communicatie over de beperkingen ervan. De resultaten van serieus onderzoek wijzen op reële voordelen wanneer AI op een doordachte manier wordt geïmplementeerd, maar ook op de noodzaak om:
In plaats van defensief te reageren op negatieve krantenkoppen, zou de AI-industrie het volgende moeten doen:
De geschiedenis van het MIT-onderzoek en de berichtgeving daarover in de media biedt belangrijke lessen voor alle belanghebbenden in het AI-ecosysteem.
De druk om 'nieuwswaardige' resultaten te publiceren mag de methodologische nauwkeurigheid niet in gevaar brengen. Preprints kunnen nuttig zijn voor het wetenschappelijke debat, maar vereisen zorgvuldige communicatie over hun beperkingen.
Het publiek verdient nauwkeurige berichtgeving waarin onderscheid wordt gemaakt tussen:
De toekomst van AI in het onderwijs hangt af van doordachte implementaties op basis van solide bewijzen, niet van reacties op de laatste sensationele krantenkoppen.
Terwijl de discussie in de krantenkoppen hoog oploopt, laat serieus onderzoek het ware potentieel van AI zien om toegang tot hoogwaardige leerervaringen te democratiseren. Het onderzoek in Ghana laat zien dat AI, mits op de juiste manier geïmplementeerd, het volgende kan doen:
De vraag is niet of AI het onderwijs zal veranderen, maar hoe we deze transformatie op verantwoorde wijze kunnen begeleiden. Het antwoord ligt in rigoureuze wetenschap, niet in sensationele krantenkoppen.
Bronnen en referenties:
Om op de hoogte te blijven van serieus wetenschappelijk onderzoek naar AI (zonder sensatiezucht), volg onze bedrijfsblog en schrijf u in voor onze newsletter.