Privacyrede 2016

Privacyrede 2016

Magazine
© SETUP / Sebastiaan ter Burg

Datagedreven Onderwijs. Wijs of Onwijs?


Mireille Hildebrandt vrijdag 16 september 2016
Inhoud: 

Deze Privacyrede werd op 6 september 2016 uitgesproken in de Senaatszaal van het Academiegebouw in Utrecht. Deze jaarlijkse rede wordt georganiseerd door SETUP in samenwerking met Studium Generale (Universiteit Utrecht) en SURF.

 

De opmaat

Wanneer heeft u voor het laatst iets voor het eerst gedaan?

Deze vraag ziet op ons leervermogen en onze bereidheid om steeds opnieuw uitdagingen te zoeken, ons zelf te veranderen en misschien zelfs te verbeteren. Het gaat over mensen die een toekomst voor zich hebben waarin ze zich staande moeten houden en liefst ook nog vooruitgang boeken.

Misschien interessant om op te merken dat staande houden en vooruitgang boeken in de eerste plaats fysieke gedragingen zijn, die geen van beide vanzelfsprekend zijn. Op twee benen staan is knap lastig Evenwicht is geen sinecure, zie bijvoorbeeld David Vender, die meent dat ‘evenwicht houden’ een elementaire vaardigheid is, die het mogelijk maakt ‘gedrag’ te onderscheiden van ‘gebeurtenissen’. Zie David Vender, “Is Balancing Emblematic of Action? Two or Three Pointers From Reid and Peirce”, Humana. Mente 15 (2011): 251–270. en vereist een vaak pijnlijk leerproces (met vallen en opstaan) en volgens sommige neurowetenschappers is beweging (bijvoorbeeld vooruitgang) de enige werkelijke reden dat we hersenen hebben ontwikkeld. Robotici weten hoe lastig het is om een machine te ontwerpen die zich met enig gemak voort kan bewegen in de echte wereld. Meer over robotica: Rolf Pfeifer and Josh Bongard, How the Body Shapes the Way We Think. A New View of Intelligence (Cambridge, MA - London, England: MIT Press, 2007) en Rodney Brooks, Flesh and Machines: How Robots Will Change Us, Reprint edition (New York: Vintage, 2003).

Daniel Wolpert, die benadrukt hoe cruciaal motorische vaardigheden zijn voor organismes die zelf bewegen en dus moeten leren om in te spelen op de omgeving, legt uit dat leren neerkomt op gedragsverandering die voortkomt uit interactie met de omgeving. Daniel M. Wolpert, Zoubin Ghahramani, and J. Randall Flanagan, ‘Perspectives and Problems in Motor Learning’, Trends in Cognitive Sciences 5, no. 11 (1 November 2001): 487–94, doi:10.1016/S1364-6613(00)01773-3. Leren is volgens Wolpert dus iets anders dan groei, een proces dat niet afhankelijk is van omgeving. Hij stelt dat leren is gebaseerd op drie typen interacties:

  1. Gecontroleerd, dat wil zeggen dat iets expliciet wordt aangeleerd;
  2. Bijgestuurd, waarbij suboptimaal gedrag wordt afgewezen;
  3. Ongecontroleerd, waarbij het organisme zonder voorbeeld of instructies relevante patronen ontdekt in de omgeving.

Laat dat nu toevallig net drie kernbegrippen zijn uit de discipline van het ‘machinaal leren’ ML, Zie hierover in meer detail, in het kader van een analyse van machinaal leren en rechtsvinding, dit artikel waar algoritmes worden ‘getraind’ op grote datasets, om zo snel en accuraat mogelijk relevante verbanden in datasets te ontdekken. Voor een onderwijsgerelateerd voorbeeld, over het trainen van machines die student essays beoordelen, zie: http://www.vikparuchuri.com/blog/on-the-automated-scoring-of-essays. Het lijkt erop dat kernbegrippen uit ML andere disciplines infiltreren en tegelijk ons begrip van onszelf, van onze manier van leren, veranderen.

Wie of wat leren?

Leren is kennelijk geen typisch menselijk vermogen. Dieren en planten, virussen en bacteriën leren ook, hoewel misschien in mindere mate, voor zover ze meer zijn voorgeprogrammeerd dan wij. Zelfs machines, meer in het bijzonder computersystemen, blijken te kunnen leren. Machinaal leren is een sub-discipline van kunstmatige intelligentie, die inzichten uit de waarschijnlijksleer, de statistiek, computationele complexiteit, informatietheorie, psychologie en neurobiologie, cybernetica en filosofie integreert. Thomas Mitchell, Machine Learning, 1 edition (New York: McGraw-Hill Education, 1997). Een gezaghebbende definitie van machinaal leren is:

We zeggen dat een machine leert:
met betrekking tot een specifieke taak T,
prestatiemaatstaaf P,
en type ervaring E,
als
het systeem de eigen prestatie P,
ten aanzien van taak T,
naar aanleiding van ervaring E,
op betrouwbare wijze verhoogt.

Een van de meest fascinerende voorbeelden van een computersysteem dat in staat blijkt om snel en bijzonder adequaat lastige cognitieve taken op te lossen en daarin steeds beter te worden, is IBM’s Watson, die een paar jaar geleden de Amerikaanse TV quiz Jeopardy won. Inmiddels wordt Watson in de vorm van een platform ter beschikking gesteld om allerlei ‘hoogwaardige’ expertise te trainen. Bijvoorbeeld medische diagnose, FinTechjuridische expertise en zo meer.

What Will You Do With Watson?

Kennelijk kunnen ook kunstmatige systemen leren en dat roept de vraag op wat het verschil is tussen menselijk en machinaal leren.

De vraag is wat er gebeurt met ons menselijk leervermogen als machines (computer systemen) leren hoe wij leren en ons daarbij gaan helpen.

Mijn stelling is dat wij – en met name onze kinderen - op het punt staan andere mensen worden, omdat zij anders gaan leren en daarmee op een andere manier hun identiteit gaan ontwikkelen.

Mijn punt zal zijn dat we ervoor moeten waken hun privacy te beschermen, in de brede en diepe zin van ‘de vrijheid van onredelijke beperkingen op de constructie van een eigen identiteit’.

De vraag is wat er gebeurt met ons menselijk leervermogen als machines leren hoe wij leren.

Wie het werk van Philip Agre en Marc Rotenberg kennen, zullen hierin hun vaak aangehaalde definitie van privacy herkennen. Philip E. Agre and Marc Rotenberg, Technology and Privacy: The New Landscape (Cambridge, Massachusetts: MIT, 2001). Die is wat abstracter en tegelijk veel radicaler dan de gebruikelijke definities, die vaak het verbergen van persoonsgegevens of controle over persoonsgegevens vooropstellen. Verbergen en effectieve controle houden over persoonsgegevens is belangrijk, ook in het kader van het onderwijs, en ik kom daar nog op terug. Maar er passen twee caveats bij de nadruk op verbergen en controle.

Ten eerste suggereert het dat consent de belangrijkste grond zou zijn voor het verwerken van persoonsgegevens. Dat is niet zo. Heel veel persoonsgegevens worden verwerkt omdat de betreffende dienst anders niet kan worden verleend (of niet gratis kan worden aangeboden, of niet kan worden verbeterd), of omdat we in een sociale rechtsstaat leven er dus controle nodig is op de herverdeling van inkomsten. Om persoonsgegevens te verwerken is een juridische grond nodig, zie de 6 mogelijke gronden in art. 6 van de Algemene Verordening Gegevensverwerking via de site van de Nederlandse Autoriteit Gegevensverwerking.

Ten tweede hebben we ook in die gevallen, waar het niet gaat om consent maar om een contract, een wettelijke plicht of het gerechtvaardigde belang van de verantwoordelijke, dataminimalisering nodig en profieltransparantie, Dataminimalisering betekent dat alleen die gegevens verwerkt worden die noodzakelijk zijn voor het te verwerken doel, zie art. 5 en 6 van de Avg. Profieltransparantie betekent dat bedrijven en overheden transparent moeten zijn over geautomatiseerde beslissingen die genomen worden op basis van profilering (waaronder machinaal leren). Die transparantie omvat 3 verplichtingen: informatie dat de beslissing op basis van profilering tot stand kwam, begrijpelijke informatie (uitleg) over de logica van het beslissingsmechanisme, informative over de voorziene gevolgen, zie art. 15(h) en 22 van de Avg. ‘data protection impact assessment’ (DPIAs) en ‘data protection by default & design’ (DPbD). Steeds wanneer de inzet van nieuwe technologie leidt tot hoge privacy risico’s moet een zogenaamde data protection impact assessment worden ondernomen om die risico’s in kaart te brengen en de maatregelen die zijn genomen om de risico’s te beperken, zie art. 35 Avg. Bij de inzet van systemen die persoonsgegevens verwerken moeten bij het ontwerp en de inrichting daarvan passende technische en organisatorische maatregelen worden genomen die de verwerking beperken wat in overeenstemming is met de Verordening, zie art. 25 Avg. Dat is echt iets anders dan opt-in of opt-out en geldt altijd, of er nu sprake is van consent of een andere verwerkingsgrond. We moeten mekaar wat dat betreft niet voor de gek houden. De bescherming van de privacy kan niet volledig op de schouders van individuele leerlingen, hun ouders of zelfs de onderwijsinstellingen worden gelegd. Er moet een default infrastructuur zijn die data minimalisering en profieltransparantie als architectonische grondbeginselen – als verdwijnpunt – heeft. En om dat te begrijpen is de definitie van Agre & Rotenberg pertinent.

Philip Agre is een computerwetenschapper die zich bezighield met de manier waarop computers onze opvattingen over de werkelijkheid herschrijven en met de gevolgen daarvan voor, bijvoorbeeld, onze privacy. Zijn definitie van privacy is dan ook toegespitst op bescherming tegen wat hij noemde de ‘capture’ van gedragsgegevens. Die ‘capture’ is volgens Agre iets anders dan gegevensvergaring. ‘Capture’ is niet zomaar verzamelen; het is eerder het vangen van het gedrag, de locatie, de status en de aanwezigheid van personen of dingen (Google vertaalt ‘capture’ heel toepasselijk met ‘vangst’). Agre merkt dan ook op dat ‘capture’ een associatie heeft met gewelddadigheid, het gaat verder dan verzamelen of observeren, je zou het ook kunnen vertalen met grijpen. Het een actief gebeuren en dus geen passieve registratie. Computerwetenschappers, degenen die de systemen bouwen waar we het vanavond over gaan hebben, duiden volgens Agre twee dingen aan met ‘capture’:

  • Data die worden doorgegeven en opgeslagen (de vangst);
  • Bepaalde onderscheidingen en indelingen die toelaten bepaalde bewerkingen te doen (modelleren, framen).

Computersystemen kunnen menselijk gedrag pas verwerken nadat het machinaal-leesbaar is gemaakt, gevangen in termen die omzetbaar zijn in wiskundige formaliseringen. Daarmee wordt de op-vatting van de werkelijkheid die computersystemen gebruiken – bijvoorbeeld om ons bij te staan bij het verbeteren van onze leerprocessen – tegelijk een om-vorming van die werkelijkheid. En om te overleven in een omgeving die verzadigd is van computationele systemen zullen we daarop in moeten spelen en ons eigen handelen daarop af gaan stemmen. Onze persoonlijke identiteit zal mee gaan bewegen met de ‘capture’ waarmee we voortdurend worden ingedeeld en opgevat, geprofiled – geframed - voorspeld en ondervangen. Dat is op zichzelf genomen geen slechte – en zelfs geen opzienbarende zaak - we profilen en framen elkaar ook voortdurend en de instituties die onze samenleving vorm geven doen niet anders. Maar de aard van de ‘capture’ die eigen is aan computersytemen is echt anders en dat zal zeker invloed hebben op de ontwikkeling van onze identiteit. De vraag is dan ook of die invloed

  1. Onredelijke beperkingen bevat,
  2. Of we daar überhaupt achter gaan komen en
  3. Hoe we de inzet van die systemen zo vorm kunnen geven dat we ons daar effectief tegen kunnen verzetten.
Om te overleven in een omgeving die verzadigd is van computationele systemen zullen we daarop in moeten spelen.

Het nieuwe onderwijs

In deze rede gaat het om de invloed van leerlingvolgsystemen en ‘learning analytics’ in de context van onderwijs in brede zin.

Onderwijs ziet op:

  • Het overdragen van tevoren vastgestelde kennis en vaardigheden,
  • waarbij een toetsbaar leerproces in gang wordt gezet.

Leren omvat veel meer dan wat in het onderwijs gebeurt. Dat is altijd zo geweest, maar de komst van het internet, het world wide web, slimme zoekmachines, social media en allerhande Apps veroorzaken inmiddels een revolutie in het denken over onderwijs.

Sommigen Kevin Carey, The End of College: Creating the Future of Learning and the University of Everywhere, (New York: Riverhead Books, 2015). kondigen het einde van het traditionele onderwijs aan, dat uit zou gaan van schaarste aan kennis, terwijl we inmiddels leven in overvloed. Studenten – zo is de gedachte – gaan zelf hun weg wel vinden bij het verzamelen van kennis en informatie. Ze hebben daarbij wel ondersteuning nodig, maar dan vooral van de juiste software applicaties, ondernemende App developers en social media platforms. Denk aan slimme zoeksystemen, tekst- en multimedia analyse systemen die handzame en gepersonaliseerde overzichten kunnen geven, en vertaalmachines die boeken, rapporten en podcasts snel omzetten van de ene in de andere taal.

Daarmee is de monopolypositie van door de staat gefinancierde en ingerichte leeromgevingen niet meer vanzelfsprekend. Onderwijsinstellingen worden uitgedaagd om elders ‘funding’ te vinden en meer samen te werken met het bedrijfsleven. Tegelijkertijd wordt de rol van degenen die digitale leermiddelen en digitale leeromgevingen ontwerpen en aanbieden steeds groter; zoals Google de toegang tot kennis beheerst door een slimme zoekmachine te ontwikkelen, zo kan IBM bijvoorbeeld met Watson de ontsluiting van allerlei vormen van expertise gaan aanbieden en daarmee zeer geavanceerde leeromgevingen ontwikkelen op allerlei terrein (medische, juridische, financiële expertise, accounting, en onderwijs). Denk bijvoorbeeld aan Blackboard en IBM, die een strategische alliantie zijn aangegaan om Watson, IBM’s platform voor cognitive computing, in te zetten voor ‘learning analytics’ op de gebruikersdata van BB (zowel van de studenten als van de docenten). Blackboard gaat bovendien gebruik maken van IBM cloud infrastructuur voor de opslag van data, die IBM overigens uitbesteedt aan Amazon Web Services. Zie ‘Rivals IBM and Amazon Team to Bring Ed-Tech Company to the Cloud’, Fortune, 30 June 2016 en 'Blackboard Inc. and IBM Enter Strategic Relationship'. Check BB’s privacy policy.

Het begrip ‘leeromgeving’ is intussen een technische term die slaat op zogenaamde elearning systemen, die op basis van leergedragsgegevens uitrekenen hoe je de leerling zo snel mogelijk bepaalde kennis of vaardigheden kunt ‘laten leren’. Om daarmee te kunnen werken moeten de leerdoelen worden geformuleerd op een manier die machinaal leesbare meetbaarheid bevordert, zodat voortdurend getoetst kan worden wat de voortgang is en welke machinaal leesbare factoren daarbij kennelijk een rol spelen. Wolfgang Greller and Hendrik Drachsler, ‘Translating Learning into Numbers: A Generic Framework for Learning Analytics’, Journal of Educational Technology & Society 15, no. 3 (2012): 42–57. Agre’s ‘capture’ is onlosmakelijk verbonden met dit soort omgevingen.

Laat ik nu kort schetsen hoe het onderwijs in sneltreinvaart en grotendeels ondergronds op het punt staat radicaal te veranderen. Over de invloed van slimme omgevingen op recht, democratie en samenleving zie mijn recente boek, Smart Technologies and the End(s) of Law. Novel Entanglements of Law and Technology (Cheltenham: Edward Elgar, 2015). Het gaat daarbij om twee vormen van ‘capture’, waar Agre het al over had, die de bouwstenen en de architectuur uitmaken van het nieuwe onderwijs:

  • De data die de input vormen van leerling- of studentvolgsystemen (vangst & bijvangst);
  • De analyse van leergedragsdata, eventueel in combinatie met data uit andere contexten (framing, profiling).

Daar komt nog een derde vorm van ‘capture’ bij, want sinds Agre schreef heeft machinaal leren een grote vlucht genomen en het mogelijk gemaakt om daadwerkelijk en soms real-time in te grijpen. Het gaat bij deze derde vorm van ‘capture’ om

  • Het ondervangen van onwenselijk gedrag, ten einde de prestaties van leerlingen en onderwijsinstituten te verhogen.

De technieken die dat mogelijk maken worden ook ingezet door overheden en commerciële partijen om gedrag te beïnvloeden, met name ‘nudging’ en AB testing. Over ‘nudging’ schrijft een econometrist op zijn blog:

Natuurlijk is manipuleren van gedrag al heel oud. Adverteerders beïnvloeden ons de hele dag, al decennia. Denk maar eens aan de wel erg ‘strategische’ plek in de supermarkt –bij de kassa namelijk – waar je doodgegooid wordt met Marsen, M&M’s en andere verleidingen. Nudging is echter subtieler. Zoals bijvoorbeeld appels – en dus geen snoep – op ooghoogte leggen in een schoolkantine. Nudging is eigenlijk een manier om je te helpen met verstandig gedrag. Gedrag dat je waarschijnlijk zou vertonen als je beter gedisciplineerd en beter geïnformeerd zou zijn. Maar nudging dwingt niet. En dat is een nieuwe manier van denken. Thaler en Sunstein merkten dat nudging acceptabeler is en sympathieker overkomt.

Ik mag aannemen dat u voldoende ironisch onderlegd bent om dit alles op waarde te schatten.

Privacy I: Leerlingvolgsystemen (LVS)

Ik ga even – om dicht bij de werkelijkheid te blijven – citeren van een website van het kennisplatform voor onderwijs:

Het leerlingvolgsysteem is een programma dat de leerkrachten inzicht geeft in de ontwikkeling van de leerlingen, zowel op individueel als op groepsniveau. In een LVS voert de leerkracht toetsresultaten in van methodetoetsen en methodeonafhankelijke toetsen. Maar het gaat niet alleen om studieresultaten, ook informatie over de sociaal-emotionele ontwikkeling komt erin te staan. In een LVS worden de handelingsplannen gemaakt en alle notities opgeschreven. Een leerkracht in de bovenbouw kan dus precies zien wat er elk jaar bij de overdracht van de leerling besproken is. Ook kan hij terugkijken of de leerresultaten van zijn leerlingen een stijgende of dalende lijn laten zien. En absentie wordt erin bijgehouden. Veelgebruikte leerlingvolgsystemen zijn Cito LOVS en ParnasSys. Daarnaast zijn er ook systemen op de markt die de ontwikkeling van de kinderen volgen op andere gebieden dan alleen de toetsen. Voorbeelden zijn Seeing Me en Looqin [prachtige metaforen: de leerling wordt gezien; er wordt naar binnen gekeken].

Een handelingsplan is er voor kinderen waarbij leer- of gedragsproblemen zijn geconstateerd. Het gaat om een plan van aanpak om die problemen zoveel mogelijk op te lossen: ‘Het [plan] moet meetbaar zijn, want anders kan nooit nagekeken worden of een leerling het doel gehaald heeft.’ http://www.wij-leren.nl/handelingsplan.php Hier zien we eigenlijk terug hoe ML het onderwijs verandert. Om te kunnen leren moet een computer een meetbare taak hebben en moet een machinaal leesbare prestatiemaatstaf worden vastgesteld. Voor een computer is dat niet opzienbarend, die kan anders niet functioneren. Bij mensen, en meer in het bijzonder bij kinderen, roept die meetbaarheidsmetafoor wel de nodige vragen op.

ParnasSys biedt een LVS met nog een aantal aanvullende modules, zodat het zowel de toetsdata als absenties en bijvoorbeeld de sociale ontwikkeling in kaart brengt. Uiteraard levert het systeem ook voorspellingen aan, bijvoorbeeld ten aanzien van het vervolgonderwijs. ParnasSys heeft bovendien ook een ouderportaal:

[dat] biedt u [de school, mh] de mogelijkheid zelf te bepalen wat u laat zien. Misschien kiest u er in eerste instantie voor om eerst alleen de gegevens van de leerlingkaart te tonen, zodat u ouders gedeeltelijk verantwoordelijk maakt voor de correctheid van deze gegevens. Of bent u al zover dat u alle mogelijke modules openzet, zoals het digitale rapport, notities en toetsen. Hoever u ook wilt gaan in het informeren, zonder extra werk betrekt u de ouders op een gemakkelijke en professionele wijze.

In de ideale school en voor de ideale leerling, met ideale ouders is hier misschien geen vuiltje aan de lucht. Maar, gelukkig, leven we niet in een ideale wereld, want wie bepaalt wat ideaal is (uw ideaal is niet mijn ideaal en het ideaal van de staat – die de eindtermen van het onderwijs bepaalt - of de aanbieder van het gekozen LVS is waarschijnlijk niet het ideaal van alle ouders, laat staan van de leerlingen). Kan een leerling die weet dat haar ouders kunnen zien:

  • hoe haar sociaal-emotionele ontwikkeling hapert (op basis van meetbare criteria die door software worden omgezet in bepaalde scores – over ‘capture’ gesproken),
  • hoe haar toetsresultaten achteruitgaan,
  • wanneer ze absent was,
  • en misschien ook wel of ze haar boterhammetjes tussen de middag wel netjes opeet.

- kan die leerling zich nog wel permitteren een eigen identiteit te ontwikkelen? Wanneer is deze leerling zo doorzichtig geworden dat ze haar eigen grenzen niet meer kan bewaken en alleen nog maar bezig is met damage-control? Mij valt een songtekst in uit de jaren ’70: ‘vluchten kan niet meer’.

Interessante vraag is natuurlijk in hoeverre de aanbieders van dit soort systemen toegang hebben tot leerlinggegevens, om op basis daarvan hun producten verder te ontwikkelen. Die producten zullen vaak bijzonder gevoelige informatie over leerlingen bevatten, bijvoorbeeld voor het zogenaamde ‘ondersteuningsprofiel’ (sinds 2014 verplicht). De doelen van dit ‘ondersteuningsprofiel’ zijn (ik citeer nu de website van een aanbieder van een software product ten behoeve van zo’n profiel):

  • Inventariseren zorgaanbod
  • Financieel instrument
  • Strategisch ontwikkelingsinstrument

Volgens die aanbieder bevat het profiel 4 onderwerpen:

  • Basiskwaliteit
  • Zorgzwaarte
  • Vormen van extra ondersteuning
  • Kengetallen

Voorwaar geen poëzie. Een optimist zou kunnen zeggen: ‘mooier kan niet – alle leerlingen (ook in het middelbaar onderwijs) worden op de voet gevolgd en bij misstanden, achterstand of uitval kan direct een ‘handelingsplan’ worden uitgezet dat is gebaseerd op toetsbare resultaten’. Een pessimist kan zeggen: ‘dit gaat leiden tot heel ingewikkeld ontwijkgedrag bij kinderen en bij docenten die zaken verborgen willen houden – misschien wel uit zorg voor het kind, en tot een enorme bureaucratie rond allerhande scores die steeds meer bepalend worden voor de kansen en mogelijkheden van degene die onder voortduring wordt beoordeeld’.

Ik herinner mij een voordracht van Terri Dowty (directeur van ARCH, Action on Rights for Children) bij de London School of Economics (2006), met de dubbelzinnige titel ‘Overlooking children: an experiment with consequences’, Terri Dowty, ‘Overlooking Children: An Experiment with Consequences’, Identity in the Information Society 1, no. 1 (24 February 2009): 109–21, doi:10.1007/s12394-009-0010-x. p. 120. waarin zij het ambitieuze jeugdzorgprogramma van Blair (Every Child Matters, n.a.v. de dood van Victoria Climbié) beschreef, dat gericht was op massale ‘capture’ van informatie over kinderen (dat beleid heeft ook onze eigen jeugdzorg geïnspireerd). Zij wees in haar voordracht op

the fundamental importance of boundaries to the development of ego-strength, self-awareness and creativity

en waarschuwt dat

[w]e simply do not know the long-term effects of bringing a child up under constant monitoring. (…) It is meaningless to tell a child that they have independence of thought and the private space to discover who they are, if we are habitually demonstrating through our actions that this is simply not true.

Leerlingen zijn jong en dus kwetsbaar. Leerling- en studentvolgsystemen zijn – laten we dat aannemen - goedbedoeld, maar bieden allerhande mogelijkheden om invloed uit te oefenen, zowel door personen uit te sluiten, als door hen extra kansen te bieden. Dat kan gaan over onderwijsgerelateerde uitsluitingen en kansen, maar het is niet ondenkbaar dat zowel commerciële partijen als politie, justitie en de veiligheidsdiensten belangstelling hebben en ook juridische gronden kunnen inroepen om data en/of profielen van individuele leerlingen of type leerlingen te kunnen bekijken en vergelijken. Vergelijk de bestandskoppeling die mogelijk is op basis van art. 54 van de Wet structuur uitvoeringsorganisatie werk en inkomen (SUWI) hier. Bij commerciële partijen gaat het om adverteerders, uitgevers, kranten, werkgevers. Die hebben allemaal een gerechtvaardigd belang om het leervermogen en het kennisniveau van hun klanten of werknemers in te schatten en kunnen daarbij wijzen op het verbeteren van hun dienstverlening of verdienmodel als doel van verwerking van persoonsgegevens. Of dat doel voldoende specifiek is en of dat belang opweegt tegen de schending van fundamentele rechten is de vraag. Politie en justitie voorzien natuurlijk graag welke leergedragsgegevens en toets resultaten samenhangen met, bijvoorbeeld, het onvermogen om impulsief of gewelddadig gedrag te beheersen en de veiligheidsdiensten zullen wellicht belangstelling hebben voor correlaties tussen leergedrag en radicalisering. Naast het aanbieden van een gepersonaliseerde leerweg, maken leerlingvolgsystemen, toetsgestuurd onderwijs en learning analytics dus ook uitsluiting en targeting mogelijk buiten de context van het onderwijs.

Het risico dat ‘capture’ tot ongewenste targeting leidt schuilt met name in het koppelen van de data uit LVS aan data uit andere contexten, zoals social networks, medische gegevens, locatiegegevens en wat dies meer zij. Maar ook koppeling van gegevens van een leerling binnen de hele onderwijsketen roept bedenkingen op, vanwege de mogelijkheden om op basis daarvan leerlingen minutieus in kaart te brengen en te matchen met allerhande voorspellingen. De verleiding om daar met de beste bedoelingen vaart mee te maken moet worden weerstaan – goede bedoelingen zijn niet genoeg (de weg naar de hel is geplaveid met goede bedoelingen). Het permanent en voortdurend framen van individuele leerlingen binnen het kader van het onderwijs, waar zij zoveel tijd doorbrengen en wat zoveel invloed heeft op hun kansen en mogelijkheden, is onverstandig en kweekt mogelijk een generatie van personen die zich voortdurend doorgemeten weten en die zich om gedoe te vermijden bij voorbaat al aanpassen aan de verwachtingen die het LVS oproept. En die verwachtingen zijn niet altijd positief; leerlingen die slecht scoren zullen zichzelf als randfiguren gaan zien en willen ontsnappen. Soms moet je mensen beschermen tegen hun eigen verleden en ze de kans geven daadwerkelijk opnieuw te beginnen (op een nieuwe school, in een nieuwe klas, bij een nieuwe leerkracht). Criminoloog Barbara Hudson, die een veelgeprezen boek schreef over Justice in the Risk Society, schreef ook een mooie tekst over ‘Secrets of the Self’, Barbara Hudson, ‘Secrets of Self: Punishment and the Right to Privacy’, in Privacy and the Criminal Law, ed. Erik Claes and Antony Duff (Antwerp Oxford: Intersentia, 2005). waarin ze laat zien hoe belangrijk het is om te erkennen en te respecteren dat mensen ook veel voor zichzelf verborgen houden. Niets is schadelijker dan ‘exposure’ van zulke geheimen door anderen, en dan nog in de koude taal van testomgevingen en pseudowetenschappelijke inzichten. Alsof iemand je plotseling de kleren van het lijf rukt om een litteken te kunnen zien, waarbij je weet dat heel veel anderen toegang zullen hebben tot dat gegeven. En misschien wist je zelf niets van dat litteken; er zijn dan toch echt beter manieren om daarachter te komen en ermee te leren leven.

Het lijkt me dus een hachelijke zaak om iedere leerling te voorzien van een enkel pseudoniem (persoonsgebonden nummer) doorheen de hele keten van het onderwijs, inclusief de aanbieders van leermiddelen, LVS en wat dies meer zij. Dat wordt desondanks wel voorgesteld in het wetsvoorstel ‘pseudonymisering leelinggegevens ten behoeve van toegang en gebruik digitale leermiddelen’. Een ketenpseudoniem maakt het makkelijk om gegevens die door verschillende partijen worden verwerkt (aanbieders van leermiddelen, distributeurs, ontwikkelaars van elektronische leeromgevingen) bij elkaar te leggen (te linken) en te re-identificeren, of voor doelen te gebruiken waarvoor ze niet zijn bestemd (met name voor commerciële exploitatie). Het is inmiddels technisch mogelijk om iedere betrokken partij een eigen pseudoniem te geven, zodat iedere partij de gepseudonymiseerde gegevens kan verwerken die noodzakelijk zijn voor de eigen taak, en niet meer en niet verder. Dat lijkt mij meer in overeenstemming met dataminimalisering, en daarmee is de invoering van meerdere pseudoniemen een juridisch vereiste. Het is de meest aangewezen manier om onrechtmatige koppeling tussen bestanden van verschillende derde partijen vrijwel onmogelijk te maken. Het is dus een vorm van ‘data protection by default’, waartoe de komende Algemene verordening gegevensbescherming verplicht.

Privacy II: Gepersonaliseerde leeromgevingen

Nu dan over gepersonaliseerde leeromgevingen. De output daarvan komt natuurlijk terecht in de LVS, maar het is interessant en belangrijk om te kijken wat die omgevingen nu eigenlijk doen. Zij maken een heel specifieke ‘capture’ mogelijk die het onderwijs ten gronde gaat veranderen. Zoals Agre aangaf is een ‘capture’ geen passief gebeuren, het is geen afdruk van de werkelijkheid maar een ingreep in de werkelijkheid, om haar machinaal leesbaar te maken. Ik heb er geen probleem mee om het gedrag van leerlingen machinaal leesbaar te maken als dat bijdraagt aan het versterken van het zelfstandig en kritisch leervermogen van die leerling. Als we maar niet gaan denken, of doen alsof we die leerling zelf machinaal leesbaar kunnen maken. Om te laten zien wat ik met dat verschil bedoel twee voorbeelden: toetsgestuurd leren en learning analytics.

Toetsgestuurd leren Dirk Tempelaar et al., ‘Toetsgestuurd leren en Learning Analytics’, Onderwijsinnovatie, no. september (2012): 17–26.

De meeste van ons denken waarschijnlijk dat een toets iets is dat je afneemt na afloop van een cursus om te kijken of de student erin is geslaagd zich de materie eigen te maken. Dat heet inmiddels een ‘summatieve’ toets. Heel nuttig en niets nieuws. Als je wilt gaan sturen op toetsen ben je met een summatieve toets eigenlijk altijd net te laat, want die wordt afgenomen aan het eind van het leerproces. Intussen spreken we dan ook van diagnostische toetsen, oefentoetsen en formatieve toetsen. De eerste is een soort ingangstoets om te bepalen op welk kennis- of vaardighedenniveau de student aan het begin van de cursus zit; de tweede geeft de student tussentijds de kans om te checken of zij op de goede weg is. Het mooie van formatieve toetsen is dat die deel uitmaken van het leerproces; ze zijn niet bedoeld als diagnose of eindoordeel. Het gaat ook niet om zomaar wat oefenen. Een formatieve toets geeft de student real-time feedback zodat die ter plekke wordt bijgestuurd en onmiddellijk merkt of zij de leerstof heeft begrepen. Door die feedback na iedere opdracht te geven en extra opdrachten te integreren waar lacunes blijken te zitten, train je de student als het ware naar het juiste kennisniveau. In termen van machinaal leren is dat een vorm van ‘reinforcement leren’: je geeft studenten een aantal problemen die ze zelf moeten oplossen en geeft direct aan of de oplossing goed of fout was en – zo mogelijk ook – waar de misstap zit. Dat blijkt bijvoorbeeld bij wiskunde en statistiek redelijk goed te werken. Vgl. ook Kit Eaton, ‘Flash Card, Math and Organizer Apps for the 21st Century Student’, The New York Times, 24 August 2016.

Interessant detail is dat sommige leerlingen veel profijt hebben van al die oefeningen maar wel heel veel moeten oefenen om het gewenste kennisniveau te bereiken. In dat geval blijkt dat kennisniveau zelf geen goede voorspeller van de examenresultaten vergeleken met eenzelfde kennisniveau van studenten die daarvoor minder tijd nodig hadden. Klinkt niet onlogisch maar de cruciale vraag is wat voor conclusie we daaruit trekken. In New York behaalde de Succes Academy vorig jaar een voldoende score voor wiskunde voor 93 procent van de leerlingen, vergeleken met een score van 35 procent voor alle kinderen in New York; 68 procent testte voldoende voor lezen, vergeleken met 30 procent in de hele stad. Mark Palko and Andrew Gelman, ‘How Schools That Obsess about Standardized Tests Ruin Them as Measures of Success’, Vox, 16 August 2016. De Succes Academy is superstreng en ambitieus (wie dacht dat China het patent heeft op dit soort praktijken moet nog eens goed om zich heen kijken). De school werkt met een vloed aan gestandaardiseerde testen om het succes van de leerlingen te meten en vergelijken. De statistische correlatie tussen goed scorende leerlingen en goed onderwijs is helaas niet waterdicht: als je leerlingen uit achterstandsmilieus weert of slecht scorende leerlingen zo snel mogelijk van school verwijdert zegt de score niets over je onderwijs. Dat is wat ik bedoel: de resultaten van al die diagnostische, formatieve en summatieve testen kunnen gemakkelijk worden ingezet om leerlingen te framen en op zo laag mogelijk niveau door te verwijzen zodat ze binnen dat niveau hoog scoren. Het gaat bij LVS en toetsgestuurd onderwijs immers niet alleen om verbeterde prestaties van individuele studenten, maar ook van de scholen, hoge scholen en universiteiten die onder hoge druk staan om hun eigen prestaties te verbeteren. Dat kan perverse effecten hebben voor individuele leerlingen. Ibid.: ‘In short, a statistical perspective can help reveal how behavior that seems like an aberration can actually be a natural response to perverse incentives. (….) Like those Soviet factories, Success Academy and other charter schools have been under pressure to perform on a particular measure, and are reminding us once again what Donald Campbell told us 40 years ago: Tampering with the speedometer won't make the car go faster.’

‘Capture’ is een tweesnijdend zwaard:

  • Het hervormt de werkelijkheid zodat we;
  • kunnen meten en vergelijken, trainen en oordelen.

De vraag blijft wat die ‘capture’ zichtbaar maakt en daarmee ook wat die onzichtbaar maakt. Wie zich die vraag blijft stellen en toetsen als middel blijft zien en niet als doel op zichzelf kan fantastische resultaten bereiken. Ik verwijs graag naar de voorbeelden van basisschool El Habib uit Maastricht, Islamitische basisschool El Habib in Maastricht werd in 2012 door een jury geselecteerd als excellente school, zie de documentaire. en naar de inzet van MyStatLab bij studenten wiskunde en statistiek bij de Universiteit Maastricht. Tempelaar et al., ‘Toetsgestuurd Leren En Learning Analytics’. Wat opvalt is dat de toetsen en de elektronische leeromgeving hier worden gebruikt om leerlingen en studenten beter bewust te maken van eigen leerstijl en lacunes, en informatie geeft hoe ze tot betere resultaten kunnen komen. Bij basisschool El Habib valt op dat de nadruk op toetsen maar een klein onderdeel is van de strategie, het gaat verder vooral om de manier waarop de ouders bij de school worden betrokken, de inzet op taal en goeddoordachte huiswerkopdrachten die zijn gericht op het voortdurend oefenen van woordenschat en taalbegrip (bijvoorbeeld ook door ouder en kind samen naar bepaalde tv programma’s te laten kijken). Bij de UM gaat het om de combinatie met probleem gestuurd onderwijs (PGO), waar de student sowieso verantwoordelijk is voor het eigen leren.

Learning analytics

MyStatLab is een voorbeeld van de inzet van Learning analytics (LA). LA maakt gebruik van Big Leerdata, waarbij gebruikersgegevens van bijvoorbeeld Blackboard, MyLab, formatieve toetsing en LVS worden samengevoegd om kennis te vergaren over leerprocessen. Die kennis bestaat uit patronen en voorspellingen, omdat Big Data het mogelijk maakt om statistisch relevante verbanden te leggen tussen allerhande gedrag en de gemeten onderwijsprestaties. Bij wijze van spreken tussen het eetpatroon van studenten en hun scores op wiskundige of meer narratieve kennis, maar vooral tussen meetbaar leergedrag en meetbare prestatieverbetering.

LA is gebaseerd op machinaal leren, in dubbele zin. Enerzijds omdat het gebruik maakt van machinaal leren bij het trainen van de algoritmes die ‘leerdergedrag’ voorspellen. Het systeem leert hoe de leerder zo snel/efficient/effectief mogelijk een specifiek inzicht, bepaalde inhoud of vaardigheid leert. Anderzijds omdat de ‘leerder’ in het kader van LA wordt getraind op een wijze die overeenkomt met de logica van machinaal leren: de student krijgt opdrachten (input) die ze gaat oplossen (output), waarna ze onmiddellijk feedback krijgt (reinforcement: dit is goed of fout), waarna de student nieuwe opdrachten krijgt, net zo lang tot ze met de goede oplossingen komt. Het oplossingsproces kan in afzonderlijke deelproblemen of oplossingsstappen worden opgebroken die een voor een getraind kunnen worden, waardoor de student gaat begrijpen op welk punt ze de mist ingaat. Het is niet verwonderlijk dat dit soort trainingen vooral effectief zijn bij problemen die zich eenvoudig laten onderverdelen – die gebaat zijn bij dit soort ‘capture’. Bij andere vakken zal het vaak gaan om meer narratieve kennis of complexe argumentatie die gebaat zijn bij de erkenning van ambiguïteit en die op veel verschillende manieren kunnen worden opgedeeld en opgelost. Dan kan die ‘capture’ tot een verarming leiden van de inzichten van de student. Zeker als zij gedwongen wordt het algoritme van een bepaalde leercyclus te volgen.

Dat neemt niet weg dat juist dit soort programma’s ook een veelheid aan oplossingen kunnen bieden, waardoor de student wordt uitgedaagd hetzelfde probleem van meerdere kanten te bekijken – en zich bewust te worden dat als je het probleem anders ‘framet’, de oplossing ook heel anders kan zijn. Dat zou winst zijn. Maar dat vraagt een bepaalde inzet van degenen die het programma ontwikkelen. En het blijft iets anders dan de ‘leerder’ uit te dagen om zonder stappenplan met een oplossing te komen.

In hoeverre maken we studenten denklui door de problematiek steeds maar voor hen uiteen te rafelen en machinaal leesbaar te maken? Dit is geen retorische vraag. Het is een echte vraag. Om die te beantwoorden moeten data scientists, docenten en studenten om de tafel gaan zitten (of staan) en bekijken hoe menselijk en machinaal leren elkaar kunnen aanvullen. Niet alleen uit een oogpunt van economie (hoeveel dure leerkrachten kun je vervangen door digitale leeromgevingen?) maar eerst en vooral uit een oogpunt van respect voor de individuele leerder en de doelen van het onderwijs. Die doelen gaan verder dan wat een individuele leerder toevallig interessant vindt of wat ‘het’ bedrijfsleven nodig denkt te hebben, het gaat ook over het voeden van een samenleving waarin individuen in staat zijn zich kritisch en zelfstandig te verhouden tot elkaar, tot hun overheid en tot hun werkgever, hun huisbaas, de bank en tot de software systemen die in toenemende mate hun toegang tot allerlei diensten en producten bepalen. Alfabetisering is niet meer voldoende, Maryanne Wolf, Proust and the Squid: The Story and Science of the Reading Brain (Icon Books Ltd, 2008). we moeten gaan nadenken over het trainen van jonge kinderen in de kunst van het programmeren en investeren in begrip van en vat op statistiek. David A. Sousa, Mind, Brain, and Education: Neuroscience Implications for the Classroom (Bloomington, IN: Solution Tree, 2010). Niet om programmeurs of statistici van onze kinderen te maken, maar juist om ze weerbaar te maken zodat ze veel sneller dan wij door hebben wanneer statistische verbanden onzin zijn en wat ze eigenlijk betekenen. ‘Capture’ die machinaal leren mogelijk maakt en ‘capture’ die het resultaat is van machinaal leren heeft alles van doen met statistiek. We zijn daar niet voor ‘bedraad’ in de bovenkamer en dat moet echt veranderen, willen we de juiste vraag kunnen stellen bij allerhande beweringen van politici, wetenschappers en anderen die ons via nieuwsplatforms bereiken. Door de staat gefinancierd onderwijs beoogt een brede, gedeelde basis te verzekeren waar individuele personen zich gerespecteerd weten en de kennis en vaardigheden hebben om zich vrij van onredelijke beperkingen te kunnen bewegen. In die zin is privacy hier meer een kwestie van: hoe voorkomen we dat kinderen al in een vroeg stadium worden getraind alsof ze machines zijn, en hoe houden we greep op de inhoud van die trainingsprogramma’s, zodat ze een aanvulling blijven en de vrijheid van individuele kinderen vergroten in plaats van die te verkleinen?

Hoe voorkomen we dat kinderen al in een vroeg stadium worden getraind alsof ze machines zijn?

Het nieuwe leren en de menselijke maat

De inzet van eLearning is niet beperkt tot het reguliere onderwijs. Het gaat bijvoorbeeld ook om specialistische training. Ik citeer uit NRC.next van een paar weken terug, over het feit dat huisartsen vaak tekortschieten in het herkennen van alcohol als oorzaak van ouderdomskwalen: Michiel Dekker, ‘“Ik Ben Echt Geen Alcoholist Hoor”’, NRC Handelsblad, 17 August 2016.

Ook artsenorganisatie KNMG maakte enkele jaren geleden een e-learningmodule voor het bespreekbaar maken van alcoholgebruik.

We lijken er inmiddels voetstoots vanuit te gaan

  • Dat computersystemen leren;
  • Dat ons eigen leren er beter van wordt als die systemen leren hoe wij leren en ons gaan leren hoe we het beste kunnen leren.

Ik noem dat voor het gemak ‘het nieuwe leren’, dat zich niet tot onderwijs beperkt en daar ook van afwijkt omdat het geen kennis overdraagt maar de ‘leerder’ als het ware ‘verleidt’ om zich bepaalde inhoud of vaardigheden eigen te maken. Het kan daarbij gaan om een vorm van subliminale beïnvloeding. Daarbij moeten we onderkennen dat degene die de algoritmes traint [of laat trainen] aan de macht is, die bepaalt namelijk wat de leerder leert binnen de contouren van een omgeving die is ingericht aan de hand van data gestuurde ‘nudge technieken’ en permanente ‘AB-testen’.

Sinds Montesqieu weten we dat vrijheid bestaat bij de gratie van het evenwicht tussen macht en tegenmacht, waarbij het hem gaat om een duurzaam evenwicht. Dat betekende een geïnstitutionaliseerd evenwicht. Inmiddels betekent dat ook een technologisch verankerd evenwicht; dat tot in de haarvaten van ict projecten reikt, want daar gebeurt het. Zie de stellingen bij mijn Preadvies NJV2016. Dat geldt met name ook voor de vrijheid om een eigen identiteit te ontwikkelen en de vrijheid van onredelijke inperkingen daarop. Of privacy een voorrecht, een luxe of het uitgangspunt is zal dus afhangen van de tegenmachten die we organiseren. Het zou een misverstand zijn om te denken dat dit enkel een kwestie is van grenzen aan de gegevensvergaring. Het gaat om het indammen, transparant en aanvechtbaar maken van beide vormen van ‘capture’, en om het scheppen van effectieve verzetsrechten tegen ondoorzichtige leeromgevingen, en tegen onjuiste, onredelijke en oneerlijke targeting.

Heel concreet betekent dat:

  1. Geen ketenpseudoniem maar voor ieder gebruik en hergebruik een ander pseudoniem, gekoppeld aan een duidelijk en begrijpelijk en natuurlijk legitiem doel,
  2. Goed doordachte default settings bij de inzage in LVS voor docent, administratie, schoolleiding, inspectie, aanbieders en distributeurs van leermiddelen en leeromgevingen en vooral ook voor ouders en kind of voor de student,
  3. De mogelijkheid voor docent, ouder en kind of student om te checken welke gedragsgegevens die aanbieders ‘vangen’ (denk alleen al aan het soort gegevensstromen die met een ebook mogelijk worden),
  4. Open source software of andere vormen van controle op welke leerdoelen ze hoe nastreven, dus: wat leeromgevingen doen, hoe ze werken, welke trade-offs ze kiezen tussen snelheid, efficiency en effectiviteit.

Wij willen een samenleving waarin creativiteit, omgang met onzekerheid en kritische reflectie tot de kernwaarden van het onderwijs behoren. Hoe meer voorspellingen hoe meer onzekerheid, zie bijvoorbeeld M Hildebrandt, ‘New Animism in Policing: Re-Animating the Rule of Law?’, in The SAGE Handbook of Global Policing, ed. Ben Bradford et al. (S.l.: SAGE Publications Ltd, 2016). Dat veronderstelt een vrije ruimte waarbinnen leerlingen, studenten en andere ‘leerders’ ongestoord kunnen experimenteren en een leeromgeving waar plaats is voor zowel verzet als vermaak (homo ludens is nog steeds een rake metafoor voor menselijke ‘leerders’). Datagedreven onderwijs gaat ons niet het paradijs binnenleiden, maar een zorgvuldige aanpak van datagestuurde onderwijsmethoden staat niet per se gelijk met het voorportaal van de hel. Goed overwogen sturing op leerdata biedt kansen om beter in te spelen op individuele studenten, nieuwe uitdagingen voor docenten en kan tot een relatief vlekkeloze en veilige administratie van studievoortgangsgegevens leiden. Dat spreekt echter niet vanzelf, zoals bijvoorbeeld blijkt uit het wetsvoorstel pseudonymisering leerlinggegevens, het gebruik van Blackboard door vrijwel alle universiteiten, en de neiging om het ei van Columbus altijd maar weer te zoeken in schaalvergroting en semi-automatische beslissystemen. Bijvoorbeeld, Onderwijsraad, ‘Variëteit in Schaal (Samenvatting)’, advies (Onderwijsraad, 2005).

Datagestuurd onderwijs mag niet enkel worden ingegeven door bezuinigingsdrang en datagedreven onderwijs lijkt gewoon veel te veel te verwachten van machinale ‘captures’ en ons onderwijsstelsel bovendien onnodig afhankelijk te maken van dit soort systemen (denk aan de beveiligingsrisico’s, niet alleen t.a.v. persoonsgegevens maar ook aan LVS als kritische infrastructuur). De uitdaging zal zijn om veilig en doorzichtig datagestuurd onderwijs te ontwikkelen en de leerling daarbij als uitgangspunt en niet alleen als meetpunt te nemen.

De menselijke maat laat zich niet restloos omzetten in datapunten en andere ‘captures’. Systemen die daar wel van uitgaan weten eo ipse geen maat te houden, en luiden precies daarom het einde in van onze privacy.