Hvilken algoritme skal bestemme over dine elever?

Den, der har data, har også indsigt og magt. I øjeblikket har private virksomheder som Google og Facebook overtaget denne magt, og nu ser vi det første opgør i datakrigen. Men tro mig, der er kun én taber, og det er individet, der sidder som en lus mellem to negle. Med skyklapper på er Staten allerede godt igang med at indføre Kinas “digitale leninisme”, hvor data bliver misbrugt til at regulere den menneskelige adfærd.

Vi skal huske på, at vores personlige data er noget af det mest private, vi mennesker har, og samtidigt noget af det vigtigste. Undervisningsministeriet er ved at finde på nye mønstre, nye kasser, der kan ensrette eleverne og dermed fjerne mangfoldigheden. Vi bliver nødt til at have en debat om, hvilke data der er nødvendige at opsamle, og på den baggrund beslutte, hvordan vi på en etisk og forsvarlig måde kan bruge disse til at forbedre læring, ikke til overvågning og kontrol – og helt sikkert ikke for at fjerne den menneskelige vurdering.

Vi har lige været igennem en proces, hvor Styrelsen for It og Læring ville forsøge at forhindre snyd til eksamen med introduktionen af Den digitale prøvevagt. Uden at gå for meget i detaljer med programmet, indhentes en række informationer fra elevens computer, mens eleven er til eksamen. Det kan fx være skærmbilleder hvert 30. sekund eller informationer om, hvilke programmer der er åbne. Målet er at undgå, at eleverne benytter programmer til fx at kommunikere med omverden, eller at de tilgår sider, de ikke skal have adgang til. Udfordringerne med Den digitale prøvevagt opstår, når ministeriet ikke har kontrol over, hvilke personlige data der samtidig opsamles, fx Unilogin og kode, private billeder på skrivebordet, oversigt over senest åbnede dokumenter, søgehistorik og bogmærker i browseren. Der kommer en mængde informationer med, som Styrelsen for It og Læring ikke har tilladelse til at indhente, og som teknisk ikke er muligt at frasortere. Som sådan er programmet blot Undervisningsministererens reaktion på en vag formodning om, at der snydes massivt til eksamen som en følge af, at eleverne nu har adgang til internettet.

Det, jeg er meget bekymret for, er den massive opsamling af data og især, hvem der efterfølgende har adgang til at behandle disse data. Så sent som den 18. marts 2019 skrev Version2 om, at ansatte på gymnasierne alle har adgang til at se elevernes opsamlede data, selv uden begrundet mistanke. Der er dermed meget lidt kontrol med, hvem der har adgang til elevernes data. Styrelsen for It og Læring lover, at data fra prøverne kun bliver gemt i fire måneder, men når først data er gemt, kan det være svært at fjerne dem igen – også selvom man har lovet noget andet. Vi så også problemstillingerne med trivslesundersøgelserne i folkeskolen, hvor der ulovligt blev indsamlet data, og efterfølgende var det nærmest umuligt at få anonymiseret og slettet disse. Konsekvensen er nu at det ikke længere er muligt at svare anonymt på trivselsundersøgelserne (Version2, 2019, Undervisningsministeriet fjerner mulighed for anonym trivselsmåling).

Overalt i vores samfund sker der for tiden en masseopsamling af brugernes data. Det handler om at opsamle mest muligt datamateriale for efterfølgende at finde ud af, hvordan disse data kan bruges. Isoleret set, er der nok ikke problemer med det enkelte datasæt, men i det øjeblik, man sammenholder disse data med andre datasæt, kan det give nye dataforbindelser, som ikke var hensigten fra starten. Jeg er bange for, at vi er i gang med at bruge data forkert, og at vi bilder os selv ind, at data kan løse alle problemer. For hvert lille datapunkt, der opsamles, kommer der nye forbindelser og tolkningsmuligheder, hvilket dermed giver nye måder at anskue og handle på.

I øjeblikket er argumentet for dataopsamling, at det handler om at sikre, at ingen snyder til eksamen. Hvis man sammenholder disse data med andre datasæt, kan det hurtigt blive til, at man ikke kan komme til eksamen, hvis man har for meget fravær. Eksempelvis har Niels Jacob Pasgaard (Pasgaard, N. J. (2017). FAQ om læringsmål (Vol. 1). Hans Reitzels Forlag) beskrevet, hvordan Styrelsen for It og Læring har en bagdør i læringssystemerne i folkeskolen, således at de selv kan trække elevdata ud. Sammenholder man disse data fra folkeskolen med data fra gymnasiernes afgangsprøver, kunne man få nogle ret specifikke brugermønstre. Disse mønstre kan efterfølgende bruges til at bremse forskellige elevtyper, som man ved vil få det svært i gymnasiet. Denne sammenkøring af data er allerede forsøgt af it-systemet Lectio til at forudsige frafald på gymnasierne (Version2, 2015, It-system til varsel af elevfrafald blev øjeblikkeligt standset af gymnasierne). Heldigvis blev det stoppet, inden algoritmen kom i gang, men det viser noget om, hvor uetisk man kan bruge data.

Fremtiden bliver karakterfri. Det bliver i stedet en algoritme, der undersøger ens data og kommer med en samlet score for, hvilke muligheder man har i uddannelsessystemet. Data bliver sammenholdt med elevens profil fra de sociale medier, og alt indgår i en slags helhedsvurdering. Alle disse data overlades til en kunstig intelligens, der sammenholder dine data med data om afgangselever fra universiteterne. Herefter udvælger systemet, hvilke elever der kan starte på universitetet, og hvem der skal lave noget andet. Det er selvfølgelig en dystopisk tankegang, men det kan blive en realitet, hvis der ikke er større åbenhed om databehandling.

Jeg er helt sikker på, at Undervisningsministeriet nok skal få udgivet en ny version af den Digitale Prøvevagt, som lever op til GDPR. Det bliver nok under et andet navn eller som en del af netprøver.dk. Grundlæggende kan det være fint nok at have en eller anden form for kontrol med prøverne, men den ukritiske tilgang til dataopsamling medfører blot nye problemer. Drømme bliver slukket, inden de overhovedet er drømt, og vi bevæger os væk fra den tillid, der ellers karakteriserer det danske samfund.

Per Størup Lauridsen, adjunkt, Odense Tekniske Gymnasium