De wijde wereld van het recht duiden met algoritmes

Juristen worden vaak gezien als ‘boekenwurmen’; niet vies van wat lees- en spitwerk in de literatuur. Maar het tussen tienduizend uitspraken van rechtbanken zoeken naar die ene die het meest relevant is, overvraagt zelfs de hongerigste boekenwurm. De pilot Web of Laws probeert daarom tools te ontwikkelen die snel de relevante uitspraken filtert voor juristen. Met FAIR datagebruik en open science als belangrijke ankerpunten.

Gezeten voor zijn muurhoge boekenkasten, zou je prof. mr. Gijs van Dijck misschien houden voor een ‘klassieke jurist’. Maar dan heb je hem nog niet horen praten over zijn werk: de samenwerking met kennistechnologen en andere dataspecialisten, met wie hij de wijde wereld van het recht toegankelijk wil maken voor zoveel mogelijk mensen. Ook niet-juristen, of de “juristen die niet voor niets voor dit vakgebied kozen”, oftewel: weinig affiniteit hebben met (computer)techniek.

Tools, zodat je verder kunt kijken dan nu mogelijk is

“Je bent als jurist altijd op zoek naar relevante uitspraken, bijvoorbeeld om je betogen mee te onderbouwen. Op dit moment heb je daarvoor weinig geavanceerde zoekbanken, je kunt handboeken lezen waarin autoriteiten een selectie voor je hebben gemaakt en je kunt natuurlijk zelf associatief nadenken. Maar dat is qua schaal allemaal beperkt”, vertelt Gijs van Dijck. “Je bent bijvoorbeeld geneigd vooral naar de hoogste rechter te kijken, maar wat er op een lager rechtspraakniveau gebeurt, is veelal onzichtbaar en dus niet bruikbaar. Dat gaan tools als de onze oplossen.”

Een netwerk van uitspraken, beter dan in de boeken

De tools zijn onder meer gebaseerd op social network analysis, waarmee bijvoorbeeld het communicatiegedrag van groepen mensen geanalyseerd kan worden. Wie praat met wie? Wie is populair, wie staat aan de zijlijn? Wanneer je alle uitspraken van rechters en de verwijzingen die ze naar elkaars uitspraken doen, op dezelfde manier in een systeem invoert, tekent zich eveneens een netwerk af met de relevantste uitspraken op een prominente plaats. “Als je die analyse ter check naast de klassieke literatuur legt, zie je dat die vaak dezelfde uitspraken als relevant eruit filteren. We kunnen dus behoorlijk goed reproduceren wat de literatuur doet en soms verbeteren we dat zelfs: relevante uitspraken die door de literatuur over het hoofd worden gezien, halen we boven water.”

En liefst natuurlijk FAIR, die data…

The algorithm that he and his colleagues are trying to optimise is, of course, dependent on good data. “That’s where FAIR comes into play. Because we want our data not only to be of good quality, but also structured in such a way that the entire academic community understands it and maybe even the world beyond. We want to do everything according to the principles of FAIR; we see too much data that is only accessible to a certain research group. A colleague whose data you request access to says, ‘Come here, you can sit in front of our computer and view the data’. That’s not FAIR.”

…wat niet per definitie ook open science is

Wat FAIR precies wel is, daarover kunnen de meningen nog verschillen, leerde Van Dijck al. “Wat versta je precies onder ‘herbruikbaar’ en ‘combineerbaar’? Dat je wat code aanlevert, of zit er ook een programma bij waarmee je meteen met de data aan de slag kunt?” In de pilot gaat het vooral om het boven water krijgen welke uitdagingen er liggen bij FAIR datagebruik. Wat overigens iets anders is dan ‘open science’. “Dat gaat wat mij betreft over het publiek toegankelijk maken van je onderzoeksresultaten. Je kunt iets FAIR hebben, maar niet open science, omdat de resultaten achter een betaalmuur van een tijdschrift staan. Maar je kunt ook iets open science hebben, want toegankelijk voor iedereen, maar de data zijn niet FAIR.”

Nu de waardering nog, voor de FAIRe, open science wetenschapper

In de Community for Data Driven Insights ontmoet hij wetenschappers uit andere disciplines die ook werken aan FAIRe data. En hij stimuleert promovendi waar hij kan om ermee aan de slag te gaan. “Je moet vanaf het begin nadenken: ‘Hoe kan een andere onderzoeker die mijn data ooit wil gebruiken hiermee uit de voeten?’ Het bewustzijn moet als een olievlek verspreid worden en dat zouden universiteiten kunnen stimuleren door het te waarderen. En dan bedoel ik niet met een schouderklopje. FAIR kost meer werk en als je wetenschappers alleen afrekent op het aantal beurzen of publicaties, gaan ze die extra moeite niet doen.” En daar komt het uiteindelijk toch op neer: onderzoekers moeten het gewoon gaan doen.

Femke Kools

Lees ook