Is de rechterlijke macht er klaar voor om kunstmatige intelligentie (ook bekend als Artificial Intelligence of AI) te omarmen? Dit was de grote vraag die boven een zaal vol rechters hing tijdens SSR-themadag ‘Big(ger) Data – Minder(e) rechter?’ op 22 februari in Amsterdam (https://ssr.nl/2018/training-big-data-de-moeizame-dans-tussen-rechter-en-machine/ ).
Machine learning en andere AI-technieken worden al op grote schaal gebruikt in het bedrijfsleven, bij grote advocatenkatoren en Het Openbaar Ministerie. Maar in de gerechtshoven krijgen professionals nog vaak de bibbers van het idee dat computers een grote rol kunnen spelen bij het de voorbereiding van zaken. En toch blijkt uit alle onderzoeken dat de laatste data science technologieën het meeste (zoek)werk sneller, vollediger, accurater en vele malen goedkoper kan overnemen.
Aan het woord waren Jaap van den Herik, Nederlands informaticus en hoogleraar aan de Universiteit Leiden; en Jan Scholtes, hoogleraar Text Mining aan de Universiteit van Maastricht en directeur van ZyLAB. De sprekers maakten gehakt van het veelgehoorde argument dat de machine typisch menselijke activiteiten nooit voor zijn rekening kan nemen. In 1998 versloeg de computer schaakkampioen Gary Kasparov, in 2011 dolven het Jeopardy! kampioensduo Ken Jennings en Brad Rutter het onderspit en vorig jaar onderging de Chinese Go wereldkampioen Ke Jie hetzelfde lot. Dus waarom zou de computer niet ook nuttig kunnen zijn in de rechtsspraak?
Bij de Raad voor de Rechtsspraak is er een gigantische massa van ongestructureerde en veelal tekstuele data opgeslagen. Het is een excellent voorbeeld van Big Data. Tijdens de themadag maakten de aanwezige rechters kennis met beslissingsondersteunende methoden om jurisprudentie op te zoeken: welke eerdere zaken passen het beste bij de behandeling van de huidige zaak? De technologie is vergelijkbaar als die waarmee Netflix en Spotify aanbevelingen doen voor series en muziek.
Big Data Analyse wordt in de praktijk al regelmatig ingezet in het recht. Zo telde het proces-verbaal in het onderzoek naar de vuurwerkramp in Enschede in 2002 zo’n 50 tot 60 ordners van de 600 ordners die de complete documentatie van het Passage proces omvatte. Deze dossiers zijn uiteindelijk digitaal beschikbaar gesteld met de software van ZyLAB, wat leidde tot enorme efficiencyvoordelen. “Je kon het dossier ineens vele malen sneller op bepaalde trefwoorden doorzoeken”, zo stelde Scholtes. Ook het Joegoslavië-tribunaal maakt dankbaar gebruik van de software om de 1,2 miljoen dossierpagina’s beter doorzoekbaar te maken. En de Nederlandse Zorgautoriteit heeft met hulp van Big Data Analysis de gemiddelde onderzoeksfase ingekort van twee maanden naar drie dagen. Ook het OM weet de losse eindjes beter aan elkaar te knopen met behulp van AI.
Het tijdperk van traditionele, Booleaanse zoekopdrachten lijkt voorbij. Zelfs de meest briljante zoekopdracht resulteert in teveel onnodige resultaten. Met het nieuwe zoeken aan de hand van kunstmatige intelligentie ontdek je nu meer abstracte onderwerpen in een collectie aan documenten. Machine learning maakt met classificeerders documenten vele malen vindbaarder dan met de klassieke zoekmethodes. In de US noemen ze dit Technology Assisted Review (TAR). TAR-gebruikers hoeven geen kennis van zoekoperatoren te hebben en ze weten precies wat het percentage van relevante documenten is. Er worden twee tot drie keer meer relevante documenten gevonden, vijf tot zes keer sneller dan voorheen en met tien tot vijftien keer minder mensen.
In de Verenigde Staten is het gebruik van Technology Assisted Review al algemeen aanvaard door de rechterlijke macht. Rechter Andrew J. Peck van Southern District in New York, die regelmatig grote zaken van Wall Street behandelt, verplicht in veel gevallen het gebruik van TAR zelfs in zijn rechtszaal. Vanwege de gigantische datavolumes die zaken daar omvatten, is handmatig werken nauwelijks meer voor te stellen. TAR werd daar langzaam populairder, omdat het aantal processen snel steeg en de proceskosten de pan uitrezen. Met de technologie van voorspellende codering leverde TAR een 50-voudige kostenbesparing op ten opzichte van de klassieke manier om documenten door te spitten.
Tijdens de cursusdag kropen de rechters uiteindelijk ook zelf achter de computer om het geleerde in de praktijk te brengen. Zo moesten ze met rechterlijke uitspraken op zoek gaan naar de meest relevante jurisprudentie bij een bepaald thema of casus. Hierbij gebruikten ze aanverwante zoektermen als ‘cybercrime’, ‘computervredebreuk’ en ‘sexting’. Met de methode van machine learning wisten de deelnemers een verrassend complete lijst met jurisprudentie vast te stellen. Dit was handmatig nooit gelukt, zo stelden enkele juristen vast.
Wilt u zelf eens zoeken met deze moderne zoektechnieken in alle data van de raad van de rechtspraak of in uw eigen data collectie, neem dan contact met ons op.