Het aantal informatieverzoeken op basis van de Nederlandse Wet open overheid (Woo) groeit gestaag. Ook neemt de omvang en complexiteit van de aanvragen steeds meer toe. Beleidsmedewerkers of speciaal voor de Woo ingehuurde juristen zijn vaak weken of zelfs maanden bezig met het doorzoeken en doorschiften van duizenden beleidsdocumenten en e-mails, en het weglakken van gevoelige gegevens. Hierbij moet met de grootste nauwlettendheid te werk worden gegaan, maar een ongeluk zit in een klein hoekje, met alle juridische, financiële en politieke gevolgen van dien.
Met de meest recent technologische ontwikkelingen, overgewaaid uit de Verenigde Staten, kan het overgrote deel van het Woo-handwerk door de computer worden overgenomen. Verloren e-mails met bijlagen worden weer teruggevonden en automatisch gecategoriseerd. Aan de hand van semantische zoekmachines komen de meest relevante (eind)documenten weer naar boven. De computer kan zelfs leren om informatie terug te vinden waarvan niet eens bekend was dat deze werd gezocht, nog voordat er een Woo-verzoek is ingediend.
Groeipijnen in gegevensbeheer
Aan de hand van het zogeheten Woo-maturity model dat door Woo-specialist ZyLAB is ontwikkeld, kunnen bedrijfsleiders, juristen en IT’ers zien hoe vergevorderd hun organisatie is in data verzamelen, organiseren en afhandelen conform de eisen van de Woo. Afhankelijk van de behoeftevraag; of het gaat om sporadische Woo-aanvragen of jaarlijkse piekperiodes, kan een overheidsdienst besluiten om op gecontroleerde wijze naar een hoger en meer gespecialiseerd niveau van afhandeling te gaan.
Aan het ene uiterste van het spectrum bevinden zich de organisaties waar enige datastrategie ontbreekt. Wanneer er meerdere grote Woo-verzoeken binnenkomen, breekt de chaos uit. Belangrijke beleidsnotities en gegevensbestanden blijken onvindbaar. De juridische – en IT-afdelingen vliegen elkaar in de haren en werkstromen raken verstoord. Een eerste oplossing is om de meest acute problemen op te lossen met losse ‘point solutions’. Deze zijn speciaal ontworpen om één specifiek IT-probleem te verhelpen (denk aan Adobe of MS-Office). De keerzijde is dat verschillende van deze oplossingen, hoewel afzonderlijk wel effectief, onderling niet goed communiceren en er tussen de systemen door informatie ‘weglekt’.
Bovendien spreken juristen en IC’ers vaak een verschillende taal, waardoor er geen goede afstemming plaatsvindt. Bij de een ontbreekt mogelijk de inhoudelijke kennis en juridische vaardigheden om grote beleidsdossiers te ontleden, terwijl de ander misschien niet erg zorgvuldig omgaat met de informatiesystemen en jaar in jaar uit op eigen houtje excelsheets en wordbestanden bijhoudt. Reguliere tools van Microsoft en Adobe kunnen de zoekvraag of het aflakken van de Woo bestanden deels automatiseren. Maar deze instrumenten zijn weinig gespecialiseerd en er blijven grote vraagtekens bestaan bij de consistentie en betrouwbaarheid van de eindresultaten, omdat er nog steeds veel handwerk en menselijke beslissingen aan ten grondslag liggen die een ieder naar eigen inzicht kan invullen.
Jongvolwassen?
Een volgende stap in systeemvolwassenheid is wanneer alle datamanagement wordt ondergebracht op een enkel platform. Dit is een eerste poging om de afhandeling van de Woo te systematiseren. Met een eenvoudige bedieningsprocedure wordt de software van verschillende aanbieders zoals Office 365, Adobe, SharePoint, Exchange, FileNet en verschillende documentarchivering geïntegreerd. Met datagedreven analyses neemt de behandelend ambtenaar betere beslissingen over welke informatie wel of niet kan worden gedeeld met de aanvrager van het informatieverzoek. Belangrijker nog, essentiële informatie die bij handmatige verwerking over het hoofd werd gezien, komt nu wél bovendrijven, met name wanneer er aan specifieke batches prioriteit wordt gegeven. Waar juristen voorheen weken bezig waren om documenten handmatig door te schiften, wordt dit nu binnen enkele seconden gedaan door de computer.
Met instrumenten als geavanceerd zoeken en deduplicatie worden enorme datasets teruggebracht tot enkele procenten van de oorspronkelijke omvang. Daar bovenop wordt nog eens 30 tot 50 procent bespaard op de kosten van beoordeling, doordat irrelevante informatie automatisch uit de datasets wordt verwijderd. Zo is de software bijvoorbeeld in staat om:
- Met automatische identificatie alle informatie rond een specifieke aanbesteding van dertig jaar terug te achterhalen;
- Alle ruimtelijke verordeningen van de gemeente binnen specifieke datums als 12 maart 1992 en 10 april 1994 weer te geven;
- Alle ontbrekende e-mail conversaties over een beleidsterrein naar boven te halen, inclusief alle antwoorden, forwards, cc’s en bcc’s;
- Een video of audiobestand van een publieke bijeenkomst (fonetisch) doorzoekbaar te maken;
- De zoekopdracht te richten op een specifieke beleidsrichting of technisch archiefmateriaal;
- Met auto-classificatie belangrijke documenten te taggen en automatisch te filteren op trefwoord, bestandstype en datumbereik;
- Automatisch privégegevens en overig beschermde informatie te selecteren en verwijderen met autoredactie.
Slimme waarheidsvinding, intelligent aflakken
Op het andere uiterste van het spectrum leert het systeem welke informatie er moet worden gezocht, nog voordat de Woo-aanvraag is ingediend. Zo ontwikkelt de software een ‘spil’ van complexe en veelkomende Woo-onderwerpen, wat veel toekomstig zoek- en selecteerwerk bespaart. Terwijl de medewerker de bestaande data categoriseert en labelt, leert de computer om toekomstige documenten automatisch te herkennen en in te delen op basis van vergelijkbare conceptuele categorieën. Dit is relevant voor zowel het vinden van relevante documenten als voor het identificeren van documenten die juist niet verstrekt dienen te worden.
Alle geautomatiseerde processen zijn grondig gedocumenteerd. Met gedetailleerde rapportages toont het systeem duidelijk aan wat het controletraject is van de genomen stappen, van begin tot einde. Met behulp van codering geeft de software automatisch aan welke data wel en niet wordt gedeeld met de aanvrager van het Woo-verzoek, met inbegrip van de uitsluitingsgronden zoals omschreven in de wet (privacy- of concurrentiegevoelige informatie, persoonlijke beleidsopvattingen, staatsgeheimen etc.).
Met machine learning worden de relevante documenten achterhaald in een proces dat vijftien tot twintig keer efficiënter is dan handmatige beoordeling. Ook zijn de zoekresultaten van hogere kwaliteit, nauwkeurigheid en houdbaarheid. Waar het menselijke precisie- en terughaalniveau van tekstindeling op op maximaal 80% ligt (voor de beste mensen), worden met kunstmatige intelligentie in een fractie van tijd waarden tot boven de 90% bereikt.
Lees meer over de mogelijkheden die het Woo-maturity model bieden in de whitepaper ‘Woo en Big Data: van groeipijn naar volwassenwording’.