Jaarlijks dienen media, actiegroepen en burgers zo’n tweeëneenhalf duizend Woo-verzoeken in bij de overheid, de meeste daarvan bij de politie, gemeentes en rijksoverheid. Hiervan valt een groot aantal in de categorie ‘grote’ aanvragen: ruim gedefinieerde verzoeken, die verschillende beleidsterreinen over meerdere jaren heen kunnen bestrijken. Medewerkers zijn zeeën van tijd kwijt om duizenden beleidsdocumenten en emails door te schiften op zoek naar de juiste informatie. Privacy- en concurrentiegevoelige gegevens moeten worden afgelakt. Ook moet een rapportage worden opgeleverd van de documenten en gegevens die niet worden gedeeld, met daarbij een opgaaf van reden.
Een groot probleem bij met name overheidsdiensten is dat vanwege de maatschappelijke aard van het werk de informatie veelal verspreid is over verschillende beleidsdepartementen en uitvoeringsdiensten. Ook zijn gegevens vaak ondergebracht bij zelfstandige bestuursorganen of maatschappelijke partners, die veelal onafhankelijk van een kerndepartement opereren. Ook is de data binnen een gemeente, provincie of uitvoeringsorganisatie vaak verspreid opgeslagen op verschillende servers en (externe) gegevensdragers, in tekstbestanden en spreadsheets, WhatsApp, fotobestanden et cetera. Organisaties proberen hun data intern te categoriseren en centraal onder te brengen, maar de uitvoering laat nog vaak te wensen over.
Een informatievraag van een burger over waarom een verkeersbord op een bepaald kruispunt is weggehaald, is voor de behandelend ambtenaar nog wel te overzien. Maar een verzoek van een journalist voor inzicht in alle milieubeslissingen die de provincie de afgelopen tien jaar heeft genomen, dat is alweer een ander verhaal. Tijdens een recente discussie tussen George Meurders (provincie Gelderland) en Johan Boersma (gemeente Smallingerland) onder leiding van professor Jan Scholtes (Universiteit van Maastricht en CSO bij ZyLAB), kwam naar voren dat grote Woo-verzoeken een waar herculeswerk kunnen zijn. Bij de provincie Gelderland kwam onlangs een verzoek binnen, waarbij zesduizend emails en 2500 documenten moesten worden uitgekamd. Bij het middelgrote Smallingerland (56.000 inwoners) ging het recentelijk over een verzoek dat 36000 emails en een totaal aan 120 gigabyte aan data bestreek.
Bij het selecteren van de relevante data die wordt vrijgegeven, moet uiterst zorgvuldig te werk worden gegaan. Mochten er per ongeluk vertrouwelijke of gevoelige gegevens worden gedeeld, dan kunnen juridische acties of ongewenste media-aandacht het gevolg zijn, met alle kosten en bestuurlijke onrust vandien. Om dit te voorkomen, wordt het doorzoeken en selecteren van documenten tweemaal gedaan door –veelal- juristen, intern opgeleid of extern ingehuurd, die dit niet van elkaar weten. Dit loopt enorm in de kosten: bij kleinere organisaties, waar het inhuren van fulltime Woo-specialisten geen optie is, ‘wobben’ ambtenaren er naast hun reguliere taken bij. Gedurende piekperiodes in Woo-verzoeken, vooral in de zomermaanden, moeten extra collega’s worden bijgeschakeld, die vaak minder bekend zijn met de inhoud. Dit vergroot de kans op kostbare fouten.
Om deze redenen wendt de overheid zich steeds vaker tot het bedrijfsleven op zoek naar efficiënte oplossingen. Zoals vaker loopt de VS hierin voorop: overheidsorganisaties krijgen daar op basis van de Freedom of Information Act jaarlijks te maken met achttienduizend verzoeken om openbaarheid, waarvan enkele honderden meer dan gemiddeld 50 gigabyte aan data bevatten. Het is niet meer voor te stellen om al deze aanvragen te behandelen zonder het gebruik van geavanceerde technologie, en de daar opgedane ervaring waait nu ook over naar Nederland. Het is nu mogelijk om data uit verschillende, losse content- en archief managementsystemen te koppelen en op te vragen; uit email, file sharing als SharePoint, of de gemeentelijke website en Facebook-pagina. Ook ‘ongebruikelijke’ gegevensbronnen als WhatsApp en voicemails, PDF-, PST- (Personal Storage Table) en Zip-bestanden, foto- en scanbestanden kunnen centraal worden opgeslagen en met slimme software worden doorzocht.
Door deze enorme hoeveelheden data doorzoekbaar te maken, kan de software op basis van honderden variabelen de informatie doorschiften, rangschikken en labelen voor gebruik. Persoons- en bedrijfsnamen, adresgegevens, telefoon- en rekeningnummers worden automatisch gecodeerd en geanonimiseerd. Hoewel de software de beleidsdscussies in bredere context (nog) niet herkent, kan het wel duplicate documenten filteren, zodat alleen de relevante einddocumenten overblijven. Ondanks alle ontwikkelingen in kunstmatige intelligentie en machine learning, zal de robot nooit een volledig Woo-onderzoek voor zijn rekening kunnen nemen. Door de relevante informatie in een fractie van tijd klaar te zetten, hoeft de medewerker slechts de laatste beslissingen te nemen over welke informatie wel en niet wordt gedeeld. Dit bespaart de organisatie enorm in de kosten.
Wilt u meer lezen over het omgaan met grote Woo-verzoeken, leest u dan onze whitepaper "Omgaan met grote Woo-verzoeken".