Bij informatieverzoeken in het kader van de Wet open overheid (Woo) of verzoeken van internationale toezichthoudende instanties is het verplicht om persoonlijke en privacy gevoelige data (denk ook aan de AVG - GDPR) te beschermen. Het beschermen van deze informatie is een van de thema's voor de Wet open overheid (Woo).
In navolging van mijn vorige blogs over het anonimiseren van email addresseen, BSN en telefoonnummers, wil ik nu meer vertellen over het anonimiseren van Persoonsnamen.
Blogserie: Anonimiseren
|
Persoonsnamen anonimiseren
Om persoonsnamen te anonimiseren of te lakken kan je gebruik maken in de ZyLAB One oplossing van 2 mogelijkheden.
- Door persoonsnamen om te zetten naar zoekvragen en hiervan een automatische redactie (lak) regel van te maken.
- Door gebruik te maken van Text Mining en de computer zelf te laten herkennen welke personen in de documenten staan en deze weg te lakken (redacten).
Persoonsnamen omzetten naar zoekvragen
Als je gebruik wilt maken van de zoekmogelijkheden moet je van te voren weten welke persoonsnamen voorkomen in de documenten en e-mails. Deels kan je dat van de voren weten omdat wij tijdens het verwerken alle From, To, CC, BCC kenmerken uit de documenten halen en die kan je in een lijst opvragen (Document Property(Eigenschap): Email Participant). De namen in deze lijst kan je omzetten naar zoekvragen zodat je deze automatisch in alle documenten kan lakken.
Je kan gebruik maken van diverse zoektechnieken om zo veel mogelijk variaties van een naam te vinden.
Neem mijn naam als voorbeeld, Daniel Schuuring. Ik kan in alle documenten in diverse variaties voor komen, denk ook aan voorletters en spelfouten zoals:
- Daniel Schuuring
- Schuuring, Daniel
- Schuuring, D.G.
- DG Schuuring
- Daniel Schuring
- Daniel
- De heer Schuuring
Een simpele zoekvraag zou zijn:
Daniel OR Schuuring
Je kan echter ook gebruik maken van extra zoekopties om al deze variaties te vinden inclusief fuzzy om ook variaties te vinden.
(Daniel OR Schuuring~1) OR (Schuuring~1 w/3 1 of {Daniel, D, G, DG, D?G})
Nu vind je alles waar Daniel of Schuuring staat en daarnaast ook Schuuring binnen 3 woorden van mijn voornaam of voorletters.
Je moet natuurlijk wel weten dat ik voorkom in de documenten.
Persoonsnamen en Text Mining
Door middel van Text Mining kan je ook de computer persoonsnamen laten vinden. De computer zoekt dan zelf door middel van taalkundige regels en/of door training van Text Mining naar persoonsnamen. Voordeel is dat je van te voren niet hoeft te weten welke persoonsnamen je wilt lakken, de computer geeft je een lijst van namen. Zo vindt de Text Mining ook minder voor de hand liggende namen zoals pseudoniemen en code namen.
In een paar stappen kan je op deze manier snel persoonsnamen anonimiseren.
Stap 1. Selecteer de documenten en de extractie regel die wilt gebruiken om personen te herkennen.
2. Evalueer de resultaten en geef aan welke herkende persoonsnamen wel of niet moeten worden gelakt. Je kan hier dus ook uitzonderingen toevoegen voor persoonsnamen die niet gelakt moeten worden. Helaas is Text Mining (nog) niet 100% correct, dus hier kan je ook de verkeerd herkende persoonsnamen uitzetten.
3. Lak de gevonden persoonsnamen met de auto-redactie optie en bekijk de resultaten.
Op deze manier kan je snel en eenvoudig persoonsnamen anonimiseren.
Meer weten over onder andere het anonimiseren en afhandelen van Woo verzoeken, klik dan hier.