Big Data waar persoonsgegevens uit verwijderd zijn, lijken de privacy te waarborgen. Maar er is maar weinig nodig om persoonlijke gegevens weer aan de persoon te koppelen, blijkt uit onderzoek

Een team wetenschappers van het Massachusetts Institute of Technology (MIT) in Cambridge wist een bank zo ver te krijgen dat ze aan de slag mochten met gegevens van creditcardtransacties. De niet bij name genoemde bank verstrekte de wetenschappers een log met 3 maanden transactiegegevens van 1,1 miljoen klanten in 10.000 winkels, restaurants etc. Creditcardnummer en adresgegevens van de creditcardhouder waren verwijderd, namen waren vervangen door een verder nietszeggende code. 

Het privacyrisico in dit soort gegevens schuilt in het feit dat het aankooppatroon van individuen uniek is. Je hebt maar heel weinig gegevens nodig van een persoon nodig om hem te koppelen aan de geanonimiseerde gegevens in de databank. Kennis van de plaats waar een persoon zich bevond op vier tijdstippen die overeenkomen met de gegevens in het databasestuwmeer, volstaat in 90 procent van de gevallen om de creditcardhouder in die database te identificeren. Als je daarenboven ook nog weet hoeveel er bij gelegenheid is gespendeerd, kun je nagenoeg iedereen in de database identificeren met slechts drie stukjes informatie.

Alles bij de bron; AutomGids