"We kunnen dankzij internet weten wie een aanslag wil plegen". Deze opinie van hoogleraar Bart Baesens lokt reactie uit. Want ook de allerkrachtigste computers kunnen het denken van mensen niet exact voorspellen.

Stel: Een haat-liefde verhouding heb ik met mijn gsm. Het onding staat dan ook regelmatig uit. Nagenoeg onmisbaar en functioneel in onze communicatiemaatschappij, waardoor hij toch nooit veraf is. Niettemin verander ik wel eens van nummer wanneer dat nummer te bekend raakt. Als nachtraaf ben ik ook vaak onderweg tussen 22 en 4u en staat die doorgaans wel aan. 

Volgens Baesens voldoe ik dus aan aardig wat indicatoren om me als terrorist te labelen, want mijn gsm-gebruik lijkt op dat van een terrorist. Door het massaal bundelen en analyseren van data uit allerlei bronnen kan een computer uitzoeken wie potentieel een aanslag wil plegen, schrijft Baessens in een opinietekst.

Dat beangstigt mij, zelfs als computerwetenschapper kan ik niet blind zijn voor de gevaren. Nét wanneer dit oordeel aan computers overgelaten wordt. Er wordt bijzonder veel vertrouwen toegedicht aan deze machines. De vooruitgang binnen big data analytics is dan ook enorm, doch niet vlekkeloos. Het ‘beknotten’ van telefoontaps, surveilleren van burgers, etc. is niet zonder reden bij wet geregeld.

Diezelfde wet hoort immers de burgers te beschermen tegen o.a. targeting. Dit gaat veel verder dan de potentiële introductie van racistische motieven en vooroordelen. Het gaat erom dat uw en mijn data niet zomaar door allerlei instanties vrij ingekeken kan worden. Het gaat erom dat er altijd wel iets te vinden is dat verdacht is. Het gaat erom dat iedereen een potentiële verdachte is en daar zware consequenties kan van ondervinden.

Je neigt te verzanden in een systeem waar je schuldig lijkt met hoge waarschijnlijkheid, terwijl we in onze rechtsmaatschappij net onschuldig horen te zijn tot het tegendeel bewezen is. Mensen het label ‘verdacht’ opplakken leidt steevast tot een vorm van tunnelvisie.

‘Misdaad’ wordt geconstrueerd door de lokale context, zoals culturele gebruiken, geschiedenis en geloof. Dat het ook snel kan veranderen toont de geschiedenis ons. Niet zo lang geleden kwam in Frankrijk 25 procent van de Joodse burgers om en in Nederland 73 procent.

Eén van de processen die de Jodenvervolging in Nederland vereenvoudigde (maar uiteraard niet veroorzaakte) was dat men er reeds in de jaren 30 begon met een doorgedreven bevolkingsadministratie. Ponskaarten van elke individuele burger werden gemaakt en de Joodse achtergrond werd toegevoegd. Duitsland kon de Joden er via sorteermachines vervolgens zo uitpikken. Frankrijk kende een minder doorgedreven administratie.

Dit is slechts een voorbeeld van hoe schijnbaar onschuldige dataregistratie in een snel wijzigende context tot verregaande consequenties kan leiden. Voor we dit soort tools dus verregaand gaan gebruiken en pleiten voor minder strikte regelgeving, moeten we veel meer sensibiliseren rond de beperkingen van deze voorspellingen en voorzien in een aangepaste regelgeving die onschuldige burgers beschermt.

Ook ik zie het nut van analytics, maar pleit voor een gezond wantrouwen en doordacht toepassen. De methodes zijn relatief recent en zeker niet onfeilbaar. Waakzaamheid is op dit punt meer dan ooit vereist.

Alles bij de bron; deRedactie


Staatssecretaris voor Privacy Philippe De Backer overweegt om farmabedrijven inzage te geven in (anonieme) patiëntengegevens uit de rijksziekteverzekering, prijs overeen te komen. Een halve dag kritiek later wist hij al niet meer of hij dat nog wel een goed idee vond. Terecht.

Noem ons ouderwets, maar wij hebben de tijd nog meegemaakt dat bescherming van de persoonlijke levenssfeer nog als grondprincipe van het liberalisme gold. Vandaag schijnt het nieuwe Vlaamse liberalisme dat recht op privacy te willen voorbehouden voor vermogenden, terwijl de gezondsheidsstatistieken van arme sloebers die even niet opletten welke checkbox ze aankruisen blijkbaar wel te grabbel mogen worden gegooid.

Het politieke geschuifel richting privatisering van de privacy komt niet uit de lucht vallen. Maar van een betrouwbare overheid verwachten we dat ze de burger enigszins beschermt tegen die tendens, niet dat ze die nog versterkt.

Alles bij de bron; deMorgen


De nieuwe staatssecretaris voor Privacy Philippe De Backer vindt dat de overheid gezondheidsgegevens van burgers aan de farmaceutische sector moet kunnen doorgeven, eventueel tegen betaling, zolang de return terugvloeit naar de patiënt. De piste die De Backer bewandelt, staat in de beleidsnota Privacy die hij vandaag voorstelt in de Kamer. Daarin wijst De Backer op de extra slagkracht die de Privacycommissie krijgt, maar ook op haar rol bij het beoordelen van welke data in handen van de overheid met private bedrijven kan worden gedeeld.

Volgens de Vlaamse liberaal werken in het buitenland mutualiteiten nu al mee om de therapietrouw van hun klanten te verbeteren via apps. Die mogelijkheden moet de Privacycommissie onderzoeken. Hij merkt op dat heel wat patiënten nu al bereid zijn hun gegevens door te spelen. Om patiënten meer controle te geven over wat ze met hun gegevens doen, wil De Backer werk maken van een privacypaspoort. Daarop kan je zien wie welke gegevens gebruikt. Hij is er niet tegen gekant dat de overheid daarvoor geld zou vragen. Voorwaarde is wel dat het geld terugvloeit naar de patiënt, bijvoorbeeld in de vorm van lagere prijzen voor medicijnen. 

Alles bij de bron; deStandaard


Onbewust strooien we dagelijks met persoonlijke data. Je zoekopdracht op google wordt geregistreerd, evenals likes op Facebook. De Nationale Verjaardagskalender van Utrechtse organisatie SETUP wil dat mensen zich daar bewust van worden.

Tijdens zes hackatons, bijeenkomsten die in dit geval draaien om het verzamelenvan informatie, stuitte SETUP op namen, adressen en verjaardagen van bijna een miljoen nederlanders. Die gegevens komen samen in De Nationale Verjaardagskalender. Eén voorbeeld van een website die veel data heeft opgeleverd, is schoolbank.nl. Bijsterbosch benadrukt dat ze niet op de site hebben ingebroken, maar slechts hebben binnengehaald wat toch al openbaar was. “We schrokken er zelf van hoe makkelijk dat allemaal ging. De beveiliging was zo slecht dat we in een klap de jackpot te pakken hadden”, zegt ze. Het gaat dan om voor- en achternaam, geboortejaar, woonplaats en de plaats waar iemand op school heeft gezeten. “Dan weet je het opleidingsniveau en daar kun je al heel veel aflezen”, verklaart Bijsterbosch.

Maar wat doe je met de data van al die Nederlanders? Openbaar maken kan niet, dus schakelt SETUP de hulp van theatermakers Ingrid Govers en Margit Odems in. De voorstelling gaat op tour door de provincie Utrecht. De discussie over de grote hoeveelheid opgeslagen data moet door meer mensen worden gevoerd. Bijsterbosch: “Natuurlijk zitten er ook goede kanten aan het verzamelen van data, maar wij willen dat een breed publiek snapt waar dit over gaat.”

Alles bij de bron; StadsbladUtrecht


In het boek Design my privacy van Tijmen Schep, geeft hij acht concrete tips hoe je systemen privacy-vriendelijker kunt ontwerpen. Die tips zijn niet alleen bedoeld voor de techneuten, maar eigenlijk voor iedereen die producten of diensten ontwerpt, of overweegt ze te door anderen te laten ontwikkelen...

...In verband met dat laatste punt werd ik getroffen door Tijmens suggestie om data niet langer als het nieuwe goud, maar als de nieuwe olie te zien. Net als goud is olie waardevol, en zijn mensen bereid veel energie te steken in het winnen ervan. Onze hele economie draait (nog) op olie. Maar olie is ook vies en vervuilend: tijdens de productie en bij het gebruik.

Er zijn ook zeker gigantische kansen voor het gebruik van data. Maar door big data te associëren met olie in plaats van goud is meteen duidelijk dat er naast voordelen ook consequenties zijn verbonden aan een big-data-economie. Consequenties die vergelijkbaar zijn met de risico’s van milieuvervuiling.

Het eerste risico is dat bepaalde kosten niet ten laste komen van de producent. Op basis van een grondige data-­analyse voerde Amazon voor bepaalde postcodegebieden ‘Prime Same Day Delivery’ in. Bijvoorbeeld voor alle grote steden in de VS. Behalve dan bepaalde wijken, ook in het centrum, waar (toevallig?) vooral zwarte mensen wonen. Zij lijden schade (latere levering) door een bias in het gebruikte big-data-algoritme.

Ten tweede maakt de oliemetafoor duidelijk dat het beschermen van onze privacy niet alleen een individueel belang is. Net als het beschermen van het milieu is het beschermen van privacy een maatschappelijk belang. Voor het functioneren van een democratie is privacy essentieel. Mensen moeten zich zelf een mening kunnen vormen, ook meningen die tegen de stroom ingaan, zonder zich bekeken te voelen en zich in de gaten ­gehouden te voelen.

Vandaag de dag proberen we verantwoord met het milieu om te gaan. Die mentaliteit, dat perspectief, is ook essentieel als we in de toekomst verantwoord gebruik willen maken van data. Want een duurzame economie gaat niet alleen spaarzaam om met ons ­milieu, maar ook verantwoord met onze persoonlijke data.

Alles bij de bron; FD[gratis registratie nodig]


Op internet zijn 427 miljoen wachtwoorden en 360 miljoen e-mailadressen van MySpace-gebruikers gelekt. Wanneer de gegevens precies zijn gestolen is onbekend, maar de website LeakedSource wist een kopie van de gestolen database te bemachtigen.

In de database bevinden zich 360 miljoen accounts, waarvan 111 miljoen een gebruikersnaam hebben. Een groot aantal accounts had twee wachtwoorden, wat verklaart dat er meer wachtwoorden dan gebruikers zijn. Volgens LeakedSource, een zoekmachine waar tegen betaling in gestolen en gelekte databases gezocht kan worden, waren de wachtwoorden via het sha-1-algoritme gehasht en was er geen gebruik van salting gemaakt. Veel wachtwoorden zouden daarnaast minder dan 10 karakters en geen hoofdletters bevatten, wat het kraken eenvoudiger maakt.

De zoekmachine vroeg MySpace om een reactie, maar heeft die nog niet ontvangen. In de tussentijd worden daarom alleen de eerste paar karakters van het onversleutelde wachtwoord getoond, zodat gebruikers kunnen controleren of hun wachtwoord is gelekt. MySpace was ooit de grootste sociale mediasite op internet, totdat het door Facebook werd ingehaald. Sindsdien neemt het aantal bezoekers steeds verder af.

Alles bij de bron; Security


Je kunt nog zoveel data verzamelen over je klanten, als je de gegevens niet weet te gebruiken is het waardeloze informatie. Smart Data beats Big Data; pas de informatie slim toe en benader de klanten op de juiste manier. Op het moment dat je met behulp van software je klanten aanbevelingen doet op basis van eerdere aankopen, doe je eigenlijk al aan Predictive Analytics, het principe is gebaseerd op datamining.

Datamining bestaat uit regressieanalyses, clustering, neurale netwerken en associatieanalyses. Predictive Analytics maakt daarnaast ook nog gebruik van statistische berekeningen, zelflerende methodes zoals deep learning en speltherapie. De achtergrond is opgebouwd uit grote hoeveelheden wiskundige, statistische gegevens en linguïstische gegevens; zoals wanneer er gebruik wordt gemaakt van tekst zoals artikelen, blogs of tweets. Zonder diepgaande kennis van de onderliggende processen te hebben kunnen de voorspellingen worden gebruikt voor Customer Experience Management. 

Hieronder volgen drie tips om je CEM te verbeteren met behulp van Predictive Analytics.

Breng het verleden in kaart; Als je een voorspelling van toekomstig koopgedrag van consumenten wil doen, heb je informatie nodig over het koopgedrag tot nu toe. Een klantenkaart is een goed voorbeeld van een loyaliteitsprogramma waarmee de aankopen uit het verleden in kaart worden gebracht. Consumenten betalen met hun creditcard en zorgen indirect voor de perfecte gegevens voor een aankoopanalyse. Professioneel informatiemanagement is nodig om een customer datawarehouse te creëren, met unieke klantidentificatie en voorzien van de benodigde data.

Regressievergelijking als snelle start: De meest algemene datamining-methode die wordt gebruikt in Predictive Analytics is de regressieanalyse. Regressieanalyse is een statistische techniek voor het onderzoeken van het causale verband tussen variabelen. Het doel is het voorspellen van een bepaalde variabele op basis van één of meerdere andere variabelen.

Monitor en evalueer je model: Bij Predictive Analytics wordt in het ‘stationaire model’ aangenomen dat het koopgedrag uit het verleden gelijk blijft in de toekomst. Maar dat is natuurlijk irreëel, daarom moet er altijd kritisch worden gekeken naar het gebruik van dit ijkmodel; of het gedrag nog actueel is, of er veranderingen hebben plaatsgevonden. Een model dat niet meer realistisch is, geeft een vertekend beeld en voegt weinig toe in Predictive Analytics.

Alles bij de bron; EMerce


Eerst even een definitie van ‘Big data’: Het koppelen van verschillende gegevens om tot een nieuw gegeven te komen. De gegevens worden gehaald worden uit bestaande gegeven sets.

Een bestaand voorbeeld (Bron Financieel Dagblad): Als experiment heeft men in een sociaal zwakke wijk in Rotterdam alle denkbare en ondenkbare bestanden aan elkaar gekoppeld. De onderzoeker trok de conclusie: “De overheid wordt als flappentap gebruikt”. Veel misbruik van toeslagen, dure auto’s rijden en veel achterstallige betalingen. Nog een bestaand voorbeeld: een sociale dienst heeft van een cliënt de bonuskaart gegevens van Albert Heijn opgevraagd en de dienst kwam tot de conclusie dat de aankopen niet in relatie stonden tot de ruimte die een uitkering biedt.

Uit een artikel van de Stentor blijkt dat Apeldoorn ook big data gaat gebruiken. Men wil inzicht krijgen en voorspellend bezig zijn wat betreft jeugdcriminaliteit. Een uitsnede uit dit artikel:

Apeldoorn gaat ‘big data’ verzamelen; inbraakcijfers, aangiftes en inkomensprofielen. Daarmee wil de gemeente de kans op jeugdcriminaliteit in wijken voorspellen.
Ook gegevens over woningen (hoe oud, koop- of huur-) en gezinssituaties worden in de databank gestopt, om te duiden waar jongeren kans hebben uit de bocht te vliegen. Verder zijn gegevens als schoolverzuim, plekken waar al eerder jeugdoverlast was en voorzieningen voor jongeren in een wijk van belang. En dat jongeren uit gezinnen met een schuldsanering een iets grotere kans lopen op het slechte pad te raken, weet de onderzoeker

Ik ben huiverig en verontrust. Bekend is dat gemeentelijke overheden slecht omgaan met privacy gevoelige gegevens, ook is bekend dat het vaak onzuivere data bestanden betreft (veel fouten). De D66 raadsfractie is al een hele tijd kritisch over het privacy beleid van Apeldoorn en brengt privacy bescherming vaak aan de orde in de raad. Daar ben ik blij mee. D66: Dank voor jullie kritische houding wat betreft privacy.

Alles bij de bron; A'doornDirect


Abonneer je nu op onze wekelijkse nieuwsbrief!
captcha