Datamining is het gericht zoeken naar statistische verbanden in heel grote gegevensverzamelingen met als doel profielen op te stellen. "Je gaat op zoek naar gelijkenissen tussen individuen, waardoor je subgroepen kan identificeren binnen de grote set van gegevens", zegt Sarah Steenhaut, professor Digitale Marketing aan de UGent in "De wereld vandaag". 

In de marketing is het een techniek die al redelijk lang bestaat, maar door de explosie van de data vandaag krijgt datamining een heel nieuwe dimensie. Door de sociale media is het aantal digitale sporen dat we nalaten explosief toegenomen. "Het gaat om hoe we ons voelen, welke merken we leuk vinden, met wie we verbonden zijn, en zo voort. Zonder dat we het beseffen laten we heel veel informatie over onszelf na". Op dezelfde basis als in de marketing wordt datamining nu op andere terreinen toegepast. "Het gaat over het identificeren van gelijkaardige patronen en profielen, en die gebruiken om de  boodschap naar bepaalde subgroepen meer persoonlijk te maken ", zegt Steenhaut.

In de Verenigde Staten wordt al langer gebruikt gemaakt van datamining om campagne te voeren, "Daar werd in eerste instantie aan het verzamelen van informatie gedaan, maar nadien ging men nog een stap verder door de profielen zo te verfijnen en die subgroepen dan zeer gerichte berichten te sturen, via mailing of via sociale media", stelt Steenhaut. 

"De bedrijven die de data verzamelen, hebben daardoor alle macht in handen en dan komen natuurlijk de discussie en de ethische vraagstukken over datatoegankelijkheid, privacy en transparantie naar boven. Vanuit de overheid moeten we dit thema zeer goed opvolgen en moet er gezocht worden om telkens opnieuw ervoor te zorgen dat de eindconsument weet dat hij een zekere bescherming krijgt", besluit Steenhaut.

Alles bij de bron; deRedactie


 

Vorig jaar zijn er zo'n 28.000 nieuwe dna-profielen van personen aan de dna-database van het Nederlands Forensisch Instituut (NFI) toegevoegd, waardoor de database nu de dna-profielen van ruim 252.000 mensen bevat. Dat heeft het NFI in het Jaarverslag DNA-databank bekendgemaakt (pdf).

Het totaal aantal personen dat ooit als minderjarige (12 t/m 17 jaar) in de dna-database is opgenomen, groeide naar zo'n 27.500. Van die personen waren er ruim 3000 op 31 december 2016 nog steeds minderjarig en ruim 24.000 inmiddels meerderjarig geworden. Ten opzichte van het totale aantal ooit in de dna-database opgenomen personen bedraagt het percentage personen dat tot en met 2016 als minderjarige is opgenomen 10,4 procent.

Het aantal dna-profielen van sporen in de database groeide vorig jaar met bijna 3800 naar 70.000. In de dna-database voor strafzaken hebben vorig jaar zo'n 5600 matches plaatsgevonden tussen een dna-profiel van een spoor en een dna-profiel van een persoon. Dat betekent dat gemiddeld iedere dag 15 keer een persoon kon worden gekoppeld aan een spoor dat op een plaats delict werd gevonden.

Alles bij de bron; Security


 

De politie gaat samenwerken met wetenschappers om beter informatie uit in beslag genomen smartphones en computers van verdachten te kunnen halen. Het idee is dat een computer met nieuwe technieken razendsnel miljoenen foto’s, berichten, locatiegegevens en filmpjes kan doorpluizen op zoek naar verbanden die een agent met het blote oog niet snel ziet.

De politie begint daarvoor het project ‘Politielab’ met Amsterdam Data Science. Dat is een samenwerkingsverband van de twee universiteiten en hogeschool in Amsterdam, en het Centrum Wiskunde & Informatica. Nu al gebruikt de politie computertools waarmee automatisch kan worden gezocht in gegevens. Politielab moet de volgende stap zetten. Zo moet de rechercheur met een druk op de knop een samenvatting krijgen van wat er interessant kan zijn van alle in beslag genomen apparaten. De computer ziet relaties en (afwijkende) patronen in de gegevens.

"Door de nieuwe tools kunnen wij straks hopelijk meer kennis halen uit de berg informatie die we in beslag hebben genomen.” zegt Theo van der Plas, programmadirecteur digitalisering en cybercrime van de politie. 

Daarmee worden niet alle problemen voor de politie opgelost, erkent hij. Gegevens die versleuteld zijn, zijn ook met de nieuwe tools niet te doorzoeken. Daarom is ook de nieuwe Wet Computercriminaliteit, die momenteel in behandeling is in de Eerste Kamer, belangrijk, zegt hij. Die geeft de politie de bevoegdheid computersystemen van verdachten te hacken, wat er onder meer voor moet zorgen dat informatie wordt verzameld vóórdat die versleuteld is. Daarnaast heeft de Hoge Raad zich onlangs uitgesproken over het doorzoeken van alle informatie op een smartphone. Dat kan een bijna compleet beeld opleveren van iemands persoonlijke leven en mag volgens het arrest dus niet zonder toestemming van een officier van justitie of rechter-commissaris, wat tot voor kort niet altijd gebeurde.

Alles bij de bron; Trouw


 

Wil de Indiase overheid efficiënter diensten verlenen, of 1,3 miljard burgers nauwlettender in de gaten houden? Deze vraag domineert de kranten en nieuwssites in het Aziatische land sinds de regering van premier Narendra Modi eind maart inschrijving in de biometrische databank Aadhaar verplicht heeft gesteld voor talloze diensten.

Een registratie in het Aadhaar-systeem kent de Indiër een uniek, twaalfcijferig nummer toe. Zo’n nummer is gekoppeld aan iemands naam, geboortedatum, adres, vingerafdrukken en irisscans. Met ruim 1 miljard ingeschreven burgers en inwoners is Aadhaar nu al het grootste biometrische identificatiesysteem ter wereld. In 2010 werd het gelanceerd als een vrijwillig systeem, vooral bedoeld om sociale voorzieningen efficiënter te verstrekken. Het bleek een populair identiteitsbewijs voor veel mensen die geen paspoort, rijbewijs of geboorteakte hebben.

Door de recente wetswijzigingen kan vrijwel niemand nog om inschrijving heen. Een Aadhaar-registratie is verplicht gekoppeld aan talloze voorzieningen en diensten en daar komen er binnenkort meer bij. Wie zijn inkomsten wil opgeven aan de belastingdienst, een mobiel telefoonnummer of een rijbewijs wil aanvragen, een werknemerspensioen wil laten uitkeren, of een hoger onderwijsdiploma wil behalen, moet beschikken over een Aadhaar-registratienummer.

Critici zien in de verplichting een teken dat het doel van Aadhaar is verschoven van dienstverlening naar surveillance. Gopal Krishna, van de actiegroep Citizen’s Forum for Civil Liberties die de verplichting via de rechtbank aanvecht, noemt het een ‘zware vertrouwensbreuk’ dat de wetten die betrekking hebben op Aadhaar zijn aangepast, nadat ruim een miljard mensen zich al hadden ingeschreven.

Krishna maakt zich zorgen over inbreuk op de privacy en mogelijk misbruik door hackers en de overheid zelf. Hij vergelijkt de Unique Identification Authority of India (UIDAI), de instelling die de databank beheert, met een inlichtingendienst. 'Niet alleen statische informatie wordt geregistreerd, maar ook dynamische informatie zoals financiële transacties worden bijgehouden. En wat biometrische data betreft zal het niet bij vingerafdrukken en irisscans blijven. De wet voorziet ook in andere vormen, dus dat kan in de toekomst bijvoorbeeld DNA betekenen.'

Nandan Nilekani, mede-oprichter van ICT-bedrijf Infosys die tot 2014 aan het hoofd van de UIDAI stond, erkent dat er nog veel fouten worden gemaakt. Hierdoor lopen mensen voorzieningen mis of kunnen ze geen pensioen opnemen van hun bankrekening. Dit kan ook al door een verkeerd gespelde naam worden veroorzaakt. Dagelijks kloppen 200.000 mensen aan bij de UIDAI om hun aan Aadhaar gekoppelde gegevens te laten corrigeren.

De koppeling van Aadhaar aan de belastingaangifte moet ontduiking tegengaan, terwijl de telecomsector hoopt een oplossing aangereikt te hebben gekregen voor de vele SIM-kaarten die nog met valse papieren worden gekocht. Alle bestaande mobiele nummers, meer dan één miljard, koppelen aan Aadhaar gaat de sector naar schatting wel Rpe 10 mrd (€ 147 mln) kosten.

Alles bij de bron; FD [gratis registratie noodzakelijk]


 

Vrijwel dagelijks geven we persoonlijke informatie over onszelf prijs. Al die kleine brokjes data worden vervolgens gebundeld, geanalyseerd en doorverkocht. De consequenties kunnen onaangenaam zijn. Hoe word je slachtoffer van je data en wat kun je er tegen doen?

Net zo makkelijk als het voor consumenten is om prijzen te vergelijken op het internet, is het voor bedrijven om het online gedrag van consumenten te monitoren en daarop hun prijzen aan te passen. „De techniek is er en de marketing- en economische literatuur zegt: het is oliedom als je het niet doet”, zegt Frederik Zuiderveen Borgesius van de UvA, die onderzoek doet naar dit fenomeen. Toch blijven voorbeelden van bedrijven schaars.

Dat komt, vermoedt hoogleraar recht en technologie Mireille Hildebrandt, omdat ondernemers huiverig zijn voor reputatieschade. En dat betekent dat bedrijven zich er of niet aan wagen, of dat ze het zó lastig maken dat je er nooit achter komt, denkt Hildebrandt. Want het grootste probleem is volgens haar dat het doorrekenen van onze verzamelde gegevens achter gesloten deuren plaatsvindt, zodat we niet precies weten wat internetbedrijven met die informatie doen of waar ze de gegevens voor gebruiken. „Dat is niet openbaar. Ze kunnen de informatie ook misbruiken. Op dit moment is dat niet goed te controleren.”

Vooral energie- en telecombedrijven laten nieuwe klanten vooraf screenen op kredietwaardigheid door externe bureaus, weet Zuiderveen Borgesius. Voor consumenten blijft deze wereld van datahandelaren schimmig. Het gaat om voor het grote publiek onbekende partijen met namen als Focum, EDR en Experian, die persoonlijke gegevens verzamelen en koppelen. Deze vorm van data-analyse is waardevol in de energie- en telecombranche omdat ze gebruikt wordt voor het berekenen van een persoonlijke kredietscore waarmee klanten worden opgedeeld: meer of minder kredietwaardig.

Postcodediscriminatie is niet verboden, maar in Nederland rijst geregeld de vraag of de postcode uitgangspunt mag zijn bij het vaststellen van premies of het toekennen van hypotheken. Postcodes verraden immers een hoop over iemands leefomgeving, en die informatie kan relevant zijn voor bedrijven die van het beprijzen van risico hun werk hebben gemaakt.

Een paar maanden geleden is de Consumentenbond een actie gestart die mensen oproept zich te melden als ze vrezen de dupe te zijn geworden van hun data. De Consumentenbond is met name geïnteresseerd in bedrijven die diensten weigeren of hoge waarborgsommen vragen op basis van verkeerde of onduidelijke informatie. Mail je ervaring naar het meldpunt: Dit e-mailadres wordt beveiligd tegen spambots. JavaScript dient ingeschakeld te zijn om het te bekijken. en hier kun je lezen hoe je een inzageverzoek kunt doen.

Alles bij de bron; TelegraafPremium


 

Edison heeft ooit eens gezegd: ‘Whatever the mind of man creates, should be controlled by man’s character’. Dat was al moeilijk genoeg in de tijd waarin hij leefde, maar hoe moet je dat doen als je de dingen niet langer zelf maakt, maar alles door robots en computers wordt gemaakt? Welkom in de wondere wereld van de kunstmatige intelligentie.

Slimme, zelflerende algoritmen leren beslissingen nemen, of patronen herkennen, door een grote hoeveelheid bestaande beslissingen of patronen te analyseren. Ze vormen een essentieel onderdeel van big data. Zonder grote hoeveelheden data leren dergelijke algoritmen niet (goed) genoeg. En zonder die algoritmen kan niemand wijs worden uit die grote berg aan data.

De voordelen van slimme algoritmen zijn overduidelijk. Ze maken het mogelijk om in grote hoeveelheden data patronen te vinden die we zelf nooit zouden zien en kunnen gebruikt worden om ons leven makkelijker te maken, om fraude op te sporen, de effectiviteit van medische behandelingen te bepalen, en om overheden en bedrijven efficiënter te maken.

De risico’s zijn ook evident. Of de beslissingen van die slimme algoritmen ook echt accuraat en eerlijker zijn hangt sterk af van het algoritme en de onderliggende data waarmee het algoritme getraind is. Er zijn helaas veel voorbeelden van slimme algoritmen die schrikbarend discriminerend en oneerlijk zijn. De vraag is dus: hoe houden we dit soort slimme algoritmen in het gareel?...

...De privacywetgeving beperkt de mate waarin geautomatiseerde beslissingen over ons genomen mogen worden. Maar op grond van die wetgeving bestaat er, helaas, geen recht op een onderbouwing of uitleg van de beslissing. Zelfs het recht om te weten op welke wijze zo’n beslissing tot stand komt — wat wel degelijk bestaat — wordt sterk beperkt door het recht van bedrijven om hun bedrijfsbelangen te beschermen... Maar gezien de belangen die op het spel staan, en de mogelijkheden die de techniek hier biedt, zou het goed zijn als hier nog eens goed naar gekeken wordt. Het vertrouwen van burgers staat op het spel.

Alles bij de bron; NetKwesties en de blog van de schrijver


 

Gaat het slecht met onze privacy? Als iemand die vraag kan beantwoorden dan is het Gerrit-Jan Zwenne. Hij is hoogleraar 'Recht en de Informatiesamenleving' aan de Universiteit Leiden, beter gezegd 'privacyprofessor', en heeft jarenlang ervaring met privacyzaken. Hoewel hij verrassend nuchter is over individuele privacyschendingen en vooral kijkt naar de ontwikkelingen op langere termijn, maakt ook hij zich weleens zorgen. 

Ongeveer anderhalf jaar geleden liep Zwenne in Utrecht het gebouw van de Belastingdienst binnen. Zwenne zou er een praatje houden over privacy, maar was net wat te vroeg en schoof aan bij een presentatie van een data-analist. Die vertelde vol enthousiasme hoe de belastingmoraal bij burgers kon worden gemeten. Zwenne: "Volgens deze data-analist kan dat door bijvoorbeeld naar iemands Spotify-playlist te kijken. Hij zou het volstrekt begrijpelijk vinden als de Belastingdienst voortaan afspeellijsten van muziek zou opvragen." Aan de hand van de muziekvoorkeuren kan worden ingeschat in hoeverre iemand geneigd is zijn aangiftebiljet zorgvuldig in te vullen of niet. "Dit was geen grap, die man was bloedserieus. Mensen die naar Bach luisteren, zijn brave burgers."...

...Nee, hij vindt zo'n Belastingdienstplannetje serieuzer. In hoeverre hebben burgers nog de mogelijkheid te ontsnappen aan de alwetende overheid, vraagt hij zich af. "Waar we voor moeten oppassen is stigmatisering en discriminatie. Dat burgers op basis van big data worden ingedeeld in risico-categorieën. Als de cijfers zeggen dat er in jouw postcode relatief veel wanbetalers zijn, is er een risico dat je daarom als wanbetaler wordt behandeld, ook al betaal jij jouw rekening wel altijd op tijd. Hoe verdedig je je tegen zo'n systeem?" 

Maar het maakt Zwenne allerminst somber. Hoewel hij vindt dat mensen vaak naïef zijn en gemak boven privacy kiezen merkt hij een kentering. "Ik heb het gevoel dat er beetje bij beetje meer aandacht komt voor privacy. Ik zie het ook bij mij in de collegezaal. Die is vol. De vakken over privacy en gegevensbescherming zijn populair." En hij wijst ook op een andere positieve ontwikkeling. De Hoge Raad oordeelde een maand geleden in een baanbrekend arrest dat de Belastingdienst niet zomaar kentekens mag verzamelen met de camera's boven de snelwegen. Het ging om minimaal drie miljard kentekenfoto's van zo'n 250.000 leaseautorijders. Zwenne: "De Hoge Raad oordeelde dat het gebruik van zo'n sleepnet niet proportioneel is. Het lijkt er dus op dat er iets aan het veranderen is, gelukkig." 

Alles bij de bron; MotherBoard [Thnx-2-Luc]


 

Het surf-en appgebruik van Amerikaanse burgers zal binnenkort naar alle waarschijnlijkheid legaal te koop aangeboden worden. Het gaat om je zoekgeschiedenis en locatie, maar ook info over je financiën, gezondheid en familie. 215 Republikeinen stemden voor de befaamde wet, de 190 aanwezige Democraten stemden tegen. Tot nu toe mochten privégegevens van klanten enkel met hun toestemming verkocht worden. Als Donald Trump de nieuwe privacyregels goedkeurt, dan hebben internetproviders geen goedkeuring meer nodig. 

“Eigenlijk maken ze daar in de VS al volop gebruik van,” licht IT-specialist Herman Maes verder toe. “Het enige verschil is dat het nu legaal zal worden door die nieuwe wet.” De praktijken zijn volgens Maes erg verregaand. “Zo kunnen banken bijvoorbeeld op basis van je zoekgeschiedenis en mailinhoud beslissen of ze je een lening of kredietkaart toekennen. Als je regelmatig naar luxesites surft en veel online shopt kunnen ze je desgewenst weigeren. Ook kunnen ze checken of je op Facebook veel contact hebt met mensen die ‘risicogedrag’ vertonen.” Men vreest hiernaast ook dat werkgevers tijdens selectieprocedures het online profiel van sollicitanten zullen kopen om een oordeel te kunnen vellen over hun potentiële nieuwe werknemer. Om het even welk bedrijf zal door de wet namelijk in staat zijn om aan dergelijke gegevens te geraken.

Volgens Herman Maes zijn dergelijke praktijken onmogelijk in ons land. Vanaf mei 2018 treedt de nieuwe GDPR-wetgeving namelijk in werking. In Europa zullen hierdoor de strengste privacyvoorwaarden van toepassing zijn.”

Wat kunnen wij zelf doen om onze privacy optimaal te beschermen?

Herman Maes geeft drie belangrijke tips om veilig te surfen met aandacht voor je eigen privacy:

1. Gebruik steeds de https-versie van een website. Https (het gekende groene slotje in je browser) zorgt ervoor dat enkel het hoofddomein geregistreerd wordt en niet de daadwerkelijke pagina’s van de websites die je bezoekt.
2. Maak gebruik van een VPN-verbinding om je surfverkeer om te leiden. Dankzij VPN verloopt je surfgedrag langs een veilige server. Dit is echter een nogal omslachtige manier die niet erg gebruiksvriendelijk is.
3. Check of jouw internetprovider of webservice een opt-out privacy-instelling heeft waar je bepaalde privacysettings kan uitvinken.

Alles bij de bron; Nieuwsblad [Thnx-2-Luc]


 

Abonneer je nu op onze wekelijkse nieuwsbrief!
captcha