We kijken al lang niet meer op als Siri, de IPhone-assistente onze verzoeken met tal van suggesties beantwoordt of wanneer Bol.com denkt dat we ook wel geïnteresseerd kunnen zijn in een paar modieuze teenslippers net nadat we een design lamp aankochten. Ons rechtvaardigheidsgevoel krijgt zelfs een opkikkertje als we lezen dat controlediensten Financiën data-analyse toepassen om fiscale fraude te detecteren.

De verbazing is dan ook beperkt nu we vernemen dat de VDAB-toepassingen binnenkort heel wat voorspellende informatie zullen aanleveren. De VDAB heeft als publieke bemiddelingsdienst de afgelopen decennia een hele transformatie doorgemaakt;  “VDAB wordt de Amazon van de arbeidsmarkt” dixit Fons Leroy.

VDAB beschikt niet alleen over honderdduizenden digitale dossiers van werkzoekenden maar ze ontvangen jaarlijks ook tienduizenden nieuwe vacatures. VDAB zorgt voor een automatisch vacatureaanbod door in enkele milliseconden honderdduizenden werkzoekenden te matchen met de tienduizenden vacatures. Daarnaast beheert de overheid in tal van andere levensdomeinen databanken die de burgers en diensten toelaten dezelfde informatie niet altijd opnieuw te moeten opgeven.  Door het koppelen van deze databanken kan de VDAB ook andere parameters uit de loopbanen kruisen met hun bemiddelingsgegevens.

En nog meer tot de verbeelding spreekt de registratie van het clickgedrag van diezelfde mensen wanneer ze gebruik maken van de tools die VDAB beschikbaar stelt. Deze gigantische berg aan dossier- en arbeidsmarktinformatie vormen samen met de matchings-, navigatie- en historische gegevens, de Big Data van de VDAB. Via een statistische benadering kunnen er aanbevelingen worden geformuleerd die de klant moet vooruithelpen in zijn zoektocht. Ze doen dit door data te verzamelen in grote datasets, deze te analyseren en vervolgens patronen en verbanden voor te stellen die een voorspellende uitspraak doen over het gedrag van de klant/gebruiker.

Het opgraven van deze informatieschat heet Datamining, het proces om via deze algoritmes voorspellende modellen te creëren die door een voortdurende stroom aan nieuwe data gevoed en aangepast worden, omschrijft men als Machine Learning. Volgens professor Max Welling, hoogleraar Machine Learning aan de Universiteit van Amsterdam is het naïef om blind te blijven voor de gevaren van de dataficatie, zoals privacy schendingen, misbruik van gegevens, het trekken van verkeerde conclusies, of de ontmenselijking van de dienstverlening...

...De digitalisering is een realiteit en het opgraven en exploiteren van dit nieuwe goud zal nog exponentieel toenemen. De overheid moet gebruik maken van de merites van deze technologieën om wins voor haar burgers te realiseren. Maar ze moet ook maatstaven ontwikkelen zodat deze platformen betrouwbaar zijn in analyse, rechtvaardig in hun output en transparant in hun opzet. Pas dan zal de nieuwe technologie bij de overheid een breed maatschappelijk draagvlak verdienen.

Alles bij de bron; deWereldMorgen


 

Zonder privacy geen vrijheid, betoogde hoogleraar Bart Jacobs laatst. Dat is zichtbaar onjuist, en dat geldt dus ook voor zijn pleidooi voor de volgens journalist Peter Olsthoorn draconische maatregelen.

.... De Tweede Kamer, media en publiek moeten alert zijn op datamisbruik en op besluiten die door computers genomen worden, zonder verdere controle. Zo kreeg de Tweede Kamer contouren voor een 'Kaderwet gegevensuitwisseling', maar niemand sloeg er acht op. Evenmin op het overzicht datakoppelingen van overheden: 57 pagina's ontoegankelijke tabellen.

...Er is nog geen begin van een antwoord op de grote vragen over data-inzet en anonimiteit. 'Big data' bieden inzicht in ziekten als ALS en Parkinson, ook in armoede, fraude, schooluitval en in polarisatie, radicalisering en racisme/antisemitisme. Maar tegen welke privacyprijs? Daar moet zeker open debat over komen, met het hele parlement en met ons. En we moeten eerst zelf zuiniger worden met data.

Zo heb ik geen mobiel internet - de privacyalarmisten wel - dus loop ik 'onbespied' rond in de openbare ruimte. Ik lees onderweg Trouw of een boek en kijk om me heen. Begin bij jezelf...

Alles bij de bron; Trouw


 

Datamining is het gericht zoeken naar statistische verbanden in heel grote gegevensverzamelingen met als doel profielen op te stellen. "Je gaat op zoek naar gelijkenissen tussen individuen, waardoor je subgroepen kan identificeren binnen de grote set van gegevens", zegt Sarah Steenhaut, professor Digitale Marketing aan de UGent in "De wereld vandaag". 

In de marketing is het een techniek die al redelijk lang bestaat, maar door de explosie van de data vandaag krijgt datamining een heel nieuwe dimensie. Door de sociale media is het aantal digitale sporen dat we nalaten explosief toegenomen. "Het gaat om hoe we ons voelen, welke merken we leuk vinden, met wie we verbonden zijn, en zo voort. Zonder dat we het beseffen laten we heel veel informatie over onszelf na". Op dezelfde basis als in de marketing wordt datamining nu op andere terreinen toegepast. "Het gaat over het identificeren van gelijkaardige patronen en profielen, en die gebruiken om de  boodschap naar bepaalde subgroepen meer persoonlijk te maken ", zegt Steenhaut.

In de Verenigde Staten wordt al langer gebruikt gemaakt van datamining om campagne te voeren, "Daar werd in eerste instantie aan het verzamelen van informatie gedaan, maar nadien ging men nog een stap verder door de profielen zo te verfijnen en die subgroepen dan zeer gerichte berichten te sturen, via mailing of via sociale media", stelt Steenhaut. 

"De bedrijven die de data verzamelen, hebben daardoor alle macht in handen en dan komen natuurlijk de discussie en de ethische vraagstukken over datatoegankelijkheid, privacy en transparantie naar boven. Vanuit de overheid moeten we dit thema zeer goed opvolgen en moet er gezocht worden om telkens opnieuw ervoor te zorgen dat de eindconsument weet dat hij een zekere bescherming krijgt", besluit Steenhaut.

Alles bij de bron; deRedactie


 

Vorig jaar zijn er zo'n 28.000 nieuwe dna-profielen van personen aan de dna-database van het Nederlands Forensisch Instituut (NFI) toegevoegd, waardoor de database nu de dna-profielen van ruim 252.000 mensen bevat. Dat heeft het NFI in het Jaarverslag DNA-databank bekendgemaakt (pdf).

Het totaal aantal personen dat ooit als minderjarige (12 t/m 17 jaar) in de dna-database is opgenomen, groeide naar zo'n 27.500. Van die personen waren er ruim 3000 op 31 december 2016 nog steeds minderjarig en ruim 24.000 inmiddels meerderjarig geworden. Ten opzichte van het totale aantal ooit in de dna-database opgenomen personen bedraagt het percentage personen dat tot en met 2016 als minderjarige is opgenomen 10,4 procent.

Het aantal dna-profielen van sporen in de database groeide vorig jaar met bijna 3800 naar 70.000. In de dna-database voor strafzaken hebben vorig jaar zo'n 5600 matches plaatsgevonden tussen een dna-profiel van een spoor en een dna-profiel van een persoon. Dat betekent dat gemiddeld iedere dag 15 keer een persoon kon worden gekoppeld aan een spoor dat op een plaats delict werd gevonden.

Alles bij de bron; Security


 

De politie gaat samenwerken met wetenschappers om beter informatie uit in beslag genomen smartphones en computers van verdachten te kunnen halen. Het idee is dat een computer met nieuwe technieken razendsnel miljoenen foto’s, berichten, locatiegegevens en filmpjes kan doorpluizen op zoek naar verbanden die een agent met het blote oog niet snel ziet.

De politie begint daarvoor het project ‘Politielab’ met Amsterdam Data Science. Dat is een samenwerkingsverband van de twee universiteiten en hogeschool in Amsterdam, en het Centrum Wiskunde & Informatica. Nu al gebruikt de politie computertools waarmee automatisch kan worden gezocht in gegevens. Politielab moet de volgende stap zetten. Zo moet de rechercheur met een druk op de knop een samenvatting krijgen van wat er interessant kan zijn van alle in beslag genomen apparaten. De computer ziet relaties en (afwijkende) patronen in de gegevens.

"Door de nieuwe tools kunnen wij straks hopelijk meer kennis halen uit de berg informatie die we in beslag hebben genomen.” zegt Theo van der Plas, programmadirecteur digitalisering en cybercrime van de politie. 

Daarmee worden niet alle problemen voor de politie opgelost, erkent hij. Gegevens die versleuteld zijn, zijn ook met de nieuwe tools niet te doorzoeken. Daarom is ook de nieuwe Wet Computercriminaliteit, die momenteel in behandeling is in de Eerste Kamer, belangrijk, zegt hij. Die geeft de politie de bevoegdheid computersystemen van verdachten te hacken, wat er onder meer voor moet zorgen dat informatie wordt verzameld vóórdat die versleuteld is. Daarnaast heeft de Hoge Raad zich onlangs uitgesproken over het doorzoeken van alle informatie op een smartphone. Dat kan een bijna compleet beeld opleveren van iemands persoonlijke leven en mag volgens het arrest dus niet zonder toestemming van een officier van justitie of rechter-commissaris, wat tot voor kort niet altijd gebeurde.

Alles bij de bron; Trouw


 

Wil de Indiase overheid efficiënter diensten verlenen, of 1,3 miljard burgers nauwlettender in de gaten houden? Deze vraag domineert de kranten en nieuwssites in het Aziatische land sinds de regering van premier Narendra Modi eind maart inschrijving in de biometrische databank Aadhaar verplicht heeft gesteld voor talloze diensten.

Een registratie in het Aadhaar-systeem kent de Indiër een uniek, twaalfcijferig nummer toe. Zo’n nummer is gekoppeld aan iemands naam, geboortedatum, adres, vingerafdrukken en irisscans. Met ruim 1 miljard ingeschreven burgers en inwoners is Aadhaar nu al het grootste biometrische identificatiesysteem ter wereld. In 2010 werd het gelanceerd als een vrijwillig systeem, vooral bedoeld om sociale voorzieningen efficiënter te verstrekken. Het bleek een populair identiteitsbewijs voor veel mensen die geen paspoort, rijbewijs of geboorteakte hebben.

Door de recente wetswijzigingen kan vrijwel niemand nog om inschrijving heen. Een Aadhaar-registratie is verplicht gekoppeld aan talloze voorzieningen en diensten en daar komen er binnenkort meer bij. Wie zijn inkomsten wil opgeven aan de belastingdienst, een mobiel telefoonnummer of een rijbewijs wil aanvragen, een werknemerspensioen wil laten uitkeren, of een hoger onderwijsdiploma wil behalen, moet beschikken over een Aadhaar-registratienummer.

Critici zien in de verplichting een teken dat het doel van Aadhaar is verschoven van dienstverlening naar surveillance. Gopal Krishna, van de actiegroep Citizen’s Forum for Civil Liberties die de verplichting via de rechtbank aanvecht, noemt het een ‘zware vertrouwensbreuk’ dat de wetten die betrekking hebben op Aadhaar zijn aangepast, nadat ruim een miljard mensen zich al hadden ingeschreven.

Krishna maakt zich zorgen over inbreuk op de privacy en mogelijk misbruik door hackers en de overheid zelf. Hij vergelijkt de Unique Identification Authority of India (UIDAI), de instelling die de databank beheert, met een inlichtingendienst. 'Niet alleen statische informatie wordt geregistreerd, maar ook dynamische informatie zoals financiële transacties worden bijgehouden. En wat biometrische data betreft zal het niet bij vingerafdrukken en irisscans blijven. De wet voorziet ook in andere vormen, dus dat kan in de toekomst bijvoorbeeld DNA betekenen.'

Nandan Nilekani, mede-oprichter van ICT-bedrijf Infosys die tot 2014 aan het hoofd van de UIDAI stond, erkent dat er nog veel fouten worden gemaakt. Hierdoor lopen mensen voorzieningen mis of kunnen ze geen pensioen opnemen van hun bankrekening. Dit kan ook al door een verkeerd gespelde naam worden veroorzaakt. Dagelijks kloppen 200.000 mensen aan bij de UIDAI om hun aan Aadhaar gekoppelde gegevens te laten corrigeren.

De koppeling van Aadhaar aan de belastingaangifte moet ontduiking tegengaan, terwijl de telecomsector hoopt een oplossing aangereikt te hebben gekregen voor de vele SIM-kaarten die nog met valse papieren worden gekocht. Alle bestaande mobiele nummers, meer dan één miljard, koppelen aan Aadhaar gaat de sector naar schatting wel Rpe 10 mrd (€ 147 mln) kosten.

Alles bij de bron; FD [gratis registratie noodzakelijk]


 

Vrijwel dagelijks geven we persoonlijke informatie over onszelf prijs. Al die kleine brokjes data worden vervolgens gebundeld, geanalyseerd en doorverkocht. De consequenties kunnen onaangenaam zijn. Hoe word je slachtoffer van je data en wat kun je er tegen doen?

Net zo makkelijk als het voor consumenten is om prijzen te vergelijken op het internet, is het voor bedrijven om het online gedrag van consumenten te monitoren en daarop hun prijzen aan te passen. „De techniek is er en de marketing- en economische literatuur zegt: het is oliedom als je het niet doet”, zegt Frederik Zuiderveen Borgesius van de UvA, die onderzoek doet naar dit fenomeen. Toch blijven voorbeelden van bedrijven schaars.

Dat komt, vermoedt hoogleraar recht en technologie Mireille Hildebrandt, omdat ondernemers huiverig zijn voor reputatieschade. En dat betekent dat bedrijven zich er of niet aan wagen, of dat ze het zó lastig maken dat je er nooit achter komt, denkt Hildebrandt. Want het grootste probleem is volgens haar dat het doorrekenen van onze verzamelde gegevens achter gesloten deuren plaatsvindt, zodat we niet precies weten wat internetbedrijven met die informatie doen of waar ze de gegevens voor gebruiken. „Dat is niet openbaar. Ze kunnen de informatie ook misbruiken. Op dit moment is dat niet goed te controleren.”

Vooral energie- en telecombedrijven laten nieuwe klanten vooraf screenen op kredietwaardigheid door externe bureaus, weet Zuiderveen Borgesius. Voor consumenten blijft deze wereld van datahandelaren schimmig. Het gaat om voor het grote publiek onbekende partijen met namen als Focum, EDR en Experian, die persoonlijke gegevens verzamelen en koppelen. Deze vorm van data-analyse is waardevol in de energie- en telecombranche omdat ze gebruikt wordt voor het berekenen van een persoonlijke kredietscore waarmee klanten worden opgedeeld: meer of minder kredietwaardig.

Postcodediscriminatie is niet verboden, maar in Nederland rijst geregeld de vraag of de postcode uitgangspunt mag zijn bij het vaststellen van premies of het toekennen van hypotheken. Postcodes verraden immers een hoop over iemands leefomgeving, en die informatie kan relevant zijn voor bedrijven die van het beprijzen van risico hun werk hebben gemaakt.

Een paar maanden geleden is de Consumentenbond een actie gestart die mensen oproept zich te melden als ze vrezen de dupe te zijn geworden van hun data. De Consumentenbond is met name geïnteresseerd in bedrijven die diensten weigeren of hoge waarborgsommen vragen op basis van verkeerde of onduidelijke informatie. Mail je ervaring naar het meldpunt: Dit e-mailadres wordt beveiligd tegen spambots. JavaScript dient ingeschakeld te zijn om het te bekijken. en hier kun je lezen hoe je een inzageverzoek kunt doen.

Alles bij de bron; TelegraafPremium


 

Edison heeft ooit eens gezegd: ‘Whatever the mind of man creates, should be controlled by man’s character’. Dat was al moeilijk genoeg in de tijd waarin hij leefde, maar hoe moet je dat doen als je de dingen niet langer zelf maakt, maar alles door robots en computers wordt gemaakt? Welkom in de wondere wereld van de kunstmatige intelligentie.

Slimme, zelflerende algoritmen leren beslissingen nemen, of patronen herkennen, door een grote hoeveelheid bestaande beslissingen of patronen te analyseren. Ze vormen een essentieel onderdeel van big data. Zonder grote hoeveelheden data leren dergelijke algoritmen niet (goed) genoeg. En zonder die algoritmen kan niemand wijs worden uit die grote berg aan data.

De voordelen van slimme algoritmen zijn overduidelijk. Ze maken het mogelijk om in grote hoeveelheden data patronen te vinden die we zelf nooit zouden zien en kunnen gebruikt worden om ons leven makkelijker te maken, om fraude op te sporen, de effectiviteit van medische behandelingen te bepalen, en om overheden en bedrijven efficiënter te maken.

De risico’s zijn ook evident. Of de beslissingen van die slimme algoritmen ook echt accuraat en eerlijker zijn hangt sterk af van het algoritme en de onderliggende data waarmee het algoritme getraind is. Er zijn helaas veel voorbeelden van slimme algoritmen die schrikbarend discriminerend en oneerlijk zijn. De vraag is dus: hoe houden we dit soort slimme algoritmen in het gareel?...

...De privacywetgeving beperkt de mate waarin geautomatiseerde beslissingen over ons genomen mogen worden. Maar op grond van die wetgeving bestaat er, helaas, geen recht op een onderbouwing of uitleg van de beslissing. Zelfs het recht om te weten op welke wijze zo’n beslissing tot stand komt — wat wel degelijk bestaat — wordt sterk beperkt door het recht van bedrijven om hun bedrijfsbelangen te beschermen... Maar gezien de belangen die op het spel staan, en de mogelijkheden die de techniek hier biedt, zou het goed zijn als hier nog eens goed naar gekeken wordt. Het vertrouwen van burgers staat op het spel.

Alles bij de bron; NetKwesties en de blog van de schrijver


 

Abonneer je nu op onze wekelijkse nieuwsbrief!
captcha