Microsoft heeft een dataset met foto's van honderdduizend mensen offline gehaald. De foto's werden van het internet geschraapt en door verschillende techbedrijven gebruikt om software voor gezichtsherkenning te ontwikkelen, zonder toestemming van de personen in kwestie.

Het was kunstenaar-onderzoeker Adam Harvey die het bestaan ervan in de aandacht bracht. Met zijn project Megapixels onderzoekt hij de privacy-implicaties van dergelijke datasets. De grootste openbaar beschikbare dataset ter wereld is MS-Celeb, drie jaar geleden door Microsoft online gezet, bevat zo'n tien miljoen foto's van bijna honderdduizend personen - vooral van beroemdheden.

De database zou echter niet alleen foto's van Amerikaanse en Britse acteurs bevatten, maar ook van ambtenaren, journalisten, academici, kunstenaars en zelfs van activisten die zich kritisch uitlaten over surveillance. Alle foto's werden geüpload onder een creative commons licensie, die gebruik voor academische doeleinden toestaat. De personen in kwestie werden echter niet op de hoogte gebracht van het feit dat hun foto gebruikt wordt om gezichtsherkenningssoftware te ontwikkelen.

De Financial Times ging op zoek welke commerciële bedrijven MS-Celeb gebruiken dat blijken onder meer IBM, Panasonic, Alibaba, Nvidia, Hitachi, Sensetime en Megvii. De laatste twee bedrijven leveren apparatuur aan ambtenaren in Xinjiang, een regio in het noordwesten van China waar gezichtsherkenning ingezet wordt om geautomatiseerde repressie te organiseren tegen de Oeigoerse moslims die daar wonen.

Enkele dagen nadat de Financial Times daarover berichtte in april, heeft Microsoft de publieke database stilletjes offline gehaald.

Dat Microsoft de bijbehorende website nu offline heeft gehaald, betekent niet dat de dataset niet meer bestaat, merkt Harvey op. "Je kunt een dataset niet zomaar laten verdwijnen. Zodra je ze online plaatst en mensen beginnen ze te downloaden, blijft de dataset bestaan op harde schijven over de hele wereld," zegt hij in de Financial Times. Op zijn website toont hij dat delen van MS-Celeb nog steeds te downloaden zijn via GitHub.

Alles bij de bron; DutchIT