Nieuws & blogs

Persoonsgegevens op straat met big data? Hoe zit dat nou!

/

Arnoud Engelfriet

3 juli 2014

Big data, wat betekent het juridisch? Je hoeft maar een juridisch tijdschrift of cursusprogramma open te slaan om deze zin aan te treffen. Big data is happening, en we moeten er wat mee als juristen zijnde. Maar is big data nu werkelijk zo uniek?

Hoeveelheid, snelheid en diversiteit
De term big data wordt gebruikt om te verwijzen naar verzamelingen data die zo groot zijn dat ze met traditionele database-systemen niet goed meer te verwerken zijn. De snelle groei van verwerkings- en opslagcapaciteit van ICT-systemen maken het mogelijk dat hoeveelheden data worden verwerkt waar vroeger alleen van kon worden gedroomd. En bij zulke grote hoeveelheden data speelt ook nog eens het probleem dat de data zelden netjes gestructureerd of gelabeld is, zodat zoeken, combineren en analyseren van die data minstens zo’n uitdaging is als ze bij elkaar krijgen.

Volgens onderzoeks- en adviesbureau Gartner gaat het bij big data om drie factoren: de hoeveelheid data, de snelheid waarmee de data binnenkomt en opgevraagd wordt en de diversiteit van de data. Ook de complexiteit van de analyse is van belang. Het krantenarchief van de Koninklijke Bibliotheek is in die definitie geen big data, aangezien hier niet vaak complexe zoekopdrachten in moeten worden uitgevoerd. De verzameling met “Vind ik leuks” die Facebook aanlegt, is wel big data, aangezien het bedrijf hieruit in real time moet achterhalen wat ‘men’ interessant vindt en er ook nog eens welke advertenties daar het beste bij passen.

Met big data kan worden gezocht naar combinaties of trends die in kleinere hoeveelheden data onzichtbaar zouden zijn gebleven. Met statistische analyses door krachtige computers kunnen dan verbanden worden gevonden die handmatig onderzoek nooit had kunnen vinden. Correleer tienduizend factoren over een periode van vijf jaar en je zult opmerkelijke dingen vinden: een patroon van frauduleuze transacties in de boekhouding, de kans dat een ontslagen patient op korte termijn terugkomt in het ziekenhuis of het tijdstip waarop een machine op de productievloer het beste vervangen kan worden.

Vind ik leuk
Een bekend voorbeeld van wat er zoal mogelijk is met big data is de Amerikaanse winkelketen Target die middels big data-analyse aan het koopgedrag van haar klanten kon achterhalen of deze vrouw waren – en zwanger. Zo blijkt het omschakelen naar geurloze lotions en de aanschaf van extra schoonmaakmiddelen opmerkelijk vaak door zwangere vrouwen te gebeuren. Toen een zestienjarige dame vervolgens een boekje kortingsbonnen voor zwangerschaps- en babyproducten ontving, verraste dat haar ouders nogal. Maar de computer van Target bleek het bij het rechte eind te hebben, en de boze vader bood dan ook zijn excuses aan voor zijn boze protest en de eerdere stap naar de media.

Dit voorbeeld laat meteen zien waar het grootste juridische pijnpunt zit: veel big data die vandaag de dag wordt verzameld, bevat persoonsgegeven . En dat maakt het verwerken van big data lastig, want het verwerken van persoonsgegevens is aan strenge regels gebonden. De Wet bescherming persoonsgegevens eist in beginsel uitdrukkelijke toestemming van de betrokkene, alsook een informatieplicht voor de verantwoordelijke die de gegevens gaat verwerken. Die toestemming is doelgebonden - toestemming voor gebruik in een bestelling betekent nog niet toestemming voor uitgebreid analyseren in een big data-bestand.

Weliswaar kent de Wbp een uitzondering voor historische, statistische of wetenschappelijke doeleinden (art. 9 lid 3) maar het doel van big data onderzoek is zelden onder dit kopje te rangschikken. Het gaat immers om het ontdekken van nieuwe commerciele mogelijkheden: welke productcombinaties kunnen we introduceren, wat werkt voor onze klanten en hoe kunnen we ze nog meer extraatjes verkopen.

De uitgangspunten van de Wbp zijn op zich overzichtelijk en helder. Alleen, ze zijn geschreven in een wereld waarin databanken kilobytes aan data bevatten – een klantenbestand, een jaaradministratie, een logboek of wat. Geen zettabyte – een triljard gigabyte – aan ongestructureerde data waar een gemiddeld databasepakket zich per direct verslikt.

Niet alle big data bevat overigens persoonsgegevens: de deeltjesversneller Large Hadron Collider in Geneve verzamelt bijvoorbeeld 40 miljoen sensormetingen per seconde in de zoektocht naar nieuwe elementaire deeltjes. Veel bigger dan dat wordt het niet, en er moet ook snel kunnen worden gezocht naar statistische afwijkingen die kunnen wijzen op natuurkundige noviteiten. Big data dus, maar het zal niet meevallen hier juridische vraagstukken bij te bedenken. Een onrechtmatige-daadsactie wegens het mogelijk veroorzaken van het einde van de wereld bleek in 2008 geen haalbare kaart. Hoewel niet uit te sluiten viel dat de LHC een zwart gat zou kunnen veroorzaken waarin de gehele aardbol verzwolgen zou worden, weigerde de Amerikaanse rechter de zaak met een beroep op gebrek aan jurisdictie.

Een aandachtspunt bij big data zal wel altijd de service level agreement zijn: hoe snel worden de data verwerkt, met welke snelheid wordt er gereageerd op problemen, en hoe vaak wordt er gebackupt. Dat laatste is per definitie niet triviaal: hoeveel harde schijven heeft u die een zettabyte aan data aankunnen?

Wat is het verschil tussen Europese en Amerikaanse wetgeving omtrent persoonsgegevens? Wanneer zijn persoonsgegevens nou vogelvrij? Welke technieken worden gebruikt om jou als individu op het internet te onderscheiden? En wat is nou echt het dilemma met big data? Lees hier het hele artikel! 

De auteur
Arnoud Engelfriet is ICT-jurist, gespecialiseerd in internetrecht waar hij zich al sinds 1993 mee bezighoudt. Hij werkt als partner bij juridisch adviesbureau ICTRecht en is eigenaar van de site Ius mentis met uitgebreide informatie over internetrecht, techniek en intellectueel eigendom.
 

"Al bloggend op weg naar PLEIT2014"
Op de site van De Advocatenwijzer is al menig artikel verschenen over ICT en recht. In de aanloop naar PLEIT2014 zullen wij wekelijks een blog plaatsen over dit onderwerp. De artikelen dienen ter kennisneming en inspiratie voor deelnemers, (potentiële) cliënten en andere geïnteresseerden. Ben je jurist op het gebied van ICT recht (in de breedste zin des woords) en wil je een interessant en prikkelend artikel delen over dit thema? Stuur je blog naar: pleit@deadvocatenwijzer.nl. Zo gaan wij samen al bloggend op weg naar PLEIT2014!