23 januari 2006
Terwijl Google alle moeite doet (niet om altrustische redenen, overigens) om de Amerikaanse justitie van zich af te houden, zijn wetenschappers geneigd het niet zo nauw met de privacy van internetters te nemen. Symptomatisch daarvoor is een onderzoek van gedragsonderzoekers van Columbia University, die een analyse maakten van de ongeveer veertien miljoen mailtjes die studenten gedurende een jaar verzonden. In totaal 43.000 studenten namen aan het experiment deel, zonder daarvan op de hoogte te zijn gebracht. Een dergelijk onderzoek staat niet op zichzelf. De directeur van Hewlett Packard’s Information Dynamics Lab, Bernardo Huberman, zou een onderzoek onder enkele honderden employs van dat bedrijf willen overdoen, met gebruik van het mailverkeer van rond de vijftigduizend werknemers. Het zorgt voor veel discussie. Die centreert zich vooral om de vraag of toestemming gevraagd moet worden om de mails te mogen gebruiken n om de vraag wat belangrijker is: wetenschappelijk onderzoek of het beschermen van privacy gegevens.
‘I think there are plenty of spooky privacy issues associated with online activity, and I agree that the trade-off between science and privacy is an issue we’ll be thinking about more and more in the future’, zegt Duncan Watts, onderzoeker aan het Institute for Social and Economic Research and Policy (ISERP) van de Columbia University. ‘But I don’t think the data in this study should be on your list of worries, compared with the kind of data that Google or Yahoo or AOL or Amazon, for example, routinely collect and analyze’. Onderzoekers hebben steeds nieuwere technieken tot hun beschikking, zoals email electroscopie, een techniek die het mogelijk maakt email op details te analyseren. Die technieken hebben een adagio: hoe meer mail kan worden onderzocht, hoe exacter en bruikbaarder de resultaten zullen zijn. De onderzoekers zijn het er ook over eens dat het veel beter zou zijn als toestemming gezocht zou worden van de emailers, maar toestemming vragen en krijgen wordt steeds ingewikkelder met het groter en effectiever worden van de onderzoeken. Daarbij: de gebruikte technieken zorgen dat de gegevens niet tot personen te herleiden zijn. De e-mails worden van alle persoonlijke data ontdaan, zodat toestemming van de betrokkenen ook niet nodig is. De onderzoekers benadrukken dat ze in het algemeen alleen naar het tijdstip van verzending, de lengte van de conversatie en andere ‘onschuldige kenmerken’ kijken. In het onderzoek van Columbia University was privay niet in het geding, zo stelt Watts: ‘All the names and other identifying information had been removed from the e-mails, along with the contents of the mail and their subject headers. What remained was the time stamp and dates when the messages were sent and received, and the dates of any replies and the names of the people who wrote them. In place of the personal data was only self-consistent but otherwise meaningless labels. We can see that person A sent an e-mail to person B at time T, and that A and B were enrolled in class X at the time, but not who A and B were, or what the class was’. Jean-Pierre Eckman van de Univeristeit van Genve, deed een onderzoek onder 20 miljoen email, die in een periode van 83 dagen waren gezonden door 10.000 mensen. ‘You can compare this to having access to the envelope of a letter, but not the letter itself’, zo is zijn reactie.
Of zulke geanonimiseerde informatie niet ook privacygevoelig is is een vraag die niet wordt gesteld. De Electronic Frontier Foundation geeft toe dat in de genoemde onderzoeken de privacy van de emailers was gewaarborgd, maar als dergelijke gegevens in handen vallen van derden, dan is die waarborg niet langer aanwezig en liggen er ramp-scenario’s in het verschiet. Uiteindelijk is het echter vooral een kwestie van geld en vertrouwen, weet analist John Battelle: ‘As we move our data to the servers at Amazon.com, Hotmail.com, Yahoo.com, and Gmail.com, we are making an implicit bargain, one that the public at large is either entirely content with, or, more likely, one that most have not taken much to heart. That bargain is this: We trust you to not do evil things with our information’. Bedrijven hebben dat niet altijd in eigen hand, zoals de Amerikaanse overheid afgelopen week liet zien.