De schatting is dat in 2020 1,7 MB aan data wordt geproduceerd door iedere persoon per seconde. Dat is een gigantische hoeveelheid. De 6de editie van ‘Data Never Sleeps’ geeft een overzicht van de enorme hoeveelheden data die in 2018 iedere minuut worden geproduceerd. De infographic spreekt voor zichzelf.
Archivos institucionales en el ‘Mundo 2.0’.
Eind 2018, begin 2019 verscheen in Tábula (een jaarboek van de Asociación de Archiveros de Castilla y León), in nr. 21 (2018), een artikel van mijn hand, getiteld: ‘Archivos institucionales en el ‘Mundo 2.0’. El marco de actuación para el ‘Archive-as-Is’ [Archivo-como-es]’. Dit artikel is een uitvloeisel van mijn artikelen eind 2017 in Archives in Liquid Times, die op deze site eerder zijn gepubliceerd. Voorzien van een nieuwe inleiding en door Verónica Fernández de Cabo and Luis Hernández Olivera in relatief korte tijd vertaald in het Spaans, verscheen het in een mooie uitgave net op het snijpunt van twee jaren.
Het abstract van dit hoofdstuk (zowel in het Spaans als in het Engels):
‘Este trabajo tiene como objetivo encontrar una base teórica viable para la gestión de la información empresarial (EIM) en un Mundo 2.0. El entorno “Archive-as- Is” es una teoría archivística dirigida a la organización. Es un modelo para enten- der el archivo “tal cual”, cómo se diseñó, construyó, procesó, manipuló y administró, y cómo “creció” para constituir el archivo que la organización que lo generó quería que fuera. Desde el momento de su creación, los archivos son dis- torsiones de la realidad, solo presentan imágenes sesgadas del pasado debido a la forma en que las organizaciones (y las personas) se “comportan”.
La contextualización (de los archiveros) será crucial para “corregir” la dis- torsión. El desafío es garantizar que el archivo se pueda utilizar como un recurso “confiable” y se administre de tal manera que una organización pueda sobrevivir a los desafíos de Mundo 2.0. El marco de actuación del “Archive-as-Is” podría uti- lizarse para conseguirlo.’
‘This paper has the objective of finding a viable theoretical foundation for Enterprise Information Management (EIM) in World 2.0. The framework of the “Archive-as-Is” is an organization-oriented archival theory. The framework is a declarative model for understanding the archive “as is”, how it has been designed, constructed, processed, manipulated, and managed, and how it has “grown” to be the archive that the organization that generated it, wanted it to be. From the moment of their creation, archives are distortions of reality, only presenting biased images of the past due to the way organizations (and the people) “behave”.
Contextualizing (by archivists) will be crucial to “correct” that distortion as much as is possible. The challenge in World 2.0 is to ensure that the organizational archive can be used as a “trusted” resource and be managed in such a way that an organization can survive the challenges of World 2.0. The theoretical framework of the “Archive-as-Is” may be the model that could be used to realize just that.’
Het artikel kan in gepubliceerde vorm hier worden gedownload.
Citatie:
G.J. van Bussel, ‘Archivos institucionales en el ‘Mundo 2.0’. El marco de actuación para el ‘Archive-as-Is’ [Archivo-como- es]’, L. Esteve Casellas I Serra and L. Hernández Olivera (eds.), Espacios de memoria. Estrategias y discursos para archivos históricos. Tabula. XII. Estudios Archivísticos de Castilla y Léon (Salamanca, 2018), pp. 41-79.
Een zalig Kerstfeest en een goed begin van 2019
IT Iconen
Bill Gates en Steve Jobs zijn twee van de meest succesvolle ICT-Iconen van het eind van de 20ste en het begin van de 21ste eeuw. Twee recente biografische films over deze twee IT grootheden laat ik hier volgen.
Wat is BLOCKCHAIN? Een begrijpelijke film over blockchain technologie.
Ik heb al meerdere malen iets gezegd en geschreven over de blockchain. De bijgaande video van het Centre for International Governance Innovation legt het concept op een begrijpelijke en realistische wijze uit. Let wel: er blijven wel enkele problemen bestaan, zoals opname van informatieobjecten (documenten, video- en audiofiles, e.d.), archiefwettelijke vernietiging en het realiseren van de AVG / GDPR. Maar de video maakt op simpele wijze duidelijk wat de betekenis van de blockchain kan zijn en maakt vooral helder dat het een voortzetting is van een eeuwenoud gebruik van registers, op een nieuwe (nog niet helemaal uitgekristalliseerde) manier. Het is een makkelijk filmpje om naar te verwijzen, zodat op een simpele wijze kan worden uitgelegd wat de technologie inhoudt, zonder in jargon te hoeven vervallen.
Symposium E-Discovery 2018: General Data Protection Regulation en het nut van E-Discovery
Het symposium E-discovery 2018 raakte noodzaak én actualiteit. Aanleiding voor dit symposium was de intreding van de Europese privacywet General Data Protection Regulation (GDPR), die t op 25 mei 2018 in werking is getreden. Volgens de Nationale Privacy Benchmark 2017 was 80% van de Nederlandse bedrijven en overheden nog niet klaar voor deze privacywet, die de bescherming van persoonsgegevens regelt. Maar liefst 60% van de bedrijven en overheden wist zelfs niet waar gegevens van burgers of klanten opgeslagen zijn.
Tijdens het symposium spraken professionals over het nut van e-discovery oplossingen en technieken, die (verder) helpen bij het in kaart brengen en verwerken van persoonsgegevens in organisaties. Ook werd er aandacht besteed aan digitaal archiveren in het kader van information governance en aan het juridische spanningsveld tussen E-Discovery en de GDPR. Uiteraard kwam de relatie tussen de GDPR en het Internet of Things aan de orde.
Een Sfeerimpressie:
Schommel en ICT
AVG, E-Discovery en Information Governance
Veel overheden en bedrijven denken dat het met de nieuwe privacy- wet (GDPR) niet zo’n vaart zal lopen. Maar weten zij waar ze alle data bewaren? En wat ermee gebeurt? Het rondslingeren van data is een groot probleem. Bedrijven en overheden hebben hun information governance en informatiewaardeketen niet onder controle.
Volgens de nationale privacy-benchmark van 30 november 2017 is 80 procent van de Nederlandse bedrijven en overheden nog niet klaar voor de nieuwe privacywet; 60 procent van de bedrijven en overheden weet zelfs niet waar de gegevens van burgers of klanten zijn opgeslagen.
In het maartnummer van AG Connect schreven Hans Henseler en Geert-Jan van Bussel over de relatie tussen GDPR (AVG), E-discovery en Information Governance. Klik hier.
Het artikel dient als een introductie voor het 9de Symposium E-Discovery in Leiden, wat dit jaar gewijd is aan GDPR en het nut van E-discovery. Geert-Jan van Bussel neemt hier de eerste presentatie voor zijn rekening over AVG, information Governance en Digital Archiving. Voor meer informatie over dit (kostenloos) te bezoeken symposium, zie hier.
Citatie:
Hans Henseler, Geert-Jan van Bussel, ‘GDPR vereist zoeken en controleren’, AG Connect, maart 2018, pp. 28-31.
Blockchain en AVG
In januari 2016 maakte Vitalik Buterin op het blog van Ethereum duidelijk dat blockchain en privacy moeizaam samengaan. Compliance aan de AVG is van belang, vooral vanwege de hoge boetes die door de Autoriteit Persoonsgegevens opgelegd kunnen worden. In hoeverre kan de blockchain overweg met de AVG?
Een blockchain is bedoeld om transacties te faciliteren tussen mensen en organisaties die elkaar niet kennen en niet (hoeven te) vertrouwen. Gebruikers leggen data vast over een transactie, een betaling, een levering of een contract. Alle gegevens die daarvoor nodig zijn (de partijen, het subject, eventuele links naar documenten) worden vastgelegd. Dit ‘databaserecord’ wordt voorzien van een cryptografische sleutel die de inhoud authentiseert en onmuteerbaar maakt (een ‘record’-hash). De vastlegging wordt automatisch gecontroleerd. Indien goedgekeurd wordt het ‘record’, samen met andere goedgekeurde ‘records’ (van de afgelopen tien minuten) verzameld in een Blok. Het Blok wordt voorzien van een ‘timestamp’, waardoor de tijd van vastlegging wordt gedocumenteerd, en een daaraan gekoppelde ‘nonce’, een unieke en versleutelde waarde (de Blok-hash). Om het Blok in de blockchain te verankeren, wordt de Blok-hash van het voorgaande Blok opgenomen. ‘Mining servers’ controleren vervolgens de validiteit van het Blok. Daarna wordt het aan de keten toegevoegd en in een gedistribueerd netwerk opgeslagen. In de ‘ledger’, het register, wordt elk ‘record’ vastgelegd, waardoor het toegankelijk en vindbaar is.
Vanuit het perspectief van de AVG is het verschil tussen een publieke en private blockchain van belang. Een publieke blockchain heeft geen ‘eigenaar’ en iedereen kan deelnemen. In een private blockchain zijn de deelnemers vooraf geïdentificeerd en goedgekeurd. Een private blockchain gaat in principe in tegen de bedoeling van een blockchain: mensen en organisaties die elkaar niet kennen en niet vertrouwen helpen met het uitvoeren van transacties.
Een publieke blockchain kan niet voldoen aan een aantal vereisten uit de AVG:
(1) Er is geen verwerkingsverantwoordelijke, waardoor de kernbeginselen die gelden voor de verwerking van persoonsgegevens niet kunnen worden nageleefd (Artikel 4 lid 7 AVG);
(2) Er is geen toezichthouder die toetst op de wijze waarop de persoonsgegevens binnen de blockchain worden verwerkt; en
(3) Persoonsgegevens worden permanent opgeslagen. Dat botst met een aantal vereisten: zo moet de verwerking van persoonsgegevens worden beperkt tot wat noodzakelijk is voor de doeleinden waarvoor zij worden verwerkt (Artikel 5 lid 1 punt c AVG), moeten de gegevens worden gerectificeerd of gewist als ze onjuist zijn (Artikel 5 lid 1 punt d AVG) en moet het ‘recht op vergetelheid’ (het recht om te worden vergeten) worden gerealiseerd (op redelijk verzoek verwijderen van gegevens) (artikel 17 AVG).
Een private blockchain kan de AVG-problemen van verwerkingsverantwoordelijke en toezichthouder oplossen, maar niet dat van permanente opslag.
Het betekent dat de huidige generatie blockchaintechnologie niet in staat is een cruciaal beginsel van de AVG te realiseren. Er wordt onderzoek gedaan naar aanpasbare blockchains, maar zover is het nog lang niet.
De AVG is een bottleneck voor de toepassing van de blockchain. Daar waar persoonsgegevens een belangrijke rol spelen dient dan ook voorzichtig te worden omgegaan met de toepassing van deze technologie, ook in een private variant.
Deze column is gebaseerd op de volgende literatuur:
Ateniese, G., B. Magri, D. Venturi, en E. Andrade, ‘Redactable Blockchain – or – Rewriting History in Bitcoin and Friends’, 2017 IEEE European Symposium on Security and Privacy (EuroS&P), Parijs, April 26-28, 2017, pp. 111-126. PDF
Berberich, M., S. Malgorzata, ‘Blockchain Technology and the GDPR – How to Reconcile Privacy and Distributed Ledgers?’, European Data Protection Law Review, 2 (2016), nr. 3, pp. 422-426.
Bussel, G.J. van, ‘Blockchains en archivering’, Archievenblad, 2017, nr. 10, pp. 10-13. PDF
Buterin, V., ‘Privacy on the Blockchain’. Online source, 15 januari 2016.
Halberstam, S., R. Lumb, ‘Blockchain – The Concept and the Law’. Online source , s.d.
Maughan, A., ‘Blockchain – Legal and regulatory issues around distributed ledger technology’. Online source, 20 april 2016 (niet langer beschikbaar, ook niet in de Internet Archive (juli 2024).
Herdruk
In februari 2017 (we werden wat laat op de hoogte gesteld) verscheen ‘Digital Archiving, Green IT and the Environment: Deleting Data to Manage Critical Effects of the Data Deluge’ als laatste (10de) hoofdstuk in Shaun Pather (ed.), Leading Issues in ICT Evaluation Research, Vol. II, Reading: Academic Conferences and Publishing International Ltd, 2017), pp. 200-220.
Dit boek is een compilatie van tien zorgvuldig geselecteerde artikelen (2010-1015), verschenen in The Electronic Journal for Information Systems Research (EJISE), die beschouwd worden als een reflectie van de ‘leading issues’ in de evaluatie van informatiesystemen in de genoemde periode. Als zodanig worden ze beschouwd als ‘invaluable to both the research and practitioner communities’. Het bovengenoemde artikel verscheen in EJISE, vol 18 (2015), nr. 2, pp. 187-198. Een PDF daarvan is hier te downloaden. De tekst van het hoofdstuk is ongewijzigd gebleven, maar wel voorzien van een inleiding door de redacteur. In deze inleiding werd aangegeven waarom dit artikel in de bundel is opgenomen. Ik laat deze redactionele inleiding hieronder volgen.
‘The phenomenal reach of networks in our modern inter-networked society of the 21st century suggests that we are witness to an exponential growth of data storage across both cloud and localised systems. Moore’s law (Moore, 1965) implies a massive increase in requirements for data storage (see e.g. Chip, 2005a). However, given that storage is largely dependent on energy, the inter-networked era is placing an undue premium on the judicious application of limited energy sources. Thus whilst this paper by van Bussel, Smit and van de Pas is not based on a typical IS evaluation problem, it does provide a basis for a new dimension of evaluation. Given that the cost of data storage will decrease as the demand increases, the evaluation of energy costs of IS projects will undoubtedly be necessary. This paper, then, provides a basis on which a new perspective of IS project (ex-ante) should evolve, involving an evaluation of the ‘greenness’ of the IS infrastructure. The outcomes of such evaluation should assist in ensuring that hardware architecture of IS will draw only minimally on the already constrained resources of the natural environment’.
Shaun Pather, Leading Issues, p. 200.
Het boek zelf is verkrijgbaar bij de Academic Bookshop, voor £19.00.
Armoede
Filosofen, zoals Derrida, Lacan en Wittgenstein, hebben ons wereldbeeld ingrijpend beïnvloed, ondanks (of misschien dankzij) de tegenstrijdigheden, inconsistenties en vage ideeën die de postmodernistische filosofie karakteriseren. Het idee echter dat ieder individu een eigen belang en (dus) een eigen waarheid heeft is gemeengoed. ‘De waarheid’ en ‘het algemene belang’ bestaan niet. Het samenstel van alle individuele belangen en subjectieve waarheden komt in evenwicht in een ‘vrije markt’.
De (op zijn best: twijfelachtige) vertaling van het postmodernisme naar de praktijk leidde tot extreme ‘economisering’ van onze maatschappij. Productiviteit, efficiëntie en rendement werden de vervangers van morele ideologieën. Burgers zijn klanten, patiënten en studenten respectievelijk zorg- en onderwijsconsumenten, 60-plussers kostenposten, artiesten en kunstenaars creatieve ondernemers.
Deze ‘economisering’ commercialiseerde de informatievoorziening. Informatiebronnen, van nieuwsmedia en onderzoekbureaus tot zoekmachines en sociale media, gebruiken commercie als fundament. De afgelopen dertig jaar is een groot deel van het nieuws, van de programma’s op tv en radio, van de boeken, tijdschriften en films geproduceerd door voortdurend groeiende multinationals, die jaarlijks honderden miljarden omzet genereren. Ze beïnvloeden ons wereldbeeld ingrijpend en ze sturen en manipuleren het om veranderende belangen en ‘waarheden’ te realiseren.
Marketeers, spindoctors, reclamemakers en communicatiestrategen maken belangrijke informatiestromen tot public relations, afgestemd op doelgroepen en beoordeeld op rendement. Ze maken de ‘waarheid’ van hun opdrachtgevers tot producten die verkocht moeten worden. Ze weten (als beoefenaars van postmoderne fenomenen als Marketing en PR) dat wat mensen voor ‘waar’ aannemen een kwestie is van hoe de wereld wordt gepresenteerd.
Informatievoorziening is een kwestie van marktwerking geworden. Het doel is niet meer om alle informatie in de wereld te ontsluiten en toegankelijk te maken, maar om het af te stemmen op de behoeften van de informatieconsument. Google werkt op basis van op behoeften bepaalde profielen die bepalen welke zoekresultaten getoond worden. Wat voor waar wordt aangenomen is gekoppeld aan een profiel. In het nieuws gaat het niet meer om maatschappelijke relevantie, maar om aansluiting vinden bij interesses en behoeften van een doelgroep. Informatiebubbels worden bewust gecreëerd als vormen van behoeftebevrediging en bevestiging van het eigen gelijk.
De commercialisering van de informatievoorziening is doorgeslagen in behoeften- en belangenbevrediging. Archieven en bibliotheken worden fijngemalen en worden geacht informatie aan te bieden voor hergebruik, voor services om specifieke doelgroepen te benaderen en om potentiële of veronderstelde behoeften te bevredigen.
Ondanks non-profit alternatieven om het tij te keren, gaat het niet meer om kennis. Het gaat om het exploiteren van informatie om behoeften te bevredigen van in eigen waarheden gelovende doelgroepen, die geen behoefte hebben aan harde feiten die deze waarheden als ‘vals’ aanmerken.
Het is deze intellectuele armoede die het failliet van het postmodernisme kenmerkt.
Voor de eerste keer gepubliceerd in: IP. Vakblad voor Informatieprofessionals, 2017, nr. 9, p. 34.
The Theoretical Framework of the ‘Archive-as-Is’
Op 12 december werd Archives in Liquid Times (Stichting Archiefpublicaties, ‘s-Gravenhage, 2017) gepresenteerd op een mini-symposium in Amsterdam. Ik presenteerde daar het theoretisch framework dat ik de afgelopen jaren ontwikkeld heb met een blik vanuit de archiefvormer en gebruik makend van de bestaande archieftheorie. Het resultaat is een archieftheorie, gebaseerd op filosofisch pragmatisme, met een zeer directe link naar de praktijk van alledag en met de focus op de bijdrage van archieven en ‘records’ aan de doelstellingen en de strategie van een organisatie. Als er namelijk iets niet is gebeurt bij de bestaande archieftheorie is het een verbinding leggen met de doelstellingen die organisaties hebben en het benadrukken van de waarde die een archief heeft voor de economische en maatschappelijke activiteiten van een organisatie. De eerste twee hoofdstukken van het boek introduceren het framework.
Citatie:
G.J. van Bussel, ‘The Theoretical Framework of the ‘Archive-as-Is’. An Organization Oriented view on Archives. Part I. Setting the Stage: Enterprise Information Management and Archival Theories’, F. Smit, A. Glaudemans, en R. Jonker (eds.), Archives in Liquid Times (Stichting Archiefpublicaties, ‘s-Gravenhage, 2017), pp. 16-41. Zie hier voor een download.
G.J. van Bussel, ‘The Theoretical Framework of the ‘Archive-as-Is’. An Organization Oriented view on Archives. Part II. An Exploration of the ‘Archive-as-Is’ Framework’, F. Smit, A. Glaudemans, en R. Jonker (eds.), Archives in Liquid Times (Stichting Archiefpublicaties, ‘s-Gravenhage, 2017), pp. 42-71. Zie hier voor een download.
Archives in Liquid Times is in zijn geheel in verschillende formaten te downloaden via de site van de KVAN/S@P.
Blockchains en Archivering
Rond 2008 werd de blockchain bedacht als een van de antwoorden op het wegvallen van het vertrouwen in de banken als bemiddelaars in financiële transacties. Het is bedacht om betalingen te verrichten met bitcoins, een alternatieve munt die zonder tussenkomst van banken wordt gebruikt. In hoeverre kan de blockchain gebruikt worden in archivering?
Een nieuwe publicatie over het nut van de Blockchain voor archivering in Archievenblad, 2017, nummer 10, pp. 8-11. Voor een PDF-downlaod klik hier.
Een wijziging: op pagina 11 staat onder Doel? geschreven: Algemene verordening persoonsgegevens. Dit hoort te zijn: Algemene verordening gegevensbescherming.
Citatie: G.J. van Bussel, ‘Blockchains en archivering’, Archievenblad, 2017, nr. 10, blz. 8-11.
AI is not good or bad, nor is it neutral, TEDx van Lokke Moerel
In een TEDx in Amsterdam ging prof.dr. Lokke Moerel, hoogleraar Global ICT Law aan de Universiteit van Tilburg, in op de positieve en negatieve aspecten van kunstmatige intelligentie. Ze gaat uitgebreid in op de grote impact die kunstmatige intelligentie heeft op de ontwikkeling van (en het bewustzijn aangaande) menselijke vooronderstellingen. Want kuntmatige intelligentie kan die vooroordelen ten goed en ten kwade tot uitdrukking brengen. Het is immers niet neutraal. De kwaliteit van de data die door de algoritmes wordt geanalyseerd is sterk bepalend voor wat die ‘intelligentie’ kan doen. Lokke Moerel behoort tot de belangrijkste privacy advocaten ter wereld. Ze is onderdeel van het privacy en cybersecurity team van het Amerikaanse advocatenkantoor Morrison & Foerster. De Ted-talk hieronder schetst in tien minuten de essenties van het feit dat AI niet neutraal is.
ZZP
In de informatiesector werken vele ZZP’ers. Velen hebben daar zelf voor gekozen. Een grote groep uit nood: een vaste baan werd verloren en de hypotheek moet worden betaald. Dat leidt tot onwenselijke situaties.
In november 2016 schreef Ellen ter Gast, ZZP-docent bio-ethiek aan de Universiteit Leiden, in de Volkskrant over de opmars van ZZP’ers in het Hoger Onderwijs. ZZP-docenten zijn voordelig voor de onderwijsinstelling. Geen loonheffingen. Geen risico bij ziekte. Alleen productieve uren worden betaald. Professionele ontwikkeling is voor rekening van de ZZP’er: die houdt immers voor eigen rekening zijn/haar vak bij. De onderwijsinstelling bepaalt hoeveel uren in rekening kunnen worden gebracht en het maximale bedrag per uur. 40 à 45 euro per uur wordt voor ZZP-docenten ‘normaal’ geacht. Opbouwen van een pensioen en een arbeidsongeschiktheidsverzekering wordt zo goed als onmogelijk.
ZZP-docenten worden niet eens slecht betaald: veel ZZP’ers moeten tevreden zijn met tarieven van rond 10 en 15 euro per uur. Vastgesteld door de opdrachtgever, met arbeidsomstandigheden die volledig door ‘de baas’ worden bepaald. Dat deze ZZP’ers geen ondernemer zijn staat buiten kijf. Vele nood-ZZP’ers staan in een gezagsverhouding ten opzichte van hun opdrachtgever.
Dit lijkt op de omstandigheden waaronder nood-ZZP’ers in ICT, informatieadvies of archiefwerk werken, al zijn de tarieven hier niet zó laag. Maar ook hier bepaalt niet de ZZP’er zelf, maar de opdrachtgever wat er gewenst is en wat acceptabele tarieven zijn. Rijkswaterstaat vroeg in het AD voor een klus van twee maanden een inwerkperiode van twee weken ‘tegen het nultarief’. Diezelfde instelling verlaagde meerdere malen de tarieven voor ingehuurde ZZP’ers. Bemiddelingsdiensten, koppelbazen die ZZP’ers behandelen als uitzendkrachten, snoepen 10-15% van het uurtarief van ZZP’ers op. Dat ook overheidsorganen de kosten drukken door gebruik te maken van dergelijke kapitalistische uitbuitingsconstructies is beschamend.
Op lange termijn lopen de opdrachtgevers aanzienlijke risico’s. Niet alleen omdat de wet deze schijnconstructies verbiedt of omdat ze reputatieschade oplopen. Vooral omdat ze zich zorgen moeten maken over de te betwijfelen vakinhoudelijke kwaliteit van deze onderbetaalde nood-ZZP’ers. De eisen die aan de informatiehuishouding en de gebruikte systemen daarin worden gesteld in onder andere de Algemene Verordening Gegevensbescherming vereisen hoge kwaliteit. Dat in handen leggen van mensen die het vel over de oren is getrokken en geen enkele loyaliteit naar de organisatie vertonen is uitermate risicovol. Datalekken kunnen leiden tot gigantische boetes.
De verbetering van de economie in 2017 leidt tot een afname van het aantal nood-ZZP’ers. Zij stromen weer in gewone banen in. De tarieven gaan weer stijgen. ZZP’ers kunnen als ondernemer gaan fungeren, hun eigen tarieven en werkomstandigheden bepalen, hun eigen offertes uitbrengen en een fatsoenlijk pensioen opbouwen. Dat het de opdrachtverstrekkers meer gaat kosten is duidelijk.
So what? Uitbuiting hoort niet voor te komen in dit land.
Voor de eerste keer gepubliceerd in: IP. Vakblad voor Informatieprofessionals, 2017, nr. 8, p. 21.
The Google Boys
Google’s opkomst en groei is een belangrijke factor in de enorme ontwikkeling van het Internet. Google slaagde in de missie om informatie beter vindbaar en toegankelijk te maken. Het werd de grootste search engine omdat het betere resultaten gaf, sneller relevante resultaten gaf dan de concurrentie en gebruikers het gevoel gaf te vinden wat ze zochten. Het algoritme is geheim, uiteraard. In 2005 maakte het Biography Channel een documentaire over de oprichters van het bedrijf, Larry Page and Sergey Brin, en dat werd tegelijkertijd ook een documentaire over het bedrijf zelf. Het is twaalf jaar oud en ontegenzeggelijk verouderd, maar is desalniettemin nog steeds zeer de moeite waard
Zootje
De overheid staat de inlichtingendiensten toe 42 persoonlijke gegevens vast te leggen bij elke boeking van een vliegticket binnen Europa. Daar zijn gegevens bij over bijvoorbeeld ‘voedselvoorkeuren’, die geen verband hebben met het ticket dat geboekt is. Ze mogen vijf jaar worden bewaard, maar niemand weet of ze worden vernietigd. Het is een voorbeeld van het verzamelen van persoonlijke gegevens (oneerbiedig: datagraaien) waar vooral sinds we online zijn geen rem meer op lijkt te staan.
Het verzamelen van persoonlijke data is de kern van de digitale revolutie. We zijn uren bezig met de online verbindingen die het Internet biedt. Wouter van Noort schreef er een boeiend boek over: Is daar iemand? Hoe de smartphone ons leven beheerst. Hij beschrijft hoe we zo verslaafd zijn geraakt dat we onze ziel en zaligheid toevertrouwen aan internetbedrijven als Facebook, Twitter, Instagram, en andere.
We zijn gewillige ‘slachtoffers’ van bedrijven die gericht zijn op het bewust creëren van internetverslaving om op basis daarvan data te verzamelen en die vervolgens te gelde te maken. Datadealers zou je die bedrijven kunnen noemen, ook al omdat ze de maatschappelijke effecten van hun handel en wandel negeren.
Onze (semi-)overheid verzamelt vrolijk mee. De onmetelijke datastromen die de Smart City-initiatieven genereren waar onze overheden gretig instappen creëren Big Data (met persoonlijke data van camera’s, verkeerslichten, energiemeters, e.d.), die gebruikt kunnen worden om het gedrag van burgers te manipuleren en te sturen. Singapore gebruikt ze om afwijkende meningen uit te bannen.
Er staat nauwelijks een rem op het verzamelen, opslaan en analyseren van die data. Dat gebeurt met argumenten als het verhogen van efficiency en vergroten van veiligheid. Gecombineerd met het “probleemoplossende ‘imago’ van de ICT”, zo stelt de Wetenschappelijke Raad voor het Regeringsbeleid, wegen die argumenten zwaarder dan “transparantie, privacy, keuzevrijheid of accountability”.
In hun boek Je hebt wél iets te verbergen proberen Maurits Martijn en Dimitri Tokmetzis te achterhalen welke datastromen de overheid verwerkt. De conclusie is ontnuchterend. Er wordt nergens duidelijk beheer gevoerd. Het is niet bekend waar welke data wordt opgeslagen, hoe die data worden gebruikt en geanalyseerd en of die data worden vernietigd. Data stroomt van de ene database naar de andere, zonder enige transparantie. Informatiebeveiliging is een chaos, waardoor het verzamelen van data op zijn minst zorgwekkend is. Datalekken volgen elkaar op. Ondanks de waarschuwende rapporten en het bewustzijn dat het moet verbeteren, gebeurt er weinig. De EU-databeschermingsrichtlijn (GDPR), die volgend jaar mei moet ingaan, lost dat niet op. Misschien dat het meer bewustzijn genereert, maar of het een rem zet op het verzamelen van persoonlijke gegevens is twijfelachtig. Regels zijn geduldig.
Al met al maakt dit ‘gegevensbeheer zootje’ de uitdrukking ‘betrouwbare overheid’ lachwekkend.
Voor de eerste keer gepubliceerd in: IP. Vakblad voor Informatieprofessionals, 2017, nr. 7, p. 19.
Blockchain Mania
Eind 2016 publiceerde Victoria Lemieux, associate professor aan de University of British Columbia in Vancouver, in het Records Management Journal een artikel over ‘trusted records’ en de rol van blockchain technologie. Dat artikel kwam op een moment dat de blockchain ‘hype’ werd.
Een blockchain is een database (een register, ‘ledger’) waarin meerdere, wereldwijd verspreide computers samenwerken om versleutelde blokken informatie (‘blocks’) op te slaan. Elk nieuw blok bevat via versleutelde coderingen (‘hashes’) ook de codering van het blok ervoor. Zo ontstaat een keten (’chain’) met volledige en onmuteerbare informatie. Bij de Bitcoin-toepassing (waarin de technologie voor het eerst gebruikt werd) is deze database publiek toegankelijk. De essentie van de technologie is dat informatie decentraal wordt bewaard, authentiek en integer is en niet kan worden gemuteerd. Ideaal voor bewijs en archivering, want de authenticiteit, integriteit en bereikbaarheid van de informatie worden gewaarborgd.
Lemieux plaatst er kanttekeningen bij. Ze bewijst de kwetsbaarheid van de blockchain voor manipulatie van timestamps, ongeautoriseerd toevoegen van malware computers in de distributiekanalen en problemen in het managen van digitale handtekeningen. Ze merkt op dat vele toepassingen vereisen dat de ‘originelen’ worden bewaard om te controleren of de hashes juist zijn. Dat vereist de aanwezigheid van digitale archieven, bewaarstrategieën en de inrichting van een technische infrastructuur die de blijvende toegankelijkheid van die originelen regelt. Maar dan kan juridisch bewijs ook worden gerealiseerd door de archivering van de originelen in die archiveringsomgeving, vooral omdat de opslag daar contextueel plaatsvindt. Een blockchain doet dat in principe niet.
Daarnaast kan in een blockchain opgenomen informatie niet vernietigd worden waardoor de wettelijke verplichting tot vernietiging niet kan worden uitgevoerd. De vernietiging van de originelen (wat formeel zou moeten) breekt de blockchain omdat een vergelijking van de hashes van de ‘originelen’ en de blockchain niet langer mogelijk is.
Dat alles doet de vraag rijzen wat het nut van die blockchain is.
Met de technologie is weinig mis. Voor archivering is een ‘private blockchain’ nodig, maar in de meeste oplossingen is dat standaard. Er is dan beperkte toegang tot de blockchain, bijvoorbeeld de partners in een ketenorganisatie. Er moeten voorzieningen zijn voor contextueel gebruik van een blockchain en voor behoud van informatie, bijvoorbeeld een koppeling met een zaaksysteem, records management applicatie of een eDepot-applicatie. Bij de meeste experimenten met blockchain-technologie is hiervan geen sprake.
De vraag wat het doel is van de blockchain wordt te weinig gesteld in de ‘mania’ om de nieuwe technologie te gebruiken. Als dat doel met traditionele databasetechnologie kan worden gerealiseerd, waarom dan een complexe blockchain gebruiken? Voor archivering de belangrijkste vraag….
Voor de eerste keer gepubliceerd in: IP. Vakblad voor Informatieprofessionals, 2017, nr. 6, p. 33.
Opmerking
Er wordt op dit moment erg veel onderzoek gedaan naar blockchain technologie in relatie tot archivering en information governance. Op het moment van schrijven van deze column waren mij twee artikelen onbekend die twee bezwaren genoemd in deze column van een mogelijke oplossing voorzien: de mogelijkheid tot aanpassing (in het kader van vernietiging) van een blockchain en het contextualiseren van de objecten opgenomen in een chain. De volgende artikelen beschrijven mogelijke oplossingen voor beide problemen:
V.L. Lemieux, M. Sporny, ‘Preserving the Archival Bond in Distributed Ledgers: A Data Model and Syntax’, Proceedings of the 26th International Conference on World Wide Web Companion WWW ’17 Com, Perth, Australia, April 3-7, 2017, pp. 1437-1443. Klik hier voor download.
G. Ateniese, B. Magri, D. Venturi, and E. Andrade, ‘Redactable Blockchain – or – Rewriting History in Bitcoin and Friends’, 2017 IEEE European Symposium on Security and Privacy (EuroS&P), Paris, April 26-28, 2017, pp. 111-126. Klik hier voor download (de PDF betreft een uitgebreidere versie dan de gepubliceerde versie).
Beide mogelijkheden zijn nog niet geïmplementeerd binnen bestaande blockchain oplossingen.
Warped priorities in the Information Age
In de tijd van Twitter kan informatie en kennis sneller plaatsvinden dan ooit tevoren. Hoe gebruiken we echter dit communicatiekanaal? Zoals de samensteller van deze infographic aangeeft: ‘Well, we mostly use it to talk about a bunch of useless crap’. Beetje sterk uitgedrukt, maar het geeft (voor de US in ieder geval voor wat betreft 2013) enkele voorbeelden die dat wel bevestigen. Interessante infographic, die vastlegt wat wel veelal het gevoel is bij deze social media.
Data never sleeps
Domo presenteerde voor de vijfde keer de ‘Data Never Sleeps 5.0’ infographic. De infographic geeft een visueel overzicht van het online gedrag van de internetgebruikrs. De infographic laat zien hoeveel data elke minuut online gegenereerd worden op de populaire platformen, zoals Snapchat, Instagram, Amazon, Twitter, Netflix, Spotify en anderen. Domo introduceerde deze infographic voor het eerst in 2013, als een snapshot in het volume en de snelheid waarin data online worden gegenereerd en gedeeld.