Archivalisering

Begin september was ik spreker op een conferentie over ‘information systems management’ in Evora (Portugal). Ik sprak over het belang van context voor het reconstrueren van het verleden. Die reconstructie is nodig om be­wijs en verantwoording te kunnen afleggen. Het is nodig om te laten zien dat wetten, regels en procedures daadwerkelijk zijn uitgevoerd. Compliance wordt dat genoemd.

Het was een populair onderwerp op die conferentie. Dat is niet vreemd, want veel informatiesystemen worden door organisaties gebruikt om compliance af te dwingen in bedrijfsprocessen. Denk aan SAP, PeopleSoft of zaaksystemen. Er waren presentaties over hoe bedrijfspro­cessen met informatiesystemen kunnen worden ingericht en geconfigureerd om alle benodigde wet- en regelgeving uit te voeren, alle han­delin­gen en activiteiten te besturen en, zo werd benadrukt, de ‘performance’ van het pro­ces te verbeteren.

In­formatiesystemen bepalen welke handelingen wanneer en op welke wijze moeten worden verricht. Organisaties gebruiken deze systemen om mensen te dwingen te werken zoals procedures vereisen en informatiesystemen zijn geconfigureerd. Dat vloeit voort uit een visie die organisaties ziet als ontwerp- en stuurbare machines. Die visie vindt mensen onbetrouwbaar. Ze maken immers fouten en doen wel eens iets wat organisaties niet willen.

In zijn inaugurele rede in 1998 introduceerde Eric Ketelaar het fenomeen ‘archivalisering’, de bewuste of onbewuste keuze om iets wel of niet te bewaren op basis van sociale, religieuze, culturele, politieke en economische invloeden. Hij stelde dat archivalisering bepaalde hoe archieven worden gevormd. Deze ‘software of the mind’ (naar de organisatiepsycholoog Geert Hofstede) reflecteert morele normen, vooroordelen en psychologische beperkingen, veroorzaakt door de omgeving. Organisaties en hun informatiesystemen wensen deze normen, vooroordelen en beperkingen te negeren om beter te kunnen controleren.

Recent onderzoek van Ciarán O’Kelly en Melvin Dubnick toont dat deze ‘software of the mind’ en de sociale relaties tussen mensen een veel belangrijkere rol spelen in organisaties dan gehoopt of ver­wacht. Mensen blijken systemen te laten voor wat ze zijn. Mensen bepalen in onderling overleg, met geven en nemen, wat er moet gebeuren, welke beslissing acceptabel is, welke informatie moet worden bewaard (en welke niet) en wat er in informatiesystemen moet worden ingegeven. Informatie wordt achteraf vastgelegd en een informeel genomen beslissing wordt achteraf geformaliseerd. De daadwerkelijke context is een totaal andere dan de vastgelegde context. Ik wees daarop in mijn voordracht in Evora.

Sociale relaties ontglippen aan bureaucratische controle en aan informatiesystemen. Er is nauwelijks aandacht voor die sociale dynamiek in organisaties en informatiesystemen, terwijl die van grote invloed is op informatiemanagement, archivering en compliance.

Ketelaar heeft gelijk. Archivalisering is veel belangrijker dan organisaties denken.

Voor de eerste keer gepubliceerd in: IP. Vakblad voor Informatieprofessionals, 2016, nr. 7, p. 34.

Share This:

Professie

Computerized Archival Science. Onder die noemer is Victoria Lemieux, associate professor in de onderzoeksgroep van Luciana Duranti bij de University of British Columbia in Vancouver, gestart met een nieuw project.

Op Research Gate beschrijft Lemieux dat computers archiveringsprocessen (als waardering, ordening en beschrijving, behoud en toegankelijkheid) efficiënter kunnen maken. Ze wil computers de ver­wer­king, analyse, opslag en behoud van archiefinformatie laten uitvoeren.

Lemieux’ vooronderstelling is dat traditionele werkwijzen onvoldoende zijn om gro­te massa’s digitale infomatieobjecten te verwerken. Dat is bekend, maar er be­staat huiver voor de gevolgen (houden archivarissen werk?). Lemieux schudt die huiveringen af. Wat ze wil doen bouwt voort op Duranti’s onderzoek naar digitale diplomatiek: het ontwaren van de vorm- en structuurvereisten van digitale informatieobjecten die de integriteit en authenticiteit van informatie waarborgen. Dat onderzoek heeft geleid tot al­lerlei criteria die door informatietechnologie kunnen worden gebruikt om ge­auto­matiseerd betrouwbare informatieobjecten te realiseren.

Lemieux zet een volgende stap. Voor de verwerking van Big Data is het namelijk nodig de processen die de betrouwbaarheid van informatieobjecten waar­­borgen (de archiveringsprocessen) door computers te laten uit­­voe­ren.

Ik denk dat het kan. Uiteindelijk. Ik noemde in 2012 in mijn lectorale rede Archiving schould be just like an Apple al ‘volledig geautomatiseerde archiveringsomgevingen’ als de toekomst. Mensen zouden intuïtief met computers kunnen werken zonder zich zorgen te maken over de ar­chi­vering van in­formatie. Die zou op de achtergrond geautomatiseerd en betrouwbaar worden uitgevoerd.

Ik besteedde in die rede ook een paragraaf aan de digitale archivaris. Ook al verlopen archiveringsprocessen geautomatiseerd, dan wil dat nog niet zeggen dat er geen archivaris meer nodig is. Maar de benodigde kennis en vaardigheden voor die rol zullen wel anders zijn dan die nu geleerd worden. Ik wees op informatie­- en organisatiewetenschap, informatietechnologie, compliance en (ook) infor­ma­tica. Een van mijn conclusies toen was zelfs dat er zoveel verschillende kennisgebieden en vaardigheden vereist worden dat een digitale archivaris niet gauw één persoon zal zijn. De generalistische archivaris is in een digitaal tijdperk passé.

De uitgangspunten van archivistische basiskennis zijn de onschendbaarheid van de bewijswaarde van archieven, het denken volgens het ‘records continuum’, het organische karakter van de archiefvorming, de vier dimensies van informatie en het ‘respect des fonds’. Die uitgangspunten zijn nodig om als digitale archivaris te kunnen functioneren, maar iedereen die met informatie werkt zou ze moeten onderschrijven.

Tenminste als we willen dat informatie vindbaar, beschikbaar, waarneembaar, begrijpelijk en contextueel is. Als we willen dat informatie betrouwbaar is en blijft.

Misschien een criterium voor de certificatie als informatieprofessional?

Voor de eerste keer gepubliceerd in: IP. Vakblad voor Informatieprofessionals, 2016, nr. 6, p. 34.

Share This:

Nieuws?

Binnenlands Bestuur beschrijft de worsteling van gemeenten met floppy’s, tapes en cd-roms. ‘Oude’ informatie is moeilijk vindbaar, niet doorzoekbaar en soms geheel ontoegankelijk. Er zijn zoveel boeken, artikelen en nieuwsberichten verschenen over de wankele ‘duurzaamheid’ van digitale in­for­matie dat het verwonderlijk is dat een tijdschrift zo’n bericht nog als nieuws kan presenteren. Al in februari 2014 publiceerde ik samen met een collega een opiniestuk in datzelfde Binnenlands Bestuur, waarin we reageerden op een rapportage van de Erfgoedinspectie over de falende di­gitale archivering bin­nen de ministeries. Wij sloten af met: ‘Onze rijksoverheid wordt niet dement – zij is het al.’ Er hebben de afgelopen jaren voldoende berichten de pers gehaald om die stelling ook te betrekken op de gemeentelijke overheid.

Het ‘geheugen’ wordt niet beter met digitale technologie. En het was al niet zo geweldig! Want ook in het analoge tijdperk was veel informatie moeilijk vindbaar, niet doorzoekbaar en geheel ontoegankelijk. In talrijke projecten werden juist die argumenten gebruikt om het papier af te zweren en te digitaliseren. Naast de kosten uiteraard, want digitaal werken en archiveren is toch stukken goedkoper? Ook die idee is een illusie gebleken. Het moeizame en kostbare proces om digitale bewaarplaatsen (e-depots) tot stand te brengen is daarvan een uiting.

Terug naar de floppy’s, tapes en cd-roms. Is het erg als ze niet toegankelijk zijn?

Dat is afhankelijk van het moment waarop ze met data beschreven zijn. Hilbert en López constateerden in 2011 in Science dat in 2000 ongeveer 25% van de beschikbare data opgeslagen was in digitale vorm, terwijl dat in 2007 al gestegen was tot 94%. Als die floppy’s, tapes en cd-roms voor 2000 te dateren zijn, dan is hun ontoegankelijkheid niet zo problematisch. De meeste informatie van voor dat moment is grotendeels in papieren dossiers opgeborgen. Maar na 2000 worden papieren dossiers steeds dunner, zijn digitale data leidend en wordt het print-commando minder gebruikt. De toegankelijkheid van opslagmedia wordt dan essentieel om data te kunnen vinden.

Wat in veel organisaties ontbreekt is het bewustzijn dat er hard moet worden gewerkt om digitale data toegankelijk te houden. Hard- en software verouderen in razend tempo en als data niet worden gemigreerd of opgeslagen volgens open standaarden, dan is het ontoegankelijk worden daarvan slechts een kwestie van tijd. Digitaal archiveren (digitale informatie toegankelijk houden in de tijd) kost inspanning, moeite en geld.

Gelukkig kan er veel informatie worden ‘gered’.

Bij alle rampverhalen over het verloren gaan van digitale data blijkt uiteindelijk dat het grootste deel ervan kon worden gered. Gespecialiseerde bedrijven kunnen data van veel van die floppy’s, tapes en cd-roms opnieuw leesbaar maken, als die media tenminste niet te ernstig zijn beschadigd. Dat kost erg veel geld, waarschijnlijk meer dan digitale informatie goed archiveren.

Maar ook dat is geen nieuws.

Voor de eerste keer gepubliceerd in: IP. Vakblad voor Informatieprofessionals, 2016, nr. 5, p. 32.

Herdrukt in: W. Bronsgeest, M. Wesseling, E. de Vries, R. Maes, Informatieprofessional 3.0. Strategische vaardigheden die u connected houden (Amsterdam: Adfo Books, 2017), pp. 266-267.

Share This:

Drijfzand

Replicatie (of herhaalbaarheid) is een wetenschappelijk dogma. Het waarborgt de controleerbaarheid van onderzoek. Directe (of: zo exact mogelijke) replicatie is echter moeilijk.

In 2005 verscheen in PLOS Medicine Why most research findings are false’, van de statisticus en epidemioloog John Ioannidis. Op basis van wiskundig en statistisch onderzoek stelde Ioannidis dat de conclusies in 80% van de medisch wetenschappelijke publicaties onhoudbaar zijn. Hij onderbouwde dat, ook in 2005, in een artikel in de Journal of the American Medical Association. Het bleek dat 41% van de 49 meest geciteerde onderzoeksconclusies vanaf 1990 onjuist of ernstig overdreven waren. Bayer en Amgen, twee van ‘s werelds grootste pharmaceuticals, rapporteerden in 2011 dat zij in hun eigen la­boratoria respectievelijk slechts 11% en 25% van eerder gepubliceerd onderzoek konden repliceren. In 2012 kon Amgen resultaten uit zes van de 54 ‘land­mark cancer papers’ re­pliceren. Het geeft aan dat Ioan­nidis’ conclusies dichter bij de waarheid zijn dan lange tijd werd gehoopt.

Vooral psychologisch onderzoek staat onder druk. Een artikel uit 2015 door een consortium van 270 wetenschappers (o.a. van de Universiteit van Amsterdam) con­cludeert dat 60% van de resultaten van psychologisch onderzoek niet repliceerbaar is. Deze studie werd in maart dit jaar onderuit gehaald met het verwijt dat er geen directe replicatie was uitgevoerd, waarna het ‘modder gooien’ begon.

De vraag is of directe replicatie binnen mens- en gedragswetenschappen wel mogelijk is. Hans Strik­werda, hoogleraar bedrijfskunde aan de Universiteit van Amsterdam, vindt van niet. Het gedrag van men­sen verandert immers in de tijd. In de bedrijfskunde liggen empirische waarnemingen bijvoorbeeld aan de basis van succesmodellen. Iedere manager die daarmee werkt, verandert de empirie, waardoor replicatie onmogelijk wordt.

Bij conceptuele replicatie wordt dezelfde theorie getoetst aan nieuwe experimenten. Dit lijkt binnen de mens- en gedragswetenschappen meer voor de hand te liggen. Maar dat vereist wel veel van het Research Data Management van de wetenschappelijke instituten. Het vereist niet alleen het bewaren van de gebruikte datasets, maar ook exacte vastlegging van de methodologie voor dataverzameling, -bewerking, -selectie, -massage, -analyse en -verificatie. Het vereist het vastleggen van zoek-, be­werkings- en analysecriteria. Het vereist het bewaren van de gebruikte versies van algoritmen. Het vereist informatiemanagement en archivering. Het vereist volledige (contextuele) transparantie in de gebruikte onderzoekmethode, beschreven en gepubliceerd. Op grond van dergelijke vastleggingen zijn er initiatieven waarbij wetenschappers experimenten voor publicatie door andere onderzoekers (vrijwillig) laten herhalen en de resultaten in de uiteindelijke publicatie opnemen.

Het is een begin.

Tot dit wetenschappelijke usance wordt, is veel onderzoek echter niet herhaalbaar.

Wetenschappelijk drijfzand dus.

Voor de eerste keer gepubliceerd in: IP. Vakblad voor Informatieprofessionals, 2016, nr. 4, p. 32.

Share This:

Amateurs

Begin maart verscheen het rapport van de enquêtecommissie van de Amsterdamse gemeenteraad naar de financiële wantoestanden in de stad. De gemeentefinanciën schieten structureel tekort, het college van Burgemeester en Wethouders deed niets en de gemeenteraad controleerde niet. Basistaken werden niet goed uitgevoerd. Het gemeentebestuur nam besluiten op basis van onjuiste informatie, greep niet in en volgde adviezen en aanbevelingen uit eerdere rapporten niet op. De gemeenteraad volgde liever hypes en vond financiën niet ‘sexy’. De gemeentesecretaris en de ambtelijke top faalden. Wethouders van Financiën wisten niet dat ze moesten besturen. De gemeentesecretaris wist ook niet welke rol te vervullen binnen het gemeentelijke apparaat.

Het onderwerp van de raadsenquête heeft (al wordt dat niet gezegd) een nauwe relatie met de ICT chaos, die Amsterdam óók kenmerkt. De rapporten daarover zijn veelzeggend. Niet op elkaar aansluitende en ‘lekke’ ICT systemen, geen informatievisie, informatiebeleid of informatiestrategie. Mislukte ICT projecten. Uit de hand lopende kosten. Geen ambtelijke discipline bij de invoer en verwerking van gegevens.

Het is niet vreemd dat het financieel mis gaat. Financieel administreren is grotendeels ‘gewoon’ informatiemanagement. Dat blijkt bij privacygevoelige informatie in de gemeente ook niet goed te gaan. Begin dit jaar kreeg Amsterdam nog een veeg uit de pan van de inspectie SZW: de gemeente doet (net als bijna alle andere gemeenten!) te weinig aan de beveiliging van Suwinet, het systeem waarmee overheidsorganen gegevens over burgers en bedrijven uitwisselen. Ambtenaren blijken regelmatig te snuffelen in die gegevens. Amsterdam blijkt slechts te voldoen aan twee van de zeven gestelde normen. Zo ontbreekt een beveiligingsbeleid, worden bevindingen over de beveiliging niet doorgegeven aan het management en hebben veel meer ambtenaren dan nodig toegang tot het systeem. Pijnlijk, omdat de eigen, interne accountantsdienst had geconstateerd dat alles op orde was. Maar ja, die voert ook de interne en externe controle op de financiën uit, en dat is geen succes.

De gemeente Amsterdam heeft een ingewikkelde informatie-infrastructuur. Zo’n omgeving vereist belangstelling voor informatiemanagement. Het gebrek daaraan is stuitend, en niet alleen in de gemeente Amsterdam.

Een onderzoeker van het Antoni van Leeuwenhoek Ziekenhuis raakte een harde schijf kwijt met medische gegevens van 781 patiënten. Die schijf lag (tegen alle richtlijnen) achter in een auto toen hij gestolen werd. Het is een uiting van eenzelfde probleem: een falend bewustzijn van informatiemanagement.

En dat is het gevolg van informatie-incompetente bestuurders, politici en ambtenaren. Ze maken het besturen van informatie-intensieve organisaties tot een farce. Of, om Job Cohen uit 2009 te citeren: het zijn ‘allemaal amateurs’. Zeker als het gaat om informatiemanagement.

Maar de Amsterdamse wethouder van financiën heeft het liever over de voorjaarsnota.

Tja…

Voor de eerste keer gepubliceerd in: IP. Vakblad voor Informatieprofessionals, 2016, nr. 3, p. 29.

Share This:

Integriteit

Het Centrum voor Ethiek en Gezondheid (CEG) publiceerde in januari Integriteit in zorgorganisaties. Hieruit blijkt dat in de praktijk van alle dag integriteit een moeilijk begrip is, gericht op gedrag en morele normen en waarden. Volgens het CEG bestaat integriteit uit vier componenten: betrouwbaarheid (handelen naar wat je zegt), deugdzaamheid (moreel het goede doen), authenticiteit (intrinsiek gemotiveerd zijn) en reflectie (je kritisch verhouden tot (de toepassing van) normen en regels). Integer handelen is moeilijk, ook omdat de publieke opinie er een beeld van heeft dat niet overeenkomt met de complexiteit ervan. Integriteit heeft te maken met persoonlijke overtuiging en ethiek, waardoor om ‘goed’ te doen ook regels aan de kant geschoven kunnen worden. Een medisch specialist laat bij een kwestie van leven en dood de ‘heilige’ protocollen voor wat ze zijn.

Want ondanks dat we overstelpt worden met integriteitscodes die omschrijven wat wel en niet mag, wetenschappelijk is aangetoond dat opgelegde regels niet helpen om integer te zijn en te blijven. Voorschrijven wat moet, wil niet zeggen dat mensen overtuigd zijn dat het zo hoort. Mensen bepalen samen het gedrag dat bij hun werk, organisatie of beroep past. Regels die daarvan een uiting zijn kunnen werken, tenminste zolang ze dynamisch zijn. Hoe over integriteit wordt gedacht is immers sterk tijdgebonden en situationeel.

Anna Bernasek toonde in 2010 in The economics of integrity aan dat integriteit een economische waarde heeft, gebaseerd op ‘trust’ en ‘trustworthiness’. Ze liet met voorbeelden zien dat integriteit de basis is voor het slagen of falen van economische activiteiten. Zo is transparantie van alle handelingen, online klantenreviews en vertrouwen in die klant de basis van de miljarden aan marktwaarde die Amazon heeft gerealiseerd. Zo is de veiligheid en de kwaliteit van de melk die we drinken en die we op basis van volledig vertrouwen kopen in de supermarkt afhankelijk van de integriteit en het onderling vertrouwen van minimaal vijftien mensen en organisaties. Zo werd Toyota de grootste automobielfabrikant ter wereld door de integriteit van de productie voorop te plaatsen, daarnaar te handelen en voortdurend bij klanten te benadrukken. En zo ging Volkswagen onderuit toen bekend werd dat er gemanipuleerd was met de uitstootwaarden van haar dieselauto’s en dat klanten moedwillig verkeerd waren geïnformeerd.

Als het vertrouwen van klanten wegvalt (mede) vanwege niet integer handelen, dan leidt dat veelvuldig tot economische schade. Denk DSB, Rochdale, TSN, Lehmann Brothers, enzovoort.

Betrouwbare informatie en informatievoorziening zijn belangrijk voor integer handelen van mensen en organisaties. ‘Trust’ en ‘trustworthiness’ kunnen verloren gaan als informatie niet juist is en als informatievoorziening misleidend is. Informatieprofessionals moeten integer handelen om de betrouwbaarheid van informatie en informatievoorziening te beschermen en te waarborgen.

Doen ze dat ook?

Voor de eerste keer gepubliceerd in: IP. Vakblad voor Informatieprofessionals, 2016, nr. 2, p. 29.

Herdrukt in: W. Bronsgeest, M. Wesseling, E. de Vries, R. Maes, Informatieprofessional 3.0. Strategische vaardigheden die u connected houden (Amsterdam: Adfo Books, 2017), pp. 195-196.

Share This:

We leven in een uitdagende tijd!

De hoeveelheid data neemt enorm toe. Organisaties worden bestookt met allerlei soorten informatie via een enorm aantal verschillende kanalen. Ze verzamelen zelf ook steeds meer data, over klanten en burgers. Vaak weten ze niet eens waarom, maar de mogelijkheden zijn er en het kan ‘misschien nog wel van pas komen’. Opslagservers, ‘on site’ of in de ‘cloud’, zijn dan ook erg in trek. Opslag is goedkoop, immers. Het is allang bekend dat dat niet zo is, maar struisvogels staan er ook om bekend hun kop in het zand te steken.

In de opslagprijzen per gigabyte zijn het gebruik en de terugvindbaarheid van data nooit meegenomen. Maar vanaf 2010 zijn de kosten daarvoor per jaar wereldwijd verdubbeld (tot €11 miljard, ongeveer)! Data behoren immers toegankelijk, vindbaar, betrouwbaar en duurzaam te zijn. Ze worden toch ook opgeslagen om te worden gebruikt. Het information governance regime, nodig voor vertrouwelijkheid, privacy, compliance en erfgoed, vergt met de stijging van de hoeveelheid data meer investeringen in software.

Een voorbeeld.
De kosten per gigabyte zijn bij Portico, een e-depot voor academische literatuur, €9 en er is een stijgende lijn te constateren. Stel dat we wereldwijd een exabyte (een miljard gigabytes) bewaren. Dat is een half promille van de wereldwijd geproduceerde twee zettabytes (twee duizend exabytes) aan data in 2011. We slaan ongeveer 20 % (vierhonderd exabytes) daarvan op. Het bewaren van die ene exabyte kost volgens Portico €9 miljard per jaar. In 2020 produceren we vijftien of twintig zettabytes!
Het is daarbij ook aardig om te weten dat we in Nederland in plaats van een half promille van alle gegenereerde data tussen de 3 en 5 % blijvend bewaren! Dat leidt dus uiteindelijk tot een grote kostenpost! Ach, opslag is goedkoop.

Alles opslaan is een economische illusie, tenminste als we alles toegankelijk, vindbaar, betrouwbaar en duurzaam willen archiveren.

Waarderen, selecteren en vernietigen van data worden enorm belangrijk. Daarom leven wij, als informatieprofessionals, in een uitdagende tijd! Die uitdaging wordt niet alleen veroorzaakt door de effecten die de toename van data in organisaties heeft. Het is vooral uitdagend om in organisaties invloed te verwerven die het mogelijk maakt om informatie toegankelijk, vindbaar, betrouwbaar en duurzaam te maken en te houden. Ik heb het idee dat het daar nogal aan schort. We zijn niet in staat duidelijk te maken wat het belang van goed informatiemanagement is. Integendeel, zou ik haast zeggen.

Alleen al van de gemeenten heeft 80% de digitale informatiehuishouding niet op orde. Dossiers zijn niet vindbaar, beschikbaar en toegankelijk, laat staan duurzaam. In onze organisaties worden we eigenlijk als overbodig beschouwd. De technologie lost het allemaal toch op? Maar die technologie, waar we als informatieprofessionals eigenlijk alleen maar gebruikers van zijn, hapert al jaren. Parlementaire rapporten over falende informatietechnologie en mislukte projecten maken duidelijk dat informatietechnologie moeilijk te regisseren is. Lokale overheden kunnen hun informatietechnologie niet overzien, aansturen en betalen, met als gevolg bezuinigingen, belastingverhogingen en fouten. Data worden onbetrouwbaar, ontoegankelijk en vaak onvindbaar.

Als informatieprofessionals zitten we in een moeilijke positie. De invloed die we nodig hebben om ons werk (informatiemanagement) goed te doen hebben we (nog) niet. We moeten de nadruk leggen waar die behoort te zijn. Niet op technologie, maar op informatie. Daar draait het immers om. Technologie is een middel. Hamer op toegankelijkheid, betrouwbaarheid, vindbaarheid en duurzaamheid. Op waarderen, selecteren en vernietigen. Zoveel mogelijk!

Toets daarop. Zeur daarover. En zeg dat technologie zich daarop moet richten! Altijd. Overal. Ondanks alle ontwikkelingen, hypes en verwachtingen! Wijs op het ‘waarom’ van informatiemanagement. Bescherm informatie ‘with your lives’!

Ik zei toch al dat we in een uitdagende tijd leven?

Voor het eerst gepubliceerd in VHIC’s Sited, nr. 165, maart 2016, 16e jaargang,

Share This:

Quantum Leap

Deel 3 uit een vierdelige serie over ‘The Fabric of the Cosmos’, gebaseerd op een boek van Brian Green, presenteert ‘a wild ride into the weird realm of quantum physics, which governs the universe on the tiniest of scales. Greene brings quantum mechanics to life in a nightclub like no other, where objects pop in and out of existence, and things over here can affect others over there, instantaneously and without anything crossing the space between them. A century ago, during the initial shots in the quantum revolution, the best minds of a generation-including Albert Einstein and Niels Bohr-squared off in a battle for the soul of physics. How could the rules of the quantum world, which work so well to describe the behavior of individual atoms and their components, conflict so dramatically with the everyday rules that govern people, planets and galaxies?’

Een documentaire van NOVA, van november 2015. Zeer de moeite waard deze ongeveer een uur durende film te bekijken en je te verwonderen over de natuurkundige ontwikkelingen die onze toekomst gaan bepalen. Quantum computers zijn slechts een voorbeeld!

Share This:

Ontspoord

Luk van Parijs, Adrian Maxim, Joost Meijer, Diederik Stapel en Dirk Smeesters. Namen van wetenschappers die ontspoorden bij het verwerken van informatie. Ze verzonnen grafieken, datasets en/of mede-auteurs. Ze pleegden wetenschappelijke fraude. Ze vielen in het mes van wat Stapel zelf ‘wetenschappelijke pornografie’ noemde. Frank van Kolfschooten legt die datamanipulatie in Ontspoorde wetenschap pijnlijk bloot.

Politici ontsporen eveneens in hun ‘informatiegedrag’. Ard van der Steur is een recent voorbeeld. Hij ‘slachtofferde’ een vooraanstaand anatoom op basis van berichten over een presentatie op een besloten bijeenkomst van anatomische vakgenoten. Die berichten waren door RTL journalisten op basis van valse voorwendselen verkregen. Dat is geen uiting van journalistieke integriteit, maar dat terzijde. Van der Steur maakte het bont toen hij een politieonderzoek dat hem in het ongelijk stelde verzweeg, dat (veel) later zwaar gecensureerd ter beschikking stelde van de Tweede Kamer en tenslotte (toen de betrokken anatoom het rapport zelf wereldkundig maakte) moest toegeven dat hij onjuist had gehandeld. Hij verschafte de Tweede Kamer bewust onjuiste informatie, een politieke doodzonde. Opstappen dus, eigenlijk, maar omdat veel parlementariërs in deze zaak ook een scheve schaats reden lijkt dat te verzanden in de verwerpelijke excuus-cultuur die gemeengoed is in politiek Den Haag.

Bestuurders zijn meesters in het onjuist, onduidelijk, ontijdig, onvolledig en/of onvoldoende beschikbaar stellen van informatie, met alle gevolgen van dien. De Betuwelijn, de HSL en de Fyra vlogen financieel ‘uit de bocht’, mede omdat de betreffende bestuurders geen middel schuwden om informatie te verdoezelen en te doen verdwijnen. De financiële crisis heeft maar al te duidelijk gemaakt dat bestuurders van financiële instellingen hetzelfde gedrag vertonen.

Dat is grotendeels te verklaren vanuit Benjamin Singer’s stelling in ‘Crazy Systems and Kafka circuits’ (al uit 1980!) dat vanuit machtsdenken de kwaliteit, toegankelijkheid, logistiek, bekendmaking en context van informatie altijd zal worden gemanipuleerd door organisaties en hun medewerkers.

Dit onethische ‘informatiegedrag’ wordt nog versterkt door het verschijnsel dat organisaties hun informatiemanagement niet op orde (willen?) hebben. Halo Business Intelligence geeft aan dat in 2014 ongeveer 40 % van alle bedrijfsinformatie inaccuraat is en dat 66 % van alle organisaties denkt negatieve gevolgen te ondervinden van hun foutieve informatie.

Informatiemanagement kan die negatieve gevolgen verminderen. Het kan zelf het onethisch omgaan met informatie moeilijker maken.

Niet vermijden, want daarvoor moet iedereen informatie-ethiek met de paplepel ingegoten krijgen….

Voor de eerste keer gepubliceerd in IP. Vakblad voor Informatieprofessionals, 2016, nr. 1, p. 32.

Share This:

Privacy, Data, Democracy

‘We need to move beyond the Silicon Valley model’.
Aral Balkan is oprichter en beangrijkste ontwikkelaar van Ind.ie, een bedrijf dat onafhankelijke alternatieven maakt voor ‘spyware 2.0’. Aral benadrukt dat wij als individuen het eigendom en de controle over onze ‘digitale identiteiten’ moeten hebben. We zijn produkten geworden die bedrijven verkopen aan hun klanten. Dat is het business model van Silicon Valley, wat door wetgevers onvoldoende wordt bestreden. Hij wil met zijn werk fundamentele vrijheden, mensenrechten, en democratie beschermen door onafhankelijke technologie te ontwerpen die niet spioneren op hun gebruikers. Aral heeft het Ind.ie Manifesto geschreven.
Op dit moment werkt hij aan de core van het Ind.ie platform, een gedistribueerd social network: Heartbeat.
In deze video vertelt hij over Heartbeat, en allerlei aspecten inzake privacy, data en democratie. Duidelijk wordt waarom het model van Silicon Valley dient te veranderen.
Hij vertelde dit verhaal op The Conference 2015 in Malmö.

 

Share This:

Digital Data and the City

Nog net voor het sluiten van 2015 verscheen de digitale versie van een artikel over digitale data en de ‘smart city’, een hoofdstuk geschreven in samenwerking met John van de Pas, Mettina Veenstra en Frans Jorna (allen van Saxion Hogescholen). In dit hoofdstuk beschrijven we de bouwblokken van een Smart City Architectuur, waarin wij Informatiemanagement (op basis van Informatiewaardeketen en de Vier Dimensies van Informatie) de plaats geven die het verdient, namelijk als een separaat bouwblok. Het is de eerste keer dat informatiemanagement als een dergelijk fundamenteel onderdeel van een Smart City Architectuur wordt gepositioneerd. We publiceren hier een pre-press van dit hoofdstuk, die in lichte mate afwijkt van het uiteindelijk gepubliceerde. Graag naar het definitieve hoofdstuk verwijzen bij gebruik als referentie. Het boek zelf is verschenen in januari 2016.

Citatie: J. van de Pas, G.J. van Bussel, M. Veenstra, F. Jorna, ‘Digital Data and the City. An exploration of the building blocks of a Smart City Architecture’, D.P. Baker, W. Evans (eds.), Digital Information Strategies. From Applications and Content to Libraries and People (Waltham, MA USA: Chandos Publishing, 2016), Chapter 13, pp. 185-198). PDF

 

Share This:

In data we (don’t) trust!

Halo Business Intelligence publiceerde in juli 2015 de onderstaande visualisatie over de betrouwbaarheid van data binnen bedrijven. Als iets de noodzaak illustreert voor een een meer gestructureerder management van informatie is het wel dit. Is deze visualisatie zelf betrouwbaar? Eerlijk gezegd heb ik geen idee, maar het bevestigt wel het beeld dat ik in de afgelopen jaren zelf gecreëerd heb op basis van de ervaringen uit mijn eigen beroepspraktijk.

data-quality-infographic

Share This:

The Second Machine Age

In de afgelopen jaren hebben computers geleerd om ziekten te herkennen, auto’s automatisch te besturen, proza te schrijven en Jeopardy te winnen. Deze ontwikkelingen hebben voor ongekende economische mogelijkheden gezorgd, maar tegelijkertijd heeft het ervoor gezorgd dat het gemiddelde inkomen gestagneerd is en is het deel van de bevolking met werk gedaald. Erik Brynjolfsson en Andrew McAfee maken de technologische krachten die deze heruitvinding van onze economie veroorzaken duidelijk en geven aan hoe dit mogelijkerwijze onze welvaart kan verhogen. Zij stellen dat mensen ‘must learn to race with machines’.Ze identificeren de beste strategieën om dat te doen, zoals ‘honing the ability to mix and match different technological resources and designing new collaborations that pair brute processing power with human ingenuity’. In deze video, gemaakt van een duo-presentatie bij Google, gaan ze in op dit thema en beantwoorden ze in een Q&A vragen van aanwezigen. Het is een intrigerend thema. De enorme opmars van de ‘intelligente’ machines gaat een enorme impact hebben op onze maatschappij, en als een ding duidelijk is, is dat we daarop op geen enkele wijze voorbereid zijn….

Brynjolfsson en MacAfee’s boek, The Second Machine Age, is een inherent optimistisch boek, dat echter van ons een radicale verandering in denken verwacht over technologische, maatschappelijke en economische vooruitgang. Voor het boek klik hier.

Share This:

Fijne Kerstdagen en een geweldig 2016 !!!

Kerst en Nieuwjaar

Share This:

Toegankelijk

Volgens McKinsey besteedde iedere werknemer in 2013 gemiddeld 9½ uur per week aan het zoeken en verzamelen van informatie, ongeacht de informatietechnologie die wordt gebruikt. Op iedere vijf personeelsleden is er dus een die alleen bezig is met zoeken naar informatie! Het wijst op de grootste uitdaging van de ‘information age’: het toegankelijk houden van een steeds grotere hoeveelheid informatie.

Dat is ingewikkeld.

Vooral omdat toegankelijkheid moet worden gerealiseerd ongeacht vorm, plaats, taal, technologie, handicap of capaciteiten!

Vijf voorwaarden moeten worden ingevuld.

Allereerst is er de (informatie-infrastructurele) voorwaarde van vindbaarheid. Waar is de informatie? Op welke webpage staat het, in welke map of database ‘zit’ het? Welke (analoge of digitale) repository bevat de informatie? Hoe is het ontsloten? Welke zoekmachine is het meest geschikt?

Als een gebruiker weet waar de gezochte informatie is, komt de tweede voorwaarde in het spel: beschikbaarheid. Weten waar de informatie is, wil nog niet zeggen dat die informatie ook beschikbaar is. Paywalls of handicaps kunnen de beschikbaarheid verhinderen, er kunnen embargo’s, wetten of vertrouwelijkheden zijn, de technologie is niet (meer) aanwezig om de media te lezen waarop de informatie is vastgelegd.

Is de informatie vindbaar en beschikbaar, dan kan de derde voorwaarde gerealiseerd worden: toegankelijkheid. Dat betekent dat de informatie gezien kan worden, gevoeld, gehoord, geroken en/of geproefd, ongeacht handicaps van de gebruikers. De gebruiker heeft mogelijkheden om die informatie te ‘lezen’ en te gebruiken, mits ‘assistive technologies’ beschikbaar zijn om gebruikers te laten zien, voelen, horen, ruiken of proeven.

Vindbaarheid, beschikbaarheid en toegankelijkheid zijn nutteloos als de informatie niet wordt begrepen. De vierde voorwaarde is begrijpelijkheid. Als het gesteld is in een taal die de gebruiker niet beheerst (Chinees?), of in moeilijk jargon (‘legalese’?), of in een moeilijk leesbaar schrift (‘paleografie’?), of ….. Iets begrijpen vergt hulpmiddelen (vertaalsoftware, e.d.), maar vooral kennis en vaardigheden bij de gebruiker. ‘Information literacy’, dus.

De vijfde voorwaarde van toegankelijkheid is contextualiteit. De gebruiker moet kunnen achterhalen in welke context de informatie ontstaan en beheerd is, zodat de betrouwbaarheid van die informatie bepaald kan worden. Het kunnen interpreteren van de contextaliteit geeft de gebruiker de mogelijkheid de omstandigheden waarin de informatie ontstaan, bewerkt, gebruikt en beheerd is te reconstrueren en de oorspronkelijke informatiewaarde te bepalen. Deze vijfde voorwaarde is het meest complex, omdat context slechts beperkt kan worden vastgelegd in metadata.

Gebruikers van informatie zijn afhankelijk van de beschrijvende capaciteiten van de oorspronkelijke gebruikers en beheerders.

In de meeste organisaties gaat het al fout met de vindbaarheid. Anders kostte het zoeken naar informatie niet zo veel tijd…

Voor de eerste keer gepubliceerd in IP. Vakblad voor Informatieprofessionals, 2015, nr. 9, p. 38.

Share This:

Digital Vellum: Vint Cerf at Università Telematica Internazionale UNINETTUNO, 2014.

Een ICT grootheid horen spreken over Digital Preservation en het belang van het behouden van informatie? Kijk en luister naar deze voordracht van Google’s Chief Internet Evangelist Vint Cerf (een van de mede-uitvinders van het Internet) over zijn (en Google’s) Digital Vellum.

Een interessante voordracht. In plm. 15 minuten loodst deze techneut je door het probleem van digitale duurzaamheid.

Digitale Duurzaamheid is ‘ineens’ op de agenda gezet. Dat gebeurt pas als een erkende ICT grootheid (wat Cerf onmiskenbaar is!) het als een probleem definieert.

Ongeacht de wetenschappers en archivarissen die er zich al druk over gemaakt hebben! En als het echt op de agenda staat, komen we steeds dichter bij een ‘oplossing’.

Share This:

Digitaal Geheugenverlies

De VPRO-documentaire Digitaal Geheugenverlies concentreert zich op de duurzaamheid van moderne artefacten zonder een materiële vorm. Een documentaire die inzicht biedt in de rol van de archivaris voor het in stand houden van informatie ‘door de eeuwen en eeuwen’. De film waarschuwt voor de gevolgen van maatschappelijk geheugenverlies. Een van de aanleidingen voor de film was de onbegrijpelijke beslissing van de Nederlandse overheid om de bibliotheek van het Koninklijk Instituut voor de Tropen zonder slag of stoot ‘weg te bezuinigen’, zonder voor rede vatbaar te zijn.

Deze video kan alleen bekeken worden via de site van de VPRO via deze link:

Digitaal Geheugenverlies

Share This:

Menselijk

Archivarissen en bibliothecarissen zijn vol van digitale duurzaamheid. Ze hebben het over een ‘Digital Dark Age’ en over de technologie die dat veroorzaakt en moet oplossen. De aandacht voor het voortbestaan van informatie is terecht, zeker voor wat betreft het dynamische Internet. Het web is immers voor het ‘nu’. Een gemiddelde webpagina verdwijnt volgens schattingen na 100 dagen.

Juist dat dynamische karakter van het web schept uitdagingen. Websites en –pagina’s kunnen onzichtbaar worden zonder dat ze door bijvoorbeeld de Wayback Machine zijn vastgelegd. De belangrijkste reden is verwaarlozing door de eigenaren, waaronder het niet verlengen van domeinregistraties, het veranderen van URL’s, het niet maken van backups, het niet betalen van de webhosters of het wissen of overschrijven van bestanden.

Concurrentie tussen webgiganten als Google, Microsoft en Yahoo! leidt tot agressieve verwerving van populaire webdiensten, die dan worden verlaten, opgeheven of opgenomen in grotere platforms, met het onzichtbaar worden van webcontent als gevolg. Het niet hebben van backups blijkt dan funest. Webarchiveringsdiensten, zoals The Internet Archive, kunnen door de rechter verplicht worden om websites, -pagina’s of content te verwijderen. Onzichtbaar worden heeft veelal niets te maken met technologie.

Datzelfde geldt voor hyperlinks, die door het onzichtbaar worden van webpagina’s nutteloos worden. Bij ‘link rot’ kan de hyperlink de betreffende webpagina niet meer vinden, bij ‘reference rot’ is de (nog steeds zichtbare) webpagina gewijzigd. In een analyse uit 2014 van de Chesapeake Digital Preservation Group blijkt dat 51% van de URL’s vanaf 2007 niet meer beschikbaar is. Meer dan 70% van de URL’s in drie juridische tijdschrifen van Harvard lijdt aan ‘reference rot’. Het is te vermijden, zonder afhankelijk te zijn van de website waarnaar de link verwijst: archiveer de bron waarnaar de link verwijst bij bijvoorbeeld WebCite.org of zorg voor een Digital Object Identifier. De content is dan met een unieke sleutel altijd terugvindbaar.

Als een website of webpagina verdwijnt betekent dat niet dat alle content verdwenen is. In bijna alle gevallen bestaat die nog steeds binnen de infrastructuur van de website-eigenaar, maar is de toegankelijkheid via het web verdwenen. Dat wil niet zeggen dat informatie niet daadwerkelijk kan ‘verdwijnen’. Dat heeft meestal niets te maken met de beperkte duurzaamheid van de technologie. Data Recovery heeft zich dusdanig ontwikkeld, dat bijna alles reconstrueerbaar is, al kost dat (erg) veel geld. David Rosenthal, van Stanford University, stelt dat de reden voor het verdwijnen van informatie niet primair technologisch is, maar vooral te maken heeft met menselijke fouten, afwegingen en handelingen.

Die menselijke factor wordt nooit benoemd in discussie over duurzaamheid. Het wordt tijd dat die discussie niet alleen gaat over technologie, maar ook over de rol van de professional. Duurzaamheid is een menselijk fenomeen.

Voor de eerste keer gepubliceerd in IP. Vakblad voor Informatieprofessionals, 2015, nr. 8, p. 25.

Herdrukt in: W. Bronsgeest, M. Wesseling, E. de Vries, R. Maes, Informatieprofessional 3.0. Strategische vaardigheden die u connected houden (Amsterdam: Adfo Books, 2017), pp. 222-223.

Share This:

Embedding Privacy in ICT Architectures

Van 23 – 26 oktober 2015 vond in Amsterdam de Amsterdam Privacy Conference plaats, georganiseerd door het Amsterdam Platform for Privacy Research (APPR). Dit is een samenwerkingsverband van privacy onderzoekers binnen de Universiteit van Amsterdam vanuit verschillende achtergronden en disciplines. De conferentie werd uitzonderlijk druk bezocht door rechtswetenschappers, privacy-juristen, informatici, politicologen, cryptologen, e.d. ‘from all around the world’. Samen met John van der Pas (Saxion Hogeschool) presenteerde ik daar een paper waarin we de stelling verkondigen dat de privacy van een burger (en zeker in het Big Data tijdvak!) alleen beschermd kan worden wanneer zijn belang op privacy en de bescherming van zijn persoonsgegevens meegenomen wordt in de ontwikkeling van soft- en hardware-architecturen. We beginnen deze paper als volgt:

“According to Johnson & Grandison (2007), failure to safeguard privacy of users of services provided by private and governmental organisations, leaves individuals with the risk of exposure to a number of undesirable effects of information processing. Loss of control over information about a person may lead to fraud, identity theft, reputation damage, and may cause psychosocial consequences ranging from mild irritation, unease, social exclusion, physical harm or even, in extreme cases, death. Although pooh-poohed upon by some opinion leaders from search engine and ICT industries for over a decade (Sprenger, 1999; Esguerra, 2009), the debate in the wake of events like the tragic case of Amanda Todd could be interpreted as supporting a case for proper attention to citizens’ privacy. Truth be told, for a balanced discussion on privacy in the age of Facebook one should not turn towards the social media environment that seems to hail any new development in big data analysis and profiling-based marketing as a breathtaking innovation. If the myopic view of technology pundits is put aside, a remarkably lively debate on privacy and related issues may be discerned in both media and scientific communities alike. A quick keyword search on ‘privacy’, limited to the years 2000-2015, yields huge numbers of publications: Worldcat lists 19,240; Sciencedirect 52,566, IEEE explore 71,684 and Google scholar a staggering 1,880,000. This makes clear that privacy is still a concept considered relevant by both the general public and academic and professional audiences. Quite impressive for a subject area that has been declared ‘dead’”.

Citatie: J. van de Pas, G.J. van Bussel, ‘Embedding Privacy in ICT Architectures. The citizen as public stakeholder in architecture development’, B. van der Sloot (red.), Proceedings of the Amsterdam Privacy Conference (21-26 October 2015), Amsterdam (Amsterdam: APPR, 2015), 14 pages, incl. references (only available on USB). PDF

Share This:

Quantum computers in a nutshell

Een korte film (half uur) over het ontstaan en de mogelijkheden van de quantumcomputer. Een interessante blik op een ontwikkeling die steeds meer de toekomst van informatietechnologie gaat bepalen. Voor leken begrijpbaar en zeer aanbevolen om op de hoogte te raken van de voordelen van deze vorm van computers.

Share This: