BBC Click onderzoekt wat er gebeurt met de data die worden verzameld van ons online gedrag. Een recapitulatie van de effecten van de GDPR. Een film van 25 minuten.
Tag Archives: Big Data
In the Age of AI
Een documentaire die onderzoekt hoe Artificial Intelligence het leven zoals we dat kennen aanzienlijk aan het veranderen is.: van banen, privacy en een groeiende rivaliteit tussen de Verenigde Staten en China. In deze documentaire worden de beloften en bedreigingen van Artificial Intelligence an automatisering onderzocht, waardoor een nieuwe industriële revolutie ontstaat die onze wereld zal hervormen en die (in het ergste geval) een surveillance maatschappij zal doen ontstaan. Het is een interessante film, maar ook een waar je niet echt vrolijk van wordt. Het is een hele zit (bijna 2 uur), maar het is wel de moeite waard om te kijken.
What is Knowledge in the Age of Big Data?
A TEDx Square Mile-Talk, door Timandra Harkness
Een zeer relevante vraag: wat is kennis eigenlijk nog als we alles hebben gedataficeerd ? Bestaat het nog ? Of is het een misvatting te denken dat data, informatie en kennis hetzelfde zijn en met een druk op de knop uit Big Data kan worden gepresenteerd ?
Het is een misvatting. En volgens Timandra Harkness is het een gevaarlijke misvatting, zoals blijkt uit de introductie bij de film:
“In the internet age, all human knowledge is only three clicks away – can that be true ? Is knowledge no more than information, or data ? What does it mean to know something, or somebody ? Can a machine know you better than you know yourself ?”
“The reduction of human knowledge, expertise, experience and understanding to stores of data is a fundamental and dangerous mistake”.
“Meaning, reasoning and understanding are not commodities but verbs. To fully benefit from the proliferation of information in the Big Data age, we must restore the human mind to the act of knowing”.
Timandra Harkness presenteert de BBC Radio 4 serie, FutureProofing, en documentaires zoals “Data, Data Everywhere”, “Personality Politics & The Singularity”. Ze is Visiting Fellow (Knowledge Exchange) in Big Data, Information Rights and Public Engagement bij het Centre for Information Rights van de Universiteit van Winchester. In 2016 publiceerde zij het boek Big Data: does size matter?
Paradox. A Digital Analytics Documentary
Opgenomen in januari 2019, tijdens de Superweek, een bijeenkomst van digitaal analisten, wetenschappers, denkers en marketeers.
Een inspirerende maar ook verontrustende video over Big Data analyse en de verschillende paradoxen die hierdoor ontstaan. Zoals het feit dat staten volledige surveillance willen reageren op basis van dat zonder enige transparantie (denk aan China), maar dat ICT-bedrijven die analyses uitvoeren (terecht, overigens) aan allerlei beperkingen worden onderworpen.
Maar ook de paradox dat meer data niet betekent dat de uitkomsten beter worden. ‘It can be. If all that data is leading to Analysis Paralysis … or if it leads to falling in love with data analysis itself and forgetting real business outcomes (the reason why you got money for funding the collection of all that data). If no one is using this mountain of data for solving problems, then it’s better that the data not be collected at all’.
Moeten we steeds doorgaan met het verzamelen van data?
Datakwaliteit wordt steeds belangrijker. En hoewel in business analytics de kwaliteit van data over het algemeen redelijk is (niet optimaal, dat is het nooit geweest), is het in web analytics uitermate slecht.
En uiteindelijk is data net zo goed als degene die de data interpreteert. Datakwaliteit alleen zegt niet zo heel veel als de interpretatie hapert, bij de mens of bij het algoritme.
Wat absoluut nodig is, is een nieuw digitaal sociaal contract gebaseerd op wederzijdse transparantie tussen staten en hun burgers.
Genoeg voer om over na te denken en verplichte kost voor ieder data scientist.
Amazon, Jeff Bezos and collecting data
Geen bedrijf dat meer data verzameld en opslaat dan Amazon, voorheen alleen maar een online boekverkoper. Jeff Bezos, de baas van het bedrijf, is een van de rijkste mannen ter wereld geworden. Elke tweede euro in online handel wordt besteed bij Amazon.
Over Amazon, dataverzameling en wat het bedrijf daarmee kan doen: daar gaat deze video over. Het is een documentaire van DW Documentary. Zie hier hoe de documentaire wordt geïntroduceerd:
‘Is the IT giant, with its unabated growth, about to turn our economic system upside down? Amazon is a machine that can simultaneously observe, compare and analyze more than 300 million people worldwide. The company is not just a marketplace, market supervisor and provider of more and more services and consumer items – it also controls all the data streams in this market and uses them to its own benefit. Who suspects that a single click on an Amazon page will forward information to the company that fills a printed DIN-A-4 page? A conversation with Alexa, watching a streaming offer on Amazon-Prime, ordering vegetables via Amazon-Fresh – all this put together creates a whole library of information about every customer. The group collects everything – it just won’t reveal what conclusions it draws from it. What would be possible if data from other, new business areas were added? In the USA, Amazon is also active in the health and insurance sectors, and police officers are using its facial recognition software to search for wanted persons’.
Deze documentaire van mei 2019 is dan ook een ‘must see’!
Data Never Sleeps
De schatting is dat in 2020 1,7 MB aan data wordt geproduceerd door iedere persoon per seconde. Dat is een gigantische hoeveelheid. De 6de editie van ‘Data Never Sleeps’ geeft een overzicht van de enorme hoeveelheden data die in 2018 iedere minuut worden geproduceerd. De infographic spreekt voor zichzelf.
Warped priorities in the Information Age
In de tijd van Twitter kan informatie en kennis sneller plaatsvinden dan ooit tevoren. Hoe gebruiken we echter dit communicatiekanaal? Zoals de samensteller van deze infographic aangeeft: ‘Well, we mostly use it to talk about a bunch of useless crap’. Beetje sterk uitgedrukt, maar het geeft (voor de US in ieder geval voor wat betreft 2013) enkele voorbeelden die dat wel bevestigen. Interessante infographic, die vastlegt wat wel veelal het gevoel is bij deze social media.
Data never sleeps
Domo presenteerde voor de vijfde keer de ‘Data Never Sleeps 5.0’ infographic. De infographic geeft een visueel overzicht van het online gedrag van de internetgebruikrs. De infographic laat zien hoeveel data elke minuut online gegenereerd worden op de populaire platformen, zoals Snapchat, Instagram, Amazon, Twitter, Netflix, Spotify en anderen. Domo introduceerde deze infographic voor het eerst in 2013, als een snapshot in het volume en de snelheid waarin data online worden gegenereerd en gedeeld.
Big Data: Biomedicine
Een korte film van ongeveer 20 minuten over de effecten van big data op de ontwikkeling van biomedisch onderzoek. Digitale data worden verzameld en geanalyseerd. De structurering, het delen en het analyseren van deze data zijn cruciaal voor de toekomst van de geneeskunde. Een snelle blik in de ontwikkelingen en de toepassing van big data analyse in biomedische gegevens.
Big Data Revolution
Big Data in a nutshell! Een PBS documentaire over Big Data en wat er mee kan, wat de prijs is die daarvoor moet worden betaald en hoe niet-democratisch gecontroleerde partijen kunnen doen en laten wat ze willen. Tenminste, daar lijkt het op…..
The Joy of Data
In deze BBC documentaire verkent de wiskundige Dr Hannah Fry de wereld van data, de wijze waarop het wordt verzameld, opgeslagen, gedeeld en van betekenis voorzien. De ‘Joy of Data’ is over het ontdekken van patronen. Fry ziet data als de brug tussen de gewone, fysieke wereld en de geordende wereld van de wiskunde, waar alles gevangen kan worden in wiskundige vergelijkingen en formules. Het gaat over de verbinding tussen Scrabble en online streaming, verklaart waarom melkkoeien stappenmeters om hebben en onthult het netwerk achter Wikipedia. Fry benadrukt de rol van Claude Shannon, die een manier bedacht om informatie te digitaliseren. Het op een voetstuk plaatsen van Shannon slaat door, maar het blijft een mooie en interessante documentaire. Fry concludeert uiteindelijk dat ondanks alles de mens nodig zal zijn om data betekenis te geven.
Big Earth Data: The Film.
Wetenschappers dienen ‘de maatschappij’ op de hoogte te stellen van wat ze doen, welke resultaten ze bereiken en wat de gevolgen en implicaties zijn daarvan. Wetenschappelijk onderzoek is vaak erg moeilijk te communiceren naar een lekenpubliek en goede simplificaties vereist grote inspanning. Daarnaast zijn de media niet altijd geïnteresseerd in wetenschappelijk onderzoek. Het maakt het dus moeilijk om het publiek te informeren wat een wetenschapper onderzoekt en het draagt ook niet echt bij aan wetenschappelijke waardering. Publicaties in belangrijle tijdschriften worden al veel belangrijker gezien.
De TV documentaire ‘Big Earth Data’ vergde lange tijd om een producer te vinden die begreep dat het niet om de aarde en de natuur zelf ging, maar over het menselijke inzicht dat verworven kan worden uit de softwareondersteunde analyse van enorme hoeveelheden data. De resulterende 53 minuten lange film werd uitgezonden in februari 2015 en maakt duidelijk welke uitdagingen er zijn in het managen, analyseren, visualiserenen gebruiken van Big Data. De film presenteert dat proces op begrijpelijke en aandachtvragende wijze. De film duurt lang, maar geeft ook een heel goed inzicht in Big Data en Big Data analysis.
Privacy, Data, Democracy
‘We need to move beyond the Silicon Valley model’.
Aral Balkan is oprichter en beangrijkste ontwikkelaar van Ind.ie, een bedrijf dat onafhankelijke alternatieven maakt voor ‘spyware 2.0’. Aral benadrukt dat wij als individuen het eigendom en de controle over onze ‘digitale identiteiten’ moeten hebben. We zijn produkten geworden die bedrijven verkopen aan hun klanten. Dat is het business model van Silicon Valley, wat door wetgevers onvoldoende wordt bestreden. Hij wil met zijn werk fundamentele vrijheden, mensenrechten, en democratie beschermen door onafhankelijke technologie te ontwerpen die niet spioneren op hun gebruikers. Aral heeft het Ind.ie Manifesto geschreven.
Op dit moment werkt hij aan de core van het Ind.ie platform, een gedistribueerd social network: Heartbeat.
In deze video vertelt hij over Heartbeat, en allerlei aspecten inzake privacy, data en democratie. Duidelijk wordt waarom het model van Silicon Valley dient te veranderen.
Hij vertelde dit verhaal op The Conference 2015 in Malmö.
Digital Data and the City
Nog net voor het sluiten van 2015 verscheen de digitale versie van een artikel over digitale data en de ‘smart city’, een hoofdstuk geschreven in samenwerking met John van de Pas, Mettina Veenstra en Frans Jorna (allen van Saxion Hogescholen). In dit hoofdstuk beschrijven we de bouwblokken van een Smart City Architectuur, waarin wij Informatiemanagement (op basis van Informatiewaardeketen en de Vier Dimensies van Informatie) de plaats geven die het verdient, namelijk als een separaat bouwblok. Het is de eerste keer dat informatiemanagement als een dergelijk fundamenteel onderdeel van een Smart City Architectuur wordt gepositioneerd. We publiceren hier een pre-press van dit hoofdstuk, die in lichte mate afwijkt van het uiteindelijk gepubliceerde. Graag naar het definitieve hoofdstuk verwijzen bij gebruik als referentie. Het boek zelf is verschenen in januari 2016.
Citatie: J. van de Pas, G.J. van Bussel, M. Veenstra, F. Jorna, ‘Digital Data and the City. An exploration of the building blocks of a Smart City Architecture’, D.P. Baker, W. Evans (eds.), Digital Information Strategies. From Applications and Content to Libraries and People (Waltham, MA USA: Chandos Publishing, 2016), Chapter 13, pp. 185-198). PDF
Over Cloud en Big Data – artikel in META
In META. Tijdschrift voor Bibliotheek en Archief, 2015, nr. 4, blz. 32-35, verscheen mijn artikel ‘Over Cloud en Big Data. Uitdagingen en onontkoombaarheid’. Het is als PDF te downloaden.
Ik sluit dat artikel af met de volgende bespiegeling:
“Cloud computing wordt in tijden van bezuiniging vooral gezien als een mogelijke en interessante automatiseringsoptie, ook in bibliotheken, musea en archieven. Het concept biedt vele mogelijkheden om kosten te besparen en tegelijkertijd kwaliteit en performance te verhogen. Uiteraard kunnen die laatste twee alleen indien de hiervoor aangegeven uitdagingen en juridische complicaties kunnen worden ondervangen. Veel organisaties zijn echter vooral gecharmeerd door de kostenverminderingen die kunnen worden gerealiseerd en de mogelijkheden om de eigen, complexe informatie infrastructuren af te bouwen. Ze zijn zich niet echt bewust van de potentiële problematiek, die cloud computing en Big Data met zich meebrengen. Juist die uitdagingen en complicaties echter oefenen rechtstreeks invloed uit op de performance van bedrijfsprocessen en zijn niet zomaar te ondervangen. Dat vergt nogal wat, waardoor het van belang is de organisatorische risico’s goed in kaart te brengen en af te wegen.”
Citatie: G.J. van Bussel, ‘Over Cloud en Big Data, Uitdagingen en onontkoombaarheid’, META. Tijdschrift voor Biblotheek en Archief, 2015, nr. 4, pp. 32-35.
Big Data Bla Bla
In 2008 schreef Chris Anderson, een redacteur bij Wired, dat de zondvloed aan data (later Big Data genoemd) en nieuwe analysetools de wetenschappelijke methode onnodig maakten en een nieuwe manier waren om de wereld te begrijpen. ‘Correlation supersedes causation, and science can advance even without coherent models, unified theories, or really any mechanistic explanation at all’.
Big Data blabla-ers (ook evangelisten genoemd) hebben deze idee met vele anekdotes ondersteund en verkondigd. Volgens hen breekt er een nieuwe tijd aan: de dataficatie van onze maatschappij maakt alles meetbaar en doet alle bestaande problemen verdwijnen. Gemakshalve wordt er aan voorbij gegaan dat (zoals onderzoeksbedrijf Gartner stelt) 55% van alle Big Data projecten mislukt, vooral omdat ze niet de optimistische resultaten leveren die vooraf zijn ingecalculeerd. Zélfs het paradepaardje van de Big Data evangelisten niet: het in 2008 gestarte Google Flu Trends (GFT). Het geprofeteerde succes bleek rafelrandjes te kennen. In 2014 werd in Science aangetoond dat de resultaten (nog steeds) niet overeenkwamen met de ‘echte’ feiten. Het voorspellen van grieptrends lukte vele malen beter met drie weken oude, op traditionele wijze verzamelde en geanalyseerde gegevens van griepcentra.
Het hebben dus van Big Data (vijfhonderd miljoen zoekvragen per dag!) wil niet zeggen dat visualisaties daaruit een accuraat beeld presenteren van wat er werkelijk gaande is. Dat kan niet als (zoals bij GFT) de gebruikte gegevens onbetrouwbaar en onjuist zijn en/of de verkeerde gegevens zijn verzameld of geselecteerd. In Science werd aangetoond dat betrouwbare voorspellingen voor de verspreiding van griep mogelijk zijn als de analyses uit Big Data gecombineerd worden met traditionele, wetenschappelijke vormen van gegevensverzameling en -analyse. Een van de problemen van GFT (en andere analyses uit Big Data) is dat de resultaten veelal niet gerepliceerd kunnen worden. Dit komt vooral doordat algoritmen, formules, zoektermen en dataselecties geheim zijn en eigendom van private bedrijven.
Ik waag te betwijfelen of we wel alleen op data kunnen vertrouwen als indicator voor beslissingen, welvaart of zingeving. Jay Liebowitz propageert in zijn boek Bursting the Big Data Bubble om naast de resultaten van data analyse in beslissingsprocessen (met dan ook nog een voorkeur voor ‘small data’) ruimte te laten voor ervaring en intuïtie.
Het is zeker dat door ervaring en intuïtie fouten gemaakt (en voorkomen!) worden. Het is zeker dat data beslissingen kunnen verbeteren (als ze objectief worden gebruikt!). Het is ook aangetoond dat we gegevens negeren als ze niet overeenkomen met wat we subjectief denken (zelfs als de objectiviteit van die gegevens vast staat!).
Big Data evangelisten verkondigen dat ‘you can only manage what you measure’. Blabla. Want de financiële crisis heeft aangetoond dat we slecht zijn in het managen van wat we meten. Mislukte fusies en productlanceringen, veelvuldige imagoproblemen en social media escapades geven aan dat we vooral beter moeten worden in het managen van datgene wat we niet kunnen meten.
Met of zonder Big Data.
Voor de eerste keer gepubliceerd in IP. Vakblad voor Informatieprofessionals, 2015, nr. 4, p. 25.
Herdrukt in: W. Bronsgeest, M. Wesseling, E. de Vries, R. Maes, Informatieprofessional 3.0. Strategische vaardigheden die u connected houden (Amsterdam: Adfo Books, 2017), pp. 217-218.
Big Ideas: Demystifying Hadoop
Patricia Florissi (EMC Americas/EMEA CTO) publiceert regelmatig video’s waarin nieuwe ontwikkelingen op begrijpelijke wijze worden uitgelegd. Dit keer gaat het over Hadoop, een beangrijk verschijnsel in het Big Data-tijdperk. Het gaat in op de geschiedenis, de architecturele principes en de functies van het platform. Nuttig om te bekijken! Het vergt even een wenningsproces aan het accent, maar als dat eenmaal ‘gevallen’ is, is het een interessante, nuttige en vermakelijke 20 minuten.
Big Data and its Dark Side
Op 6 maart 2013 hielden Viktor Mayer-Schoenberger en Neil Cukier een voordracht over Big Data en vooral over de ‘donkere kant’ van deze Big Data op een door het Berkman Center van de Harvard University georganiseerd seminar hierover. De voordracht werd als volgt aangekondigd: ‘The power of big data—analyzing huge swaths of information to uncover insights and make predictions that were largely impossible in the past—is poised to transform business and society. Yet there is a dark side. Privacy is eroded like never before. And a new harm emerges: predictions about human behavior that may result in penalties prior to actual the infraction being committed. In this talk Viktor Mayer-Schönberger—Professor of Internet Governance and Regulation at Oxford—and Kenneth Neil Cukier—Data Editor of The Economist—take a look at big data’s power, the dangers it poses and how to address them’. Nog in ‘the mood’ van de KVAN Dagen 2014 in Assen over ‘Big Archives’ is deze voordracht wel heel interessant voor iedere informatieprofessional.
Disaster Big Data? The key to recovery
De Japanse aardbeving van 11 maart 2011 (met de tsunami die daaraan gepaard ging) heeft enorme hoeveelheden data achtergelaten in cyberspace. Deze data vertellen het verhaal van de mensen tijdens (en na) deze ramp. Die data worden Disaster Big Data genoemd. Wat kunnen deze data betekenen voor de toekomst van de heropbouw van dit land?
Deze video is niet meer beschikbaar.
The age of Big Data: voorspellen met data
Een van de genoemde ‘benefits’ van Big Data is het kunnen voorspellen van wat er gaat gebeuren op korte termijn. Dus bijvoorbeeld het voorspellen van criminele handelingen of het plotselinge stijgen of dalen van aandelenkoersen. Of dat werkelijk zo is en ook leidt tot een daadwerkelijke aanpassing van werkwijzen moet nog worden aangetoond. De BBC documentaire Horizon besteedde aandacht aan deze “Age of Big Data” in 2013. Het is een introductie in het fenomeen. De documentaire duurt een uur, maar het is de moeite waard om een idee te krijgen over wat er allemaal ‘zou kunnen’ en de verwachtingen die kunnen ontstaan.
11 februari 2015: de oorspronkelijke film is verwijderd. We verbinden nu met een gecomprimeerde (spaans ondertitelde) versie van 16 minuten.
The Age of Big Data – Recorte do Documentário da BBC. from Carlo Caricchio on Vimeo.