De bijgaande infographic is afkomstig van John Bell. Bell is de HASTAC scholar 2013. HASTAC is het Humanities, Arts, Science and Technology Advanced Collaboratory, ‘an organization of more than 10,000 individuals and institutions dedicated to innovative new modes of learning and research in education from kindergarten to post-graduate’. De bijgaande infographic was een presentatie voor de AMIA (Association of Moving Image Archivists) en van zijn bijdrage aan Digital Humanities Week van 2013. De infographic geeft in kort bestek aan de waarde van bestandsformaten en media voor ‘information survival’.
Category Archives: Opslag (Storage)
80 % of an organization’s information is unstructured….
The costs of storage hardware
Deze infographic brengt de kosten van opslagapparatuur in kaart vanaf 1956. Het gaat uiteraard om de opslaghardware; de kosten van dataopslag zijn uiteraard vele malen hoger, rekening houdend met de organisatie van informatiemanagement er omheen. Maar dit brengt fraai de kosten van de opslagmiddelen in beeld, inclusief de kosten van inflatie.
De kosten van dubbele (medische) dossiers
Het aantal dubbele medische dossiers groeit exponentieel in de gezondheidszorg met de in gebruikname van deelbare electronische medische dossiersystemen. Vooral bij registratie in ziekenhuizen zelf worden vaak meerdere dossiers aangemaakt voor eenpatient. Daarnaast bestaat er vaak ook nog allerlei files over patienten, die niet in de elektronische medische dossiers wordt opgenomen. Problematisch dus.
‘Missing or incorrect information in duplicate medical records can causes severe injuries, illness and even death. Duplicate medical records and overlays also leads to reimbursement losses, administrative inefficiencies, resource drains, liability concerns, and perhaps most significantly, compromised care delivery and threats to patient safety’, zo wordt in een studie van de John Hopkins University gesteld..
Deze infographic is gemaakt door M2SYS, een leverancier van biometrische identitificatiesystemen voor de zorg. Of de geboden ‘oplossing’ ook werkelijk de oplossing is: dat valt te bezien. Hier komt uiteraard het belang van de producent van deze infographic naar boven.
Waar vind je Big Data ?
De volgende infographic van Kapow Software maakt duidelijk waar Big Data ‘gevonden’ worden. Of, zoals Kapow zelf stelt: ‘Learn where innovative companies are leveraging critical data from a wide variety disparate internal and external sources to meet business objectives’. We zitten er dus bovenop. Maar kunnen we er nu werkelijk wel zoveel mee ? Hoe harder geroepen wordt dat Big Data ontzettend beangrijk zijn, hoe meer ik me afvraag of dat ook werkelijk wel zo is….
The past, present and future of Data Storage
Kijken we naar gegevensopslag dan heeft dat een erg lange geschiedenis. De infographic van mozy.com laat dat heel mooi zien en doet tevens een duit in het zakje, daar waar het de toekomst betreft. De infographic besteed alleen aandacht aan de gegevensdragers, niet aan wat er nodig is om data te repliceren. Het geeft dan ook alleen de geschiednis weer van de gegevensdragers. Desalniettemin: een interessant plaatje….
The times really are changing
Waarschijnlijk loopt er niemand meer rond die denkt dat er het afgelopen decennium niets is veranderd. Dat visueel te zien maakt het wel wat pregnanter. De onderstaande infographic geeft aan hoezeer media zijn veranderd in de jaren tussen 2000 en 2010. Zouden we het doortrekken naar 2013 dan wordt het verschil nog veel groter.
OpenStack: building a free massively scalable cloud computing platform
Cloudaanbieders willen een alternatief voor de gesloten oplossingen van Microsoft, VMware en Amazon: er zijn immers significante risico’s verbonden aan het gebruiken van één aanbieder. Er is behoefte aan een besturingssyteem dat zich als Linux van de cloud kan positioneren. Openstack van Nasa en Rackspace ontwikkelt zich snel in een halfjaarlijkse release-cycle en er wordt geen poging gedaan aan te sluiten bij gesloten oplossingen zoals die van Amazon. Openstack zorgt ervoor dat potentiële gebruikers een duidelijk open source alternatief hebben.
Onderstaande video laat een presentatie zien van Soren Hansen, een van de ontwikkelaars van Openstack, die het volgende stelt over zijn presentatie: ‘We’ll take a detailed look at the architecture and dive into some of the challenges we’ve faced building a platform that is supposed to handle millions of gigabytes of data and millions of virtual machines, and how we’ve dealt with them’.
Het is een 50-minuten durende presentatie, maar ‘it’s worth your time’. Het beantwoordt nog lang niet alle vragen, maar het zorgt er wel voor dat de afhankelijkheid van cloud-leveranciers minder wordt en dat de ‘cloud’ meer ‘open’ wordt.
The state of cloud computing in 2013
Een nieuwe infographic van Nasuni.com: the state of cloud computing 2013. Deze infographic geeft het spel der giganten aan in hun prestaties bij de levering van cloud diensten. Er is ook een white paper bij geschreven die hier gratis is te downloaden.
The art of Digital Preservation
Preservica heeft een mooie video op haar site staan over digitaal behoud met daarbij de volgende tekst:
‘Safeguarding your digital assets requires much more than secure data archiving or storage. Technology evolves, formats become obsolete, organizations change….digital information that’s important today may be lost or become unreadable in the future. That’s why Active Preservation is important. It can help you to find and read that vital contract, research project, product design, or marketing video – for years to come.’
Ja, dat is allemaal waar. De video:
It’s 2013, people !
Een beetje humor is nooit weg ! Alhoewel: wie heeft het beter geregeld ?
Ontleend aan de Doghousediaries.
What is big data ?
2012 was een belangrijk jaar coor de term ‘big data’ en maakte duidelijk dat we een nieuw tijdperk van dataconsumptie hebben bereikt. Eric Schmidt van Google maakt duidelijk hoe overweldigend onze dataconsumptie geworden is: ‘From the dawn of civilization until 2003 humankind generated five exabytes of data. Now, we produce five exabytes everyday’. Dat geeft aan hoe enorm de productie en consumptie van data is geworden.
De meeste media zijn vooral bezig met het genereren van angst voor Big Data en ze zijn genegen het vooral met het ‘Big Brother-fenomeen’ is verband te brengen. En dat is uiteraard ook niet helemaal ten onrechte, want deze data in handen van de ‘verkeerde’ persoon of organisatie kan inderdaad bedreigend zijn. Maar er zijn ook talloze voorbeelden die tonen dat we deze Big Data kunnen gebruiken om onze omgeving te verbeteren. IBM’s supercomputer Watson bijvoorbeeld gebruikt Big Data om de beste kankerbehandeling voor te stellen. Maar dat de uitdagingen voor opslag, backup, herste’, beveiliging en privacy enorm zijn kan niet ontkend worden.
De bijgaande infographic van Deloitte.nl brengt het Bi9 Data vraagstuk in kaart en legt de do’s en don’ts vast.
Big Brother is an internet company
Elke activiteit die online op Internet wordt uitgevoerd wordt vastgelegd. Niet alleen door de NSA, maar ook door de grote internetbedrijven. Alle handelingen die tijdens het afnemen van software of ‘diensten’ worden verricht worden vastgelegd in de databases van deze bedrijven. Onderstaande infographic brengt in kaart wat en hoe die bedrijven dat doen, alleen maar met het doel de gebruiker en zijn gedrag in kaart te brengen.
Deze infographic is ontwikkeld door Baynote, een bedrijf dat oplossingen ontwikkeld om de gebruikservaring van online klanten te verbeteren en (uiteraard) gebaseerd op al die verzamelde data.
Good reasons for email archiving
Het Australische SaveIt is gespecialiseerd in email archiving en heeft een mooie infographic gemaakt om het belang daarvan aan te geven. Nuttig om duidelijk te maken waarom (email) archiving van groot belang is.
The lifespan of storage media
Media zijn niet eeuwigdurend, dat blijkt uit de onderstaande infographic in ieder geval. Theoretisch en rakrisch is dat natuurlijk ook al jaren bekend. De donkergroene balk impliceert de jaren dat het medium in ‘regular use’ is; de lichtgroene balk de tijd dat het medium slechts met extreme zorg kan worden gebruikt.
Overigens: de tijd waarin het medium kan worden gebruikt zegt niets over de mogelijkheden om de informatie die daarop is weggeschreven kan worden gebruikt. Daarvoor zijn hele nadere randvoorwaarden van belang: software, besturingssystemen, hardware compatibiliteit, bestandsformaten, en zo. En uiteraard ook de ‘additional ways media can fail’, waarmee de infographic wordt afgesloten. Een belangrijk aspect voor het langdurige behoud zijn de klimatologische omstandigheden waarin de media worden beheerd. Hoe langer media worden bewaard, hoe extremer de klimaatomstandigheden in de behoudruimten afgestemd moeten worden op de media. Die effecten van het klimaat zijn in deze infographic ideaal. In werkleijkheid is dat bijna nooit zo.
De infographic is van Code 42 Software, Inc en is gemaakt in 2012.
2016: zettabyte-jaar !
Ik heb wat met infographics de laatste tijd !
Tegen het einde van 2016 zal de informatiewereld (tenminste volgens Cisco’s Visual Networking Index, de grens van de Zettabyte passeren, voornamelijk veroorzaakt door video streaming, telefonie (video calling) en mobiele streaming. Dit wordt allemaal versneld door extreem snelle internetsnelheden en data transfers. De hier opgenomen infographic visualiseert ‘how big zettabytes will be’.
De bron van deze infographic is: XO Communications, Are you Ready for 2016: The Year of the Zettabyte.
Information Risk Management
Een nieuwe infographic die de risico’s van ‘data loss’ in kaart brengt en information risk management op de kaart zet. De infographic is ontwikkeld door Iron Mountain.
What happens in 1 minute on (or related to) the internet ?
Ik heb hier twee infographics opgenomen die aangeven wat er in 60 seconden gebeurt op (of in relatie tot) het internet. De enorme activiteit die er in 1 minuut wereldwijd plaatsvindt is ‘staggering’. Laat inwerken en denk na hoe deze massa organisaties beinvloedt en of het analoge paradigma nog wel een kader biedt om deze problematiek te benaderen.
Backups voor archivering ?
Het is afgezaagd, maar laten we er toch nog maar een keer op terugkopmen. Uit onderzoeken blijkt nog steeds dat veel ondernemingen hun gegevens eindeloos lang opslaan en geen grip hebben op het beheer van die gegevens, met alle risico’s van dien.
Hoewel 87 procent van de Nederlandse ondernemingen aangeeft het belang van procedures voor gegevensretentie in te zien, beschikt slechts de helft over zo’n procedure. De andere helft geeft aan de eigen richtlijnen niet of niet altijd op te volgen. Daardoor krijgen deze bedrijven te maken met een ongebreidelde groei van de hoeveelheid opgeslagen documenten, onhoudbare back-uptijden, een verhoogd risico op rechtszaken en dure en inefficiënte ontsluiting.
In veel bedrijven is het nog gebruikelijk alles voor altijd te bewaren. De hoeveelheid gegevens groeit echter exponentieel, dus alles bewaren kost heel veel opslagruimte en stelt grote eisen aan de beschikbare IT-resources. Bedrijven zijn veel meer tijd en geld kwijt aan de negatieve gevolgen van slecht gegevensbeheer en ondermaatse gegevensontsluiting dan aan de maatregelen die ze op dit gebied zouden kunnen nemen.
Het belang van metadata bij Big Data
John McAfee vluchtte uit Belize, uit anst voor een aanklacht in het kader van een moordonderzoek, maar hij verdween niet. Hij bleef zichtbaar voor het publiek door blogposts, tweets en mediarapportages. Hij had waarschijnlijk de politie kunnen blijven ontwijken en virtueel aanwezig te zijn, ware het niet voor een enkele elektronische broodkruimel: een foto van McAfee op de website van Vice, een magazine over kunst en cultuur uit New York. Het beeld onthulde weinig, maar de informatie die in die foto was ge-embed gaf precies de coordinaten weer waar de foto genomen was. En dat was het begin van het einde voor McAfee….
Volgens ‘The Digital Universe in 2020: Big Data, Bigger Digital Shadows, and Biggest Growth in the Far East’, een rapport uit december 2012 door IDC en EMC is metadata een van de snelst-groeiende subsegmenten van dat digitale universum.
Het probleem is dat terwijl het volume metadata groeit (en ook het belang ervan om data te kunnen begrijpen) het geen gelijke voet houdt met de groei van ‘big data’. IDC noemt dit het ‘big data gap’ en het vereist van CIO’s om hun data management strategie te ‘herdenken’.