1 oktober 2010
Google heeft een nieuw beeldformaat ontwikkeld. Het WebP-formaat is open source en biedt een hogere compressie dan JPEG en JPEG 2000 bij gelijke beeldkwaliteit. Google heeft ook een conversietool voor WebP uitgebracht. Volgens Google maken plaatjes en foto’s ongeveer 65 procent uit van het aantal verstuurde bytes bij het laden van webpagina’s. Een groot deel daarvan is afkomstig vanJPEGs. Het nieuwe WebP-beeldformaat levert volgens Google een reductie van gemiddeld bijna veertig procent op wat betreft grootte van het beeldbestand. Net als JPEG is WebP een lossy compressiemethode, en daardoor volstrekt ongeschkt voor de langdurige bewaring van beeldmateriaal. Google baseert zich bij zijn claims op een vergelijkend onderzoeken dat het heeft uitgevoerd tussen WebP, Re-JPEG en JPEG 2000. Google heeft deze drie compressiemethodes losgelaten op een dataset van in totaal 900.000 plaatjes, waarbij het grootste gedeelte bestond uit JPEG-bestanden. Bij WebP leverde dat een gemiddelde afname in bestandsgrootte op van bijna veertig procent. Re-JPEG en JPEG 2000 bleven in de test steken op een percentage van respectievelijk 14,62 en 9,71 procent. Als parameter voor de beeldkwaliteit werd de signal-to-noise-ratio aangehouden.
Het WebP-beeldformaat is gebaseerd op de VP8-codec die ook gebruikt wordt in het WebM-videoformaat van Google om video te comprimeren. De WebP-container is gebaseerd op RIFF en voegt slechts 20 bytes overhead toe met behoud van de mogelijkheid om in de toekomst de header uit te breiden met nieuwe metagegevens. WebP heeft een maximaal formaat van 16.383×16.383 pixels en maakt gebruik van 14bit-encodering. Google heeft een gallery online gezet waarbij de beeldkwaliteit en bestandsgrootte van originele JPEG-bestanden vergeleken kunnen worden met de WebP-versies. Google heeft een WebP-conversietool voor ontwikkelaars op zijn site gezet, waarmee beeldbestanden naar het nieuwe formaat kunnen worden omgezet. De commandline-tool verkeert nog in het bèta-stadium. Het is volgens Google niet nodig om alle JPEG-plaatjes direct om te zetten naar WebP-formaat. Servers zouden namelijk on-the-fly WebP-versies van plaatjes kunnen serveren als een WebP-compatibele browser wordt herkend, zo blijkt uit een vraaggesprek van CNet met Richard Rabbat, projectleider van Google’s ‘Make the web faster’-project. Naast WebP, wat als een presentatiebestand kan worden gebruikt, maar zeker niet als een duurzaam archiveringsformaat, heeft Adobe in juni van dit jaar het DNG (Digital Negative) extensie-formaat geintroduceerd, dat in het kader van duurzaamheid wel kan worden gebruikt. DNG is een extensie-formaat op TIFF dat als doel heeft digitale foto’s die zijn opgeslagen in een proprietary raw formaat te converteren naar een open standaardformaat waarin de `ruwe` beeldinformatie bewaart blijft. Het opslaan van de raw photo data heeft voordelen voor de beheerder van fotografisch materiaal: alle informatie die de digitale camera heeft vastgelegd op de CCD bevindt zich in het beeld. In die zin lijkt een raw formaat op een analoog negatief (vandaar: digital negative). DNG is een extensie op het TIFF formaat en biedt naast de raw opslag een andere interessante eigenschap: de mogelijkheid van non-destructieve nabewerking (parametric image editing). Nabewerkingen zijn in een DNG slechts lagen bovenop de originele, onaangetaste beeldinformatie. Ook een sterke feature is dat alleen van de basisbeeldlaag een checksum wordt gemaakt. Het mooie hiervan is dat de duurzaamheid van het bestand kan worden bewaakt, los van de eventuele nabewerkingen. DNG kan zeker interessant zijn voor erfgoedinstellingen. Op zich is het erg jammer dat het JPEG2000-formaat zo weinig ingang vindt, want als het om duurzaamheid gaat biedt dit formaat enorm veel mogelijkheden. JPEG2000 is een zeer veelzijdig formaat, met een lossless en lossy compressie variant en mogelijkheden qua presentatie. Standaard ondersteuning van het formaat blijft echter uit. Vooral de lossless compressiemogelijkheid is van groot belang voor duurzame bewaring. In dat verband is ook het PNG-formaat aan te raden: lossless (winst ongeveer 40%), open, veel mogelijkheden qua bitdiepe en probleemloos te openen in een browser. Het heeft echter eenzelfde nadeel als JPEG2000: het wereldwijde gebruik door consumenten en de erfgoedsector is laag. Wat aanbevelingen:
- ga voor compressieloos of lossless compressie (TIFF, JPEG2000 of PNG) bij vervanging;
- wanneer het niet gaat om vervanging: gebruik lossless of conservatieve lossy compressie (JPEG2000 lossless, PNG, JPEG2000 lossy 1:20, JPEG 1:10);
- wanneer het gaat om access, kies dan voor lossy compressie (JPEG2000 1:20 of meer, JPEG 1:10 of meer, WebP).
Wanneer het gaat om multipage-bestanden, dan zijn PNG en JPEG niet te gebruiken. Dan kan het DNG-formaat worden gebruikt of PDF/A, waar je alle kanten meer op kunt. (qua compressie (of zelfs geen compressie) en qua gebruikerswensen) en wat zeer breed wordt ondersteund. Gescande gepagineerde documenten alleen als PDF opslaan, is niet echt verstandig. Een voorzichtiger model is de masters als losse afbeeldingen op te slaan (TIFF, JPEG2000, PNG) en PDF/A te gebruiken voor beschikbaarstelling. Bij een beperkt budget en een minder robuuste infrastructuur (in de komende jaren van bezuiniging zeer waarschijnlijk) is het echter niet problematisch exclusief te kiezen voor PDF/A, mits er een zeer conservatieve compressie binnen het bestand wordt gebruikt (en liever eigenlijk helemaal geen compressie!).