ODF of OpenXML ?
Het nieuws is vol van een bestandsformatenstrijd. Een strijd tussen twee formaten die beide gebaseerd zijn op XML en beide de markt voor kantoorautomatiseringsssoftware bestrijken. Het ene formaat, OpenDocument Format (ODF), voortkomende uit de open source-beweging; het andere, OpenXML, het product van de partij die de betreffende markt al zeker een decennium domineert, Microsoft. ODF is een gepubliceerde ISO-standaard: ISO/IEC 26300:2006: Open Document Format for Office Applications v.1.0. OpenXML is onlangs vastgesteld als een ECMA-standaard en wordt voorgedragen voor ISO-certificering. Microsoft zet al haar aanzienlijke marketingmacht in om Open XML te promoten; ODF heeft veel backers, maar er wordt weinig kapitaal besteed aan de marketing, omdat het formaat in principe van niemand is. Het bestandsformaat wordt steeds meer gebruikt dankzij de ISO-certificering ervan. De argumenten voor het gebruik van beide formaten concentreren zich op open standaard, interoperabiliteit en duurzaamheid. Laten we die argumenten successievelijk eens doorlopen om te zien in hoeverre beide formaten daaraan voldoen.
Beide formaten zijn gestandaardiseerd en maken gebruik van XML. XML is een open ‘taal’, die in principe voor iedereen begrijpelijk is en die uitgebreid is gedocumenteerd. ODF heeft een uitgebreid revisie- en onderzoekstraject doorlopen voordat het tot OASIS-, en later tot ISO-standaard werd, waarin vele opmerkingen, commentaren en kritieken werden verwerkt. Het formaat is volledig gedocumenteerd en maakt gebruik van XML zoals daarvan gebruik gemaakt moet worden. OpenXML is gestandaardiseerd ‘as is’, zoals het is aangeleverd bij de ECMA en het standaardisatieproces betrof geen openbare reviewfase. Er is ongeveer 6500 pagina’s aan beschrijvende specificaties, die in recordtempo door de ECMA zijn verwerkt. Als het standaardisatieproces ‘serieus’ was doorlopen dan was standaardisatie van OpenXML niet bij voorbaat vanzelfsprekend geweest. Bij ISO-standaardisatie is dat ook nog maar de vraag. Het volgende speelt namelijk. Tijdens het maken van vertaal-interfaces van ODF naar OpenXML blijkt dat de conversie van ODF naar OpenXML heel moeilijk gaat, omdat OpenXML niet (of niet goed) werkt met XSL Transformations (een W3C-recommendation, voor het converteren van XML-documenten naar andere XML-documenten) en Xpath (een W3C-recommendation om delen van XML-documenten te benoemen voor gebruik door XSLT). XSLT vereist hoog gestructureerde XML. OpenXML kan hier blijkbaar niet aan voldoen. Een van de belangrijkste redenen hiervoor is (naast de structuur) het feit dat binnen OpenXML uitgebreid gebruik gemaakt wordt van ‘bitmasks‘. We schreven daar eerder over. Bitmasks zijn in XML niet nodig, en zelfs verwerpelijk. Bitmasks zorgen ervoor dat XML niet langer door het menselijke oog leesbaar is, en begrijpelijk is. Door bitmasks wordt het voor andere partijen zo goed als onmogelijk om OpenXML op de juiste wijze te presenteren. OpenXML is dus niet open, maar bevat elementen van ‘proprietary’ code, die met XSLT niet te vertalen is in een ander XML-formaat, zoals ODF. Microsoft heeft een XML-formaat ontwikkeld dat enkel en alleen gericht is op de zo juist mogelijke presentatie van het eigen Microsoft-formaat. Of dat ook oudere versies betreft is nog maar de vraag.
Met het vaststellen dat OpenXML niet echt open is, wordt meteen aangegeven dat interoperabiliteit ook een vraagteken is. Dat het op XML is gebaseerd wil nog niet zeggen dat het binnen iedere kantoorautomatiseringssuite kan worden gebruikt. Omdat het niet voldoet aan normale XML-eisen wordt het een moeilijk verhaal. Waar OpenXML wel heel erg goed in zal zijn is het transformeren van de bestaande Microsoft-formaten naar een nieuw, opener en beter gedocumenteerd formaat (het is alleen de vraag wie die 6500 pagina’s kan doornemen….). Dat is op zich een belangrijk feit, dat het makkelijker maakt om documenten te managen.
Dan rest het laatste argument: duurzaamheid. Ik heb me altijd afgevraagd wat dit argument in deze discussie betekende. ODF is als ISO-standaard een duurzaam formaat; OpenXML kan dat (als ISO-certificatie plaatsvindt – wat ik op grond van het voorgaande betwijfel) worden, is met de ECMA-standaardisatie en de enorme documentatie in ieder geval op weg. Maar ‘duurzaam’ betekent ook kunnen beschikken over de inhoud van documenten op een later moment in de tijd, en wel zodanig dat die inhoud gelijk is aan het moment waarop het document is gegenereerd. En met dat laatste heb ik bij beide formaten problemen. Beide documentformaten blijven muteerbaar. Ik kan uiteraard allerlei soft- en hardware voorzieningen aanwenden om onmuteerbaarheid te waarborgen, maar die voorzieningen verdwijnen met de onontkoombare vervanging van hard- en software. Daarbij: duurzaamheid is al geregeld in een andere ISO-standaard, namelijk die van PDF/A (ISO/IEC 19005-1. Document management – Electronic document file format for long-term preservation). Kortom: beide XML-formaten hoeven zich niet bezig te houden met duurzaamheid. Iedere zichzelf respecterende document-, content- of records management applicatie dient zijn opslag te waarborgen op basis van PDF/A. Het argument duurzaamheid in de bestandsformatenstrijd is dan ook niet echt valide.
De reden van de strijd ligt in wezen ook niet in de genoemde argumenten. De reden van de strijd ligt in de beheersing van de markt van kantoorsoftware. Als ODF als open standaard, gestandaardiseerd door de ISO, de strijd wint, dan volgt daaruit een grote bedreiging voor Microsoft in die markt. Het kan zelfs een bedreiging zijn van het business model van Microsoft, dat zo sterk op licenties en de vergoeding daarvan is gebaseerd. Andere kostenvriendelijker kantoorsoftware zou Microsoft Office kunnen bedreigen.
Dat gevaar bestaat ook met twee formaten: ODF en OpenXML. Zelfs als die laatste door de ISO wordt gestandaardiseerd. Een slimmerik zou kunnen besluiten ODF voor de toekomstige documentenverwerking te gaan gebruiken (het is immers het betere XML-formaat), OpenXML te gebruiken om de erfenis uit het verleden toegankelijk te houden (of te maken) en van daaruit een conversie uit te voeren naar PDF/A. Als dat gebeurt is OpenXML niet lang nodig. De consequenties voor Microsoft zullen dan niet te overzien zijn…..
December 2006-maart 2007