DOC idzie w odstawkę

Ostatnio wielkie zainteresowanie wywołała zapowiedź Microsoftu, że jego pakiet Office 12 pójdzie śladem konkurencyjnych WordPerfect Office i OpenOffice i pozwoli zapisywać dokumenty w formacie PDF. Czyżby kapitulacja przed Adobe?


Ostatnio wielkie zainteresowanie wywołała zapowiedź Microsoftu, że jego pakiet Office 12 pójdzie śladem konkurencyjnych WordPerfect Office i OpenOffice i pozwoli zapisywać dokumenty w formacie PDF. Czyżby kapitulacja przed Adobe?

Do opublikowania tej sensacyjnej informacji Microsoft wybrał dość osobliwy sposób. Ukazała się w jednym z blogów w formie zwyczajnej odpowiedzi na postulat internauty, użytkownika biurowego pakietu. Biorąc pod uwagę, że Microsoft systematycznie ignorował takie i podobne życzenia przez ostatnich 12 lat, warto zadać pytanie, co się właściwie stało i jakie wydarzenia wywołały zmianę dotychczasowego stanowiska.

Skromny urzędnik

Większość specjalistów uważa, że zmiana postawy giganta z Redmond została wymuszona przez władze amerykańskiego stanu Massachusetts, które nie zgadzają się na używanie formatów dokumentów pakietu Office w celach urzędowych. Na liście aprobowanych (http://www.mass.gov ) są wyłącznie formaty "otwarte", zdefiniowane w Open Document Format for Office Applications, OpenDocument, oraz PDF (Portable Document Format). Nowa zasada zacznie obowiązywać w 2007 roku. Podstawą decyzji władz było przekonanie, że dokumenty urzędowe przeznaczone do opublikowania powinny być dostępne dla każdego bez kupowania niezbędnego oprogramowania. Do tej pory powyższego warunku nie spełniały formaty z pakietu Microsoftu.

Dzisiaj liczba użytkowników bezpośrednio zainteresowanych tą decyzją nie jest może wielka, ale nie da się tego powiedzieć o samej zasadzie uwolnienia treści dokumentu od formatu aplikacji, w którym została zakodowana. Jest to idea, której czas właśnie nadchodzi i której znaczenie trudno przecenić. Wśród przeciwników dominacji giganta, na buntowniczym forum Rebel Alliance decyzja z Massachusetts została uznana za pierwszy mały podmuch wolności i otwartości, który rosnąc w siłę, zmiecie "szatańskie imperium" Microsoftu po największej bitwie, jaką kiedykolwiek stoczono w komputerowym przemyśle.

Niedoceniany geniusz

Wracając na ziemię, trudno nie zauważyć, że zarówno decyzja administracji stanu, jak i kontra Microsoftu w istocie działają na korzyść wymyślonej w Adobe wizji PDF-u jako uniwersalnego formatu do wymiany dokumentów. Jego prototypem jest dobrze znany PostScript PDL (Page Description Language), którego istotną zaletę stanowi gwarancja zachowania wyglądu strony złożonej z wielu rodzajów fontów, grafiki wektorowej i rastrowej. Układ strony powinien pozostać identyczny zarówno po wydrukowaniu na drukarce laserowej o rozdzielczości 300 dpi, jak i wysokorozdzielczej atramentówce do zdjęć, niezależnie od użytej aplikacji i systemu operacyjnego.

Przebłysk geniuszu Adobe polegał na uświadomieniu sobie, że PostScript może być przydatny nie tylko do komercyjnego drukowania, ale także sam w sobie wykorzystany jako format wymiany dokumentów. Ulepszony i skompresowany plik wyjściowy PostScriptu stał się podstawą PDF-u (Portable Dokument Format) i związanej z nim uniwersalnej, wielosystemowej aplikacji Reader, przeznaczonej do przeglądania dokumentów na ekranie. PDF odziedziczył po PostScripcie otwartość i programowalną architekturę. Adobe poszło jeszcze dalej, czyniąc go łatwo dostępnym, w pełni udokumentowanym i bezpłatnym. Te cechy zachęcają prawie wszystkich twórców programów do projektowania, autorów pakietów biurowych zaś do udostępniania możliwości bezpośredniego zapisania pliku w formacie PDF. Wszystkich oprócz Microsoft Publisher i Microsoft Office, ale nawet z dokumentów tych programów można otrzymać PDF, stosując oprogramowanie samego Adobe w postaci sterownika "drukarki" albo produkty innych firm.

Za darmo

Nadanie dokumentowi pożądanego wyglądu jest sprawą ważną, ale o popularności formatu PDF zadecydowało co innego. Najważniejsza była decyzja o rezygnacji z pobierania opłat za przeglądarkę Acrobat Reader, gotową do pracy z różnymi systemami operacyjnymi, i zachęcenie firm trzecich do rozpowszechniania w swoich programach, instrukcjach i wielu innych produktach formatu PDF. Dzięki wolnemu i uniwersalnemu dostępowi PDF stał się na poczekaniu najważniejszym, najbardziej popularnym formatem medialnym. Microsoft próbował dodać podobną funkcjonalność plikom swoich formatów z pakietu Office, udostępniając różne bezpłatne przeglądarki, ale rozwiązanie okazało się zbyt skomplikowane i ograniczone do Windows. Dzięki uniwersalności na wielu polach i dostępności PDF jest formatem otwartym, w przeciwieństwie do binariów Microsoftu w rodzaju DOC, XLS, PPT, PUB i tym podobnych.

PDF do poprawki

Obraz pokornego Microsoftu, zmuszanego do naprawienia strategicznych błędów przez szybkie dodanie obsługi formatu PDF, nie jest prawdziwy. Po pierwsze, błyskawiczne dodanie tej obsługi w ciągu kilku tygodni, które minęły od zapowiedzi z Massachusetts, nie jest możliwe. Jasne, że ta opcja była przygotowana wcześniej. Jednak ważniejsze jest pytanie, co właściwie oznacza aprobata PDF wyrażona w dokumencie z Massachusetts i jaki jest aktualny oraz pożądany stopień otwartości tego formatu. Warto zauważyć, że chociaż nowa specyfikacja PDF jest otwarta i dostępna, a wersja formalizowana niezależnie jako standard ISO (PDF/X do druku oraz PDF/A do archiwizacji), to jego źródła nie są dostępne i tylko Adobe decyduje o kierunku dalszego rozwoju. Trudno oczekiwać, aby robiło to bezinteresownie.

Word z Office 12 nauczył się zapisywać w formacie PDF.

Word z Office 12 nauczył się zapisywać w formacie PDF.

Sam PDF nie jest ideałem. Jego niedoskonałości ujawniają się choćby podczas edycji dokumentu albo prób wycięcia z niego jakiegoś fragmentu. Dzięki podstawom z PostScriptu precyzyjnie opisuje i odtwarza wizualny kształt strony, ale treść nie jest już tak ważna. Adobe próbuje rozwiązać ten problem, adaptując rozwiązania z innych formatów - uzupełnia PDF o znaczniki treści i eksport w rodzaju RTF, ale do przejścia ma jeszcze daleką drogę, zwłaszcza że nie korzysta z pomocy niezależnych firm. Z powodu tych problemów PDF należy nazywać formatem nie otwartym, ale zamkniętym z zasady: raz wprowadzona do dokumentu treść nie daje się już bezboleśnie z niego wyekstrahować.

Wejście XML

Jak widać, dopisanie przez urzędników z Massachusetts PDF-u do listy formatów otwartych nie jest bezsporne. Z tego powodu prawdziwy atak na zamknięte formaty z pakietu Office prawdopodobnie nastąpi z innego kierunku. Orężem może stać się XML (eXtensible Markup Language). Jest formatem otwartym z założenia, bo opiera się na tekście i znacznikach tekstowych, a to podstawa z natury niezależna od platformy systemowej i używanej aplikacji. Inaczej niż w jakimkolwiek formacie binarnym, plik XML można otworzyć za pomocą dowolnego edytora tekstu, potem sprawdzić, jak poprawki i uzupełnienia wpływają na wygląd i treść. O wyglądzie decydują zdefiniowane wcześniej znaczniki, podobnie jak w HTML. Jednak system znaczników w XML jest znacznie bardziej rygorystyczny, dlatego zanim plik będzie gotowy do przeczytania i zinterpretowania przez ludzi, powinien zostać sprawdzony za pomocą odczytu i przetwarzania maszynowego.

XML różni się od HTML także większą elastycznością. Jego specyfikacja nie definiuje poszczególnych znaczników, pozostawiając programistom czy autorom swobodę tworzenia własnych rozwiązań. Z tego powodu zastosowanie XML nie jest ograniczone do żadnej grupy zadań. Jeden język znaczników może być nawet wykorzystany do utworzenia innego języka znaczników. Takie możliwości są szczególnie przydatne do obsługi baz danych. Każdy rekord czy pole bazy może zostać otoczone odpowiednimi znacznikami. Poza tym posługiwanie się znacznikami pasuje także idealnie do renderowania przy użyciu przeglądarki. Z tego powodu uważa się, że technologie wywodzące się z XML, XHTML (eXtensible HTML), RSS (Really Simple Syndication) oraz XSL (eXtensible Style Language), będą decydować o przyszłym wyglądzie Światowej Pajęczyny. W dodatku zastosowanie XML nie ogranicza się do treści. Języki wywodzące się z tego pnia, takie jak SVG (Scalable Vector Graphics), SMIL (Synchronous Multimedia Integration Language) i X3D (eXtensible 3D), obsługują także grafikę.

Szczypta marzeń

Starszy Explorer jeszcze nie wyświetla prawidłowo plików Office XML, ale i bez tego widać tekstową naturę nowego formatu.

Starszy Explorer jeszcze nie wyświetla prawidłowo plików Office XML, ale i bez tego widać tekstową naturę nowego formatu.

Skoro każdą treść da się opisać za pomocą XML, można go wykorzystać także do nowego formatu biurowego dokumentu, który byłby z zasady oraz w praktyce otwarty i uniwersalny. To kusząca perspektywa dziś, kiedy treść różnego rodzaju jest uwięziona w postaci binariów: zakodowana w procesorach tekstu, arkuszach kalkulacyjnych, rozmaitych tabelkach i grafice. W XML wszystkie te rodzaje mogliby tworzyć, odczytywać i przetwarzać programiści i użytkownicy, niezależnie od producenta aplikacji i systemu operacyjnego, w którym powstaną.

To nie jest jedynie odległa perspektywa, ale dokładnie zawartość specyfikacji opartego na XML standardu Open Dokument Format (ODF). Ten format, przedstawiony ISO do zatwierdzenia, opracowano na podstawie poprzednika utworzonego przez OpenOffice.org z wykorzystaniem XML, pochodzącego z kolei z integracji takich standardów, jak SVG, XSL i SMIL. Co więcej, specyfikacja, zwolniona z opłat za prawa autorskie, została przekazana OASIS, organizacji typu nonprofit, która będzie koordynować prace rozwojowe prowadzone przez całą wspólnotę. Taki schemat działania ma zagwarantować priorytet wartości merytorycznych nad interesem korporacji, czego nie udało się uniknąć w wypadku Adobe i PDF.

Imperium kontratakuje

To jasne, że autorom specyfikacji z Massachusetts chodziło raczej nie o współczesny PDF, a o przyszły ODF. Tylko on mógłby wyprzeć z rynku zastrzeżone formaty Microsoftu. Logika stoi wyraźnie po tej stronie: XML jest otwarty i łatwy do rozwijania. Z tej perspektywy binarne formaty Microsoftu sprawiają wrażenie dinozaurów zdolnych jedynie do stopniowego wymierania. Oczywiście Microsoft nie czeka bezczynnie. Otwarty charakter XML-u pozwala zastosować starą strategię gigantów: jeśli nie możesz pokonać przeciwnika, połącz się z nim. Z tego powodu, zamiast zajmować się wprowadzeniem obsługi PDF-ów, warto skoncentrować się na innej wiadomości z Redmond. W pakiecie Office 12 pierwszym naturalnym proponowanym formatem plików do Worda, Excela i PowerPointa stanie się skompresowany ZIP-em XML. Taka sama przyszłość czeka pozostałe aplikacje pakietu.