Nachodzi era nieczytelnego dla człowieka XML-a

Opracowany przez World Wide Web Consortium (W3C) język XML łączy w sobie zalety prostej bazy danych oraz języka HTML: jest łatwy w obsłudze, wygodny w przetwarzaniu i posługuje się językiem czytelnych dla człowieka znaczników. To jednak może doprowadzić go do zguby.
Zastosowanie XML jest bardzo szerokie: ze standardu korzysta zarówno projekt Gnome (graficznego środowiska dla systemów uniksowych) przy definiowaniu zawartości menu startowego, jak i handel elektroniczny - do przesyłania list zakupów.

Wygodny, ale obszerny

Od pewnego czasu pojawiają się jednak głosy krytyczne. Warto bowiem wiedzieć, że wygoda stosowania XML-a ma swoją cenę - plik zawierający informacje o zaledwie jednym kupionym przedmiocie jest zwykłym plikiem tekstowym i może mieć 1 kB lub więcej!

Najwięcej powodów do narzekania mają producenci urządzeń mobilnych, w których każdy bajt jest na wagę złota, a dodatkowa sekunda intensywnego przetwarzania danych oznacza szybsze zużycie baterii.

Robin Berjon z W3C przyznaje, że XML padł ofiarą własnego sukcesu - stosowano go nawet tam, gdzie niezbyt pasuje.

Binarny XML

Aby zaradzić problemom z objętością W3C rozpoczęło prace nad binarną wersją XML-a. Zainteresowanie nią już wyraziły Siły Powietrzne USA (XML w urządzeniach stosowanych w samolotach) oraz producenci telefonów komórkowych.

Pojawiły się jednak głosy sprzeciwu mówiące, że wprowadzenie nowego, niekompatybilnego z istniejącym standardu powoduje spore zamieszanie na rynku. Już teraz istnieje kilka opracowanych przez różne firmy (i niezależnie od W3C) metod zmniejszania objętości plików XML: Epway opracował swój własny binarny standard, AgileDelta sprzedaje oprogramowanie kompresujące pliki XML w locie a Sun uruchomił projekt o nazwie Fast InfoSet, dzięki któremu - według danych firmy - można przyspieszyć aplikacje korzystające z XML-a od 2 do 10 razy.

Trudna decyzja

W3C musi teraz zdecydować, czy opracuje jeden, pasujący do wszystkich zastosowań (a zatem mogący powtórzyć historię klasycznego XML-a) standard, czy może uruchomić kilka równoległych projektów. Ostateczna decyzja dotycząca kontynuowania prac nad nowym formatem ma zapaść latem.


Więcej informacji: ZDNet
Aktualizacja: 30 marca 2005 17:49
Jako że sprawa binarnego XML-a jest czymś, co na pewno zaważy na możliwościach urządzeń konstruowanych przynajmniej przez najbliższe kilka lat, postanowiliśmy zapytać Robina Berjona, czego możemy się spodziewać po tym formacie. Oto, co nam odpowiedział:

PC World Komputer: Jak będzie wyglądał binarny XML? Czy będzie to po prostu potraktowana bzipem, gzipem czy innym kompresorem forma XML-a? Czy może coś innego?

Robin Berjon: Celem XML Binary Characterization Working Group nie było zdefiniowanie binarnego formatu XML-a, lecz raczej analiza potrzeb przemysłu w celu sprawdzenia, czy binarna forma XML-a jest rzeczywiście potrzebna - i jeśli tak, to czy możliwe jest wykorzystanie jednego formatu we wszystkich zastosowaniach. Udało nam się dowieść, że na obydwa pytania odpowiedź brzmi "tak".
Zdajemy sobie sprawę, że format powinien być prosty, ale nie oznacza to - skompresowany gzipem czy bzipem. Metody te nie dają choćby zbliżonego do wystarczającego poziomu kompresji i powodują, że czas przetwarzania danych zwiększa się zamiast zmniejszać.

Plotki głoszą, że na rynku potrzebny jest więcej niż jeden format binarnego XML-a (jeden dla telefonów komórkowych, jeden dla set-top boksów itd.) Czy to prawda?

Ogólnie rzecz ujmując: nie. Po wnikliwej analizie wiemy na pewno, że przynajmniej w 80 procentach przypadków jeden format w zupełności wystarczy. Co więcej, jeden format jest wręcz niezbędny, ponieważ potrzebujące go urządzenia są ze sobą powiązane (branie ich pod uwagę jako należących do oddzielnych gałęzi przemysłu jest prowadzącą donikąd abstrakcją, która rozpada się w drobny mak, gdy tylko przyjrzeć się jej dokładniej). Ostatecznie mogą istnieć jeden czy dwa działy przemysłu, które różnią się nieco bardziej od innych i mają bardzo dziwne zapotrzebowanie (np. set-top boksy) - te będą miały inne formaty, ale stanowią rzadkie wyjątki. Zresztą nawet w tym wypadku nie jestem przekonany, że to wydarzy się w ten właśnie sposób, ponieważ wykorzystanie ustanowionego, obowiązującego standardu jest niesamowicie ważne.

Czy W3C zamierza użyć Fast InfoSet? Lub jakiegokolwiek innego istniejącego rozwiązania?

Jest zbyt wcześnie, żeby o tym mówić, ale wątpię, żebyśmy wykorzystali FI jako takie. Wkrótce zaczniemy przyglądać się kandydującym formatom i wtedy będę mógł powiedzieć nieco więcej na ten temat.
Tagi: XML, W3C, World Wide Web Consortium, AgileDelta
Ocena:
Twoja ocena:

Komentarze (9)

kravietz

31-03-2005 09:21

Ten "binarny XML" który W3C chce wynajdować po raz kolejny już istnieje i nazywa się ASN1.

hawk

25-03-2005 10:32

>Jestem ciekaw jak w przedstawionej przez siebie "semantyce" masz zamiar >zrealizować zagnieżdżanie elementów, albo kontrolę poprawności składni. >Gdyby rozwiązanie było takie proste, to już by je zastosowano. A właśnie >"rozwlekłość" składni xml'a paradoksalnie dała mu szansę na sukces. Dobrze się zastanów zanim napiszesz. Zagnieżdżenie elementów? Proszę bardzo... <cośtam :cośtam="cośtam" bla bla <cośtam1 :cośtam2="bla" hjk hjk> bla bla> lub używając drugiego sposobu: <<cośtam cośtam="cośtam"> bla bla <<cośtam1 cośtam2="bla"> hjk hjk> bla bla> Napisanie parsera takiej składni jest bardzo proste (spróbój jak nie wierzysz) tak samo jak kontrolowanie jej poprawności. Co więcej jak zastanowisz się dobrze nad tym co napisałem dojdziesz do wniosku że w "mojej" składni znaki "=" są całkowicie zbędne -- można je z powodzeniem zastąpić spacjami i nie wprowadzi to niejednoznaczności ani nie skomplikuje parsera. Jeśli chcesz wiedzieć dlaczego "mojej" napisałem w cudzysłowiu przyjrzyj się jezykowi Lisp.

Zdihu Hemracek

25-03-2005 02:57

Nie skończyli CSS 3 i wszystkich modułów XHTML1.1 a już dopsko pchają w trepanowanie XML. Jak tak dalej pójdzie XHTML stanie się dopiero standardem za 15 lat a my będziemy się cieszyć z XHTML1.0, który okaże się tak stary jak obecnie HTML4.1

mexml

24-03-2005 21:57

Errata: popełniłem poniżej literówkę. Oczywiście nie chodzi o XLS'a (bo ten format nie jest żadnym standardem i nikt poza MS nie wie jak jest narpawdę zbudowany) ale XSL'a :-) czyli eXtended Style Language :-)

mexml

24-03-2005 21:54

Jestem ciekaw jak w przedstawionej przez siebie "semantyce" masz zamiar zrealizować zagnieżdżanie elementów, albo kontrolę poprawności składni. Gdyby rozwiązanie było takie proste, to już by je zastosowano. A właśnie "rozwlekłość" składni xml'a paradoksalnie dała mu szansę na sukces. I dla wszystkich którym wydaje sie, że XML to następca HTML - nic bardziej błędnego. Fakt, że XML podobnie jak HTML wykorzystuje język znaczników, oraz fakt, że jedną z aplikacji XML'a jest XHTML (niestety bowiem czysty HTML jest niezgodny ze składnią XML'a) nie oznacza tej pozornej implikacji. Prawdziwym źródłem sukcesu XML'a jest oddzielenie formy od treści (czyt. dane w XMLu są zupełnie pozbawione informacji o prezentacji owych, bo te można odpowiednimi XLS'ami zaprezentować w postaci HTMLa i do PDFa.

hawk

24-03-2005 17:06

> Gdyby nie XML nie bylo by HTML Kolego tyś się chyba z choinki urwał. HTML był przed XML. Poza tym w roku 1996 kiedy standard XML został zaproponowany w wielu domach w Polsce stały już PC'ty (były to najczęściej AT286). A co do samego XML to nie dość ze jest prosty jak szprycha w kole, a robi się z niego supertechnologię, to w dodatku jest zupełnie niepotrzebnie koszmarnie rozwlekły. Czy nie lepiej jest zamiast pisać: <cośtam cośtam1="cośtam3"> bla bla bla bla </cośtam> napisać: <cośtam :cośtam="cośtam" bla bla bla bla> albo ewentualnie: <<cośtam cośtam="cośtam"> bla bla bla bla>

sQuid

24-03-2005 16:33

nie ma ci narzekac, xml to plik tekstowy i latwo mozna go skompresowac nawet w locie przez serwer ww uzywajac webserisu w dodatku i tak jest juz okrojony bo powstal jako aplikacja SGML stworzonego chyba przez Hitach jeszcze kiedy PC w kazdym domu byl Sc-fi wiec nie moze byc marketingowym chwytem. Gdyby nie XML nie bylo by HTML

kelog

24-03-2005 13:02

a ja od poczatku bylem zdania ze XML pomysl specow od markietingu;) wymyslili go to zeby na byle g*** pisac "powered by xml". to zreszta ci sami co wykumali "powered by .net" i "using werbservices" :D komentarz edytowany przez moderatora

seba

24-03-2005 12:13

spokojnie. po to został wymyślony aby ułatwiał życie, nie komplikował. Przepustowości sieci rosną, urządzenia mobilne stają się bardziej wydajne a konsumpcja energi spada wraz z nowymi technologiami. Zalety użycia XMLa są o wiele większe aniżeli koszty jego eksloatacji. TRzeba czasu aby ten standard znalazł swoje miejsce i został dobrze wykorzystany.

Polecane

PC World z prezentem!

Tak, zamawiam 12 wydań PC World po 14,09 zł każde (zamiast 19,90 zł) od numeru 6/2012.
Dodatkowo program Panda Antyvirus Pro 2012,
chroniący aż 3 komputery, dostanę za darmo.

PC World 6/2012
Nowy numer PC World 6/2011
Razem: 169


  • Z darmową wysyłką
Wyrażam zgodę na wykorzystywanie mojego adresu email do celów marketingowych. rozwiń »

Pobierz bezpłatnego e-booka

20 lat polskiej sieci
Ebook 20 lat polskiej sieci to kompletna charakterystyka polskiego internetu (oraz polskiego internauty). Odpowiadamy na pytanie, jak wygląda nasz kraj na tle bliższych i dalszych europejskich sąsiadów pod względem popularyzacji szerokopasmowych łączy internetowych i rynku mobilnego. Wymieniamy również wady i zalety korzystania z bezpłatnych punktów dostępowych.
Jeśli chcesz otrzymać darmowego e-booka, wpisz swój adres e-mail. Wyślemy Ci go natychmiast!
Wyrażam zgodę na wykorzystywanie mojego adresu email do celów marketingowych. rozwiń »