Poznaj XML-a

Trudno dziś nadążyć za nowinkami w samym technożargonie, a już utrzymanie firmy na najnowszym poziomie technologicznym wydaje się wręcz niemożliwe. Dziś trzeba mieć możliwość przygotowywania materiałów do publikacji w druku, w sieci, a już za chwilę trzeba będzie umieć wysyłać informacje do telefonów komórkowych, urządzeń internetowych, elektronicznych książek i niezliczonej ilości innych gadżetów.

Trudno dziś nadążyć za nowinkami w samym technożargonie, a już utrzymanie firmy na najnowszym poziomie technologicznym wydaje się wręcz niemożliwe. Dziś trzeba mieć możliwość przygotowywania materiałów do publikacji w druku, w sieci, a już za chwilę trzeba będzie umieć wysyłać informacje do telefonów komórkowych, urządzeń internetowych, elektronicznych książek i niezliczonej ilości innych gadżetów.

Nowa fala komputerowych urządzeń to poważne wyzwanie dla osób zawodowo zajmujących się kreacją. Jak nie dać się wyrzucić poza nawias i ciągle być w zgodzie z najnowszymi trendami w ewoluującym świecie technologii? Choć rozwiązanie nie jest tak do końca proste, łatwo się go nauczyć, zrozumieć i łatwo z niego korzystać. Witajcie w świecie XML-a!

Mało kto wie, co to jest XML, a zapewne jeszcze mniej osób kojarzy, że to skrót od Extensible Markup Language. Ale nie przerażaj się tym, czego nie wiesz. Dzięki XML-owi publikowanie w sieci stanie się prawdopodobnie proste niczym ćwiczenia z gramatyki w podstawówce. A przygotowany przez nas dogłębny przewodnik po XML-u wyjaśni ci, o co w tym wszystkim chodzi.

Drzewo genealogiczne

Żeby zrozumieć XML-a, należy sięgnąć do jego korzeni i przyj-rzeć się wcześniejszym rozwiązaniom,czyli HTML-owi (HyperText Markup Language) i SGML-owi (Standard Generalized Markup Language, od których wywodzi się ten nowy dialekt. HTML charakteryzował się kilkoma atrybutami, które sprawiły, że stał się idealnym narzędziem do tworzenia łatwo dostępnej globalnej sieci. Chodzi o zdecentralizowany sposób umieszczania informacji w plikach i gwarancję ich czytelności w wielu rozmaitych sieciach. Treść oznakowana jest serią znaczników, które określają, z jakim rodzajem informacji mamy właśnie do czynienia. Na przykład tytuł i treść artykułu będą oznaczone w następujący sposób:

<h1>Tytuł: wszystkie tytuły w standardowym HTML-u zamknięte są takimi znacznikami.</h1>

<p>Akapit: kolejne akapity zam-knięte są znacznikami, które wyodrębniają porcje informacji.</p>

Co to u licha znaczy?

Co to u licha znaczy?

HTML zawdzięcza sporo SGML-owi, który oparto na podstawowej koncepcji kodowania - najpierw opracowujemy elastyczny, precyzyjny i opisowy słownik do prezentacji treści dokumentów elektronicznych. Taki słownik określa strukturę i organizację dokumentu, dzięki czemu łatwo go odczytać w wielu różnych aplikacjach (oczywiście przy założeniu, że owe aplikacje rozumieją SGML). SGML nadal jest wykorzystywany przez ludzi, którzy muszą organizować złożone struktury informacyjne - np. przez bibliotekarzy czy redaktorów pracujących nad wielkimi dokumentami technicznymi.

SGML rozwinął się, bo umożliwił tworzenie dokumentów uniwersalnych. Ceną za to była złożoność tego języka. HTML powstał po części po to, by szybko i łatwo zapewnić taką uniwersalność dokumentów w sieciach. Jednak HTML-owi brakuje dwóch rzeczy, których potrzebują użytkownicy i twórcy serwisów WWW: łatwo indeksowalnych struktur danych i dostosowywania wyglądu do własnych potrzeb. Jako że HTML opisuje tylko bardzo podstawową strukturę dokumentu, ci, którzy chcą, by publikowane w sieci dokumenty odzwierciedlały to, w jaki sposób są zorganizowane, srodze się zawiodą. W podobnej sytuacji znajdą się ci, którzy chcą panować nad wyglądem publikowanych treści.

We wstępnej fazie rozwoju sieci HTML-owe znaczniki opisujące strukturę dokumentu, takie jak <p> czy <body>, zostały powiązane ze znacznikami opisującymi wygląd dokumentu, takimi jak <font color>. W efekcie powstało wiele stron WWW, będących wysoce skomplikowanymi strukturami z mnóstwem zagnieżdżonych tabel, definicji czcionek i obrazków. Projektantom udawało się najczęściej określić wygląd strony, ale stawało się to kosztem struktury dokumentów. W efekcie mnóstwo pracy miały osoby, które musiały czuwać nad aktualizacją stron.

Projektant mógł na przykład przedstawić wszystkie tytuły wielką, jasnoczerwoną czcionką kroju Arial. Każdy czytelnik dysponujący odpowiednią przeglądarką dojdzie do wniosku, że wszystkie fragmenty dużą czerwoną czcionką to tytuły. Ale z punktu widzenia gramatyki języka opisowego taki dokument jest nieuporządkowany. Nie sposób stwierdzić, które znaczniki miały oznaczać tytuł. XML rozwiązuje ten problem, dając możliwość samodzielnego opisywania danych w łatwy sposób i przenoszenia tych definicji między różnymi komputerami.

Porównanie XML-a i HTML-a

HTML zawodzi w dwóch istotnych obszarach: trudno z jego pomocą organizować informacje w kategorie czy hierarchie. Nie pozwala też w łatwy sposób zapanować nad wyglądem elementów na stronie. Kiedy trzeba zorganizować informacje, twórcy HTML-owi uciekają się do wykorzystania kilku znaczników definiujących wielkość tytułu - <h1> do <h4> - i w ten sposób porządkują hierarchię dokumentu.


Zobacz również