Twarde liczby

Cytując dane statystyczne, warto korzystać z dobrych opracowań - w Sieci znajdziemy dziś mnóstwo wiarygodnych źródeł informacji, które dobrze mieć na podorędziu.


Cytując dane statystyczne, warto korzystać z dobrych opracowań - w Sieci znajdziemy dziś mnóstwo wiarygodnych źródeł informacji, które dobrze mieć na podorędziu.

Poszukiwanie informacji o naszym kraju trzeba zaczynać od wizyty w witrynie GUS.

Poszukiwanie informacji o naszym kraju trzeba zaczynać od wizyty w witrynie GUS.

Pisząc jakiekolwiek poważniejsze opracowania, zarówno do publikacji w Internecie, jak i na potrzeby ograniczonej grupy odbiorców, korzystamy często z konkretnych danych liczbowych. Trudno oczywiście zawierzać własnej pamięci, a w większości sytuacji po prostu danych takich w ogóle nie znamy, zatem konieczne jest spożytkowanie publicznie dostępnych informacji. Co więcej, trzeba się wyraźnie powoływać na wykorzystane w opracowaniu źródło, aby zapewnić dostateczną wiarygodność zarówno cytowanych danych, jak i wyprowadzanych z nich wniosków. Odpowiedzialność jest wtedy, przynajmniej w warstwie faktograficznej, przerzucana na źródło.

Znajdź dane...

Z wiarygodnością danych bywa różnie. Stacje telewizyjne, przygotowując prognozę pogody, nierzadko sięgają do kilku źródeł i zależnie od nich podają różne przewidywania, na przykład zróżnicowane rozkłady i dynamikę temperatur czy opadów w następnych dniach. Trzeba pamiętać, że poszczególne bazy danych są tworzone przez instytucje posługujące się odmiennymi narzędziami i nierzadko własną metodologią, zaś w wypadku opracowań o charakterze probabilistycznym - całkowicie niepokrywającymi się próbkami danych. Widzimy to na co dzień choćby w sondażach dotyczących preferencji politycznych, opracowywanych przez rozmaite ośrodki badania opinii publicznej. Ich wyniki często znacznie różnią się między sobą i są potem propagandowo wykorzystywane przez ugrupowania partyjne, rząd itd.: te niekorzystne są ignorowane, te przychylne - nagłaśniane.

Nie sposób nie dostrzec konieczności dysponowania wiedzą merytoryczną, którą uzasadnia się czerpanie z takich, a nie innych źródeł. Typowym przykładem są bardzo często wykorzystywane w publikacjach dane makroekonomiczne, na przykład poziom produktu narodowego na głowę (per capita) w poszczególnych krajach. Wielu publicystów korzysta z baz informacji wyrażających wzajemne relacje na podstawie aktualnego kursu walutowego, co prowadzi nierzadko do fałszywych wniosków. Z kolei popularna baza danych, jaką jest dostępny w Internecie CIA World Factbook, porównuje poziomy na podstawie parytetu siły nabywczej, który daje wyniki znacząco odmienne - i bardziej wiarygodne - od opartych na kursach walutowych. Wynika to z dużej zależności kursu walutowego zarówno od bieżących sił rynkowych, jak i świadomej polityki państwa. Okazuje się, dla przykładu, że rzeczywisty poziom dochodu w Polsce (14 100 dolarów w 2006 r.) nie jest już o tyle niższy - rzekomo dziesięć razy - od poziomu krajów zachodnioeuropejskich (większość państw "starounijnych" jest w przedziale 30-35 tys. dolarów), co skłonni są sądzić nie tylko publicyści, ale przede wszystkim zwykli czytelnicy. A najlepiej jest przywołać w takich sytuacjach różne źródła.

Sprostaj liczbom

Znajomość elementarnych technik z zakresu statystyki opisowej to przydatne wyposażenie intelektualne wykształconego, interesującego się światem, człowieka, który powinien sobie radzić z wyciąganiem wniosków z surowych danych liczbowych. Już przestudiowanie podstawowego podręcznika statystyki opisowej przygotuje do ich przetwarzania i interpretacji.

W ramce zamieszczamy garść ważniejszych stron WWW, podających wyniki badań statystycznych, na które można się powoływać w tworzonych przez siebie opracowaniach - są sygnowane przez poważne, wiarygodne instytucje. Naturalnie, istnieje wiele innych, bardziej szczegółowych źródeł danych dotyczących wyspecjalizowanych gałęzi wiedzy i działalności, których wymienianie mija się z celem (zajęłoby to dużo więcej miejsca), choć mogą one zainteresować autorów wąsko tematycznych opracowań. Wykorzystywanie źródeł internetowych nie umniejsza, oczywiście, wagi różnego rodzaju roczników statystycznych, publikowanych w postaci książkowej.

... i je przetwórz

Statystyki CIA są doskonałym, obszernym źródłem danych porównawczych.

Statystyki CIA są doskonałym, obszernym źródłem danych porównawczych.

Warto jeszcze powiedzieć kilka słów o wykorzystaniu dostępnych danych za pomocą oprogramowania komputerowego. Podawane liczby nie zawsze dokładnie odpowiadają naszym potrzebom - na ogół przydatne są tylko wybrane informacje. Przykładowo, ze statystyki obejmującej produkt narodowy w poszczególnych państwach świata możemy potrzebować jedynie wiadomości o krajach europejskich, zaś z tabeli ilustrującej choroby zakaźne - jedynie danych o chorobach pochodzenia wirusowego albo bakteryjnego.

Dane statystyczne, jako ujmowane tabelarycznie liczby, z samej swej istoty są idealnym tworzywem dalszych przekształceń za pomocą wyspecjalizowanego oprogramowania. Rzecz jasna, tak zaawansowane i kosztowne narzędzia, jak choćby słynna Statistica firmy StatSoft, są dostępne dla nielicznych, profesjonalnych użytkowników - zarówno ze względu na stopień skomplikowania, jak i wysoki koszt. Jednak gros obliczeń można przeprowadzić za pomocą arkuszy kalkulacyjnych, takich jak Microsoft Excel czy OpenOffice Calc. Oba zawierają po ok. 80 wyspecjalizowanych funkcji z zakresu statystyki opisowej i matematycznej, którymi można tworzyć dowolnie skomplikowane formuły do przekształcania danych i automatyzacji przeliczeń. W Internecie są też wtyczki produkowane przez firmy trzecie, współpracujące z Excelem i rozszerzające jego możliwości analityczne. Wiele komercyjnych i bezpłatnych narzędzi można znaleźć m.in. w Mathtools.net (http://www.mathtools.net/Excel/Statistics/ ).

Statystyki WHO zawierają mechanizmy pozwalające porównywać wybrane wielkości.

Statystyki WHO zawierają mechanizmy pozwalające porównywać wybrane wielkości.

Niewątpliwie idealnym rozwiązaniem o charakterze systemowym byłoby powszechne zastosowanie w Internecie aplikacji języka XML jako "opakowania" danych statystycznych - przynajmniej w ważniejszych, publicznie dostępnych bazach danych. Obecnie dominują jeszcze zwykłe HTML-owe tabele, nierzadko dane są też udostępniane w postaci arkuszy Excela lub Calca, które można po prostu pobrać na swój komputer. Dane takie mają jednak siłą rzeczy statyczny charakter, a po dokonaniu przeliczeń w komputerze każda próba aktualizacji wymaga ponownego opracowania. Natomiast powiązanie danych źródłowych dostępnych w Sieci w postaci XML z zainstalowanymi w komputerach programami klienckimi (przede wszystkim właśnie z arkuszami kalkulacyjnymi) pozwoli całkowicie zautomatyzować przeliczenia, gdyż każda aktualizacja będzie po pobraniu od razu przetwarzana przez arkusz, zaś wygenerowane wykresy będą samoczynnie modyfikowane.