Jurorzy konkursu piękności

Wśród użytkowników komputerów są ludzie, którzy zawsze muszą mieć najszybsze dostępne maszyny. Są i tacy, którzy raz na jakiś czas decydują się na małe unowocześnienie swojej konfiguracji. I jednych, i drugich łączy chęć przetestowania wydajności swojego komputera. Z pomocą przychodzą liczne programy, które określą dokładnie, ile mocy drzemie pod jego maską.


Wśród użytkowników komputerów są ludzie, którzy zawsze muszą mieć najszybsze dostępne maszyny. Są i tacy, którzy raz na jakiś czas decydują się na małe unowocześnienie swojej konfiguracji. I jednych, i drugich łączy chęć przetestowania wydajności swojego komputera. Z pomocą przychodzą liczne programy, które określą dokładnie, ile mocy drzemie pod jego maską.

Mowa oczywiście o benchmarkach - programach, których jedynym zadaniem jest określanie wydajności komputerów. Jak pokazuje krótki rekonesans w Internecie, jest nie tylko wielu miłośników testowania komputerów, ale również bardzo wielu autorów stosownych programów. W efekcie powstają dziesiątki, a nawet setki mniejszych i większych narzędzi, których rzeczywista przydatność waha się od zerowej do bardzo wysokiej. W tym artykule mamy nadzieję nieco rozjaśnić sytuację i pomóc przedrzeć się przez gąszcz programów mierzących wszystko co mierzalne.

PC WorldBench 2000

Uważni czytelnicy z całą pewnością zauważyli, że ilekroć publikujemy testy komputerów, za każdym razem pojawia się wynik uzyskany w teście PC WorldBench 2000. Benchmark ten nie jest ze względów licencyjnych powszechnie dostępny i tym bardziej warto go w kilku słowach opisać.

PC WorldBench 2000 to klasyczny benchmark użytkowy, przygotowany na użytek pism z rodziny PC World na całym świecie. Podobnie jak w przypadku opisywanego w tym artykule SYSmark 2000, w skład PC WorldBench 2000 wchodzi kilkanaście typowo biurowych aplikacji. Zadaniem samego benchmarku jest zadbanie o optymalne dla wiarygodności testu ustawienia systemowe, uruchamianie odpowiednich makr i zbieranie wyników.

Wśród aplikacji, które służą do testów, znalazły się najbardziej popularne programy, na przykład Adobe Photoshop 5.0, MS Access 97, MS Excel 97, MS Word 97, MS PowerPoint 97, Netscape Communicator 4.06, Lotus 1-2-3 i kilka innych.

Program pozwala ustawić liczbę powtórzeń poszczególnych testów, co wpływa na wiarygodność wyników. W redakcyjnej procedurze przyjęliśmy trzykrotne powtórzenie, po którym następuje uśrednienie wyników. Między poszczególnymi powtórzeniami komputer jest restartowany - o ten drobiazg również dba PC WorldBench 2000. Program minimalizuje także wpływ zewnętrznych czynników - odcina na przykład połączenia sieciowe, które uaktywniając się, mogłyby obciążyć procesor i spowolnić inne operacje.

W obecnej wersji testom nie podlega wydajność w grafice 3D, ale według zapowiedzi, już w następnej wersji można się spodziewać odpowiedniego modułu.

Benchmarki naukowo

Pierwszym i narzucającym się sposobem klasyfikacji benchmarków jest ich podział w zależności od tego, jaki element systemu testują. Istnieje jednak podział jeszcze bardziej uniwersalny - na benchmarki syntetyczne i użytkowe.

Benchmarki syntetyczne badają wydajność określonego podzespołu, na przykład procesora bądź karty graficznej. Autor takiego testu sam wybiera, które funkcje danego urządzenia należy przetestować i w jaki sposób zrobić to najlepiej. Istnieje oczywiście ryzyko błędu przy projektowaniu założeń takiego testu - dość łatwo pominąć funkcje, które są intensywnie wykorzystywane w rzeczywistych aplikacjach, a uwzględnić wykorzystywane dużo rzadziej. W efekcie wyniki benchmarków syntetycznych mogą się czasami w niewielkim stopniu przekładać na rzeczywistą wydajność komputera w typowych zastosowaniach.

Rozwiązanie tego typu problemów umożliwiają benchmarki użytkowe. Zazwyczaj odbywa się to w ten sposób, że autor testu przygotowuje zestaw makr, które uruchamiają po kolei różne aplikacje, zadając im do wykonania zestaw typowych operacji i mierząc czas ich wykonania. Tak działa między innymi PC WorldBench 2000, wykorzystywany przez naszą redakcję do pomiarów wydajności komputerów, a także konkurencyjny Babco SysMark 2000.

Istnieją również testy-hybrydy, które próbują metodą "dwa w jednym" wykonać zarówno pomiary użytkowe, jak i syntetyczne. Przykładem jest na przykład bardzo znany 3DMark2000, który zawiera testy bardzo przypominające gry (na przykład pierwszy test z helikopterem) oraz typowo syntetyczne, na przykład mierzące szybkość procesora.

Naprawdę dobry benchmark, czyli...

Programów testujących jest w Sieci bez liku, ale zaledwie kilkanaście z nich można uznać za rzeczywiście przydatne, wiarygodne i wygodne w użyciu. Zastanówmy się zatem przez chwilę, czym się powinien charakteryzować dobry benchmark.

Kluczową sprawą jest dokładność i powtarzalność wyników danego testu. Jeśli ten podstawowy warunek nie jest spełniony, wówczas wszystkie inne funkcje i udogodnienia właściwie przestają mieć znaczenie.

Wymieniony warunek jest praktycznie jednoznaczny z dyskwalifikacją większości testów, które trwają kilka czy kilkanaście sekund. W tak krótkim czasie nie da się bowiem dokładnie zbadać wydajności żadnego komponentu komputera, wykluczając jednocześnie wpływ przypadkowych czynników na wynik testu. Oczywiście, długi czas trwania testu nie jest jednoznaczny z wiarygodnością rezultatów.

Nie należy się również dziwić, gdy dwa różne programy testujące z tej samej kategorii, na przykład badające wydajność twardych dysków, podają różne wyniki. Wyniki zależą bowiem bezpośrednio od użytych procedur testowych. Powtarzalność wyników uzyskiwanych z danego programu pozwala jednak porównać urządzenie do innego, testowanego tym samym programem, a właśnie takie porównania są dla większości użytkowników najważniejsze.

Skoro jesteśmy przy porównaniach, dodatkowe punkty przyznaliśmy programom, które pozwalają natychmiast po zakończeniu testu porównać jego rezultaty z rezultatami uzyskanymi przez innych użytkowników. Stosowane są tutaj dwie strategie. Niektóre programy, takie jak SiSoft Sandra, mają wbudowane na stałe referencyjne wyniki testów typowych konfiguracji. Inne benchmarki, na przykład 3DMark2000, pozwalają łączyć się z internetowymi bazami danych, do których użytkownicy programu zgłaszają osiągnięte wyniki. Zawsze cenną funkcją jest również możliwość zapisania przez program uzyskanych rezultatów. W przypadku późniejszego unowocześnienia komputera można będzie szybko ocenić wzrost wydajności, porównując wyniki testów.

Na poprawę oceny wpływa także szczegółowość informacji podawanych przez dany program testujący. Niektóre ograniczają się do podania syntetycznego wyniku testu, jednak naprawdę dobre powiedzą dużo więcej o możliwościach komputera. Przykładem znowu może być SiSoft Sandra. Program ten potrafi wyciągnąć olbrzymią liczbę parame-trów dotyczących praktycznie każ-dego podzespołu komputera. Może w związku z tym posłużyć nie tylko jako benchmark, ale również program diagnostyczny, pozwalający wyszukiwać przyczyny ewentualnych problemów.

Kto pyta, nie błądzi

Stosunkowo najmniej błędów w pomiarach można popełnić, gdy celem jest zbadanie wydajności komputera w konkretnej konfiguracji. Nie trzeba bowiem wówczas analizować, jak poszczególne podzespoły wpływają na siebie nawzajem.

Jeśli jednak chce się przeprowadzić syntetyczny test jednego elementu komputera, na przykład karty graficznej lub procesora, wówczas sprawa się komplikuje, a o fałszywe wnioski bardzo łatwo. O czym należy pamiętać, przystępując do tego typu testów? Poniżej przedstawiamy krótki poradnik.