Prawie dwa w jednym

Gdy pod koniec kwietnia AMD Opteron obchodził drugie urodziny, producent zaprezentował w Nowym Jorku pierwszy dwurdzeniowy procesor. Czyżby Intel rozłożony na łopatki? Sprawdzamy, czy dwurdzeniowy Opteron rzeczywiście jest tak rewolucyjny, jak wynika z oficjalnych informacji.

Gdy pod koniec kwietnia AMD Opteron obchodził drugie urodziny, producent zaprezentował w Nowym Jorku pierwszy dwurdzeniowy procesor. Czyżby Intel rozłożony na łopatki? Sprawdzamy, czy dwurdzeniowy Opteron rzeczywiście jest tak rewolucyjny, jak wynika z oficjalnych informacji.

Zaletą nowego procesora jest nie tylko możliwość zamiany jednoprocesorowych stacji roboczych i serwerów w komputery dwuprocesorowe (czy dwuprocesorowych w czteroprocesorowe), ale również ułatwienie użytkownikom Opteronów przejścia na nowe układy. Wystarczy zamontować nowy procesor, a komputer będzie pracował z dotychczas używanym oprogramowaniem. Możliwość przejścia na dwurdzeniowe procesory, dotychczas zarezerwowana dla dużych systemów, obecnie znalazła się w zasięgu nabywców małych serwerów.

Termin "dwurdzeniowy" oznacza umieszczenie drugiego procesora na fizycznie tym samym układzie. Oba rdzenie są pełnoprawnymi Opteronami, a układ ma dokładnie takie same wymiary, jak jednordzeniowy. Takie rozwiązanie pozwala korzystać z mocy, według producenta, o 70-90 procent większej w wypadku aplikacji wykorzystujących ukła-dy wieloprocesorowe. Jeśli zapewnienia AMD okażą się prawdziwe, zakup dwurdzeniowych Opteronów będzie szczególnie atrakcyjny dla osób, których nie stać na czteroprocesorowe komputery.

Jak testowaliśmy

Zmontowaliśmy zgodny z rekomendacjami AMD komputer z nowym procesorem i przeprowadziliśmy wiele testów wydajności. Producent dostarczył nam dwa egzemplarze Opteron 875 2,2 GHz i płytę główną Tyan do stacji roboczych - model Thunder K8WE (S2895). Wyniki testów pozwalają porównać wydajność nowych, dwu-rdzeniowych Opteronów ze starszymi, jednordzeniowymi modelami.

Do testów wydajności użyliśmy oprogramowania SPEC2000 firmy Standard Performance Evaluation Corporation (SPEC). Testowe skrypty skompilowaliśmy, używając kompilatora Intel do EM64T (Extended Memory 64 Technology), który uruchamialiśmy w systemie Windows Server 2003 Enterprise x64 Edition. Oprogramowanie SPEC jest dopracowane i dostarcza spójnych wyników z różnych platform. Wyniki starszych testów publikowane przez producentów są dostępne w witrynie www.spec.org. Zawierają pełną informację o warunkach testów i przed publikacją zostały zatwierdzone przez SPEC.

CPU2000 składa się z SPECint2000 i SPECfp2000, które mierzą wydajność procesora, odpowiednio, w operacjach na liczbach całkowitych i zmiennoprzecinkowych. Test na liczbach całkowitych sprawdza raczej wydajność aplikacji czy zarządzanie pamięcią niż tempo, w jakim procesor mnoży liczby całkowite. Dla odmiany, test zmiennoprzecinkowy wyciska siódme poty z procesora i jego otoczenia (chłodzenie, zasilanie, poziom hałasu).

Rezultat

Wyniki przedstawione w tabeli pochodzą z testów SPECint_rate2000 i SPECfp_rate2000, które są składnikami pakietu CPU2000. Testy benchmarkowe uruchamiały wiele jednoczesnych procesów. Aby dokładnie sprawdzić, jak system radzi sobie ze wzrostem obciążenia ideałem byłoby uruchamiać po jednym testowym procesie na każdym rdzeniu. Jeśli wydajność zostałaby zwiększona w 100 procentach, to po podwojeniu liczby procesorów komputer radziłby sobie z dwukrotnie większą pracą bez spadku wydajności. Co za tym idzie, wyniki testów CPU2000 powinny być w przybliżeniu dwa razy wyższe niż w konfiguracjach jednordzeniowych.

Wyniki naszych testów: SPECint_rate2000 - 57,9 punktu oraz SPECfp_rate2000 - 62,8 punktu pokazują odpowiednio wzrost wydajności o 85 procent i 64 procent. Krótko mówiąc, osiągnęliśmy wyniki zbliżone do tego, co zapowiadał producent (od 70 do 90 procent). W teście na liczbach całkowitych (typowe operacje wykonywane przez komputer) wzrost wydajności jest bliski ideału. Nie zaskakuje gorszy wynik testu zmiennoprzecinkowego, bo aplikacje wykonujące tego typu obliczenia wyma-gają dodatkowej optymalizacji. Zresztą wynik osiągnięty w teście zmiennoprzecinkowym jest również imponujący. Stosunek wzrostu wydajności do kosztów jest bardzo atrakcyjny.

Wyniki testów na liczbach całkowitych i zmiennoprzecinkowych

Wyniki testów na liczbach całkowitych i zmiennoprzecinkowych

Jak wyniki dwurdzeniowego Opterona wypadają na tle wcześniejszych testów? Dotychczas najlepszy rezultat uzyskany przez procesory AMD i opublikowany w witrynie SPEC należał do dwuprocesorowego jednordzeniowego systemu pracującego z częstotliwością 2,6 GHz. W teście SPECint_rate200 stary Opteron uzyskał 40,5 punktu. Z kolei w teście SPECfp_rate2000 rezultat wyniósł 38,6. Oba testy przeprowadzono w 32-bitowym Windows XP Professional oraz Windows Ser-ver 2003. W obu wypadkach używano kompilatorów Intel C++ oraz Fortran.

Intel nie zamieścił żadnych wyników testów 64-bitowych Xeonów, dlatego próbowaliśmy odnaleźć najbardziej zbliżony układ z 32-bitowymi Xeonami. Dotarliśmy do wyników komputera Della z dwoma jednordzeniowymi 32-bitowymi Xeonami, pracującymi z częstotliwością 3,6 GHz. Procesory te miały 2 MB pamięci cache drugiego poziomu w porównaniu z 1 MB w naszych Opteronach. Miały też, co należy odnotować, sporą przewagę, jeśli chodzi o częstotliwość taktowania (3,6 GHz kontra 2,2 GHz). Te parametry oznaczają jednak wyższy koszt CPU w porównaniu z Opteronami oraz większe zużycie energii, podwyższone wytwarzanie ciepła i wyższy poziomu hałasu. Mając lepsze "warunki startowe", Xeony uzyskały następujące wyniki: SPECint_rate2000 - 40,5 punktu, SPECfp_rate2000 - 31,7.

Ciężki cios dla Intela

Już pierwsze wyniki pokazują, że nowe Opterony będą miały spory wpływ na klientów, którzy dotychczas faworyzowali procesory Intel Xeon. Mówiąc bez ogródek, twierdzenia Intela, że technologicznie stoi na tym samym poziomie, co AMD, okazują się mydleniem oczu.

Jeśli pominąć inne technologiczne różnice, decydujące znaczenie w walce z nową technologią Intela EM64T będą miały następujące elementy: kontroler pamięci umieszczony na układzie, gniazda pamięci przeznaczone do każdego procesora oraz niezależne kanały wejścia/wyjścia pomiędzy procesorami. Wymienione funkcje są unikatowe dla 64-bitowych systemów opartych na procesorach AMD i będą wykorzystywane przez głównych producentów systemów operacyjnych i oprogramowania, m.in. w systemach Windows Server 2003 x64 czy Visual Studio 2005.

Zanim Intel sam zaoferuje procesory dwurdzeniowe, może jedynie konkurować swoją technologią HyperThreading. Jest to pomysłowa namiastka zwiększająca wydajność niewielkiej liczby aplikacji - tych, które wykonują część zadań w tle, poprzez dodatkowe wątki, uruchamiane oddzielnie poza głównym wątkiem programu. Ani procesor, ani system operacyjny nie zapobiegają korzystaniu przez wątki z tych samych zasobów, co sprawia, że niedbałe posługiwanie się nimi staje się głównym powodem niestabilnoś-ci oprogramowania. Jednak Hyper-Threading zwiększa wydajność aplikacji, nawet według szacunków Intela, zaledwie o 30 procent. Ten wzrost dotyczy tylko aplikacji intensywnie korzystających z wątków, a nie całego systemu. Okazuje się, że w większości systemów wykorzystujących mieszankę procesów i wątków HyperThreading może obniżać wydajność. Przeglądając wyniki benchmarków SPEC, można zauważyć, że większość producentów serwerów z procesorami Xeon wyłącza wielowątkowość, żeby uzyskać lepszą wydajność.

Natomiast dwurdzeniowe Opterony zostały opracowane pod kątem możliwie równomiernego przys-pieszania pracy wszystkich aplikacji. Dwurdzeniowe procesory są wydajną alternatywą powszechnej praktyki "rozdzielania" - większą wydajność serwera uzyskuje się, rozkładając jego zadania na kilka połączonych z nim maszyn. Dwuprocesorowy, dwurdzeniowy system z procesorami Opteron może rozkładać obciążenie ekwiwalentnie do czterech fizycznych procesorów.

Przyszłość procesorów

Tak to jest ze wszystkimi benchmarkami, że ich wyniki nabierają znaczenia dopiero w porównaniu z wynikami testów innych urządzeń, a na razie porów-nań mogliśmy dokonać tylko z 32-bitowymi procesorami. Wyniki naszego testu niezbicie dowodzą bardzo dobrej wydajności dwurdzeniowych procesorów. Mimo to dwurdzeniowy Opteron nie jest gwoździem do trumny swojego poprzednika. Wszystkie inne elementy procesora pozostają takie same. Jest to raczej sygnał dla Intela i zapowiedź przyszłych zmian, które zamierza wprowadzać AMD - więcej rdzeni w jednym procesorze, szybsza szyna HyperTransport czy wydajniejsza pamięć.

Komputery z dwurdzeniowymi Opteronami kupione dzisiaj będą działać także za pięć, a nawet siedem lat, wymagając w tym czasie jedynie rozbudowy, np. wymiany układów pamięci z 512 MB na 1 GB czy procesora na szybszy. Komputery z tymi układami nie są w tej chwili najbardziej opłacalne i doradzamy ich kupno tylko osobom, które nie zamierzają przez dłuższy czas wymieniać swojego sprzętu.

Tom Yager jest szefem działu technicznego laboratorium InfoWorld Test Center.

Zalety Opteronów

Dwurdzeniowe Opterony nie dają powodów do niezadowolenia.

  • Są w pełni zgodne z jednordzeniowymi Opteronami oraz 32- i 64-bitowymi systemami operacyjnymi Windows i Linux.

  • Można wymienić jednordzeniowy Opteron na dwurdzeniowy (zwykle wystarczy aktualizacja BIOS-u).

  • Zużywają tyle samo energii i wytwarzają tyle samo ciepła, co procesory jednordzeniowe.

  • Wykorzystują zalety dwurdzeniowej optymalizacji w kompilatorach Microsoftu i Intela.

  • Oferują podobną wydajność, jak układy dwuprocesorowe, ale za dużo niższą cenę.

Kochamy benchmarki

Można mieć wiele zastrzeżeń do benchmarków, argumentując, że ich wyniki są bez znaczenia, wprowadzają w błąd i faworyzują urządzenia, których producent sponsorował powstawanie danego programu. Jednak benchmarki, których używamy, nie są zabawką, bo w takim wypadku nie używalibyśmy ich. Niezależnie od zastrzeżeń, każdy przyzna, że benchmarki są potrzebne.

Gdyby ich nie było, moglibyśmy porównywać tylko parametry techniczne: częstotliwość taktowania, liczbę przetwarzanych wielokątów na sekundę, wielkość i ilość pamięci podręcznej itp. Co jest ekscytującego w dwurdzeniowym Opteronie, który pracuje z częstotliwością 2,2 GHz, gdy Xeon osiąga 3,6 GHz? Lepiej kupić pięć dysków Serial ATA 7500 obr./min czy może trzy dyski SCSI 15000 obr./min? Pamięci DDR2 są szybsze niż DDR, nieprawdaż? Wygląda to jak proste zadania matematyczne, jednak zastosowanie reguł algebry nie da właściwych odpowiedzi. Możesz wiedzieć wszystko o sprzęcie, a jednak wciąż wahać się, gdy staniesz przed decyzją, co kupić. W tym wypadku benchmarki mogą się okazać dobrym partnerem, jeśli wybierzesz odpowiednie i będziesz wiedział, jak interpretować ich wyniki, na które wartości zwracać uwagę, a które ignorować. Szczególnego znaczenia nabierają w firmach, w których wydatki na komputery są znacznie wyższe niż prywatnego użytkownika.

Testowanie za pomocą benchmarków daje wiedzę, której nie zdobędziesz w inny sposób. Najważniejszą funkcją tych programów jest dostarczenie podstawowej miary, której nie znajdziemy wśród parametrów technicznych: przepustowości. Niekiedy ważniejsze jest, jakie obciążenie wytrzyma komputer (szczególnie serwer) niż to, jak szybko wykona określone zadania.

Wyniki zyskują wiarygodność, jeśli wiemy, jak przeprowadzono testy. Jest naprawdę sporo dobrych benchmarków. Jednym z nich jest użyty przez nas w teście Operonów CPU2000 firmy SPEC. Zaletą programu jest możliwość porównywania wyników z różnych platform, a także ze starszych testów. Nie zawsze jest to możliwe, ponieważ wiele benchmarków co chwila pojawia się w nowych wersjach, które dają inne wyniki.

Cztery rdzenie, każdy inny

AMD już planuje kolejne posunięcia. Jest niemal pewne, że firma będzie oferować procesory czterordzeniowe, ale nie to jest najciekawsze. W grę wchodzi kilka kierunków rozwoju procesorów po pojawieniu czterordzeniowych produktów. Największym wyzwaniem jest obecnie dla producentów znalezienie dla nich właściwych zastosowań. Jedną z opcji są niejednorodne rdzenie - można zbudować procesor składający się z dwóch różnych rdzeni, co otwiera nowe możliwości. Rozwiązanie to, nazwane system-on-a-chip, polega na wbudowaniu w procesor wielu zadań komputera. Układy system-on-a-chip raczej nie będą się nadawały do zastosowań wymagających dużej mocy, oferując przeciętną wydajność. Istotą tego rozwiązania jest zaspokojenie potrzeb poszczególnych grup użytkowników, wykorzystujących komputery do różnych celów.


Zobacz również