Intel Pentium 4 Prescott

Obecny procesor Intela do komputerów stacjonarnych, Pentium 4 z rdzeniem Northwood, dożywa swoich dni. Od czasu premiery w styczniu 2002 Intel zwiększy) częstotliwość taktowania z 2,2 do 3,4 GHz. Ze ''starego'' Northwooda zapewne nie da się wycisnąć więcej. Już przy 3,4 GHz procesor produkowany w technologii 130 nm zużywa do 82 W energii. Zresztą Intel nie musi już podkręcać starego rdzenia, gdyż następca w technologii 90 nm o nazwie Prescott jest już gotowy i równolegle sprzedawany.

Obecny procesor Intela do komputerów stacjonarnych, Pentium 4 z rdzeniem Northwood, dożywa swoich dni. Od czasu premiery w styczniu 2002 Intel zwiększy) częstotliwość taktowania z 2,2 do 3,4 GHz. Ze 'starego' Northwooda zapewne nie da się wycisnąć więcej. Już przy 3,4 GHz procesor produkowany w technologii 130 nm zużywa do 82 W energii. Zresztą Intel nie musi już podkręcać starego rdzenia, gdyż następca w technologii 90 nm o nazwie Prescott jest już gotowy i równolegle sprzedawany.

Całkowicie od nowa zaprojektowany procesor jest już produkowany w dwóch fabrykach; trzecia, w Irlandii, rozpoczęta pracę w połowie 2004. Wszystkie fabryki mogą produkować rdzeń z wafli krzemowych o średnicy 300 mm. Zakładając wydajność około 500 procesorów z jednej płytki, Intel może produkować miesięcznie do miliona procesorów Prescott. Dostawy nowych procesorów rozpoczęły się w lutym 2004 roku. Intel postanowił pozostawić nazwę Pentium 4; inna byłaby nawet w pewnym sensie niestosowna, ponieważ Prescott mimo wszystko opiera się na architekturze NetBurst, zapoczątkowanej wraz z pierwszym procesorem Pentium. Proces produkcyjny został jednak unowocześniony o dwie generacje, a projektanci rdzenia też nie próżnowali. Sądzi się, że Prescott będzie skalowalny co najmniej do 5 GHz. Wysoka częstotliwość taktowania, jakkolwiek bardzo nośna marketingowo, decyduje jedynie w części o rzeczywistej mocy obliczeniowej procesora. Równie ważna jest liczba poleceń wykonywanych w trakcie jednego cyklu taktowania, a w tym względzie Prescott ma sporą przewagę nad starym rdzeniem Northwood.

Nowe wielkości pamięci cache i nowe gniazdo

Prescott przewyższa pierwsze Pentium wieloma parametrami, które decydują o wydajności. Z reguły wartości są co najmniej podwojone. (źródło - Intel)

Prescott przewyższa pierwsze Pentium wieloma parametrami, które decydują o wydajności. Z reguły wartości są co najmniej podwojone. (źródło - Intel)

Obie pierwsze generacje Pentium z rdzeniami Willamette i Northwood musiały zadowolić się zaledwie 8 KB szybkiej pamięci cache L1 na dane. Prescott ma do dyspozycji 16 KB pamięci cache L1. Jednak pamięć instrukcji (Trace Cache) pozostanie na poziomie 12k µOps. Pamięć cache L2, która przechowuje zarówno dane, jak i kod, została podwojona do wielkości 1 MB. Więcej, bo 2 MB, może zaoferować tylko Pentium 4 Extreme Edition, który jednak wewnętrznie opiera się na rdzeniu Xeon-Gallatin. Podobnie jak w rdzeniu Northwood, pamięć cache 2 jest połączona z rdzeniem magistralą 256-bitową i przy częstotliwości taktowania 3,4 GHz ma przepustowość 108 GB/s. Częstotliwość taktowania magistrali FSB rozpoczyna się w przypadku procesora Prescott od 800 MHz - z takiej korzystał również rdzeń Northwood. Ponieważ Prescott jest jednocześnie kompatybilny z dotychczasowym gniazdem 478, wystarczy odpowiednio uaktualnić BIOS, żeby mógł pracować w wielu dotychczasowych płytach głównych do Pentium 4. Intel zadbał o to już na wiosnę 2003 roku, publikując odpowiednie specyfikacje do chipsetów i865 oraz i875 Prescotta. Mając dwa kanały pamięci DDR 400 MHz, oba chipsety doskonale pasują do magistrali FSB 800 MHz. Jeszcze w roku 2004 Prescott będzie mógł pracować w starych płytach z częstotliwością 3,6 GHz - na tym kompatybilność prawdopodobnie się skończy. W połowie 2004 roku Intel wprowadził równolegle gniazdo LGA775.

Początkowo było ono przystosowane również do magistrali FSB 800 MHz, jednak w niedługim czasie powinno osiągnąć 1200 MHz. Ponadto 297 dodatkowych styków umożliwia zasilanie procesora większym prądem, a więc moc strat przekroczy 100 W. Już to wystarczy, żeby Prescott (a może jego następcy) mógł dojść do bariery 5 GHz.

Rozszerzenia architektury

Prescott to konsekwentne rozwinięcie architektury NetBurst pierwszego procesora Pentium z rdzeniem Willamette.

Prescott to konsekwentne rozwinięcie architektury NetBurst pierwszego procesora Pentium z rdzeniem Willamette.

Wysoka częstotliwość taktowania wymaga długich potoków, by poszczególne stopnie potoków były w miarę proste. Jednak im dłuższy potok, tym bardziej dramatyczny spadek wydajności, gdy dojdzie do zatkania potoku. Dlatego też Intel po raz kolejny wyraźnie rozbudował mechanizmy przewidywania skoku i wstępnego pobierania poleceń. Chociaż prace nad nimi trwają od lat, wydaje się, że wciąż można tu wiele poprawić. Oba bloki funkcjonalne dostarczają nieustannie kolejnych porcji poleceń, przyczyniając się w ten sposób do lepszego wykorzystania skrajnie długich potoków Prescotta.

Wbrew wcześniejszym oczekiwaniom, Intel nie zwiększył liczby wirtualnych procesorów w technologii HyperThreading - pozostały dwa. W ostatecznym efekcie zwykłymi plotkami okazały się też pogłoski o 64-bitowym rozszerzeniu Yamhill,czy wręcz kompatybilności x86-64 z procesorami AMD Opteron i Athlon.

Niewielkim pocieszeniem jest to, że dzięki instrukcji Imul mnożenie liczb odbywa się o kilka taktów szybciej. Instrukcja ta działa obecnie na własnym module sprzętowym, nie obciążając już modułu obliczeń zmien-nopozycyjnych. Intel przyspieszył również wykonywanie instrukcji shift oraz rotate dla liczb całkowitych, dodając kolejne bufory zwiększające przepustowość. Liczbę Store Buffer Intel zwiększył w stosunku do rdzenia Northwood z 24 do 32, a liczbę Write Combine Buffer z sześciu do ośmiu. Cztery dodatkowe Floatingpoint Scheduler Buffer przyspieszają pracę jednostki zmiennopozycyjnej.

Wiele kontrowersji budzi rozszerzenie La Grande Support. Ma ono umożliwiać bezpieczne wykonywanie programów (secure computing), chroniąc nawzajem przed sobą programy i wątki.

W gruncie rzeczy jest to zintegrowana w procesorze koncepcja Trusted Computing Group ( http://www.trustedcomputinggroup.org/home ) (TCG, wcześniej TCPA), idąca jednak o krok dalej. La Grande ma sprawić, że żaden, nawet wysoko uprzywilejowany program nie będzie mógt się odwoływać do danych lub kodu innej aplikacji.

La Grande daje możliwość wykonywania chronionego kodu w izolowanym otoczeniu w procesorze i w pamięci. W ten sposób wyklucza się późniejsze debugowanie, reverse engineering oraz zakładanie łat przez złośliwe oprogramowanie w trakcie wykonywania programu. Nawet komunikacja z urządzeniami wprowadzania danych, jak klawiatura czy mysz, odbywa się kanałami chronionymi kryptograficznie. Wszystko to wymaga jednak wielkich zmian w chipsecie i systemie operacyjnym.

Rozszerzenie La Grande mogłoby po raz pierwszy znaleźć zastosowanie w następcy Windows XP, systemie operacyjnym o kryptonimie Longhorn. To jednocześnie dowód na to, że Microsoft praktycznie zrezygnował z utworzenia całkowicie bezpiecznego systemu Windows. Zamiast tego Longhorn podzieli wirtualnie komputer na dwie części: jedną zwykłą, z jak zwykle niebezpiecznym systemem Windows, i drugą z bezpiecznym jądrem Nexus. Nexus odgrodzi się od reszty komputera tym łatwiej, że będzie dysponował nawet własną warstwą abstrakcji sprzętu (Hardware Abstraction Layer, HAL), w tym przypadku o nazwie NAL. W twierdzy Nexusa mają bezpiecznie pracować wybrane programy, na przykład do obsługi bankowości internetowej.

Rozszerzenia zestawu poleceń SSE3

Intel po raz kolejny rozszerza zestaw instrukcji SSE. (źródło - Intel)

Intel po raz kolejny rozszerza zestaw instrukcji SSE. (źródło - Intel)

W procesorze Prescott Intel rozszerzył zestaw poleceń IA32 o 13 dodatkowych. Nowe dotyczą głównie jednostki zmiennopozycyjnej z nowymi poleceniami SIMD, ponadto obejmują rozszerzenia do obliczeń na liczbach zespolonych. Intel określa zestaw dodatkowych poleceń mało spektakularną nazwą SSE3. Większość nowych poleceń jest raczej egzotyczna i ma zastosowanie w bardzo szczególnych przypadkach. SSE3 dysponuje pewnym potencjałem optymalizacji w przypadku bibliotek matematycznych, które wykonują wiele operacji na liczbach zespolonych lub wykorzystują algorytm motylkowy do szybkich transformacji Fouriera. Prawdopodobną korzyść mogą odnieść aplikacje naukowe i kodeki audio/wideo.

Oto przegląd nowych poleceń procesora Prescott:

FISTTP przekształca wartość zmien-nopozycyjną na wartość całkowitą przez obcięcie, a nie jak w dotychczasowym poleceniu FISTP - przez zaokrąglenie. Gdy w starej wersji zachodziła potrzeba obcięcia zamiast zaokrąglenia, konieczna była jeszcze dodatkowa operacja odejmowania 0,5.

MOVSHDUP zwraca przy argumencie SIMD o każdorazowo czterech pojedynczych wartościach zmienno-pozycyjnych dwa razy pierwszą wartość i dwa razy drugą wartość. Z wektora (A3,A2,A1,A0) polecenie MOVSHDUP tworzy więc wektor (A2,A2,A0,A0). Polecenie to jest przydatne w działaniach na liczbach zespolonych, gdy część rzeczywista i część urojona zapisana jest w sąsiadujących zmiennych (A3,A2) oraz (A1,A0).


Zobacz również