Procesory przyszłości

Ponad sześć miesięcy po premierze procesora AMD K6-2 z zestawem instrukcji 3DNow Intel zaprezentował od dawna oczekiwany produkt nazywany kodowo Katmai

Ponad sześć miesięcy po premierze procesora AMD K6-2 z zestawem instrukcji 3DNow Intel zaprezentował od dawna oczekiwany produkt nazywany kodowo Katmai. Nawiązując do ugruntowanej w świadomości użytkowników marki, nadał nowemu procesorowi nazwę Pentium III.

Architektura Pentium III

Architektura Pentium III

Procesor był gotowy od ponad roku, lecz jego premiera miała miejsce dopiero teraz. Dlaczego tak się stało? Wprowadzona ponad roku temu z procesorem Pentium MMX technologia multimedialna, mimo starań marketingowych, do tej pory nie doczekała się zbyt wielu implementacji w programach. Aby Pentium III odniósł sukces, potrzebne było wsparcie ze strony programistów, tym bardziej, że nowy produkt ma zasadnicze zmiany.

Odważny krok

Po raz pierwszy od 1985 roku Intel zmienił w zasadniczy sposób architekturę procesora. Z budowy procesorów Pentium II zachowano dynamiczne działanie, pamięć podręczną L1 wielkości 32 KB, pamięć podręczną L2 - 512 KB, szynę systemową 100 MHz i technologię MMX. Pentium III zawiera natomiast 70 nowych instrukcji (nazywanych SSE, a uprzednio KNI) i 8 nowych 128-bitowych rejestrów, w których wykonywane są operacje na liczbach zmiennoprzecinkowych pojedynczej precyzji.

Producenci umieścili w komputerach z Pentium III najnowsze komponenty.

Producenci umieścili w komputerach z Pentium III najnowsze komponenty.

Poprzedni, przełomowy krok dotyczył przejścia z architektury 16-bitowej na 32-bitową w procesorze 386. Uważni czytelnicy pamiętający wprowadzenie technologii MMX, zaczną się pewnie zastanawiać, czy nie jest to czasem chwyt reklamowy, gdyż wtedy również mówiło się o nowych rejestrach, instrukcjach i rewolucji. Technologia MMX bazowała na nowych rejestrach, jednak były one "schowaneŢ za rejestrami zmiennoprzecinkowymi i wykonywanie operacji na nich wymagało zapisania zawartości tych ostatnich, dokonania obliczeń i powtórzenia operacji w odwrotnej kolejności. Taki sposób działania okazał się dość powolny.

Przeprowadzone analizy wykazały, że większość obecnych aplikacji multimedialnych korzysta z działań na liczbach stałoprzecinkowych. Jest to spowodowane charakterystyką wykorzystywanych danych. Jedynymi operacjami zmiennoprzecinkowymi są obliczenia geometrii obiektów trójwymiarowych. Analizy pokazały też, że arytmetyka zmiennoprzecinkowa mogłaby być wykorzystywana przez wiele procesów multimedialnych, jak przetwarzanie dźwięku czy rozpoznawanie mowy, niestety, moc procesorów nie była wystarczająca.

Penium III okazał się najszybszy.

Penium III okazał się najszybszy.

W rezultacie stworzono 50 nowych instrukcji SIMD (single instruction multiple data - pojedyncza instrukcja wiele danych), które, operując na 128-bitowych rejestrach zmiennoprzecinkowych, mogą przetwarzać sygnały cyfrowe i dane aplikacji multimedilanych. Jaki sens ma to dla zwykłego użytkownika? Jednoczesne przetwarzanie czterech danych pozwoli generować sceny 3D zawierające większą liczbę wielokątów (z których budowane są obiekty) i oświetleń, co przyczyni się do bardziej realnych widoków. W przypadku audio-wideo będziemy mogli uzyskać lepszą jakość obrazu i szybsze rozpoznawanie mowy.

Ulepszony MMX

Procesor Pentium III Xeon

Procesor Pentium III Xeon

Pentium III zawiera też 12 nowych instrukcji MMX, których zabrakło w pierwotnym zestawie. Jedną z nich jest przewidywanie ruchu wykorzystywane w kodowaniu MPEG (które polega na poszukiwaniu jednakowych bloków obrazu). Inne przyśpieszają proces kompensacji ruchu czy algorytmów rozpoznawania mowy.

Pozostałe 8 nowych instrukcji odnosi się do buforowania danych, gdyż algorytmy multimedialne wykorzystywane przy kompresji wideo i obsłudze grafiki 3D wymagają szerokiego pasma pamięci. W Pentium III zastosowano mechanizmy, które pozwalają programom ładować dane do bufora, zanim zostaną wykorzystane, inne zaś wysyłać bezpośrednio do pamięci systemowej z pominięciem bufora (by nie "zaśmiecaćŢ go niepotrzebnymi informacjami). Pamięci buforowe są znacznie szybsze od systemowych, dlatego też przepływ danych z nich jest szybszy. Instrukcje pozwalają definiować, do której z pamięci podręcznej mają być wysłane dane (L1, L2). Przyśpieszenie ich przepływu pozwoli zwiększać wykorzystywanie zbiorów danych o obiektach 3D oraz informacji wideo.


Zobacz również