Koniec procesorów jakie znamy


AMD z nowymi podstawkami

Podobnie jak w Nehalemie, Fusion wymagać będzie nowych podstawek. Liczba wyprowadzeń ma być większa o około 10 procent od obecnych złączy. Związane to jest nie tylko ze zintegrowaną grafiką, ale również z wprowadzoną obsługą pamięci DDR3. Gniazdo to ma nosić nazwę Socket FS1 i ma występować w dwóch wersjach - White i Black. Pierwsze przeznaczone ma być dla jednordzeniowych procesorów Fusion, drugie zaś wykorzystywane będzie w wypadku procesorów dwurdzeniowych.

Z projektem AMD Fusion związane też są prace nad nowym chipsetem SB800, którym dopasowany ma być do wymagań technologii Swift Accelerated Processing Unit (APU). Pod kodową nazwą Swift kryją się bowiem wszystkie wymagania dotyczące całościowego opracowania platformy Fusion - zintegrowanego procesora, chipsetu i rozwiązań technologicznych dla płyt głównych (w tym nowych gniazd), stanowiącą część projektu Fusion. Obecnie wiadomo, że nowy chipset umożliwi obsługę do 14 portów USB, SATA 3 pozwalającego przesyłać dane z prędkością 6 Gb/s oraz obsługę magistrali PCI Express 3.0.

Graficzna ofensywa Intela

Procesory Intel Nehalem i AMD Fusion to układy zgodne z architekturą x86, do których niejako przy okazji dołączono oddzielny, aczkolwiek klasyczny, moduł graficzny. W wypadku Nehalema będzie on występował tylko w niektórych modelach tej jednostki centralnej. Należy pamiętać, że oba układy są cały czas typowymi procesorami. Nieco inaczej przedstawia się natomiast sytuacja z ostatnim procesorem, a mianowicie z Larrabee.

Otóż Larrabee jest procesorem x86, który przystosowany został do przetwarzania grafiki 3D. Innymi słowy jest to układ graficzny przeznaczony do budowy standardowych akceleratorów 3D, tak samo jak ma to miejsce w wypadku GeForce'ów czy Radeonów. Z drugiej strony, dzięki swojej zgodności z kodem x86 jest on jednocześnie procesorem który mieści się w założeniach idei GPGPU (General-Purpose computing on Graphics Processing Units).

Układ GPGPU, to najprościej rzecz ujmując kość graficzna przystosowana do wykonywania obliczeń niezwiązanych z przetwarzaniem strumienia graficznego. Układ taki może zająć się dowolnymi obliczeniami, ale cały czas pozostaje on kartą graficzną. Do niedawna najlepszym przykładem typowego układu GPGPU była NVIDIA Tesla, czyli zmodyfikowana na potrzeby skomplikowanych obliczeń numerycznych karta GeForce 280GTX.

Architektura Intel Larabee wywodzi się wprost od procesora Pentium. Można powiedzieć, że jest to hybryda zawierają w sobie najlepsze cechy jednostek centralnych ogólnego przeznaczenia i nowoczesnych układów graficznych. Najważniejszą cechą Larrabee jest jego uniwersalność i pełna programowalność, które to cechy zawdzięcza zgodności z architekturą i kodem x86. Bez problemu można zatem wykonać na nim zarówno obliczenia związane z przetwarzaniem strumienia graficznego, jak i np. przetwarzaniem materiałów audio-wideo, obliczeniami związanymi z fizyką postaci, czy innymi dowolnymi zadaniami jakie przyjdą do głowy programiście. Co więcej, może on wspomóc jednostkę centralną komputera w chwili wykonywania na skomplikowanych obliczeń inżynierskich czy naukowych przyczyniając się do poważnego wzrostu ogólnej wydajności peceta. Innymi słowy, można powiedzieć, że Larrabee jest uniwersalnym akceleratorem wspierającym CPU w zależności od potrzeb bądź to w obliczeniach graficznych, bądź w innych sytuacjach wymagający dużej mocy obliczeniowej.

Larrabee od środka

Podstawę konstrukcji Larrabee stanowią odpowiednio zmodyfikowane jądra procesorów Pentium, zwane w tym wypadku jednostkami Multithreaded Wide SIMD. Każda z nich może jednocześnie obsłużyć cztery wątki. Budowa pojedynczego modułu Multithreaded Wide SIMD nie jest skomplikowana. Znaleźć w nim można znaną z procesorów Pentium unowocześnioną jednostkę ALU (Arithmetic Logic Unit), która, w odróżnieniu od oryginału może wykonywać operacje 64-bitowe i pracować w trybie wielowątkowym. W celu jej uproszczenia konstruktorzy zrezygnowali z jednostek przewidywania skoków i rozgałęzień (Branch Prediction) oraz modułu Out of Order Execution wykonującego obliczenia poza kolejnością. Oznacza to, że Larrabee wykonuje rozkazy wyłącznie w kolejności, takiej jaką narzuca kod programu.

Slide block diagram

Slide block diagram

Rys. - Schemat architektury Lrrabee

Memory Controller - kontroler pamięci

Fixed function - funkcje zarezerwowane

Texture Logic - Jednostka teksturująca

Display Interface - interfejs odpowiedzialny za wyświetlanie obrazu

System Interfejs - interfejs systemowy

L2 cache - pamięć cache L2.

I$ - cache L1 dla instrukcji

D$ - cache L1 dla danych

Drugim elementem składowym znajdującym się w module Multithreaded Wide SIMD jest jednostka wektorowa VPU (Vector Processing Unit). Składa się ona z wektorowej jednostki o szerokości wektora 16 oraz działa na liczbach pojedynczej i podwójnej precyzji. W czasie trwania cyklu zegarowego przetwarza szesnaście 32-bitowych operacji i potrafi między innymi wykonywać konwersje między różnymi formatami danych takimi jak Int32, FP32 i FP64 czy łączyć w jedną operację wielokrotne dodawanie na trzech argumentach. Oczywiście, wykonywane są przez nią również inne standardowo wymagane dla jednostek VPU operacje wektorowe. Układ Larrabee obsługiwać będzie także nowy zestawy instrukcji AVE (Advanced Vector Extensions), który ma pozwolić na jednoczesne przetwarzanie całych wektorów danych. Innymi słowy, instrukcje AVE są rozszerzeniem istniejących instrukcji SIMD, które mają przyspieszyć operacje przetwarzania grafiki trójwymiarowej.

Core

Core

Rys - Budowa modułu Multithreaded Wide SIMD

Instruction Decode - dekoder instrukcji

Scalar Unit - jednostka skalarna

Vector Unit - jednostka wektorowa

Scalar Register - rejestry skalarne

Vector registers - rejestry wektorowe

L1 Icache & Dcache - Cache L1 (dane i instrukcje)

256K L2 cache Local Subset - lokalnie dostępny cache L2 (256 KB)

Ring - magistrala pierścieniowa