Koniec procesorów jakie znamy


Dzięki technologii Nehalem Turbo Mode, każdy z rdzeni może być niezależnie zwalniany lub wyłączany - może np. sam przejść w tryb głębokiego uśpienia C6, niezależnie od pozostałych jednostek. Prędkość działania pozostałych rdzeni może zaś zostać w tym czasie przyspieszona, co ma za celu zwiększenie wydajności przetwarzanych przez nie zadań, przy jednoczesnym zachowaniu ogólnego bilansu wydzielanego dla całego procesora ciepła. System ten działa w sytuacjach, gdy nie ma potrzeby wykorzystania mocy obliczeniowej wszystkich rdzeni, gdyż np. uruchomiono tylko dwa jednowątkowe programy, które i tak byłyby wykonywane na dwóch rdzeniach, a dla sprawnego ich działania liczy się najbardziej częstotliwość zegara. "Mostkowanie" mocy powinno sprawdzić się dobrze w grach, które najczęściej nie potrafią wykorzystać mocy wielu rdzeni. W tych zastosowaniach wciąż liczy się częstotliwość taktowania procesora i przewidujemy, że tu Turbo Mode rozwinie skrzydła. Pamiętajmy jednak, że Turbo Model uruchamiany jest na bazie bardzo precyzyjnej analizy działania procesora - w nim znajdziemy kilkanaście sensorów na bieżąco monitorujących jego obciążenie i temperaturę. Jeśli zatem procesor będzie kiepsko chłodzony (obudowa nie będzie dostatecznie wentylowana lub po prostu układ chłodzenia nie będzie wydajny) to "dopalacze" nie zostaną uruchomione lub tez nie dodadzą tyle mocy ile mogłyby dać w optymalnych warunkach.

Jedną z najważniejszych nowości w Nehalemie jest wbudowanie w jego strukturę kontrolera pamięci RAM. Podobne rozwiązanie jest obecnie stosowane w układach firmy AMD. Wbudowany kontroler pamięci eliminuje przy dostępie do danych pośrednictwo układów chipsetu płyty głównej i stosunkowo wolnej magistrali FSB - ma to szczególne znaczenie w wypadku maszyn wieloprocesorowych, gdyż poszczególne kości nie blokują sobie nawzajem dostępu do będącej dla nich w tym wypadku wąskim gardłem magistrali systemowej. Co ważne, wbudowany w Nehalema kontroler pamięci obsługuje pamięci DDR3 (zarówno DDR3 800, 1066 i 1333 MHz) w sposób jedno, dwu, trzy lub czterokanałowy.

Działanie systemu Nehalem Turbo Mode.

Nehalem Turbo Mode

System Nehalem Turbo Mode dynamicznie dostarcza optymalną moc obliczeniową przy zachowaniu najlepszego współczynnika efektywności wykorzystania zasilania.

Power Gates - bramki zasilające

Zero power for inactive cores - brak zasilani dla nieaktywnych rdzeni

No Turbo - bez systemu turbo

Tyrbo Mode - tryb turbo

In response to workload demand adds aditional performance bin - w zależności od obciążenia, na żądanie dodawana jest dodatkowa wydajność.

Lightly threaded workload - obliczenia o nieskomplikowanej wielowątkowości

TPD - TPD

Istotną nowością związaną z wymianą danych jest również wprowadzenie do architektury Nehalema specjalnego łącza międzyprocesorowego, wykorzystywanego też do komunikacji z chipsetem. Technologia ta nosi miano, technologii Quick-Path Interconnect i pozwala na szybką (do 25,6 GB/s - zastosowano cztery linie o przepływności 6,4 GB/s każda), bezpośrednią komunikację między procesorami z pominięciem chipsetu płyty głównej. Dzięki temu uzyskano ponad dwukrotny wzrost wydajności w międzyukładowej transmisji danych w stosunku do wieloprocesorowych systemów korzystających z tradycyjnej magistrali FSB. Jak już wspomnieliśmy magistrala systemowa QPI służy też do komunikacji z chipstem.

Powyżej omówione zmiany dotyczą głównie otoczenia rdzeni. Wpływają one na szybkość pracy systemu komputerowego jako całości i na lepsze funkcjonowanie układów wielordzeniowych. Jednak to nie jedyne zmiany jakie znaleźć możemy w Nehalemie w stosunku do układów z rodziny Penryn. Modyfikacje nie ominęły bowiem również wewnętrznej mikroarchitektury procesora.

Najważniejszą zmianą jest optymalizacja podzespołów i układów na poziomie mikroarchitektury. Nehalem potrafi szybciej o ok. 33% wykonywać wewnętrzne mikrooperacje. Istotnym zmianom poddano również moduły pamięci cache drugiego poziomu odpowiadające za przewidywanie dalszej części programu i potrzebnych danych, które z wyprzedzeniem załadowane muszą być do pamięci cache L2. Chodzi tutaj o moduł przewidywania rozgałęzień oraz 512 wejściowy bufor TLB (Translation Lookaside Buffer), w którym przechowywane są fragmenty tablicy stron pamięci operacyjnej komputera.

Nehalem z grafiką

To co może okazać się ważne, a dla wielu użytkowników wręcz najważniejsze, przewidziane są wersje Nehalema z wbudowanym w półprzewodnikową strukturę układem graficznym. Jest to ten sam zmodyfikowany moduł graficzny, który znalazł się niedawno w chipsecie przeznaczonym dla platformy Cetrino 2.

Wykorzystana w "graficznej" wersji Nehalema jednostka graficzna zgodna jest z pod względem sprzętowym z bibliotekami Microsoft DirectX 10 oraz modelem cieniowania Shader Model 4.0 i Open GL 2.0. Duży nacisk położony został na dekodowanie materiałów wideo. Dzięki temu moduł graficzny może odciążyć jednostkę centralną komputera od pracochłonnego wykonywania takich operacji związanych z dekodowaniem obrazu jak, jak obliczanie odwrotnej, dyskretnej transformaty kosinusowej (iDCT), kompensacji ruchu, deinterlacingu i korekcji kolorów. Sprzętowe dekodowanie materiałów wideo wykonywane jest dla materiałów wideo zarówno w zwykłej, jak i wysokiej rozdzielczości zapisanych w formatach AVC, VC1 i MPEG-2.

Kolejnymi dwoma ciekawostkami związanymi z obróbką materiałów wideo są Panel Fitter 2 oraz Non-Linear Anamorphic Scaling. Pierwsza technologia odpowiada za sprzętowe skalowanie obrazu, dostosowując go do aktualnej rozdzielczości wyświetlacza. Drga pozwala na przeskalowywanie obrazów w formacie 4:3 do formatu 16:9 w sposób nieliniowy tak, aby obraz był jak najmniej zniekształcony w miejscach, w których koncentruje się wzrok widza. Skalowanie rozpoczyna się zatem niewielkim "rozciąganiem" obrazu w środku ekranu, a kończy przy jego krawędzi, gdzie deformacje są największe, ale jednocześnie najmniej widoczne.

W tym miejscu warto odpowiedzieć sobie na pytanie, co daje integracja modułu graficznego w procesorze. Obecnie zintegrowane moduły graficzne znaleźć możemy w chipsetach. Taka konstrukcja zestawu układów sterujących przeznaczona jest do budowy na jej bazie typowych komputerów biurowo-domowych. Pecety typu używane są przede wszystkim do surfowania po Internecie, do edycji tekstów, prowadzenia prostych obliczeń w arkuszach kalkulacyjnych, wprowadzania danych, pisania e-maili i oglądania filmów. Sporadycznie wykorzystywane są również do uruchamiania gier. Co więcej, gry takie są to zazwyczaj dostępne w Internecie tytuły wykonane we flash'u lub starsze, niezbyt wymagające gry sprzed kilku lat. Jak wiemy, do wymienionych powyżej zadań w zupełności wystarczy układ graficzny o niewygórowanej mocy obliczeniowej.

Dokonując analiz rynkowych, producenci płyt głównych już kilkanaście lat temu wpadli na pomysł, że zamiast wmontowywać do biurowo-domowych komputerów oddzielne karty graficzne lepiej (i znacznie taniej) będzie zaoferować niewymagającym użytkownikom zintegrowane płyty główne wykorzystującą stosunkowo proste, low-endowe układ graficzny. Pomysł przyjął się na tyle, że producenci chipsetów go podchwycili i zaczęli wbudowywać bezpośrednio w strukturę krzemową proste moduły graficzne, co jeszcze bardziej pozwoliło obniżyć koszty produkcji tanich komputerów.

Aby, niepotrzebnie nie rozbudowywać zintegrowanego podsystemu graficznego zaczęto wykorzystywać do jego obsługi pamięć operacyjną komputera. System przydziela wówczas na potrzeby grafiki pewną jej część. I tu dochodzimy do sedna związanych z Nehalemem zmian. Otóż w klasycznej konstrukcji, stosowanej dotychczas, za obsługę pamięci odpowiada mostek północny. Dzięki niemu moduł graficzny mógł się bezpośrednio komunikować z przydzieloną mu pamięcią RAM. Przesunięcie obsługi pamięci do procesora sprawia, że szybkość wymiany danych między modułem graficznym a pamięcią spada. W większości wypadków, w których wykorzystywane są zintegrowane moduły graficzne, ten spadek nie ma większego znaczenia, z jednym wyjątkiem - odtwarzanie filmów wysokiej rozdzielczości. Tutaj takie opóźnienia sprawiają, że obraz zamiast być płynnie odtwarzanym zaczyna się rwać i przeskakiwać.

Stąd właśnie konstruktorzy zauważyli konieczność przeniesienia modułu graficznego bliżej kontrolera pamięci tak, aby nie trzeba było wykorzystywać do transportu informacji graficznych spowalniającej przepływ danych magistrali systemowej. Podobnie rozumowali inżynierowie z AMD. W procesorach tej firmy kontroler pamięci od dawna znajdował się w procesorze. Teraz okazało się również, że ze względu na coraz popularniejsze dekodowanie materiałów wideo w standardzie HD trzeba w zintegrowanych układach przenieść moduł graficzny z chipsetu do procesora - tak pojawiła się koncepcja procesora AMD Fusion, o którym za chwilę.

Inną korzyścią, jest również to, że wbudowanym w procesor rdzeniem graficznym znacznie łatwiej zarządzań pod kątem oszczędzania energii. Po pierwsze taki układ, wykonany jest w mniejszym procesie technologicznym niż chipset, co samo przez się niesie niższe zużycie energii. Po drugie przełączanie niewykorzystywanego procesora w niższe tryby poboru mocy i obniżanie jego częstotliwości pracy, automatycznie przekładać się może na wyłącznie modułu graficznego. Czy takie rozwiązanie zostanie zastosowane w Nehalemie - zobaczymy.