Transmeta Efficeon

Efficeon to kolejna generacja procesorów Transmety. Nowa architektura i zintegrowany mostek północny mają stanowić wyzwanie dla intelowskiego Pentium M.

Efficeon to kolejna generacja procesorów Transmety. Nowa architektura i zintegrowany mostek północny mają stanowić wyzwanie dla intelowskiego Pentium M.

Nazwa nowego procesora Transmety stała się znana już w sierpniu 2003 roku. Efficeon to mniej więcej tyle, co "więcej wydajności". Rodzina Efficeon ma zawojować, dzięki oszczędnemu gospodarowaniu energią i dużej wydajności, świat notebooków, tabletów PC, cichych komputerów stacjonarnych, serwerów typu blade oraz komputerów przemysłowych.

Aby osiągnąć ten cel, kalifornijski producent opracował od nowa cały projekt sprzętowy i oprogramowanie przekształcające kod wykonywalny (code-morphing). Następca procesora Crusoe TM5800 ma mieć o 50 procent większą wydajność w operacjach na liczbach całkowitych, aplikacje multimedialne zaś mają pracować o 80 procent szybciej w przeliczeniu na częstotliwość taktowania. Transmeta zastosowała dużą pamięć cache L2 oraz intelowski zestaw poleceń SSE2. Oznaczone jako TM8000 procesory Efficeon są pozycjonowane wyraźnie jako konkurencja dla Pentium M. Oficjalna premiera odbyła się podczas Microprocessor Forum 2003 w San Jose w Kalifornii. W dalszym ciągu tekstu przedstawimy szczegóły dotyczące kolejnej generacji procesorów Transmety.

Efficeon - wersje procesora

Procesor Transmety jest wyposażony w zestaw poleceń SSE2, kontroler pamięci DDR400-SDRAM i interfejs AGP. (źródło - Transmeta)

Procesor Transmety jest wyposażony w zestaw poleceń SSE2, kontroler pamięci DDR400-SDRAM i interfejs AGP. (źródło - Transmeta)

W chwili premiery w październiku 2003 roku procesory Efficeon były dostępne w wersjach 1,0, 1,1, 1,2 i 1,3 GHz. Transmeta oferuje procesory dodatkowo w różnych wykonaniach. TM8300 ma pamięć cache L2 o wielkości 512 KB i jest traktowany jako rozwiązanie ekonomiczne. TM8600 ma już 1 MB pamięci cache L2. Oba umieszczone są w standardowej obudowie o wymiarach 29x29 mm. Trzeci wariant to Efficeon TM8620 "Small Package" w obudowie o wymiarach 21x21 mm, który mimo mniejszych wymiarów ma 1 MB pamięci cache L2.

Procesory Efficeon wytwarzane są w procesie 0,13 µm CMOS przez fabrykę TSMC. Wersje z 1 MB pamięci cache L2 mają strukturę o powierzchni 119 mm2. Ponieważ Efficeon ma zintegrowany mostek północny, do kompletu potrzebuje tylko zewnętrznego mostka południowego. Dzięki temu systemy z tym procesorem mogą być gęściej upakowane. Intel Pentium M z układami MCH 855PM oraz ICH zajmuje całkowitą powierzchnię 3592 mm2. Efficeon TM8600 z mostkiem południowym NVIDIA nForce3 Go 150 zajmuje 2066 mm2. Wersja Small Package procesora Efficeon i wspomniany mostek południowy firmy NVIDIA to już tylko 925 mm2.

256-bitowy hardware

Hardware, który wykonuje obliczenia w procesorach Crusoe Transmety, to zwykły procesor VLIW. "Very Long Instruction Words" mają we wszystkich modelach procesora Crusoe, łącznie z ostatnim TM5800, do 128 bitów, które mogą zawierać do czterech niezależnych poleceń po 32 bity. Procesor może zatem w jednym cyklu taktowania wykonać cztery instrukcje.

W procesorze Efficeon Transmeta zastosował zupełnie nowe rozwiązanie. Superskalarny procesor TM8000 dysponuje 256-bitowym modułem VLIW i może wykonywać osiem 32-bitowych poleceń w jednym cyklu taktowania. Producent utrzymuje, że w porównaniu z TM5800 i większością konkurencji Efficeon może wykonać w jednym cyklu podwójną pracę.

Porównanie architektur pamięci cache

Porównanie architektur pamięci cache

To umożliwia z kolei znacznie lepsze wykorzystanie zasobów energii, a więc wydłuża czas pracy na bateriach. Jak znów twierdzi Transmeta, procesor wykonuje tę samą pracę przy niższej częstotliwości taktowania i niższym napięciu rdzenia.

Efficeon - budowa rdzenia

Nie tylko częstotliwość taktowania i 256-bitowe przetwarzanie poleceń odróżnia procesor Efficeon od poprzednika Crusoe. TM8000 zawiera znacznie więcej zmian w rdzeniu. Jedną z najłatwiej dostrzegalnych jest obsługa SSE/SSE2. Po AMD (Athlon 64 i Opteron) również Transmeta wprowadza rozszerzenia multimedialne Intela. Pierwszy stopień pamięci cache w procesorze Efficeon ma następującą konstrukcję: pamięć L1 poleceń ma wielkość 128 KB, a więc dwa razy więcej niż w Crusoe i jest 4-drożna, skojarzeniowa; linia pamięci podręcznej ma 64 bajty.

Pamięć cache L1 danych ma 64 KB (jak w Crusoe TM5800) i jest 8-drożna, skojarzeniowa, a linia pamięci podręcznej ma 32 bajty.

Wielkość pamięci cache L2 wynosi, zależnie od modelu, 512 lub 1025 KB. Drugi stopień pamięci podręcznej jest również 4-drożny, skojarzeniowy, a linia pamięci podręcznej ma 128 bajtów. Ponadto pamięć cache L2 typu write back wyposażono w mechanizm korekcji ECC. To ważna właściwość, zwłaszcza w środowiskach serwerowych, a Crusoe nią nie dysponował.

Transmeta informuje, że wartość TDP procesora Efficeon 1,3 GHz wynosi 14 W, a wersji 1 GHz - 5 W. Dla porównania: Pentium M 1,3 GHz ma wartość TDP 22 W, zaś wersja ULV taktowana z częstotliwością 1 GHz - 7 W według specyfikacji.

Przepływy zadań w potokach

Efficeon przetwarza liczby całkowite w sześciu, a wartości zmiennopozycyjne w ośmiu stopniach. Potoki są zasilane z zarządcy, mieszczącego do 48 poleceń.

Efficeon przetwarza liczby całkowite w sześciu, a wartości zmiennopozycyjne w ośmiu stopniach. Potoki są zasilane z zarządcy, mieszczącego do 48 poleceń.

W procesorze Efficeon jedenaście jednostek wykonawczych (patrz rysunek obok) zajmuje się wykonaniem poleceń, które dostarcza zarządca procesów (o pojemności do 48 poleceń).

Podczas wykonywania 32-bitowych poleceń architektura TM8000 korzysta z sześciostopniowych potoków load/store, sześciu stopni do liczb całkowitych lub jednego ośmiostopniowego potoku obliczeń zmiennopozycyjnych. Operacje na liczbach całkowitych rozpoczynają się od stopnia Instruction Issue. Pobrane polecenie wykonania tych operacji jest przesyłane do odpowiedniej jednostki, a następnie dekodowane w drugim kroku. Następnie odczytywane są argumenty z rejestru. Po wykonaniu obliczeń stałopozycyjnych w piątym stopniu dodawane są znaczniki i na koniec wynik jest zapisywany w rejestrze stałopozycyjnym.

Osiem stopni potoku zmiennopozycyjnego rozpoczyna się również od stopnia Instruction Issue. Pobrane polecenie przechodzi przez dwa stopnie dekodujące. Obliczenia zmiennopozycyjne Efficeon wykonuje czterostopniowo. Ostatni etap to zapisanie wyniku w rejestrze zmiennopozycyjnym.

Procesor Crusoe przetwarzał polecenia stałopozycyjne w 7 stopniach, zaś zmiennopozycyjne - w 10 stopniach, Efficeon zaś potrzebuje mniej etapów do przetworzenia instrukcji. Wydłużanie potoków to znana i popularna metoda zwiększania częstotliwości taktowania. Im dłuższy potok, tym więcej czasu procesor marnuje w przypadku fałszywych prognoz kolejnych skoków. W najmniej korzystnym przypadku trzeba załadować od nowa cały potok, czyli wszystkie jednostki funkcjonalne. Potrzeba na to wiele cykli zegara, a skutkiem jest spadek wydajności. Powtarzanie poleceń także zwiększa zużycie energii. Transmeta rozwiązuje te problemy, skracając potoki.

Zintegrowany mostek północny

Efficeon może rozdzielić zadania do wykonania na łącznie jedenaście jednostek wykonawczych.

Efficeon może rozdzielić zadania do wykonania na łącznie jedenaście jednostek wykonawczych.

Efficeon wyposażony jest w trzy szybkie interfejsy. Szybki dostęp do pamięci, z niewielkim opóźnieniem, zapewnia zintegrowany kontroler Single Channel DDR400-SDRAM. Procesor obsługuje również pamięci typu 266, 333 i praktycznie niespotykane 366. Zastosowania serwerowe umożliwia wbudowany mechanizm korekcji ECC. Efficeon może ogółem zaadresować do 4 GB pamięci roboczej, podzielonej na cztery banki. Crusoe TM5800 również ma zintegrowany kontroler pamięci, jednak może zaadresować maksymalnie 512 MB pamięci DDR266-SDRAM lub 1024 MB pamięci PC133-SDRAM bez korekcji ECC.

Kolejny szybki interfejs procesora Efficeon to zintegrowana magistrala AGP 4x. Karta graficzna nie musi się już komunikować z pamięcią roboczą za pośrednictwem oddzielnego mostka północnego. To wyraźny element przewagi Transmety nad innymi rozwiązaniami, jak choćby mobilny Athlon 64 AMD. Procesor AMD ma wprawdzie również zintegrowany kontroler pamięci, ale z kartą graficzną AGP współpracuje przez mostek północny.


Zobacz również