PC World
czwartek 18 marca 2010

Archiwum

GeForce3 - kolejny przełom


W tym artykule:

Długo oczekiwany układ graficzny nVidii w końcu ujrzał światło dzienne. Kodową nazwę NV 20 zmieniono na oficjalnie obowiązującą - GeForce3.

Już od kilku lat koncern nVidia znajduje się w czołówce producentów układów graficznych, służących do przyspieszania obróbki grafiki trójwymiarowej. Główni konkurenci firmy to ATI i do niedawna 3Dfx, który w ub.r. został przez nVidię wykupiony. Inżynierowie koncernu przyzwyczaili użytkowników do tego, iż co kilka miesięcy pojawia się nowa wersja zmodyfikowanego lub nowego układu graficznego.

Znakomita passa nVidii rozpoczęła się w momencie wprowadzenia do sprzedaży kart graficznych opartych na chipsecie TNT, będącym pierwszym układem graficznym integrującym obróbkę grafiki 2D i 3D w obrębie jednego chipsetu i zapewniającym prędkość działania porównywalną z dedykowanymi "dopalaczami". W tym czasie produkt był jedynym urządzeniem konkurencyjnym wobec kart Voodoo, stworzonym przez firmę 3Dfx. Voodoo były dodatkowymi akceleratorami wspierającymi jedynie obróbkę grafiki 3D, montowanymi oprócz zwykłych kart graficznych.

Kolejne produkty koncernu stanowiły rozwinięcie idei zintegrowanego i wydajnego chipsetu TNT. Co kilka miesięcy pojawiały się zmodyfikowane układy zapewniające znaczny wzrost wydajności. Chipset TNT2, a następnie rewolucyjny GeForce 256, który jako pierwszy produkt w tym segmencie zapewniał sprzętowe wparcie przekształceń geometrycznych i świetlnych (T&L), wyniosły nVidię na pozycję lidera w segmencie układów graficznych przeznaczonych dla odbiorcy masowego.

Kliknij, aby powiększyćChipset graficzny GeForce3 w całej okazałości Po przejęciu przez koncern konkurencyjnej firmy 3Dfx, jedynym konkurentem stała się ATI, która nie chcąc poddać się bez walki wprowadziła na rynek bardzo udany produkt o nazwie Radeon. Układ ATI wyposażono w wiele ciekawych i nowatorskich rozwiązań, takich jak interpolacja poklatkowa, nakładanie tekstur w sposób imitujący wypukłość płaskich powierzchni (environment bump mapping), teksturowanie 3D oraz firmową technologię HyperZ. Konkurencja ze strony ATI zmusiła nVidię do opracowania procesora, który stawiłby czoła Radeonowi i przeniósł proces obróbki grafiki 3D na nie spotykany do tej pory poziom. Tak oto narodził się nowy, flagowy układ graficzny NVidii o nazwie GeForce3.
Imponujące liczby
Dzięki produkcji układu GeForce3 w technologii 0,15 mikrona możliwe było zwiększenie liczby tranzystorów do 57 mln, co jest wartością ponad dwukrotnie większą w porównaniu z poprzednim układem GeForce 2. Jako ciekawostkę można podać fakt, iż najnowszy procesor Intel Pentium 4 zawiera o ok. 20% mniej tranzystorów niż GeForce3. Układ ten może poszczycić się kilkoma naprawdę imponującymi wartościami specyfikacji. Oto one:

- Jednostka obliczeniowa zbudowana w technologii 0,15 mikrona
- Tranzystory - 57 mln###
- Liczba potoków renderowania pikseli - 4
- Liczba bloków tekstur przypadających na potok renderowania - 2
- Liczba operacji cieniowania pikseli w jednym potoku - 36
- Liczba instrukcji dla wierzchołka w jednym potoku - 128
- Częstotliwość taktowania rdzenia procesora graficznego - 200 MHz
- Częstotliwość taktowania pamięci - 230 MHz DDR (efektywne 460 MHz)
- Maksymalna przepustowość szyny pamięci przy zastosowaniu modułów 230 MHz DDR - ponad 7 GB/s
- RAMDAC - 350 MHz####
- Maksymalna rozdzielczość - 2048 x 1536 przy rozdzielczości 75 MHz
- Zintegrowany nadajnik TMDS pozwalający na podłączenie cyfrowych monitorów pracujących z rozdzielczością do 1600 x 1200 pikseli
- Sprzętowe wsparcie przekształceń geometrycznych i świetlnych (T&L) z prędkością 76 gigaflopów
- Pełne wsparcie MS DirectX 8.0 i OpenGL 1.2
- Wsparcie Cube environment mapping#
- Wsparcie Projective textures##
- Sprzętowe wsparcie dla teksturowania powierzchni (Embosing, Dot Product3 i EMBM)
- Wsparcie S3TC i wszystkich metod kompresji DXTC 5
- Wsparcie FSAA na podstawie różnych technik MSAA
- Wsparcie oszczędzania przepustowości pamięci - kompresja Bufora Z oraz wsparcie HSR
- Wsparcie tekstur do 4096 x 4096 przy 32-bitowej głębi kolorów
- Pamięć bufora - 64 MB###
- Wspierane standardy pamięci - SDR i DDR
- Szyna pamięci - 128-bitowa##

Ponadto chipset oferuje funkcje wpierające odtwarzanie telewizji wysokiej rozdzielczości HDTV i dekodowania DVD. Procesor wideo wysokiej rozdzielczości (HDVP) umożliwia pełnoekranowe odtwarzanie HDTV i DVD oraz zapewnia sprzętową konwersję kolorów (YUV 4:2:2 and 4:2:0) i kompensację ruchu.

Nowe funkcje

Funkcją nowego chipsetu, z której inżynierowie nVidii są szczególnie dumni, jest silnik nfiniteFX. Korzystając ze specyficznych funkcji silnika, wspieranych przez oprogramowanie Microsoft DirectX i OpenGL, programiści mogą stworzyć praktycznie nie ograniczoną liczbę nowego rodzaju efektów. Jedną z najistotniejszych funkcji nfiniteFX jest programowalny - Vertex Shaders. Właśnie obsługą tej funkcji zajmuje się większość spośród 57 mln tranzystorów. Funkcja ta pozwala programistom na przydzielenie poszczególnym wierzchołkom obiektów (lub całym klatkom) specjalnych programów, modyfikujących ich specyficzne cechy.

Aby lepiej zrozumieć mechanizm działania tej funkcji, należy pokrótce wyjaśnić znaczenie określenia "wierzchołek" i operacji, jakie można na nim wykonywać. Każdy obiekt 3D jest zbudowany z siatki połączonych ze sobą punktów. Punkty te to właśnie wierzchołki. Dopiero na tak zbudowaną siatkę nakłada się tekstury, które następnie są oświetlane. Im gęstsza jest siatka i co za tym idzie im więcej jest wierzchołków, tym lepsza wizualizacja obiektu - jest on mniej kanciasty i wygląda bardziej naturalnie. Każdy wierzchołek jest opisany kilkoma parametrami, które są interpretowane przez procesor graficzny i przekładane na obraz końcowy. Te informacje to m.in. współrzędne X, Y, Z i W (położenie w przestrzeni 3D), kolor zakodowany w formacie RGBA (red, green, blue, alpha), koordynaty tekstur (s, t, r , q), określające położenie tekstury względem wierzchołka, informacje o sposobie oświetlenia wierzchołka (rodzaj - np. punktowe, globalne, kierunkowe; oraz sposób aplikacji - np. rozproszone). Dotychczas stosowano metodę oświetlania light mapping, która polegała na nakładaniu na trójkąt światła w postaci tekstury. Vertex lightening zastosowany w GeForce3 umożliwia określenie charakterystyki oświetlenia już na poziomie wierzchołków.

Dzięki możliwości przypisania każdemu z wierzchołków maksymalnie 128 różnych instrukcji możliwe jest uzyskanie nieosiągalnego do tej pory (w przypadku kart przeznaczonych na rynek masowy) poziomu realizmu tworzonych obiektów. Funkcje te w ograniczonym zakresie już były wykorzystywane przez inne karty wspierające obróbkę przekształceń geometrycznych i przestrzennych T&L (GeForce 256, GeForce2, ATI Radeon), jednak ich uaktywnienie powodowało ogromny spadek wydajności. GeForce3 zapewnia pełne wsparcie sprzętowe T&L bez dodatkowego obciążania procesora komputera.

Przy animacji obu obrazów maksymalnie wykorzystano nowe możliwości silnika nfiniteFX: Vertex oraz Pixel Shaders zostały użyte do uzyskania efektu wypukłości i odblasków świetlnych, natomiast mapy kolorów, bump mapping oraz cieniowanie phong sprawiły, iż twarz Zooltara wygląda realistycznie.

Drugą istotną nowością jest wprowadzenie funkcji Programmable Pixel Shaders (programowalne cieniowanie pikseli), która umożliwia programistom dodawanie różnych efektów już na poziomie pikseli. Może to być np. charakterystyka oświetlenia oraz blinn bump mapping (przypisywanie teksturom informacji o głębi, co pozwala na wyświetlanie rzeźby powierzchni sprawiającej wrażenie wypukłości; w przypadku GeForce3 zastosowano dodatkowo mechanizm uwzględniający odbicia świetlne). Silnik nfiniteFX pozwala na nałożenie czterech tekstur (możliwe jest określenie ośmiu operacji przypisanych teksturze) w jednym potoku. To sprawia, że GeForce3 jest w stanie dokonać jednocześnie 36 operacji cieniowania pikseli. Dla porównania, GeForce2 GTS umożliwiał wykonanie tylko 7 tego typu operacji.

Efekty nfiniteFX + blinn bump mapping wygiętej blachy

Teraz wygładzamy

Już od dawna firmy projektujące układy graficzne zmagały się z problemem wygładzania "postrzępionych krawędzi obiektów". Powstały dwie koncepcje zniwelowania tego efektu. Pierwsza, zastosowana przez inżynierów 3Dfx w produkcie Voodoo5, nosiła nazwę Multi sampling, natomiast konkurencyjną metodę nVidii nazwano Super sampling.

Kliknij, aby powiększyćMechanizm działania trybu Quincunx Filtrowanie w celu uzyskania obłych krawędzi obiektów polega w skrócie na mieszaniu sąsiadujących ze sobą pikseli otaczających krzywe. Metoda Super sampling, zaimplementowana przez nVidię w dotychczasowych produktach, opierała się na prostym rozwiązaniu zwielokrotniania rozdzielczości klatki (2 lub 4 razy). Każdy piksel, z którego składał się obraz, miał odpowiednio więcej (w zależności od trybu zwielokrotnienia rozdzielczości) kopii własnego obrazu, które przechowywane w back buforze (obszar obrazu gromadzonego w tle w buforze klatki podczas podwójnego buforowania), a następnie poddane obróbce, składały się na ostateczny wygląd piksela wyświetlanego na ekranie. W ten sposób uzyskiwano zadowalające efekty wygładzenia. Jednak ogromna moc obliczeniowa niezbędna do przetworzenia pomnożonych klatek powodowała drastyczny spadek wydajności układu.

Obecnie Super sampling antialiasing jest obsługiwany przez karty wyposażone w chipsety GeForce i ATI Radeon. unkcja ta jednak działa tylko rozdzielczości 800 x 600 pikseli, kiedy to (w przypadku korzystania z poczwórnego antyaliasingu) rozdzielczość obrazu przetwarzania w back buforze wzrasta do 1600 x 1200 pikseli.

Kliknij, aby powiększyćRodzaje antyaliasingu i osiągane efekty W GeForce3 nNVidia zastosowała zmodyfikowany Multi sampling, opracowany przez inżynierów 3Dfx. W stosunku do Super samplingu uaktywnienie efektu wygładzania nie powoduje tak znacznego spadku wydajności. Nowy mechanizm o nazwie HRAA (antyaliasing wysokiej rozdzielczości) wykorzystuje próbki pikseli przechowywane w back buforze, aby następnie korzystając z rozszerzonych możliwości porównywania sąsiadujących pikseli (funkcja wspierana sprzętowo przez GeForce3), zastosować tę samą mapę tekstur dla wszystkich pikseli. Oprócz znanych dotychczas standardowych trybów AA 2 i 4x dodano nowy tryb o nazwie Quincunx. Pozwala on na uzyskanie efektu wygładzania zbliżonego jakością do znanego z trybu 4x przy zachowaniu wydajności charakterystycznej dla pracy w trybie 2x. Dzieje się tak dlatego iż podczas pracy w trybie Quincunx są pobierane próbki sąsiadujący pikseli, a nie tworzone nowe próbki dla każdego pojedynczego piksela.

Przy zastosowaniu zarówno metody Qincunx, jak i standardowej AA 4x zwiększenie wydajności w porównaniu z układami GeForce2 Ultra wynosi ok. 40-50%.

Transfer pamięci z prędkością światła

Obróbka graficzna coraz bardziej skomplikowanych obiektów przedstawionych we wszelkiego rodzaju aplikacjach wymaga zastosowania w kartach graficznych rozwiązań, oferujących ponadprzeciętne możliwości, jeśli chodzi o przepustowość szyny pamięci.

Ma to szczególne znaczenie w przypadku pracy w wysokich rozdzielczościach z uaktywnioną 32-bitową głębią kolorów. Dotychczas producenci zapewniali zadowalającą przepustowość, zwiększając prędkość taktowania modułów pamięci i powiększając wielkość bufora kadru. Karty oparte na chipsecie GeForce2 Ultra korzystały z modułów pamięci taktowanych z prędkością 460 MHz, co teoretycznie pozwoliło na osiągnięcie przepustowości pamięci na poziomie 7,3 GB/s. Jednak szybko się okazało, że najistotniejsze w procesie zwiększania przepustowości nie jest osiąganie maksymalnych możliwości transferu przez zwiększanie prędkości taktowania, lecz zmniejszanie opóźnień między odczytem a transferem danych. W związku z tym specjaliści z nVidii opracowali rewolucyjny i genialny w swojej prostocie kontroler pamięci (Crossbar Memory Controller), który składa się z czterech pojedynczych minikontrolerów o przepustowości 64 bitów każdy. Minikontrolery kontaktują się między sobą, pracując tak, aby maksymalnie skrócić czas dostępu.

Kliknij, aby powiększyćSchemat działania rewelacyjnego kontrolera pamięci Podział na minikontrolery sprawia, iż takie rozwiązanie jest znacznie bardziej efektywne niż zastosowanie jednego 256-bitowego kontrolera DDR-SDRAM. Dlatego nie należy porównywać wyłącznie teoretycznych, maksymalnych przepustowości, podawanych w specyfikacjach technicznych kart graficznych. Przykładowo, mimo iż wg specyfikacji GeForce3 ma mniejszą w stosunku do starszego GeForce2 Ultra maksymalną zdolność wypełniania -fill rate - (800 do 1000 Mpiksel/s), to jednak zastosowanie nowatorskiego kontrolera pamięci - Crossbar Memory Controller - sprawiło, iż nowy układ działa znacznie szybciej i wydajniej.

Kolejną funkcją, której celem jest ograniczenie do niezbędnego minimum ilości danych, które muszą być przesyłane za pomocą szyny AGP, jest funkcja Microsoftu: high order surfaces. W czasach gdy pojawiają się coraz nowocześniejsze i szybsze karty graficzne, umożliwiające pracę w wysokich rozdzielczościach, szyna AGP musi przesyłać ogromne ilości danych, co przy ograniczeniach technologicznych związanych z określoną maksymalną przepustowością szyny AGP powoduje, iż staje się ona wąskim gardłem wydajność układu graficznego. High order surfaces - rozwiązanie zaproponowane przez Microsoft - polega na tym, iż obiekty składające się z krzywych miałyby być opisane jedynie kilkoma punktami kontrolnymi, zawierającymi informacje o współrzędnych geometrycznych danego obiektu. GeForce3 wspiera obsługę tej funkcji i może interpretować dane o punktach kontrolnych zamiast trójkątów. W momencie odczytu przez chipset funkcji matematycznych, opisujących punkty kontrolne, następuje ich przetworzenie na trójkąty (proces ten nazywa się "tesselacja"). Aby funkcja ta była aktywna, programiści już podczas tworzenia aplikacji muszą wprowadzić modyfikacje kodu umożliwiające jej wsparcie.

Kolejne rozwiązania wchodzące w skład Lightspeed Memory Architecture, które w znacznym stopniu wpływają na usprawnienie obsługi pamięci, to: Z Compression i Z-Occlusion Culling. Z Compression ma minimalizować ilość danych przesyłanych do Z-bufora, który przechowuje informacje o położeniu pikseli w przestrzeni trójwymiarowej. W tym celu niezbędne dane są poddawane bezstratnej kompresji, która maksymalnie osiąga wartość 4:1 i w ten ogranicza sposób ryzyko spowolnienia transferu danych.

Z-Occlusion Culling natomiast odpowiada za usuwanie pikseli, które w danym momencie nie są wyświetlane. Proces ten odbywa się w taki sposób, że jednostka Z-Occlusion Culling sprawdza w Z-buforze, czy każdy piksel będzie widoczny na ekranie. Jeśli okaże się, że jakieś piksele nakładają się na siebie, to zasłonięty piksel nie zostanie wysłany do procesora graficznego do dalszej obróbki. Tak zostanie zmniejszone zapełnienie pamięci bufora kadru, co z kolei będzie miało wpływ na zwiększenie przepustowości szyny pamięci.

Programiści otrzymali prezent w postaci możliwości umieszczenia w swych produktach obsługi funkcji Occlusion Query, która rozszerza działanie Z-Occlusion Culling. Programista, tworząc aplikację, może rozszerzyć zapis kodu o wpis, który wysyłając zapytanie do procesora graficznego GeForce3 sprawdzi, czy cały obiekt lub obszar będzie w danym momencie widzialny. W przypadku otrzymania negatywnej odpowiedzi cały obiekt lub obszar nie zostanie poddany procesowi renderingu i przekształceń T&L.

Optymalizacja absolutna

Aby nowy GeForce w pełni korzystał ze specyficznych funkcji, w jakie wyposażono najnowsze procesory, nVidia ściśle współpracowała z firmami Intel i AMD. Sterowniki GeForce3 umożliwią skorzystanie z takich cech procesora AMD Athlon, jak: duża przepustowość szybkich pamięci DDR SDRAM PC2100, wydajna architektura pamięci cache oraz technologia 3DNow!

Użytkownicy najszybszych procesorów Intela również powinni poczuć się usatysfakcjonowani, gdyż nVidia zoptymalizowała oprogramowanie sterujące pracą GeForce3 pod kątem wykorzystania dodatkowych cech charakterystycznych dla architektury Pentium 4. Sterowniki zapewniają wsparcie dla technologii Intela o nazwie NetBurst, która pozwala na znaczne przyspieszenie wykonywania operacji graficznych i multimedialnych. Oprogramowanie wspiera część ze 144 nowych instrukcji procesora, przyspieszających działanie różnorodnych funkcji (m.in. proces wizualizacji grafiki 3D). Pozostałe charakterystyczne cechy budowy Pentium 4, wykorzystywane do zwiększenia wydajności GeForce3, to: zaawansowany transfer cache, szybka szyna systemowa 400 MHz i Rapid Execution Engine.

Kiedy w Polsce

Krajowi dystrybutorzy zapowiadają rozpoczęcie sprzedaży kart opartych na chipsecie GeForce3 na koniec marca br. Za 2 tygodnie firma Komputronik zamierza wprowadzić do dystrybucji produkt koncernu Microstar o nazwie StarForce 822. Budowa karty MSI jest zgodna z projektem referencyjnym, udostępnionym producentom przez firmę nVidia. Prędkość układu graficznego wynosi 200 MHz, natomiast 64 MB pamięci DDR działa z częstotliwością 460 MHz. Oprogramowanie firmowe zawiera programowy odtwarzacz MSI DVD i aplikację MSI 3D!Turbo 2000, służącą m.in. do optymalizacji parametrów pracy układu graficznego i modułów pamięci DDR. Cena karty powinna wynieść ok. 2200 zł.

Firma Tornado zamierza sprzedać karty oparte na referencyjnym chipsecie nVidii. Oprócz produktu koncernu Microstar w ofercie Tornado może się znaleźć karta firmy Leadtek - WinFast GeForce3, która również została zbudowana zgodnie ze wskazówkami nVidii. Jedyną wyróżniającą ten produkt cechą jest zastosowanie ogromnego układu chłodzącego identycznego ze stosowanym dotychczas w karcie Leadtek WinFast GeForce2 Ultra.

Słownik pojęć
AA (antyaliasing) - wygładzanie "postrzępionych" krawędzi krzywych poprzez mieszanie sąsiadujących pikseli

Back buffer - obszar obrazu gromadzonego w tle w buforze klatki podczas podwójnego buforowania

Crossbar Memory Controller - kontroler pamięci, który składa się z czterech pojedynczych minikontrolerów o przepustowości 64 bitów każdy; minikontrolery kontaktują się między sobą, pracując tak, aby maksymalnie skrócić czas dostępu

Cube environment mapping - odwzorowywanie zniekształceń, jakie zachodzą podczas patrzenia przez obłe szklane powierzchnie

EMBM - environmental bump mapping#

Environment bump mapping - nakładanie tekstur w sposób imitujący wypukłość płaskich powierzchni

FSAA - pełnoekranowy antyaliasing##

HDTV- telewizja wysokiej rozdzielczości#

High order surfaces - rozwiązanie zaproponowane przez Microsoft, którego zasada działania polega na tym, iż obiekty składające się z krzywych miałyby być opisane jedynie kilkoma punktami kontrolnymi, zawierającymi informacje o współrzędnych geometrycznych danego obiektu

HRAA ( antyaliasing wysokiej rozdzielczości) - wykorzystuje próbki pikseli przechowywane w back buforze, aby następnie korzystając z rozszerzonych możliwości porównywania sąsiadujących pikseli (wspierane sprzętowo przez GeForce3) zastosować tę samą mapę tekstur dla wszystkich pikseli

HyperZ - procedura stosowana w kartach ATI Radeon, polegająca na zrezygnowaniu z obróbki graficznej pikseli, które nie są w danym momencie widoczne na ekranie

Interpolacja - uśrednianie kolorów składowych pikseli w celu zredukowania efektu "postrzępionych krawędzi" krzywych; "schodki" powstają w wyniku rozciągnięcia obrazu w celu dopasowania do rozmiaru wyświetlanego okna. Zwielokrotnienie liczby pikseli obrazu w celu jego dopasowania do rozmiaru okna prowadzi do pojawienia się zjawiska "postrzępionych krawędzi" obiektów

Multi sampling - metoda wygładzania "postrzępionych" krawędzi opracowana przez programistów firmy 3Dfx; stosowana w kartach Voodoo 5

NetBurst - technologii Intela zastosowana w procesorach Pentium 4, która pozwala na znaczne przyspieszenie wykonywania operacji graficznych i multimedialnych
Wystaw ocenę: 
 Średnia ocena: 
(Głosów: )

Komentarze

Redakcja PC World nie ponosi odpowiedzialności za wypowiedzi Internautów opublikowane na stronach serwisu oraz zastrzega sobie prawo do redagowania, skracania bądź usuwania komentarzy zawierających treści zabronione przez prawo, uznawane za obraźliwie lub naruszające zasady współżycia społecznego. Osoby zamieszczające wypowiedzi naruszające prawo lub prawem chronione dobra osób trzecich mogą ponieść z tego tytułu odpowiedzialność karną lub cywilną.

Maciek

  • ocena: brak oceny
  • IP: 93.105.25.209
  • 24-07-2008, 13:35

Coś mi tu nie pasuje :/ Przecież już dawno jest karta graficzna Geforce 3 - nawet używam takiej, więc nie wiem po co zrobili taką samą nazwę...



AUKCJE

NAWIGACJE DO WV DX PO POLSKU Z MAPA

Cena: 900 zł
Kup Teraz: 999 zł
Ilość przedmiotów: 1
Liczba ofert: 0
Data zakończenia: 2010-03-23 16:10:47
Lokalizacja: bialystok