Zgłoś błąd
X
Zanim wyślesz zgłoszenie, upewnij się że przyczyną problemów nie jest dodatek blokujący reklamy.
Błędy w spisie treści artykułu zgłaszaj jako "błąd w TREŚCI".
Typ zgłoszenia
Treść zgłoszenia
Twój email (opcjonalnie)
Nie wypełniaj tego pola
.
Załóż konto
EnglishDeutschукраїнськийFrançaisEspañol中国

Test Radeon HD5870 vs High End Nvidii

focus_ | 02-10-2009 20:37 |

Radeon HD 5870 – historia architektury

Na początek nieco historii. W maju 2007 roku swoją premierę miał niezbyt dobrze zapamiętany Radeon HD 2900 XT (R600). Pomimo ogromnych możliwości, jakie oferował w papierowych specyfikacjach, rzeczywistość dość brutalnie zweryfikowała teoretycznie wysoką wydajność wówczas przełomowej karty ATi (pierwsza DX10). Mało kto na świecie był w stanie w miarę racjonalnie wyjaśnić powody niskich wyników uzyskiwanych przez te karty. Producent długo twierdził, że winne były sterowniki, ale w sytuacji gdy kilka miesięcy później nic w tym temacie się nie poprawiało, to trudno było traktować poważnie zapewnienia ATI. Najlepszym dowodem na to było późniejsze wypuszczenie kart graficznych Radeon HD 3870 / HD 3850 (węższy kontroler i niższy proces produkcji względem R600), które co prawda cieszyły się dużym zainteresowaniem, ale tylko i wyłącznie dzięki znacząco niższej cenie w jakiej były sprzedawane. Decydując się na uplasowanie tych kart w niższych segmentach cenowych AMD-ATI zweryfikowało wydajność układu R600 / RV670 – tym razem trafnie.

Jednak rdzeń RV670 wciąż cierpiał na niemal wszystkie przypadłości obecne w Radeonie HD 2900 XT. Mowa głównie o niskiej wydajności teksturowania / wypełniania jak i jeszcze niższej wydajności wygładzania krawędzi. To była (2007 i połowa 2008 roku) pięta Achillesowa kart graficznych z rodziny HD xxxx (wszystkich). Wreszcie w 2008 roku (w 13 miesięcy po premierze nieszczęsnego HD 2900 XT) ATI wprowadziło na rynek coś nowego, ale na papierze bynajmniej nie wyglądającego na rewolucję, a tylko ewolucję. Co prawda zwiększono ilość jednostek cieniujących z 64 (320) na 160 (800), ale pobieżne przejrzenie specyfikacji nie wskazywało na poprawę wydajności w aspektach, w których owa architektura kulała. Rzeczywistość okazała się jednak zupełnie inna.

Rdzeń RV770, a więc Radeon HD 4850 / HD 4870 został poprawiony w pewnych detalach, które to okazały się kluczowe z punktu widzenia poprawienia wydajności. Po pierwsze dla każdego bloku procesorów strumieniowych (po 16 w każdym) zostały „oddelegowane” jednostki TMU (4) wraz z cache L1. W przypadku R600 czy RV670 procesory strumieniowe były niejako oddzielone od TMU. Po drugie – najważniejsze – zwielokrotniono oraz mocno usprawniono (wydajnościowo jak i organizacyjnie) jednostki TMU (TA oraz TF) wraz z ich pamięcią podręczną. I wreszcie po trzecie wzięto się za jednostki RBE (Render Back Ends), które to są odpowiednikami ROPów u NVidii. Cypress posiada ich dwa razy więcej niż w RV770, a tym samym potrafi wypuścić dwa razy więcej pikseli niż w przypadku RV770 i 4 razy więcej niż R600 czy RV670. To w sposób zdecydowany wpłynęło na wydajność wygładzania krawędzi, co zresztą wyraźnie było widać w testach. Ostatnią istotną zmianą z punktu widzenia wydajności było przebudowanie kontrolera pamięci – zrezygnowano z drogiego w implementacji oraz jak się okazało mało-wydajnego Ring-Bus’a na rzecz konstrukcji podobnej do kontrolera pamięci w procesorze AMD K10. Logiczny ośrodek zwany „Hubem” zajmowała się zarządzaniem kontrolerami pamięci korzystając z 4 kontrolerów (po 64-bit każdy) w sposób optymalny (dało się zauważyć większą sprawność niż w przypadku rozwiązania nVidii).

Historia opowiedziana powyżej miała miejsce również wcześniej – ale w obozie NVidii. GeForce serii 6000 był (z pewnym uproszczeniem) w podobny sposób poprawionym GeForce’em FX. Tak czy owak – Radeony z serii HD 4800 wykorzystywały teoretycznie tylko nieznacznie poprawioną architekturę Radeona HD 2900 XT, ale oferowały od niego nieporównywalnie wyższą wydajność – w każdym aspekcie. Radeon HD 5870, a więc rdzeń Cypress również wykorzystuje tę samą architekturę co RV770, ale ponownie zastosowano kosmetyczne poprawki (w sensie: działania samych jednostek, a nie ich ilości) w architekturze.

Na początek: zwiększono ilość procesorów strumieniowych... dwukrotnie (żeby nie być małostkowym). Mamy ich teraz 320 (1600 licząc ilość jednostek ALU), co w przeliczeniu na teoretyczną moc obliczeniową stanowi wartość wręcz astronomiczną jak na dzisiejsze czasy: niemal 3 gigaflopy. Bardziej zorientowani w temacie czytelnicy zapewne pamiętają o czymś takim jak: Ultra Threaded Dispatch Processor. Został on oczywiście przystosowany do pracy ze zwiększoną ilością jednostek, ale na pytanie czy optymalnie, będziemy w stanie się dowiedzieć po części testowej. Same jednostki cieniujące zostały ponoć NIECO zoptymalizowane pod kątem określonych zastosowań, ale jest to związane z obsługą nowych instrukcji zawartych w DX 11.

Podwojono również ilość jednostek teksturujących. Mamy ich teraz 80 (względem 40 w RV770). Dodatkowo zwiększono pamięć podręczną drugiego poziomu przy jednostkach TMU – ma ona teraz pojemność 512 KB. W zasadzie nie zmieniły się za to ich możliwości w zakresie wypełniania oprócz obsługi nowych instrukcji zawartych w DX11 (większe tekstury oraz nowe algorytmy kompresji). Poprawiono algorytm filtrowania anizotropowego – teraz co do jego jakości nie powinno być wątpliwości.

Podwojono możliwości jednostek RBE poprzez... podwojenie ich liczby – wciąż każda z nich może wypuścić 16 pikseli podczas wygładzania krawędzi na poziomie x2 lub x4, ale z racji dwa razy większej ilości jednostek otrzymujemy dwukrotnie wyższą wydajność. Dla porównania RBE w RV770 umożliwiało „namalowanie” 16 pikseli, zaś R600 tylko 8. Krok ten wydaje się oczywisty z tego powodu, że kontroler pamięci został zachowany w niezmienionej formie względem rodziny HD 4000. Gdyby nie zwielokrotniono jednostek RBE, to skutkowałoby to ogromnym spadkiem wydajności po włączeniu wygładzania krawędzi. Poprawki, które zostały wprowadzone powinny zapobiec takiej sytuacji. Przekonamy się o tym w części testowej.

Podsumujmy powyższe rozważania tabelą:

  Cypress(RV870) RV770 RV670

Proces wykonania:

40 nm 55 nm 55 nm

Ilość tranzystorów:

2150 mln 956 mln 666 mln

Powierzchnia rdzenia:

334 mm2 260 mm2 180 mm2
Ilość procesorów strumieniowych: 320 (1600) 160 (800) 64 (320)
Ilość jednostek TMU (TA/TF): 80 (80 / 80) 40 (40 / 40) 32 (32 / 16)
Kontroler pamięci: 4x 64-bit 4x 64-bit Ring-Bus 256-bit
Ilość jednostek RBE: 32 16 16
Max pkt przy MSAA x4 / 1 RBE 32 16 8
Zastosowane pamięci: GDDR5 GDDR5 / GDDR3 GDDR4 / GDDR3
Obsługiwany DirectX: DX11 DX10.1 DX10

Jak widać, zupełnie teoretycznie, Radeon HD 5870 powinien oferować wydajność blisko dwa razy wyższą od podobnie taktowanego Radeona HD 4890! Na tej świetlistej drodze mogą się pojawić tylko dwie przeszkody: kontroler pamięci oraz nieoptymalne zarządzenie jednostkami obliczeniowymi (w szczególności procesorami strumieniowymi). O tym przekonamy się w części testowej Co zaś sie tyczy DirectX 11, na ten temat trudno jest dziś cokolwiek pisać, gdyż na dobrą sprawę system operacyjny, który go będzie obsługiwał jeszcze się nie pojawił na rynku (mowa oczywiście o Windows 7). Niemniej Radeon HD 5870 wspiera go w pełni.

Bądź na bieżąco - obserwuj PurePC.pl na Google News
Zgłoś błąd
Liczba komentarzy: 0
Ten wpis nie ma jeszcze komentarzy. Zaloguj się i napisz pierwszy komentarz.
x Wydawca serwisu PurePC.pl informuje, że na swoich stronach www stosuje pliki cookies (tzw. ciasteczka). Kliknij zgadzam się, aby ta informacja nie pojawiała się więcej. Kliknij polityka cookies, aby dowiedzieć się więcej, w tym jak zarządzać plikami cookies za pośrednictwem swojej przeglądarki.