Zgłoś błąd
X
Zanim wyślesz zgłoszenie, upewnij się że przyczyną problemów nie jest dodatek blokujący reklamy.
Błędy w spisie treści artykułu zgłaszaj jako "błąd w TREŚCI".
Typ zgłoszenia
Treść zgłoszenia
Twój email (opcjonalnie)
Nie wypełniaj tego pola
.
Załóż konto
EnglishDeutschукраїнськийFrançaisEspañol中国

Test GeForce GTX 650 Ti - Średni Kepler kontra HD 7850 1GB

Sebastian Oktaba | 09-10-2012 15:00 |

Przycięty rdzeń Kepler GK106 z bliska

NVIDIA i AMD wypuszczanie na rynek kart nowej generacji rozpoczynają od najwyższych modeli. Z każdą następną premierą przedstawiającą nam słabsze odmiany, dowiadujemy się o zmianach w ich budowie, a przede wszystkim cięciach dokonywanych w zawartych w nich rdzeniach. Tak było z Radeonami HD 7000, tak było z GeForce GTX 500 i tak też jest z GeForce GTX 600. Najczęściej proces kastracji sprowadzą się do zmian zegarów, wycięcia kilku bloków z jednostkami obliczeniowymi czy ewentualnego przycięcia szyny pamięci. Zdarza się jednak, że dodatkowo owe bloki z jednostkami obliczeniowymi przechodzą metamorfozę - tak było chociażby w przypadku wydania na świat GeForce GTX 550 Ti, którego rdzeń GF116 składał się z bloków SM dość mocno różniących się w stosunku do tych stosowanych w GeForce GTX 570 i GTX 580 opartych na GF110. Seria GTX 600 póki co takich skomplikowanych zmian nam nie serwowała, gdyż wszystkie dotychczas poznane przez nas karty opierały się o jeden i ten sam rdzeń GK104. Przy GTX 670 zmniejszono tylko liczbę bloków SMX do siedmiu, zaś w GTX 660 Ti dodatkowo zabrano jeden kontroler pamięci i tym samym sparowane z nim osiem jednostek ROP.

Na górze GK104 (Kepler), na dole GF106 (Też Kepler ;])

W GeForce GTX 660 w stosunku do GTX 660 Ti wycięto dwa bloki SMX, pozostawiając ich jedynie pięć. Przy tak radykalnych cięciach zarówno AMD, jak i Nvidia zwykły wypuszczać nowe, mniejsze rozmiarem rdzenie. Nie inaczej było i w tym przypadku. GK106, bo tak nazywa się uszczuplona odmiana rdzenia Kepler, w porównaniu do pełnego brata GK104 utracił jeden główny blok GPC, czyli razem trzy bloki SMX oraz jeden kontroler pamięci. Budowa pojedynczego SMX nie uległa zmianie i zawiera on wciąż 192 rdzenie CUDA, 4-krotnie więcej niż SM w Fermi (GF116). Mamy też cztery razy więcej (32) jednostek SFU (Special Function Units) odpowiedzialnych między innymi za operacje transcendentalne czy interpolacje graficzne. SMX w Keplerze otrzymał 16 jednostek teksturujących, dwa razy więcej od SM w Fermi GF116. Liczba silników polimorficznych pozostała bez zmian i wynosi jeden, a silniki te odpowiadają przede wszystkim za teselację, niemniej te w Keplerze są dwukrotnie wydajniejsze. Całość SMX uzupełnia dwukrotnie większa liczba jednostek odpowiedzialnych za ładowanie i zapis (32 jednostki LD/ST) oraz kolejkowanie (4 Warp Schedulery).

SMX w GK104 i GK106 (Wszystkie GTX 600)

Po lewej SM w GF116 (GTX 550 Ti), po prawej SM w GF110 (GTX 580)

NVIDIA natrafiła jednak na problem. GK106 pod swoją bazową postacią w GTX 660 jest sporo wydajniejszym rozwiązaniem od póki co najbardziej "poobcinanego" przedstawiciela Keplerów (GK107) obecnego w GTX 650/GT 640. Należałoby tą lukę jakoś wypełnić. I tak właśnie zrodził się "kastrowany" GK106 obecny w testowanych w niniejszym artykule odmian GeForce GTX 650 Ti. Rdzeń pozbawiono jednego kontrolera pamięci (upodobniając go tym samym do GK107), a wraz z nim ośmiu ROP i 128KB pamięci podręcznej L2. Wyłączono także jeden z bloków SMX pozostawiając sprawne pozostałe cztery. Aczkolwiek sposób wykonania tejże operacji powoduje, że na rynku pojawią się tak naprawdę dwie odmiany GTX 650 Ti różniące się liczbą bloków GPC, a co za tym idzie znajdujących się weń silników rastrowych. "Zieloni" zapewniają, że nie ma to większego wpływu na wydajność. Jak tylko będziemy w stanie sprawdzić ile GPC jest aktywne - nie omieszkamy przetestować czy się to potwierdzi. Na poniższych schematach pokazano owe dwa podejścia do przycinania GK106:

Na górze i na dole dwie główne metody "kastracji" GK106 w GTX 650 Ti

Kompletny rdzeń składa się z mieszanki klastrów GPC (Graphics Processing Clusters) zawartych w nich multi-procesorów strumieniowych SMX, zaś całość uzupełniają kontrolery pamięci. Na pełnię GeForce GTX 650 Ti składają się 2 bądź 3 klastry GPC, natomiast znajdziemy w nich po jednym dedykowanym silniku rastrowym i łącznie 4 multi-procesory SMX. W porównaniu do 4 SM w GTX 550 Ti (GF116) otrzymujemy więc 4 razy więcej procesorów CUDA (łącznie 768) oraz jednostek SFU (128). Otrzymujemy także 2-krotnie więcej jednostek teksturujących (64), jednostek LD/ST (128) i jednostek kolejkujących (16). Liczba silników polimorficznych jest taka sama i wynosi 4, jednak ich sumaryczna wydajność jest 2 razy większa. W stosunku do Fermiego GF116 zmalała też liczba kontrolerów pamięci. Uwzględniono ich "tylko" dwi sztuki, aczkolwiek dzięki optymalizacjom, kontrolery GTX 650 Ti są w stanie pracować z kośćmi GDDR5 taktowanymi zegarem 1350 MHz (5400 MHz efektywnie). Takie taktowanie przy łącznej szerokości szyny pamięci wynoszącej 128-bit owocuje przepustowością na poziomie 86,4 GB/s, czyli niestety o 12 GB/s mniej od GTX 550 Ti. Każdy z kontrolerów sparowany jest z 128KB pamięci podręcznej L2, i 8 ROP-ami (każdy ROP operuje na pojedynczej próbce koloru), co daje 256KB pamięci L2 i 16 ROP w całym rdzeniu. Kompletne porównanie między całymi rdzeniami, oraz zawartymi w nich multi-procesorami SM / SMX zawierają poniższe tabelki.

Kompletne rdzenie Keplera kontra Fermiego

SMX Keplera kontra SM Fermich

Bądź na bieżąco - obserwuj PurePC.pl na Google News
Zgłoś błąd
Sebastian Oktaba
Liczba komentarzy: 24

Komentarze:

x Wydawca serwisu PurePC.pl informuje, że na swoich stronach www stosuje pliki cookies (tzw. ciasteczka). Kliknij zgadzam się, aby ta informacja nie pojawiała się więcej. Kliknij polityka cookies, aby dowiedzieć się więcej, w tym jak zarządzać plikami cookies za pośrednictwem swojej przeglądarki.