Test GeForce GTX 650 Ti - Średni Kepler kontra HD 7850 1GB
- SPIS TREŚCI -
- 0 - GeForce GTX 650 Ti
- 1 - Przycięty Kepler GK106
- 2 - ASUS i Palit GTX 650 Ti
- 3 - Platforma testowa
- 4 - 3DMark, Heaven, Stone
- 5 - AvP, Batman, Battlefield 3
- 6 - Crysis: Warhead, Crysis 2
- 7 - DiRT 3, GTA IV: EfLC
- 8 - Mafia 2, Metro 2033
- 9 - Stalker: COP, Starcraft 2
- 10 - TES V: Skyrim, Wiedźmin 2
- 11 - Testy GPGPU
- 12 - Chłodzenie i Pobór mocy
- 13 - Overclocking GTX 650 Ti
- 14 - Podsumowanie
Przycięty rdzeń Kepler GK106 z bliska
NVIDIA i AMD wypuszczanie na rynek kart nowej generacji rozpoczynają od najwyższych modeli. Z każdą następną premierą przedstawiającą nam słabsze odmiany, dowiadujemy się o zmianach w ich budowie, a przede wszystkim cięciach dokonywanych w zawartych w nich rdzeniach. Tak było z Radeonami HD 7000, tak było z GeForce GTX 500 i tak też jest z GeForce GTX 600. Najczęściej proces kastracji sprowadzą się do zmian zegarów, wycięcia kilku bloków z jednostkami obliczeniowymi czy ewentualnego przycięcia szyny pamięci. Zdarza się jednak, że dodatkowo owe bloki z jednostkami obliczeniowymi przechodzą metamorfozę - tak było chociażby w przypadku wydania na świat GeForce GTX 550 Ti, którego rdzeń GF116 składał się z bloków SM dość mocno różniących się w stosunku do tych stosowanych w GeForce GTX 570 i GTX 580 opartych na GF110. Seria GTX 600 póki co takich skomplikowanych zmian nam nie serwowała, gdyż wszystkie dotychczas poznane przez nas karty opierały się o jeden i ten sam rdzeń GK104. Przy GTX 670 zmniejszono tylko liczbę bloków SMX do siedmiu, zaś w GTX 660 Ti dodatkowo zabrano jeden kontroler pamięci i tym samym sparowane z nim osiem jednostek ROP.
Na górze GK104 (Kepler), na dole GF106 (Też Kepler ;])
W GeForce GTX 660 w stosunku do GTX 660 Ti wycięto dwa bloki SMX, pozostawiając ich jedynie pięć. Przy tak radykalnych cięciach zarówno AMD, jak i Nvidia zwykły wypuszczać nowe, mniejsze rozmiarem rdzenie. Nie inaczej było i w tym przypadku. GK106, bo tak nazywa się uszczuplona odmiana rdzenia Kepler, w porównaniu do pełnego brata GK104 utracił jeden główny blok GPC, czyli razem trzy bloki SMX oraz jeden kontroler pamięci. Budowa pojedynczego SMX nie uległa zmianie i zawiera on wciąż 192 rdzenie CUDA, 4-krotnie więcej niż SM w Fermi (GF116). Mamy też cztery razy więcej (32) jednostek SFU (Special Function Units) odpowiedzialnych między innymi za operacje transcendentalne czy interpolacje graficzne. SMX w Keplerze otrzymał 16 jednostek teksturujących, dwa razy więcej od SM w Fermi GF116. Liczba silników polimorficznych pozostała bez zmian i wynosi jeden, a silniki te odpowiadają przede wszystkim za teselację, niemniej te w Keplerze są dwukrotnie wydajniejsze. Całość SMX uzupełnia dwukrotnie większa liczba jednostek odpowiedzialnych za ładowanie i zapis (32 jednostki LD/ST) oraz kolejkowanie (4 Warp Schedulery).
SMX w GK104 i GK106 (Wszystkie GTX 600)
Po lewej SM w GF116 (GTX 550 Ti), po prawej SM w GF110 (GTX 580)
NVIDIA natrafiła jednak na problem. GK106 pod swoją bazową postacią w GTX 660 jest sporo wydajniejszym rozwiązaniem od póki co najbardziej "poobcinanego" przedstawiciela Keplerów (GK107) obecnego w GTX 650/GT 640. Należałoby tą lukę jakoś wypełnić. I tak właśnie zrodził się "kastrowany" GK106 obecny w testowanych w niniejszym artykule odmian GeForce GTX 650 Ti. Rdzeń pozbawiono jednego kontrolera pamięci (upodobniając go tym samym do GK107), a wraz z nim ośmiu ROP i 128KB pamięci podręcznej L2. Wyłączono także jeden z bloków SMX pozostawiając sprawne pozostałe cztery. Aczkolwiek sposób wykonania tejże operacji powoduje, że na rynku pojawią się tak naprawdę dwie odmiany GTX 650 Ti różniące się liczbą bloków GPC, a co za tym idzie znajdujących się weń silników rastrowych. "Zieloni" zapewniają, że nie ma to większego wpływu na wydajność. Jak tylko będziemy w stanie sprawdzić ile GPC jest aktywne - nie omieszkamy przetestować czy się to potwierdzi. Na poniższych schematach pokazano owe dwa podejścia do przycinania GK106:
Na górze i na dole dwie główne metody "kastracji" GK106 w GTX 650 Ti
Kompletny rdzeń składa się z mieszanki klastrów GPC (Graphics Processing Clusters) zawartych w nich multi-procesorów strumieniowych SMX, zaś całość uzupełniają kontrolery pamięci. Na pełnię GeForce GTX 650 Ti składają się 2 bądź 3 klastry GPC, natomiast znajdziemy w nich po jednym dedykowanym silniku rastrowym i łącznie 4 multi-procesory SMX. W porównaniu do 4 SM w GTX 550 Ti (GF116) otrzymujemy więc 4 razy więcej procesorów CUDA (łącznie 768) oraz jednostek SFU (128). Otrzymujemy także 2-krotnie więcej jednostek teksturujących (64), jednostek LD/ST (128) i jednostek kolejkujących (16). Liczba silników polimorficznych jest taka sama i wynosi 4, jednak ich sumaryczna wydajność jest 2 razy większa. W stosunku do Fermiego GF116 zmalała też liczba kontrolerów pamięci. Uwzględniono ich "tylko" dwi sztuki, aczkolwiek dzięki optymalizacjom, kontrolery GTX 650 Ti są w stanie pracować z kośćmi GDDR5 taktowanymi zegarem 1350 MHz (5400 MHz efektywnie). Takie taktowanie przy łącznej szerokości szyny pamięci wynoszącej 128-bit owocuje przepustowością na poziomie 86,4 GB/s, czyli niestety o 12 GB/s mniej od GTX 550 Ti. Każdy z kontrolerów sparowany jest z 128KB pamięci podręcznej L2, i 8 ROP-ami (każdy ROP operuje na pojedynczej próbce koloru), co daje 256KB pamięci L2 i 16 ROP w całym rdzeniu. Kompletne porównanie między całymi rdzeniami, oraz zawartymi w nich multi-procesorami SM / SMX zawierają poniższe tabelki.
Kompletne rdzenie Keplera kontra Fermiego
SMX Keplera kontra SM Fermich
- « pierwsza
- ‹ poprzednia
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- …
- następna ›
- ostatnia »
- SPIS TREŚCI -
- 0 - GeForce GTX 650 Ti
- 1 - Przycięty Kepler GK106
- 2 - ASUS i Palit GTX 650 Ti
- 3 - Platforma testowa
- 4 - 3DMark, Heaven, Stone
- 5 - AvP, Batman, Battlefield 3
- 6 - Crysis: Warhead, Crysis 2
- 7 - DiRT 3, GTA IV: EfLC
- 8 - Mafia 2, Metro 2033
- 9 - Stalker: COP, Starcraft 2
- 10 - TES V: Skyrim, Wiedźmin 2
- 11 - Testy GPGPU
- 12 - Chłodzenie i Pobór mocy
- 13 - Overclocking GTX 650 Ti
- 14 - Podsumowanie