Napier ma uderzyć w NVIDIA GB300 i Rubin. Tensordyne stawia na arytmetykę logarytmiczną zamiast klasycznego podejścia GPU
Rynek akceleratorów AI zaczyna męczyć się własnym rozmachem. Modele rosną, zużycie energii też, a dokładanie kolejnych szaf z GPU przestaje wyglądać jak rozsądna odpowiedź na każdy problem. W takim momencie na scenę wchodzi Tensordyne z układem Napier i obietnicą, że da się pójść inną drogą, czyli zapewnić mniej mnożeń, więcej sprytu w matematyce, dużo SRAM i mniej bólu głowy przy rachunkach za zasilanie oraz chłodzenie.
Tensordyne oferuje dziś wizję serwera AI, który ma bić Blackwella NVIDII szybkością i rachunkiem za prąd, ale na razie rynek dostał głównie papier, tape-out i bardzo odważne symulacje.
Procesory AMD Zen 6 z serii Olympic Ridge po raz pierwszy zaoferują wbudowany chip NPU, jednak kosztem innego komponentu
Tensordyne Napier to akcelerator po tape-oucie, co oznacza, że układu został już ukończony i wysłany do produkcji w TSMC 3 nm. Według przecieków pojedynczy pakiet ma pobierać 300 W, osiągać 2,1 PFLOPS w formacie FP8 przy pełnej gęstości danych (dense FP8) i 144 GB pamięci HBM3e. Tensordyne dorzuca do tego 256 MB SRAM na chip, własną arytmetykę logarytmiczną Pareto, a także połączenia pomiędzy układami z opóźnieniami poniżej 1 mikrosekundy. Cały rack z 288 chipami ma dostarczać 608 PFLOPS, 42 TB HBM3e i zmieścić się w 120 kW przy chłodzeniu powietrzem. Firma twierdzi, że taki zestaw osiąga 13x więcej tokenów na sekundę i 17x więcej tokenów na wat niż system oparty na NVIDIA GB300.
CoPoS kontra CoWoS. TSMC szykuje nowy format pakowania dla układów NVIDIA Feynman i jeszcze większych akceleratorów AI
Jest to obietnica niższych kosztów inferencji i krótszych opóźnień, o ile deklarowane parametry potwierdzą się poza materiałami producenta. I tu pojawia się najważniejsza niewiadoma. Na razie brakuje niezależnych benchmarków. Firma mówi o ponad 1000 tokenów/s na użytkownika dla modeli wielobilionowych i sugeruje, że do podobnego zadania NVIDIA potrzebowałaby dziewięciu racków Rubin oraz systemu Groq LPX. To ambitne deklaracje. Warto jednak pamiętać, że NVIDIA przy okazji Vera Rubin, opisywanej już u nas, również prezentuje bardzo wysokie wartości, siegające PFLOPS NVFP4 na GPU, 3,6 TB/s przepustowości pamięci i nawet 10-krotnie niższy koszt generowania tokena względem Blackwella. Różnica polega na tym, że Rubin bazuje na ugruntowanej pozycji NVIDIA w centrach danych, podczas gdy Napier dopiero będzie musiał potwierdzić swoje możliwości w praktycznych wdrożeniach.
Powiązane publikacje

Snapdragon Reality Elite - nowy chip dla platform XR, takich jak Samsung Galaxy XR. Następca Snapdragona XR2+ Gen 2
2
Intel zapowiedział rozszerzenie oferty procesów technologicznych o Intel 18A-P. Poznaliśmy szczegóły i wydajność nowej litografii
4
AMD ujawnia procesory Ryzen Threadripper o kodowej nazwie Mustang Peak. Układy wykorzystają proces 2 nm oraz PCIe 6.0
13
AMD po cichu wyłącza TSME w zwykłych Ryzenach. Szyfrowanie RAM-u zostaje funkcją modeli PRO
35







![Napier ma uderzyć w NVIDIA GB300 i Rubin. Tensordyne stawia na arytmetykę logarytmiczną zamiast klasycznego podejścia GPU [1]](/image/news/2026/06/16_napier_ma_uderzyc_w_nvidia_gb300_i_rubin_tensordyne_stawia_na_arytmetyke_logarytmiczna_zamiast_klasycznego_podejscia_gpu_0.jpg)
![Napier ma uderzyć w NVIDIA GB300 i Rubin. Tensordyne stawia na arytmetykę logarytmiczną zamiast klasycznego podejścia GPU [2]](/image/news/2026/06/16_napier_ma_uderzyc_w_nvidia_gb300_i_rubin_tensordyne_stawia_na_arytmetyke_logarytmiczna_zamiast_klasycznego_podejscia_gpu_2.png)
![Napier ma uderzyć w NVIDIA GB300 i Rubin. Tensordyne stawia na arytmetykę logarytmiczną zamiast klasycznego podejścia GPU [3]](/image/news/2026/06/16_napier_ma_uderzyc_w_nvidia_gb300_i_rubin_tensordyne_stawia_na_arytmetyke_logarytmiczna_zamiast_klasycznego_podejscia_gpu_1.jpg)





