Zgłoś błąd
X
Zanim wyślesz zgłoszenie, upewnij się że przyczyną problemów nie jest dodatek blokujący reklamy.
Błędy w spisie treści artykułu zgłaszaj jako "błąd w TREŚCI".
Typ zgłoszenia
Treść zgłoszenia
Twój email (opcjonalnie)
Nie wypełniaj tego pola
Załóż konto
EnglishDeutschукраїнськийFrançaisEspañol中国
 

Napier ma uderzyć w NVIDIA GB300 i Rubin. Tensordyne stawia na arytmetykę logarytmiczną zamiast klasycznego podejścia GPU

Maciej Lewczuk | 17-06-2026 07:00 |

Napier ma uderzyć w NVIDIA GB300 i Rubin. Tensordyne stawia na arytmetykę logarytmiczną zamiast klasycznego podejścia GPURynek akceleratorów AI zaczyna męczyć się własnym rozmachem. Modele rosną, zużycie energii też, a dokładanie kolejnych szaf z GPU przestaje wyglądać jak rozsądna odpowiedź na każdy problem. W takim momencie na scenę wchodzi Tensordyne z układem Napier i obietnicą, że da się pójść inną drogą, czyli zapewnić mniej mnożeń, więcej sprytu w matematyce, dużo SRAM i mniej bólu głowy przy rachunkach za zasilanie oraz chłodzenie.

Tensordyne oferuje dziś wizję serwera AI, który ma bić Blackwella NVIDII szybkością i rachunkiem za prąd, ale na razie rynek dostał głównie papier, tape-out i bardzo odważne symulacje.

Napier ma uderzyć w NVIDIA GB300 i Rubin. Tensordyne stawia na arytmetykę logarytmiczną zamiast klasycznego podejścia GPU [1]

Procesory AMD Zen 6 z serii Olympic Ridge po raz pierwszy zaoferują wbudowany chip NPU, jednak kosztem innego komponentu

Tensordyne Napier to akcelerator po tape-oucie, co oznacza, że układu został już ukończony i wysłany do produkcji w TSMC 3 nm. Według przecieków pojedynczy pakiet ma pobierać 300 W, osiągać 2,1 PFLOPS w formacie FP8 przy pełnej gęstości danych (dense FP8) i 144 GB pamięci HBM3e. Tensordyne dorzuca do tego 256 MB SRAM na chip, własną arytmetykę logarytmiczną Pareto, a także połączenia pomiędzy układami z opóźnieniami poniżej 1 mikrosekundy. Cały rack z 288 chipami ma dostarczać 608 PFLOPS, 42 TB HBM3e i zmieścić się w 120 kW przy chłodzeniu powietrzem. Firma twierdzi, że taki zestaw osiąga 13x więcej tokenów na sekundę i 17x więcej tokenów na wat niż system oparty na NVIDIA GB300.

Napier ma uderzyć w NVIDIA GB300 i Rubin. Tensordyne stawia na arytmetykę logarytmiczną zamiast klasycznego podejścia GPU [2]

CoPoS kontra CoWoS. TSMC szykuje nowy format pakowania dla układów NVIDIA Feynman i jeszcze większych akceleratorów AI

Jest to obietnica niższych kosztów inferencji i krótszych opóźnień, o ile deklarowane parametry potwierdzą się poza materiałami producenta. I tu pojawia się najważniejsza niewiadoma. Na razie brakuje niezależnych benchmarków. Firma mówi o ponad 1000 tokenów/s na użytkownika dla modeli wielobilionowych i sugeruje, że do podobnego zadania NVIDIA potrzebowałaby dziewięciu racków Rubin oraz systemu Groq LPX. To ambitne deklaracje. Warto jednak pamiętać, że NVIDIA przy okazji Vera Rubin, opisywanej już u nas, również prezentuje bardzo wysokie wartości, siegające PFLOPS NVFP4 na GPU, 3,6 TB/s przepustowości pamięci i nawet 10-krotnie niższy koszt generowania tokena względem Blackwella. Różnica polega na tym, że Rubin bazuje na ugruntowanej pozycji NVIDIA w centrach danych, podczas gdy Napier dopiero będzie musiał potwierdzić swoje możliwości w praktycznych wdrożeniach.

Napier ma uderzyć w NVIDIA GB300 i Rubin. Tensordyne stawia na arytmetykę logarytmiczną zamiast klasycznego podejścia GPU [3]

Źródło: Tensordyne
Bądź na bieżąco - obserwuj PurePC.pl na Google News
Zgłoś błąd
Liczba komentarzy: 12

Komentarze:

x Wydawca serwisu PurePC.pl informuje, że na swoich stronach www stosuje pliki cookies (tzw. ciasteczka). Kliknij zgadzam się, aby ta informacja nie pojawiała się więcej. Kliknij polityka cookies, aby dowiedzieć się więcej, w tym jak zarządzać plikami cookies za pośrednictwem swojej przeglądarki.