inferencja AI

SK Hynix i Sandisk formalizują standard HBF (High Bandwidth Flash) dla rynku AI inference

Hierarchia pamięci w serwerach AI zmienia się w zawrotnym tempie. SK Hynix i Sandisk ogłosiły formalne uruchomienie konsorcjum standaryzacyjnego dla technologii HBF (High Bandwidth Flash) pod auspicjami Open Compute Project. Nowy standard ma zapełnić lukę między ultraszybką, ale pojemnościowo ograniczoną pamięcią HBM a tanimi dyskami SSD, i zrobić to akurat wtedy, gdy rynek inferencji AI zaczyna odczuwać realne wąskie gardła pamięciowe.

Tagi:

Startup Taalas HC1 wpisuje modele AI bezpośrednio w krzem. 16 000 tokenów na sekundę i dzięsieciokrotnie niższe koszty niż GPU

Maciej Lewczuk |

Procesory

Komentarzy: 30

Startup Taalas HC1 wpisuje modele AI bezpośrednio w krzem. 16 000 tokenów na sekundę i dzięsieciokrotnie niższe koszty niż GPU

Kanadyjski startup Taalas wyszedł z ukrycia z radykalnym podejściem do akceleracji AI. Zamiast budować kolejną elastyczną platformę obliczeniową, firma dosłownie wytrawiła parametry modeli językowych w strukturze krzemowego układu. Efekt? ponad 16 000 tokenów na sekundę dla Llama 3.1 8B. To dziesięć razy więcej niż potrafią najpotężniejsze systemy konkurencji, przy jednoczesnym dziesięciokrotnym obniżeniu kosztów eksploatacji.

Tagi:

inferencja AI

SK Hynix i Sandisk formalizują standard HBF (High Bandwidth Flash) dla rynku AI inference

Startup Taalas HC1 wpisuje modele AI bezpośrednio w krzem. 16 000 tokenów na sekundę i dzięsieciokrotnie niższe koszty niż GPU

Recenzja DDPAI Z90 Master 3CH. Wideorejestrator 4K + 4K + 3K, z doświetlaniem IR oraz podwójną pamięcią

Jaka myszka do grania? Jaka klawiatura mechaniczna? Poradnik zakupowy i polecany sprzęt dla graczy na lipiec 2026

Recenzja DDPAI Z60 Pro 3CH. Wideorejestrator 4K z trzema kamerami, w akceptowalnej cenie

Test wydajności Assassin's Creed Black Flag Resynced - Wymagania sprzętowe zmiatają z pokładu? Piraci puszczą wszystkich bez gaci?

Test procesora AMD Ryzen 7 7700X3D - Słabsza wersja AMD Ryzen 7 7800X3D... Jednak cena na poziomie szybszego modelu

Tomb Raider: Legacy of Atlantis - nowy gameplay prezentujący poruszanie się i eksplorację w grze

Deepfake nie ma szans? NVIDIA pokazuje narzędzie, które łapie fałszywe wideo z 92-procentową skutecznością w 22 milisekundy

Google szykuje Frozen v2. Chip pod Gemini ma dać 6–10x więcej tokenów z wata niż obecne TPU

Gracz przykręcił do GeForce RTX 4060 radiator wielkości cegły. Powstała z tego najszybsza pasywnie chłodzona karta graficzna

Steam Machine został wyceniony z myślą o przyszłych wzrostach cen pamięci RAM. Wywiad z inżynierami Valve ujawnia kulisy

Wyniki wielkiego konkursu na 20 urodziny PurePC! Sprawdź czy wygrałeś jedną z kilkudziesięciu nagród

Steam Machine z oficjalną ceną. Valve właśnie zgasiło entuzjazm graczy - aż trudno uwierzyć w te kwoty!

GeForce RTX 5090 Founders Edition padł w redakcyjnym teście. Kabel 12V-2x6 stopił się po obu stronach

Jest odczyt Hot Spot na NVIDIA GeForce RTX 5000 - Diagnostyczne programy zaczęły podawać informacje o temperaturach

Karty graficzne AMD Radeon RX 7000 z serii RDNA 3 od dzisiaj oficjalnie z dostępem do ulepszonego upscalingu FSR 4.1

Gracz przykręcił do GeForce RTX 4060 radiator wielkości cegły. Powstała z tego najszybsza pasywnie chłodzona karta graficzna

NVIDIA DLSS 5 - Firma ujawnia szczegóły działania techniki renderowania neuronowego podczas konferencji SIGGRAPH

Tomb Raider: Legacy of Atlantis - nowy gameplay prezentujący poruszanie się i eksplorację w grze

Steam Machine został wyceniony z myślą o przyszłych wzrostach cen pamięci RAM. Wywiad z inżynierami Valve ujawnia kulisy

Wsadził 192 baterie AA do komputera i uruchomił system nazwany na cześć nastoletniej gwiazdy Disneya

Najlepsze darmowe programy na Linux cz. 2. Monitorowanie GPU, CPU, kontrolowanie wentylatorów, rozpoznawanie muzyki i inne

Darmowe programy do Windows cz. 14. Pobieranie filmów z YT, menedżer plików, launcher, informacje o dyskach i inne

Formatowanie dysku HDD i nośnika SSD - jaki rozmiar jednostki alokacji wybrać? Wyjaśniamy, jak to działa i jakie ma zastosowania

Najlepsze darmowe programy na Linux cz. 1. Monitorowanie GPU, czyszczenie pamięci, obsługa słuchawek, muzyka i inne

Jak działa AI? Co naprawdę dzieje się pod maską chatbota, jak działa kontekst i dlaczego model potrafi mylić się tak przekonująco

Lexar na CES 2026 wkracza w kolejny rozdział z nowymi produktami - karta pamięci Silver Plus microSDXC 2 TB i SSD Play X

Miesiąc wielkich rabatów w Showroomie Lenovo & Motorola z okazji Black Friday

MODECOM oficjalnym polskim partnerem NNG - profesjonalne rozwiązania nawigacyjne iGO przeznaczone dla kierowców

MSI prezentuje klawiaturę Strike Pro Wireless - nową klasę komfortu i precyzji

Szukasz idealnego laptopa? MSI pomoże wybrać i jeszcze dołoży 100 zł

O portalu PurePC

Najważniejsze

Znajdź PurePC na