Zgłoś błąd
X
Zanim wyślesz zgłoszenie, upewnij się że przyczyną problemów nie jest dodatek blokujący reklamy.
Błędy w spisie treści artykułu zgłaszaj jako "błąd w TREŚCI".
Typ zgłoszenia
Treść zgłoszenia
Twój email (opcjonalnie)
Nie wypełniaj tego pola
Załóż konto
EnglishDeutschукраїнськийFrançaisEspañol中国
 

NVIDIA właśnie pokazała, po co komu RTX 5090 poza grami. Ten model AI potrafi generować tekst z absurdalną prędkością

Maciej Lewczuk | 11-06-2026 14:30 |

NVIDIA właśnie pokazała, po co komu RTX 5090 poza grami. Ten model AI potrafi generować tekst z absurdalną prędkościąGoogle DeepMind wypuściło DiffusionGemma w momencie, gdy rynek lokalnego AI zaczyna wreszcie schodzić z poziomu marketingu do realnych ograniczeń sprzętu. Klasyczne modele autoregresyjne nadal się sprawdzają, ale na desktopie i stacji roboczej często marnują potencjał GPU, bo generują tekst token po tokenie. NVIDIA błyskawicznie to podchwyciła i ogłosiła pełne wsparcie dla nowego modelu na platformach RTX i DGX. Przypadek?

DiffusionGemma to model skrojony pod szybkość lokalnej inferencji, a NVIDIA natychmiast podpięła go pod własny sprzęt, bo dobrze wygląda na slajdach i jeszcze lepiej wypada w benchmarkach.

NVIDIA właśnie pokazała, po co komu RTX 5090 poza grami. Ten model AI potrafi generować tekst z absurdalną prędkością [1]

Microsoft Scout wchodzi do testów. Nowy agent dla Microsoft 365 ma więcej swobody niż Copilot, ale dostaje też krótszą smycz

DiffusionGemma bazuje na szkielecie Gemma 4 i ma 25,2 mld parametrów, ale podczas inferencji aktywuje 3,8 mld. Sedno leży gdzie indziej. Model nie składa odpowiedzi liniowo, tylko odszumia blok 256 tokenów naraz. Google podaje do 4x wyższą szybkość generowania na GPU, a NVIDIA dorzuca własne liczby, czyli ponad 700 tokenów/s na GeForce RTX 5090, ponad 1000 tokenów/s na pojedynczym H100, 150 tokenów/s na DGX Spark i nawet 2000 tokenów/s na DGX Station. Dochodzi kontekst do 256 tys. tokenów, Apache 2.0 i gotowe wsparcie w Hugging Face Transformers, vLLM, NeMo oraz NIM.

NVIDIA właśnie pokazała, po co komu RTX 5090 poza grami. Ten model AI potrafi generować tekst z absurdalną prędkością [2]

Apple przedstawia nową, ulepszoną Siri o funkcje AI na WWDC 2026. Dedykowana aplikacja Siri, tworzenie obrazów i wiele więcej

Google przyznaje, że standardowa Gemma 4 nadal wypada lepiej tam, gdzie liczy się jakość odpowiedzi. DiffusionGemma ma sens przy lokalnych, interaktywnych zadaniach, czyli edycji tekstu, infillingu kodu (technika w modelach AI, w której system nie tylko dopisuje kod na końcu pliku, ale potrafi uzupełnić brakujący fragment w środku istniejącego kodu), szybkich iteracjach i pracy na małych batchach. W chmurze przewaga słabnie, bo klasyczne LLM-y da się lepiej zapełnić ruchem wielu użytkowników. Innymi słowy, jest to broń pod desktop i workstation, a nie uniwersalny zamiennik dla wszystkiego.

NVIDIA właśnie pokazała, po co komu RTX 5090 poza grami. Ten model AI potrafi generować tekst z absurdalną prędkością [3]

Anthropic Claude Fable 5 i Mythos 5. Jeden model, dwa poziomy dostępu i mocne blokady dla cyberbezpieczeństwa oraz biologii

Na tle konkurencji najciekawsze jest to, że Google testuje inną drogę niż zwykłe dosypywanie parametrów albo sztuczki pokroju speculative decoding (technika przyspieszania generowania tekstu przez modele AI, w której używa się dwóch modeli, małego „kandydata” i dużego „weryfikatora”). Jeśli ten kierunek się utrzyma, producenci GPU dostaną kolejny argument, aby sprzedawać lokalne AI razem z drogim sprzętem, a twórcy modeli zaczną mocniej rozdzielać modele „najmądrzejsze” od modeli „najszybszych”.

NVIDIA właśnie pokazała, po co komu RTX 5090 poza grami. Ten model AI potrafi generować tekst z absurdalną prędkością [4]

Źródło: NVIDIA, Google
Bądź na bieżąco - obserwuj PurePC.pl na Google News
Zgłoś błąd
Liczba komentarzy: 17

Komentarze:

x Wydawca serwisu PurePC.pl informuje, że na swoich stronach www stosuje pliki cookies (tzw. ciasteczka). Kliknij zgadzam się, aby ta informacja nie pojawiała się więcej. Kliknij polityka cookies, aby dowiedzieć się więcej, w tym jak zarządzać plikami cookies za pośrednictwem swojej przeglądarki.