NVIDIA właśnie pokazała, po co komu RTX 5090 poza grami. Ten model AI potrafi generować tekst z absurdalną prędkością

Maciej Lewczuk | 11-06-2026 14:30 |

Oprogramowanie

NVIDIA właśnie pokazała, po co komu RTX 5090 poza grami. Ten model AI potrafi generować tekst z absurdalną prędkością Google DeepMind wypuściło DiffusionGemma w momencie, gdy rynek lokalnego AI zaczyna wreszcie schodzić z poziomu marketingu do realnych ograniczeń sprzętu. Klasyczne modele autoregresyjne nadal się sprawdzają, ale na desktopie i stacji roboczej często marnują potencjał GPU, bo generują tekst token po tokenie. NVIDIA błyskawicznie to podchwyciła i ogłosiła pełne wsparcie dla nowego modelu na platformach RTX i DGX. Przypadek?

DiffusionGemma to model skrojony pod szybkość lokalnej inferencji, a NVIDIA natychmiast podpięła go pod własny sprzęt, bo dobrze wygląda na slajdach i jeszcze lepiej wypada w benchmarkach.

Microsoft Scout wchodzi do testów. Nowy agent dla Microsoft 365 ma więcej swobody niż Copilot, ale dostaje też krótszą smycz

DiffusionGemma bazuje na szkielecie Gemma 4 i ma 25,2 mld parametrów, ale podczas inferencji aktywuje 3,8 mld. Sedno leży gdzie indziej. Model nie składa odpowiedzi liniowo, tylko odszumia blok 256 tokenów naraz. Google podaje do 4x wyższą szybkość generowania na GPU, a NVIDIA dorzuca własne liczby, czyli ponad 700 tokenów/s na GeForce RTX 5090, ponad 1000 tokenów/s na pojedynczym H100, 150 tokenów/s na DGX Spark i nawet 2000 tokenów/s na DGX Station. Dochodzi kontekst do 256 tys. tokenów, Apache 2.0 i gotowe wsparcie w Hugging Face Transformers, vLLM, NeMo oraz NIM.

Apple przedstawia nową, ulepszoną Siri o funkcje AI na WWDC 2026. Dedykowana aplikacja Siri, tworzenie obrazów i wiele więcej

Google przyznaje, że standardowa Gemma 4 nadal wypada lepiej tam, gdzie liczy się jakość odpowiedzi. DiffusionGemma ma sens przy lokalnych, interaktywnych zadaniach, czyli edycji tekstu, infillingu kodu (technika w modelach AI, w której system nie tylko dopisuje kod na końcu pliku, ale potrafi uzupełnić brakujący fragment w środku istniejącego kodu), szybkich iteracjach i pracy na małych batchach. W chmurze przewaga słabnie, bo klasyczne LLM-y da się lepiej zapełnić ruchem wielu użytkowników. Innymi słowy, jest to broń pod desktop i workstation, a nie uniwersalny zamiennik dla wszystkiego.

Anthropic Claude Fable 5 i Mythos 5. Jeden model, dwa poziomy dostępu i mocne blokady dla cyberbezpieczeństwa oraz biologii

Na tle konkurencji najciekawsze jest to, że Google testuje inną drogę niż zwykłe dosypywanie parametrów albo sztuczki pokroju speculative decoding (technika przyspieszania generowania tekstu przez modele AI, w której używa się dwóch modeli, małego „kandydata” i dużego „weryfikatora”). Jeśli ten kierunek się utrzyma, producenci GPU dostaną kolejny argument, aby sprzedawać lokalne AI razem z drogim sprzętem, a twórcy modeli zaczną mocniej rozdzielać modele „najmądrzejsze” od modeli „najszybszych”.

Źródło: NVIDIA, Google

Bądź na bieżąco - obserwuj PurePC.pl na Google News

Tagi:

Zgłoś błąd

Powiązane publikacje

Spora porcja testów 3DMark od teraz z natywną obsługą architektury ARM64. Będą także nowe opcje dla emulacji

Anthropic Claude Fable 5 i Mythos 5. Jeden model, dwa poziomy dostępu i mocne blokady dla cyberbezpieczeństwa oraz biologii

Gemini 3.5 Live Translate: tłumaczenie prawie na żywo w ponad 70 językach od Google. Nowość już dostępna na Android i iOS

Apple przedstawia nową, ulepszoną Siri o funkcje AI na WWDC 2026. Dedykowana aplikacja Siri, tworzenie obrazów i wiele więcej

TikTok Pro Events wystartował w USA. Osobna aplikacja pod Mundial 2026 łączy krótkie wideo, nagrody i handel

Liczba komentarzy: 17

Komentarze:

Załaduj komentarze

NVIDIA właśnie pokazała, po co komu RTX 5090 poza grami. Ten model AI potrafi generować tekst z absurdalną prędkością

DiffusionGemma to model skrojony pod szybkość lokalnej inferencji, a NVIDIA natychmiast podpięła go pod własny sprzęt, bo dobrze wygląda na slajdach i jeszcze lepiej wypada w benchmarkach.

Microsoft Scout wchodzi do testów. Nowy agent dla Microsoft 365 ma więcej swobody niż Copilot, ale dostaje też krótszą smycz

Apple przedstawia nową, ulepszoną Siri o funkcje AI na WWDC 2026. Dedykowana aplikacja Siri, tworzenie obrazów i wiele więcej

Anthropic Claude Fable 5 i Mythos 5. Jeden model, dwa poziomy dostępu i mocne blokady dla cyberbezpieczeństwa oraz biologii

Powiązane publikacje

Spora porcja testów 3DMark od teraz z natywną obsługą architektury ARM64. Będą także nowe opcje dla emulacji

Anthropic Claude Fable 5 i Mythos 5. Jeden model, dwa poziomy dostępu i mocne blokady dla cyberbezpieczeństwa oraz biologii

Gemini 3.5 Live Translate: tłumaczenie prawie na żywo w ponad 70 językach od Google. Nowość już dostępna na Android i iOS

Apple przedstawia nową, ulepszoną Siri o funkcje AI na WWDC 2026. Dedykowana aplikacja Siri, tworzenie obrazów i wiele więcej

TikTok Pro Events wystartował w USA. Osobna aplikacja pod Mundial 2026 łączy krótkie wideo, nagrody i handel

Komentarze:

Jaki laptop kupić? Polecane laptopy do gier, nauki, pracy i multimediów. Poradnik zakupowy na czerwiec i lipiec 2026

Recenzja Redragon NYX Pro H891. Trzy rodzaje łączności, szeroka kompatybilność i długi czas pracy. Wszystko za niecałe 200 zł

Recenzja Gothic Remake - Alkimia Interactive wita nas w Kolonii po remoncie. Relacja z ponad 30 godzin zmagań w Górniczej Dolinie

Porównanie aparatów w smartfonach Vivo X300 Ultra vs Xiaomi 17 Ultra. Robią świetne zdjęcia, ale jeden wygrywa

Test chińskiej karty graficznej Moore Threads MTT S80 - Niewiele oczekiwałem i jeszcze mniej dostałem. Dramat w trzech aktach

BOOX Go 6 (Gen II): 6-calowy czytnik e-booków i notatnik w jednym. Cztery kolory, Android i wsparcie dla rysika

Epic Games Store - Warhammer 40,000: Speed Freeks i The Ouroboros King nowymi pozycjami w darmowej ofercie

STALKER 2: Heart of Chornobyl - oto fabularny zwiastun dużego dodatku Cost of Hope. Premiera już wkrótce

Ubisoft pogłębia restrukturyzację. Do 380 pracowników zagrożonych, studia w Winnipeg i Belgradzie do zamknięcia

Czat na YouTube: Google umożliwia rozmowy w aplikacji na Android i iOS. Opcja już dostępna w Polsce

20 urodziny PurePC! Mega konkurs z nagrodami. Do wygrania karta graficzna, procesory, RAM, SSD, monitor, peryferia i wiele więcej

Recenzja karty graficznej PNY GeForce RTX 5080 Slim OC - Chłodzenie zajmujące dwa sloty zwiastuje kłopoty?

Test wydajności 007 First Light - Jaka karta graficzna do tajnych misji? Kuzyn Borewicza ma duże wymagania

Test wydajności Gothic Remake - Wymagania sprzętowe niczym magiczna bariera? Bez mocnego sprzętu lepiej nie podchodź

Test chińskiej karty graficznej Moore Threads MTT S80 - Niewiele oczekiwałem i jeszcze mniej dostałem. Dramat w trzech aktach

O portalu PurePC

Najważniejsze

Znajdź PurePC na