NVIDIA właśnie pokazała, po co komu RTX 5090 poza grami. Ten model AI potrafi generować tekst z absurdalną prędkością
Google DeepMind wypuściło DiffusionGemma w momencie, gdy rynek lokalnego AI zaczyna wreszcie schodzić z poziomu marketingu do realnych ograniczeń sprzętu. Klasyczne modele autoregresyjne nadal się sprawdzają, ale na desktopie i stacji roboczej często marnują potencjał GPU, bo generują tekst token po tokenie. NVIDIA błyskawicznie to podchwyciła i ogłosiła pełne wsparcie dla nowego modelu na platformach RTX i DGX. Przypadek?
DiffusionGemma to model skrojony pod szybkość lokalnej inferencji, a NVIDIA natychmiast podpięła go pod własny sprzęt, bo dobrze wygląda na slajdach i jeszcze lepiej wypada w benchmarkach.
Microsoft Scout wchodzi do testów. Nowy agent dla Microsoft 365 ma więcej swobody niż Copilot, ale dostaje też krótszą smycz
DiffusionGemma bazuje na szkielecie Gemma 4 i ma 25,2 mld parametrów, ale podczas inferencji aktywuje 3,8 mld. Sedno leży gdzie indziej. Model nie składa odpowiedzi liniowo, tylko odszumia blok 256 tokenów naraz. Google podaje do 4x wyższą szybkość generowania na GPU, a NVIDIA dorzuca własne liczby, czyli ponad 700 tokenów/s na GeForce RTX 5090, ponad 1000 tokenów/s na pojedynczym H100, 150 tokenów/s na DGX Spark i nawet 2000 tokenów/s na DGX Station. Dochodzi kontekst do 256 tys. tokenów, Apache 2.0 i gotowe wsparcie w Hugging Face Transformers, vLLM, NeMo oraz NIM.
Apple przedstawia nową, ulepszoną Siri o funkcje AI na WWDC 2026. Dedykowana aplikacja Siri, tworzenie obrazów i wiele więcej
Google przyznaje, że standardowa Gemma 4 nadal wypada lepiej tam, gdzie liczy się jakość odpowiedzi. DiffusionGemma ma sens przy lokalnych, interaktywnych zadaniach, czyli edycji tekstu, infillingu kodu (technika w modelach AI, w której system nie tylko dopisuje kod na końcu pliku, ale potrafi uzupełnić brakujący fragment w środku istniejącego kodu), szybkich iteracjach i pracy na małych batchach. W chmurze przewaga słabnie, bo klasyczne LLM-y da się lepiej zapełnić ruchem wielu użytkowników. Innymi słowy, jest to broń pod desktop i workstation, a nie uniwersalny zamiennik dla wszystkiego.
Anthropic Claude Fable 5 i Mythos 5. Jeden model, dwa poziomy dostępu i mocne blokady dla cyberbezpieczeństwa oraz biologii
Na tle konkurencji najciekawsze jest to, że Google testuje inną drogę niż zwykłe dosypywanie parametrów albo sztuczki pokroju speculative decoding (technika przyspieszania generowania tekstu przez modele AI, w której używa się dwóch modeli, małego „kandydata” i dużego „weryfikatora”). Jeśli ten kierunek się utrzyma, producenci GPU dostaną kolejny argument, aby sprzedawać lokalne AI razem z drogim sprzętem, a twórcy modeli zaczną mocniej rozdzielać modele „najmądrzejsze” od modeli „najszybszych”.
Powiązane publikacje

Spora porcja testów 3DMark od teraz z natywną obsługą architektury ARM64. Będą także nowe opcje dla emulacji
4
Anthropic Claude Fable 5 i Mythos 5. Jeden model, dwa poziomy dostępu i mocne blokady dla cyberbezpieczeństwa oraz biologii
13
Gemini 3.5 Live Translate: tłumaczenie prawie na żywo w ponad 70 językach od Google. Nowość już dostępna na Android i iOS
12
Apple przedstawia nową, ulepszoną Siri o funkcje AI na WWDC 2026. Dedykowana aplikacja Siri, tworzenie obrazów i wiele więcej
51







![NVIDIA właśnie pokazała, po co komu RTX 5090 poza grami. Ten model AI potrafi generować tekst z absurdalną prędkością [1]](/image/news/2026/06/11_nvidia_wlasnie_pokazala_po_co_komu_rtx_5090_poza_grami_ten_model_ai_potrafi_generowac_tekst_z_absurdalna_predkoscia_0.jpg)
![NVIDIA właśnie pokazała, po co komu RTX 5090 poza grami. Ten model AI potrafi generować tekst z absurdalną prędkością [2]](/image/news/2026/06/11_nvidia_wlasnie_pokazala_po_co_komu_rtx_5090_poza_grami_ten_model_ai_potrafi_generowac_tekst_z_absurdalna_predkoscia_2.jpg)
![NVIDIA właśnie pokazała, po co komu RTX 5090 poza grami. Ten model AI potrafi generować tekst z absurdalną prędkością [3]](/image/news/2026/06/11_nvidia_wlasnie_pokazala_po_co_komu_rtx_5090_poza_grami_ten_model_ai_potrafi_generowac_tekst_z_absurdalna_predkoscia_3.jpg)
![NVIDIA właśnie pokazała, po co komu RTX 5090 poza grami. Ten model AI potrafi generować tekst z absurdalną prędkością [4]](/image/news/2026/06/11_nvidia_wlasnie_pokazala_po_co_komu_rtx_5090_poza_grami_ten_model_ai_potrafi_generowac_tekst_z_absurdalna_predkoscia_1.png)





