Nadchodzą chatboty, które będą działać 10x szybciej od obecnych. Mercury to pierwsza seria dLLM, która to udowadnia

Natan Faleńczyk | 01-03-2025 09:00 |

Oprogramowanie

Nadchodzą chatboty, które będą działać 10x szybciej od obecnych. Mercury to pierwsza seria dLLM, która to udowadnia Niemal wszystkie dzisiejsze małe i duże modele językowe opierają się na tej samej metodzie działania - niemal, gdyż właśnie zadebiutowała nowość od Inception Labs, która funkcjonuje w inny, choć całkiem znany sposób, tyle że z innego segmentu tzw. sztucznej inteligencji. Mowa o rodzinie dyfuzyjnych dużych modeli językowych (dLLM) o nazwie Mercury. Zamiast generować tekst od lewej do prawej, dane wyjściowe są wydobywane z szumu. Taki proces ma wiele zalet.

Mercury to nowa rodzina dyfuzyjnych dużych modeli językowych, która została stworzona przez Inception Labs. Nowości opierają się na tym samym sposobie działania, co modele obrazu i wideo, takie jak Midjourney, czy Sora. Szybkość, potencjalnie mniejsze halucynacje i niższe koszty, to główne zalety.

OpenAI prezentuje GPT-4.5. Największy model AI już dostępny dla subskrybentów ChatGPT Pro. Większa wiedza i naturalne rozmowy

Dzisiejsze duże modele językowe (LLM) są autoregresyjne, a więc - jak już wspomniano - tworzą tekst od lewej do prawej i wykonują wszystko sekwencyjnie. Kolejny token (fragment tekstu) jest generowany dopiero po sfinalizowaniu poprzedniego. Metoda ta jest powszechnie używana, ale wymaga sporych zasobów obliczeniowych do działania, co zarazem zwiększa ogólne koszty. Inaczej jest z dyfuzyjnymi dużymi modelami językowymi (diffusion large language models - dLLM). Nie muszą one generować tekstu po kolei, gdyż wyjściowe dane są odszumiane - pozwala to na dużo szybszą pracę, a przy tym może się przyczynić do zmniejszenia halucynacji przez korygowanie błędów w trakcie całego procesu. Pierwsze komercyjne modele AI od Inception Labs, które są oparte na takiej metodzie działania, ujrzały właśnie światło dziennie.

Claude 3.7 Sonnet oraz Claude Code - nowości od Anthropic dla programistów. Łatwiejsze pisanie i sprawdzanie kodu

Mercury Coder, bo o tej rodzinie dLLM mowa, składa się z dwóch odsłon: Mini oraz Small. Nowości są w stanie działać od 5 do 10 razy szybciej od obecnych LLM. Z użyciem akceleratora NVIDIA H100 Mercury Coder Mini generuje odpowiedzi z prędkością ponad 1100 tokenów na sekundę - do takiej wartości żadne konkurencyjne rozwiązanie ze strony Google, Anthropic, DeepSeek, czy też OpenAI, po prostu nie ma podejścia. Modele są przystosowane do generowania kodu, a rozwiązanie można samemu przetestować pod tym adresem. Na utworzonej platformie możemy przy okazji uruchomić kod, co okazuje się naprawdę bardzo przydatne. Na koniec można dodać, że Inception Labs zostało utworzone przez profesorów z Uniwersytetu Stanforda, Uniwersytetu Kalifornijskiego, a także Uniwersytetu Cornella, a pracownicy pochodzą z takich firm jak NVIDIA, OpenAI, Microsoft, Meta, czy też z laboratorium badawczego Google DeepMind.

Źródło: Inception Labs, TechCrunch, Miniaturka mobilna: roketpik/Pixabay

Bądź na bieżąco - obserwuj PurePC.pl na Google News

Tagi:

Zgłoś błąd

Powiązane publikacje

Ile klatek z DLSS, a ile bez? Klient Steam oferuje nowy monitor wydajności. Zmiany dotyczą też Linuksa i trybu Big Picture

Apple prowadzi negocjacje z OpenAI i Anthropic w sprawie integracji zaawansowanych LLM z asystentem Siri

F-Droid - sklep z aplikacjami na Androida, o którym mogłeś nie wiedzieć. Łatwy dostęp do bazy FOSS

WhatsApp, Messenger, a może Signal? Jaki komunikator sprawdzi się dla nas najlepiej? Sprawdź zestawienie różnych rozwiązań

Linux kernel 6.16 rc4 - kolejna odsłona jądra systemu w wersji beta. Poprawki sterowników, stabilności oraz systemów plików

Liczba komentarzy: 40

Komentarze:

Załaduj komentarze

Nadchodzą chatboty, które będą działać 10x szybciej od obecnych. Mercury to pierwsza seria dLLM, która to udowadnia

OpenAI prezentuje GPT-4.5. Największy model AI już dostępny dla subskrybentów ChatGPT Pro. Większa wiedza i naturalne rozmowy

Claude 3.7 Sonnet oraz Claude Code - nowości od Anthropic dla programistów. Łatwiejsze pisanie i sprawdzanie kodu

Powiązane publikacje

Ile klatek z DLSS, a ile bez? Klient Steam oferuje nowy monitor wydajności. Zmiany dotyczą też Linuksa i trybu Big Picture

Apple prowadzi negocjacje z OpenAI i Anthropic w sprawie integracji zaawansowanych LLM z asystentem Siri

F-Droid - sklep z aplikacjami na Androida, o którym mogłeś nie wiedzieć. Łatwy dostęp do bazy FOSS

WhatsApp, Messenger, a może Signal? Jaki komunikator sprawdzi się dla nas najlepiej? Sprawdź zestawienie różnych rozwiązań

Linux kernel 6.16 rc4 - kolejna odsłona jądra systemu w wersji beta. Poprawki sterowników, stabilności oraz systemów plików

Komentarze:

Jaki komputer do gier kupić? Polecane zestawy komputerowe na lipiec 2025. Komputery gamingowe w różnych cenach

Test chłodzenia AiO MSI MAG CoreLiquid A13 360 - Niedrogi zestaw o dobrej wydajności z efektownym podświetleniem ARGB

Test płyty głównej ASUS ROG Crosshair X870E Extreme - Kosmiczne wyposażenie w ekstremalnie wysokiej cenie

Test obudowy komputerowej MSI MPG Velox 300R Airflow PZ - Solidna konstrukcja plus wydajne 160 mm wentylatory ARGB

Wypasiony notebook do gier w naszych rękach. Test Predator Helios 18 AI z kartą NVIDIA GeForce RTX 5080 Laptop GPU

Ile klatek z DLSS, a ile bez? Klient Steam oferuje nowy monitor wydajności. Zmiany dotyczą też Linuksa i trybu Big Picture

Nothing Headphone (1) - pierwsze słuchawki nauszne tego producenta. Obsługa ANC, kodeka LDAC oraz spatial audio

Nothing Phone (3) to bardzo... oryginalny smartfon. Snapdragon 8s Gen 4, Glyph Matrix i Android 15. Relacja prosto z Londynu

Netflix sięga w kosmos. Materiały NASA+ już latem 2025 z transmisją startów rakiet i widokami Ziemi z ISS

Ten zespół rockowy to kompletna fikcja, ale ma więcej słuchaczy niż większość prawdziwych artystów. Spotify ukrywa prawdę?

Test wydajności DOOM: The Dark Ages - Path Tracing to piekielne wymagania sprzętowe. Porównanie wydajności i jakości grafiki

Test kart graficznych AMD Radeon RX 9060 XT vs NVIDIA GeForce RTX 5060 Ti - Waga kogucia doładowana 16 GB pamięci?

NVIDIA z totalną dominacją na rynku kart graficznych dla PC. Intel na tym rynku praktycznie nie istnieje

AMD Radeon RX 9070 XT - modele z pamięciami GDDR6 od Samsunga są trochę wolniejsze od tych z modułami od SK hynix

AMD Radeon RX 9060 XT - pierwsze wyniki testów potwierdzają niższą wydajność od GeForce'a RTX 5060 Ti

O portalu PurePC

Najważniejsze

Znajdź PurePC na