NVIDIA TensorRT-LLM - układy graficzne GeForce RTX z serii 30 i 40 będą teraz wydajniejsze w obsłudze modeli sztucznej inteligencji

Natan Faleńczyk | 16-11-2023 16:35 |

Oprogramowanie

NVIDIA TensorRT-LLM - układy graficzne GeForce RTX z serii 30 i 40 będą teraz wydajniejsze w obsłudze modeli sztucznej inteligencji Usług związanych ze sztuczną inteligencją jest obecnie wiele, natomiast jednymi z popularniejszych są chatboty, które funkcjonują w oparciu o duże modele językowe (LLM). Natomiast skorzystanie z nich wiąże się z przesyłaniem danych wejściowych na serwer zewnętrzny, co nie sprzyja prywatności. Inną możliwością jest uruchomienie modeli językowych lokalnie, jednak do sprawnego działania wymaga to odpowiedniej mocy obliczeniowej. NVIDIA chce pomóc użytkownikom w tym zadaniu, więc niebawem udostępni nową wersję biblioteki TensorRT-LLM.

Nadchodząca nowa wersja oprogramowania NVIDIA TensorRT-LLM pozwoli na dużo wydajniejsze wykorzystanie dużych modeli językowych na komputerach osobistych. Warunkiem jest posiadanie układu graficznego NVIDIA GeForce RTX z serii 30 i 40 z co najmniej 8 GB pamięci VRAM.

Czy sztuczna inteligencja zastąpi wkrótce programistów i podstępnie przystąpi do samodzielnej modyfikacji i replikacji?

Nowa edycja biblioteki NVIDIA TensorRT-LLM (v.0.6.0) została zaprezentowana na trwającej jeszcze konferencji Microsoft Ignite (15-16.11.23). Głównymi zmianami będzie obsługa większej liczby modeli LLM (np. Mistral 7B i Nemotron-3 8B), z kolei funkcjonowanie lokalnych odsłon ma być teraz wydajniejsze aż pięciokrotnie. Tak jak wspomniano, z omawianych możliwości skorzystają posiadacze układów NVIDIA GeForce RTX od serii 30, które wyposażono w 8 GB pamięci VRAM i więcej. Odnosi się to również do mobilnych odsłon tych układów graficznych, więc użytkownicy laptopów też zauważą lepszą wydajność w tej kwestii.

NVIDIA chce wykorzystać boom na sztuczną inteligencję. Szykuje się imponujący wzrost podaży układów graficznych

Wprowadzona zostanie także obsługa interfejsu API, który będzie podobny do tego z ChatGPT, co dodatkowo powinno okazać się bardzo przydatne dla programistów. Usprawnień ma się doczekać również biblioteka DirectML, więc osoby korzystające lokalnie z modeli takich jak Llama 2 od Mety, czy też Stable Diffusion, odczują znaczącą poprawę w szybkości ich działania. Nowe oprogramowanie ma być dostępne do pobrania już 21 listopada 2023 roku (dla urządzeń z systemem Microsoft Windows). Jeśli sami chcemy wypróbować działanie modelu Llama 2 lub jakiegokolwiek innego, możemy udać się do tego poradnika.

Źródło: NVIDIA

Bądź na bieżąco - obserwuj PurePC.pl na Google News

Tagi:

Zgłoś błąd

Powiązane publikacje

Windows 11 na razie bez kontrowersyjnej funkcji Recall. Microsoft postanowił wstrzymać się z jej udostępnieniem

Basemark GPUScore Breaking Limit - nadchodzi nowy benchmark, który pozwoli przetestować układy graficzne z Ray Tracingiem

Microsoft załatał lukę bezpieczeństwa w sterowniku Wi-Fi Windowsa. Pozwalała na zdalną instalację malware

Stable Diffusion 3 Medium - pierwszy model obrazu z nowej serii już dostępny. Najbardziej zaawansowana wersja do tej pory

Wysyp nowości od Google dla linii Pixel. Smartfony z serii Google Pixel 8 skorzystają z lokalnej AI i zrobią lepsze zdjęcia

Liczba komentarzy: 44

Komentarze:

Załaduj komentarze

NVIDIA TensorRT-LLM - układy graficzne GeForce RTX z serii 30 i 40 będą teraz wydajniejsze w obsłudze modeli sztucznej inteligencji

Nadchodząca nowa wersja oprogramowania NVIDIA TensorRT-LLM pozwoli na dużo wydajniejsze wykorzystanie dużych modeli językowych na komputerach osobistych. Warunkiem jest posiadanie układu graficznego NVIDIA GeForce RTX z serii 30 i 40 z co najmniej 8 GB pamięci VRAM.

Czy sztuczna inteligencja zastąpi wkrótce programistów i podstępnie przystąpi do samodzielnej modyfikacji i replikacji?

NVIDIA chce wykorzystać boom na sztuczną inteligencję. Szykuje się imponujący wzrost podaży układów graficznych

Powiązane publikacje

Windows 11 na razie bez kontrowersyjnej funkcji Recall. Microsoft postanowił wstrzymać się z jej udostępnieniem

Basemark GPUScore Breaking Limit - nadchodzi nowy benchmark, który pozwoli przetestować układy graficzne z Ray Tracingiem

Microsoft załatał lukę bezpieczeństwa w sterowniku Wi-Fi Windowsa. Pozwalała na zdalną instalację malware

Stable Diffusion 3 Medium - pierwszy model obrazu z nowej serii już dostępny. Najbardziej zaawansowana wersja do tej pory

Wysyp nowości od Google dla linii Pixel. Smartfony z serii Google Pixel 8 skorzystają z lokalnej AI i zrobią lepsze zdjęcia

Komentarze:

Test smartfona Motorola edge 50 ultra - flagowiec z układem Snapdragon 8s Gen 3. Udany pod (prawie) każdym względem

Jaka karta graficzna do gier? Kupić AMD Radeon czy NVIDIA GeForce? Polecane karty graficzne na czerwiec 2024

70mai A510 - recenzja wideorejestratora z przetwornikiem Sony STARVIS 2 IMX675. Doskonały obraz nawet przy słabym oświetleniu

Test słuchawek Creative Aurvana Ace 2. Ładna stylistyka, dobry dźwięk, ANC i wodoszczelność. Jednak wady też się znajdą

Jaki laptop kupić? Polecane laptopy do gier, nauki, pracy i multimediów. Poradnik zakupowy na czerwiec i lipiec 2024

OpenAI może wkrótce stać się normalną firmą. Założyciel podmiotu rozważa rezygnację ze statusu non-profit

Samsung Galaxy Z Flip6 - wygląd, specyfikacja i ceny składanego smartfona. Nowy aparat oraz większy akumulator

Qualcomm Adreno X1 - układ graficzny z serii Snapdragon X prawie bez tajemnic. Porównanie wydajności z Intel Core Ultra 7 155H

Płyty główne z gniazdem AMD AM5 i chipsetem AMD B650 są coraz tańsze. Ogromny wzrost zainteresowania wśród graczy z Korei

Samsung Galaxy Z Fold6 - specyfikacja, wygląd i ceny nowego składanego smartfona. Nie będzie dużo lepiej, ale za to drożej

NVIDIA GeForce RTX 50 - poznaliśmy specyfikację rdzeni dla kart graficznych Blackwell. Jest kilka rozczarowań

NVIDIA zmienia cykl wydawania układów graficznych. Nadchodzi lawina nowych modeli, które będą się ukazywać co roku

Jaka karta graficzna do gier? Kupić AMD Radeon czy NVIDIA GeForce? Polecane karty graficzne na czerwiec 2024

Historia PurePC bez cenzury z okazji 18. urodzin - Początki bywały trudne, jednak wyszliśmy na prostą i pozostajemy niezależni

Test smartfona Google Pixel 8a - czysty Android z 7-letnim wsparciem i genialny aparat. Czy trzeba czegoś więcej?

O portalu PurePC

Najważniejsze

Znajdź PurePC na