StarCoder2 - kolejna generacja LLM, która pomoże programistom w pisaniu kodu. Za sterami BigCode, którego wspierała NVIDIA
Duże modele językowe (LLM) leżą u podstaw wszystkich chatbotów do ogólnego użytku, takich jak ChatGPT, czy też Gemini. Jednak istnieją także warianty, które są bardziej wyszkolone w jakiejś dziedzinie, dzięki czemu mogą się okazać przydatniejsze dla konkretnych osób. Tak właśnie jest w przypadku nowej rodziny LLM o nazwie StarCoder2, która ma służyć jako pomoc dla programistów w pisaniu i edycji kodu. W projekt zaangażowana jest NVIDIA, Hugging Face i ServiceNow.
StarCoder2 to następna generacja rodziny dużych modeli językowych (LLM), która została stworzona po to, aby asystować programistom przy pisaniu kodu. Dzięki temu mogą oni pracować dużo wydajniej.
Chat with RTX - nowe narzędzie od NVIDII, które pozwoli stworzyć spersonalizowanego chatbota. Dostępne do pobrania za darmo
Omawiana rodzina LLM StarCoder2 jest dostępna w trzech wariantach, które różnią się od siebie możliwościami, czyli parametrami. Mamy więc dostęp do wersji StarCoder2-3B, StarCoder2-7B i StarCoder2-15B. Pierwsza odsłona została wytrenowana przez ServiceNow na 17 językach programowania. Za „trening” edycji z 7 miliardami parametrów (tutaj także mamy wsparcie dla 17 języków programowania) odpowiada Hugging Face. Natomiast ostatnia wersja, która ma największe możliwości, to „dzieło” NVIDII. Model ten wyszkolono na ponad 600 językach programowania z użyciem platformy NVIDIA NeMo (oczywiście wykorzystano akceleratory graficzne NVIDII). Cała rodzina opiera się na jednym z największych zbiorów danych, a dokładniej The Stack v2. Za udostępnienie StarCoder2 odpowiada BigCode zarządzany właśnie przez Hugging Face oraz ServiceNow.
Darmowa konkurencja dla ChatGPT - skorzystaj z modelu językowego Llama 2 bezpośrednio na swoim komputerze
Programiści mogą liczyć na opcję uzupełniania kodu, a więc StarCoder2 może np. zasugerować dalszą część niedokończonej linii. Dostępna jest także funkcja podsumowania całego kodu, czy też wyszukiwania konkretnych fragmentów w otwartoźródłowych repozytoriach, aby odnaleźć te najbardziej odpowiednie. Oczywiście modele można także dostosować lub stworzyć na ich podstawie chatboty. Projekt na GitHubie znajdziemy pod tym adresem, jednak możemy także skorzystać z platformy Hugging Face. Jeśli jesteśmy spragnieni wiedzy, to możemy się zapoznać z naprawdę bardzo obszernym dokumentem na temat StarCoder2. Jednak mimo faktu, że omawiana rodzina LLM udostępniona jest za darmo, to ma swoje ograniczenia (licencja BigCode Open RAIL-M 1.0). Rozwiązania nie można wykorzystywać do nielicznych celów, które są sprzeczne z „przepisami dotyczącymi sztucznej inteligencji” (np. tworzenie aplikacji, które mogłyby udzielać porad medycznych).
Powiązane publikacje

CrystalMark Retro 2.0.0 to nowa wersja kultowego benchmarku z obsługą systemów od Microsoft Windows 95 do Windows 11
12
Google Gemini 2.5 Pro dostępny za darmo. Nowy model AI zaskakuje wynikami w testach i multimodalnością
23
Apple planuje rewolucję w aplikacji Zdrowie, wprowadzając wirtualnego lekarza wykorzystującego sztuczną inteligencję
24
Przeglądarka internetowa Vivaldi integruje się z Proton VPN. Użytkownicy mogą stać się bardziej anonimowi w Internecie
142