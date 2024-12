Duże modele językowe (LLM) leżą u podstaw wszystkich chatbotów do ogólnego użytku, takich jak ChatGPT, czy też Gemini. Jednak istnieją także warianty, które są bardziej wyszkolone w jakiejś dziedzinie, dzięki czemu mogą się okazać przydatniejsze dla konkretnych osób. Tak właśnie jest w przypadku nowej rodziny LLM o nazwie StarCoder2, która ma służyć jako pomoc dla programistów w pisaniu i edycji kodu. W projekt zaangażowana jest NVIDIA, Hugging Face i ServiceNow.

StarCoder2 to następna generacja rodziny dużych modeli językowych (LLM), która została stworzona po to, aby asystować programistom przy pisaniu kodu. Dzięki temu mogą oni pracować dużo wydajniej.

Omawiana rodzina LLM StarCoder2 jest dostępna w trzech wariantach, które różnią się od siebie możliwościami, czyli parametrami. Mamy więc dostęp do wersji StarCoder2-3B, StarCoder2-7B i StarCoder2-15B. Pierwsza odsłona została wytrenowana przez ServiceNow na 17 językach programowania. Za „trening” edycji z 7 miliardami parametrów (tutaj także mamy wsparcie dla 17 języków programowania) odpowiada Hugging Face. Natomiast ostatnia wersja, która ma największe możliwości, to „dzieło” NVIDII. Model ten wyszkolono na ponad 600 językach programowania z użyciem platformy NVIDIA NeMo (oczywiście wykorzystano akceleratory graficzne NVIDII). Cała rodzina opiera się na jednym z największych zbiorów danych, a dokładniej The Stack v2. Za udostępnienie StarCoder2 odpowiada BigCode zarządzany właśnie przez Hugging Face oraz ServiceNow.

Programiści mogą liczyć na opcję uzupełniania kodu, a więc StarCoder2 może np. zasugerować dalszą część niedokończonej linii. Dostępna jest także funkcja podsumowania całego kodu, czy też wyszukiwania konkretnych fragmentów w otwartoźródłowych repozytoriach, aby odnaleźć te najbardziej odpowiednie. Oczywiście modele można także dostosować lub stworzyć na ich podstawie chatboty. Projekt na GitHubie znajdziemy pod tym adresem, jednak możemy także skorzystać z platformy Hugging Face. Jeśli jesteśmy spragnieni wiedzy, to możemy się zapoznać z naprawdę bardzo obszernym dokumentem na temat StarCoder2. Jednak mimo faktu, że omawiana rodzina LLM udostępniona jest za darmo, to ma swoje ograniczenia (licencja BigCode Open RAIL-M 1.0). Rozwiązania nie można wykorzystywać do nielicznych celów, które są sprzeczne z „przepisami dotyczącymi sztucznej inteligencji” (np. tworzenie aplikacji, które mogłyby udzielać porad medycznych).

Źródło: NVIDIA, Hugging Face, TechCrunch