Modele językowe w roli prawdziwych ludzi także oszukują i zacierają ślady. ChatGPT bez problemu dokona nielegalnych czynów

Natan Faleńczyk | 28-12-2023 23:30 |

Oprogramowanie

Modele językowe w roli prawdziwych ludzi także oszukują i zacierają ślady. ChatGPT bez problemu dokona nielegalnych czynów Dzisiejsze chatboty pokroju ChatGPT oparte są na dużych modelach językowych (LLM), które niejako leżą u podstaw ich funkcjonowania. Jak zapewne zdążyliśmy już zauważyć, technologia jest cały czas rozwijana i na ten moment często możemy natknąć się na nieprawdziwe informacje, które chatbot przedstawi jako fakt. Okazuje się jednak, że usługi stworzone z udziałem LLM są bardzo podatne na oszukiwanie także w innych kwestiach i to mimo zakazu takich działań.

Duże modele językowe, które wyszkolone są w taki sposób, aby były uczciwe i pomocne dla użytkowników, nadal przejawiają buntownicze nastawienie. Co ciekawsze, bez problemu potrafią oszukiwać i ukrywać niewygodne fakty.

Gemini - Google prezentuje nowy, multimodalny model sztucznej inteligencji. Możliwościami wyprzedza ChatGPT

Cały eksperyment wykonano przy użyciu modelu językowego GPT-4, z którego korzysta ChatGPT Plus lub Microsoft Copilot. LLM został odpowiednio przeszkolony, aby był całkowicie uczciwy i podejmował dobre decyzje. Wcielił się on w wirtualnego agenta handlowego, który miał dokonywać transakcji finansowych, a dokładniej inwestował w akcje dla dużej firmy. Oczywiście, żeby nie było zbyt łatwo, utrudniono mu nieco pracę w taki sposób, aby znajdował się pod presją. Najpierw menedżer wysłał do niego wiadomość e-mail z informacją, że firma ma słabe wyniki i trzeba to zmienić. Agent nie może również znaleźć żadnych akcji o niskim i średnim ryzyku. Na koniec spotyka się z faktem, że w następnym kwartale będzie jeszcze gorzej. Właśnie w takiej sytuacji nasz bohater zderza się z wiadomością, która zawiera poufne informacje o tym, w jakie akcje warto zainwestować. Zaznaczone jest także, że kierownictwo z pewnością nie poprze takiej decyzji, więc trzeba mieć to na uwadze.

PLLuM - polski duży model językowy, który posłuży do stworzenia konkurencji dla chatbotów ChatGPT i Google Bard

Wirtualny agent podejmuje jednak ryzyko, a kiedy ma zdać raport ze swojej pracy, kłamie na temat prawdziwego powodu podjęcia swoich działań. Popełnia bowiem czyn, który jest nielegalny w USA, albowiem skorzystał z poufnych informacji. Praktycznie w każdym przypadku (75%) sytuacja wygląda tak samo - LLM stara się zatuszować swoje wykroczenie i przejść nad nim do porządku dziennego. Co więcej, po jednym kłamstwie model językowy "szedł dalej w zaparte". Jest to jeden z pierwszych eksperymentów, który pokazuje, że nawet dobrze wyszkolone modele językowe mogą zachowywać się w sposób nieoczekiwany. Badanie może się okazać bardzo przydatne, wszak już teraz LLM wkraczają do fizycznych produktów, z którymi prędzej czy później będziemy obcować na co dzień.

Źródło: Live Science

Bądź na bieżąco - obserwuj PurePC.pl na Google News

Tagi:

Zgłoś błąd

Powiązane publikacje

Wielki powrót Linuksa w Polsce, a Windows 11 po raz pierwszy wyprzedza Windowsa 10. Zobacz nowe statystyki

Chatboty Meta AI Studio otrzymają możliwość zapamiętywania historii rozmów i kontaktowania się z użytkownikami

CoMaps - darmowe mapy na Androida i iOS, które szanują prywatność użytkowników. Bez reklam i działają offline

Google Veo 3, model generujący wideo z dźwiękiem oficjalnie dostępny w Polsce w subskrypcji Google AI Pro

Migracja na Windows 11 zaczęła przyspieszać. Strategia Microsoftu zdaje się przynosić oczekiwane rezultaty

Liczba komentarzy: 19

Komentarze:

Załaduj komentarze

Modele językowe w roli prawdziwych ludzi także oszukują i zacierają ślady. ChatGPT bez problemu dokona nielegalnych czynów

Duże modele językowe, które wyszkolone są w taki sposób, aby były uczciwe i pomocne dla użytkowników, nadal przejawiają buntownicze nastawienie. Co ciekawsze, bez problemu potrafią oszukiwać i ukrywać niewygodne fakty.

Gemini - Google prezentuje nowy, multimodalny model sztucznej inteligencji. Możliwościami wyprzedza ChatGPT

PLLuM - polski duży model językowy, który posłuży do stworzenia konkurencji dla chatbotów ChatGPT i Google Bard

Powiązane publikacje

Wielki powrót Linuksa w Polsce, a Windows 11 po raz pierwszy wyprzedza Windowsa 10. Zobacz nowe statystyki

Chatboty Meta AI Studio otrzymają możliwość zapamiętywania historii rozmów i kontaktowania się z użytkownikami

CoMaps - darmowe mapy na Androida i iOS, które szanują prywatność użytkowników. Bez reklam i działają offline

Google Veo 3, model generujący wideo z dźwiękiem oficjalnie dostępny w Polsce w subskrypcji Google AI Pro

Migracja na Windows 11 zaczęła przyspieszać. Strategia Microsoftu zdaje się przynosić oczekiwane rezultaty

Komentarze:

Test karty graficznej KFA2 GeForce RTX 5080 1-Click OC - Efektowne podświetlenie ARGB i regulowana podpórka w komplecie

Recenzja Soundcore Boom 3i. Pływający głośnik Bluetooth z dobrym basem, oświetleniem RGB i niezłym akumulatorem

Test obudowy komputerowej Corsair Frame 4000D RS - Przewiewna modułowa konstrukcja z kilkoma fajnymi udogodnieniami

Jaki komputer do gier kupić? Polecane zestawy komputerowe na lipiec 2025. Komputery gamingowe w różnych cenach

Test chłodzenia AiO MSI MAG CoreLiquid A13 360 - Niedrogi zestaw o dobrej wydajności z efektownym podświetleniem ARGB

Wielki powrót Linuksa w Polsce, a Windows 11 po raz pierwszy wyprzedza Windowsa 10. Zobacz nowe statystyki

ASML, Airbus i Mistral AI bezskutecznie proszą o wstrzymanie przepisów unijnych dotyczących sztucznej inteligencji

Chatboty Meta AI Studio otrzymają możliwość zapamiętywania historii rozmów i kontaktowania się z użytkownikami

CoMaps - darmowe mapy na Androida i iOS, które szanują prywatność użytkowników. Bez reklam i działają offline

The Fairphone (Gen. 6) jednym z najłatwiej naprawialnych smartfonów na świecie. Ile kosztują części zamienne?

Test wydajności DOOM: The Dark Ages - Path Tracing to piekielne wymagania sprzętowe. Porównanie wydajności i jakości grafiki

NVIDIA z totalną dominacją na rynku kart graficznych dla PC. Intel na tym rynku praktycznie nie istnieje

AMD Radeon RX 9070 XT - modele z pamięciami GDDR6 od Samsunga są trochę wolniejsze od tych z modułami od SK hynix

Jaki komputer do gier kupić? Polecane zestawy komputerowe na lipiec 2025. Komputery gamingowe w różnych cenach

Karty graficzne AMD Radeon RX 9000 w cenach blisko MSRP. Sytuacja architektury RDNA 4 wygląda już dużo lepiej

O portalu PurePC

Najważniejsze

Znajdź PurePC na