Zgłoś błąd

a{display:none !important}Wygląda na to, że masz wyłączony Javascript.
Włącz go, bo bez niego portal nie działa prawidłowo - niektóre elementy strony mogą nie działać lub nie być poprawnie wyświetlane.

psycho sycophancy

Naukowcy odkryli prosty sposób na zmuszenie AI do łamania zasad. Wystarczy jedna sztuczka psychologiczna i działa w 100 proc.

Maciej Lewczuk |

Oprogramowanie

Komentarzy: 43

Naukowcy odkryli prosty sposób na zmuszenie AI do łamania zasad. Wystarczy jedna sztuczka psychologiczna i działa w 100 proc.

Sztuczna inteligencja i duże modele językowe stają się coraz bardziej zaawansowane. Ich twórcy implementują w nich zabezpieczenia, które mają uniemożliwić generowanie szkodliwych lub niebezpiecznych treści. Jednakże, wraz z rozwojem technologii, rozwijają się również metody obchodzenia tych barier. Najnowsze badania pokazują, że do złamania zabezpieczeń nie potrzeba już skomplikowanego kodu. Czasami wystarczy odpowiednie podejście psychologiczne.

Tagi:

PurePC.pl to serwis informacyjny o nowinkach technologicznych, testach sprzętu, porównaniach, telefonach, najgorętszych grach oraz polecanych zestawach komputerowych.

Działamy nieprzerwanie od 2006 roku i wśród portali o tematyce IT jesteśmy jednym z liderów w branży, pozostając jednak w pełni medium niezależnym.

x Wydawca serwisu PurePC.pl informuje, że na swoich stronach www stosuje pliki cookies (tzw. ciasteczka). Kliknij zgadzam się, aby ta informacja nie pojawiała się więcej. Kliknij polityka cookies, aby dowiedzieć się więcej, w tym jak zarządzać plikami cookies za pośrednictwem swojej przeglądarki.

psycho sycophancy

Naukowcy odkryli prosty sposób na zmuszenie AI do łamania zasad. Wystarczy jedna sztuczka psychologiczna i działa w 100 proc.

Recenzja DDPAI Z90 Master 3CH. Wideorejestrator 4K + 4K + 3K, z doświetlaniem IR oraz podwójną pamięcią

Jaka myszka do grania? Jaka klawiatura mechaniczna? Poradnik zakupowy i polecany sprzęt dla graczy na lipiec 2026

Recenzja DDPAI Z60 Pro 3CH. Wideorejestrator 4K z trzema kamerami, w akceptowalnej cenie

Test wydajności Assassin's Creed Black Flag Resynced - Wymagania sprzętowe zmiatają z pokładu? Piraci puszczą wszystkich bez gaci?

Test procesora AMD Ryzen 7 7700X3D - Słabsza wersja AMD Ryzen 7 7800X3D... Jednak cena na poziomie szybszego modelu

Tomb Raider: Legacy of Atlantis - nowy gameplay prezentujący poruszanie się i eksplorację w grze

Deepfake nie ma szans? NVIDIA pokazuje narzędzie, które łapie fałszywe wideo z 92-procentową skutecznością w 22 milisekundy

Google szykuje Frozen v2. Chip pod Gemini ma dać 6–10x więcej tokenów z wata niż obecne TPU

Gracz przykręcił do GeForce RTX 4060 radiator wielkości cegły. Powstała z tego najszybsza pasywnie chłodzona karta graficzna

Steam Machine został wyceniony z myślą o przyszłych wzrostach cen pamięci RAM. Wywiad z inżynierami Valve ujawnia kulisy

Wyniki wielkiego konkursu na 20 urodziny PurePC! Sprawdź czy wygrałeś jedną z kilkudziesięciu nagród

Steam Machine z oficjalną ceną. Valve właśnie zgasiło entuzjazm graczy - aż trudno uwierzyć w te kwoty!

GeForce RTX 5090 Founders Edition padł w redakcyjnym teście. Kabel 12V-2x6 stopił się po obu stronach

Jest odczyt Hot Spot na NVIDIA GeForce RTX 5000 - Diagnostyczne programy zaczęły podawać informacje o temperaturach

Karty graficzne AMD Radeon RX 7000 z serii RDNA 3 od dzisiaj oficjalnie z dostępem do ulepszonego upscalingu FSR 4.1

Gracz przykręcił do GeForce RTX 4060 radiator wielkości cegły. Powstała z tego najszybsza pasywnie chłodzona karta graficzna

NVIDIA DLSS 5 - Firma ujawnia szczegóły działania techniki renderowania neuronowego podczas konferencji SIGGRAPH

Steam Machine został wyceniony z myślą o przyszłych wzrostach cen pamięci RAM. Wywiad z inżynierami Valve ujawnia kulisy

Tomb Raider: Legacy of Atlantis - nowy gameplay prezentujący poruszanie się i eksplorację w grze

Wsadził 192 baterie AA do komputera i uruchomił system nazwany na cześć nastoletniej gwiazdy Disneya

Najlepsze darmowe programy na Linux cz. 2. Monitorowanie GPU, CPU, kontrolowanie wentylatorów, rozpoznawanie muzyki i inne

Darmowe programy do Windows cz. 14. Pobieranie filmów z YT, menedżer plików, launcher, informacje o dyskach i inne

Formatowanie dysku HDD i nośnika SSD - jaki rozmiar jednostki alokacji wybrać? Wyjaśniamy, jak to działa i jakie ma zastosowania

Najlepsze darmowe programy na Linux cz. 1. Monitorowanie GPU, czyszczenie pamięci, obsługa słuchawek, muzyka i inne

Jak działa AI? Co naprawdę dzieje się pod maską chatbota, jak działa kontekst i dlaczego model potrafi mylić się tak przekonująco

Lexar na CES 2026 wkracza w kolejny rozdział z nowymi produktami - karta pamięci Silver Plus microSDXC 2 TB i SSD Play X

Miesiąc wielkich rabatów w Showroomie Lenovo & Motorola z okazji Black Friday

MODECOM oficjalnym polskim partnerem NNG - profesjonalne rozwiązania nawigacyjne iGO przeznaczone dla kierowców

MSI prezentuje klawiaturę Strike Pro Wireless - nową klasę komfortu i precyzji

Szukasz idealnego laptopa? MSI pomoże wybrać i jeszcze dołoży 100 zł

O portalu PurePC

Najważniejsze

Znajdź PurePC na