psycho sycophancy
Naukowcy odkryli prosty sposób na zmuszenie AI do łamania zasad. Wystarczy jedna sztuczka psychologiczna i działa w 100 proc.
Sztuczna inteligencja i duże modele językowe stają się coraz bardziej zaawansowane. Ich twórcy implementują w nich zabezpieczenia, które mają uniemożliwić generowanie szkodliwych lub niebezpiecznych treści. Jednakże, wraz z rozwojem technologii, rozwijają się również metody obchodzenia tych barier. Najnowsze badania pokazują, że do złamania zabezpieczeń nie potrzeba już skomplikowanego kodu. Czasami wystarczy odpowiednie podejście psychologiczne.



























Recenzja karty graficznej PNY GeForce RTX 5080 Slim OC - Chłodzenie zajmujące dwa sloty zwiastuje kłopoty?
Test wydajności 007 First Light - Jaka karta graficzna do tajnych misji? Kuzyn Borewicza ma duże wymagania
AMD FSR 4.1 oficjalnie zmierza do kart graficznych Radeon RX 7000. Nowości trafią w 2027 roku także dla kart Radeon RX 6000
Test kart graficznych AMD Radeon RX 9070 GRE vs NVIDIA GeForce RTX 5070 - Trochę za późno, trochę za słabo, trochę za drogo
Myślałeś, że karty dźwiękowe PCIe już wymarły? Creative Sound Blaster AE-X wraca do gry o pecetowe audio