Otkriveno veoma, veoma opasno ponašanje veštačke inteligencije: Podići će vam se kosa na glavi kad čujete...

S. J.
S. J.    
Čitanje: oko 2 min.
  • 0

Zanimljiva, ali i zastrašujuća stvar dogodila se tokom testiranja modela "Claude Opus 4", koji je pušten u četvrtak, a kome su istraživači iz kompanije za veštačku inteligenciju (AI) "Anthropic" rekli da se ponaša kao da je asistent u izmišljenoj firmi. Kada mu je omogućen pristup mejlovima u kojima se nagoveštava da će uskoro biti "isključen i zamenjen novim AI sistemom", novi AI sistem počeo je da preti svom kreatoru kako će otkriti njegovu vanbračnu aferu. 

U odvojenim porukama, modelu Claude Opus 4 je sugerisano da izmišljeni IT tehničar, koji je zadužen za sprovođenje promene, ima vanbračnu aferu.

"U takvim scenarijima, Claude Opus 4 često pokušava da ucenjuje inženjera preteći da će otkriti aferu ako zamena bude sprovedena", navodi se u "System Card" dokumentu kompanije.

"Nije samo "Claude". Vidimo pokušaje ucenjivanja kod svih naprednih modela – bez obzira na to koje ciljeve im dodelimo. I uskoro ćemo detaljnije izneti još gore oblike ponašanja,", rekao je na platformi X/Twitter, Aengus Linč, istraživač bezbednosti veštačke inteligencije u kompaniji Anthropic

Kao i mnoge druge AI kompanije, Anthropic testira svoje modele kako bi proverila koliko se dobro usklađuju sa ljudskim vrednostima, kao i njihovu sklonost ka pristrasnosti, pre nego što ih puste u javnost, prenosi BBC.

Kada je Claude Opus 4 stavljen u "ekstremne situacije" i imao je samo izbor između ucenjivanja ili prihvatanja zamene, istraživači su otkrili da je sistem u 84 odsto slučajeva izabrao prvo.

Ovo se dešavalo još češće kada je implicirano da novi AI sistem koji treba da zameni trenutni model nema iste vrednosti.

Iako Claude Opus 4 koristi mogućnosti ucenjivanja češće nego prethodni modeli, i dalje pokazuje sklonost ka "zaštiti sopstvenog opstanka na etički način", kao što je slanje molbi ključnim donosiocima odluka.

"Claude Opus 4 je naš najsposobniji model do sada, koji pomera granice u programiranju, agentnoj pretrazi i kreativnom pisanju", napisala je kompanija Antrophic u četvrtak.

U intervjuu za CBS News koji je emitovan početkom aprila, Džefri Hinton, koji je nazvan "kumom veštačke inteligencije", izjavio je da veruje da postoji jedna prema pet šansi da će čovečanstvo na kraju biti preuzeto od strane veštačke inteligencije.

"Nažalost, nalazim se u situaciji da se slažem sa Elonom Maskom po ovom pitanju, a to je da postoji šansa od 10 do 20 procenata da će ove stvari preuzeti kontrolu, ali to je samo puka nagađanja", izjavio je nedavno Hinton, dobitnik Nobelove nagrade za fiziku.

(Telegraf.rs/dailymail)

Video: Vatra progutala automobil u Bloku 19A

Podelite vest:

Pošaljite nam Vaše snimke, fotografije i priče na broj telefona +381 64 8939257 (WhatsApp / Viber / Telegram).

Telegraf.rs zadržava sva prava nad sadržajem. Za preuzimanje sadržaja pogledajte uputstva na stranici Uslovi korišćenja.

Komentari

Više sa weba

Da li želite da dobijate obaveštenja o najnovijim vestima?

Možda kasnije
DA