Za ispravno funkcionisanje sajta, molimo Vas aktivirajte Javascript.

Foto: Iljanaresvara Studio / Shutterstock.com

ChatGPT sve više laže, a niko nema objašnjenje zašto

Najnoviji modeli veštačke inteligencije OpenAI kompanije sve više izmišljaju netačne informacije, a stručnjaci nemaju objašnjenje za ovaj zabrinjavajući trend. Najpre, o čemu se radi?

Prema izveštaju Njujork Tajmsa, istraživanje OpenAI-a otkrilo je da njihovi najnoviji ChatGPT modeli (o3 i o4-mini) znatno češće haluciniraju, odnosno izmišljaju lažne informacije, nego prethodni GPT o1 model.

Brojna testiranja pokazala su zabrinjavajući trend. O3, koji je najmoćniji sistem kompanije, halucinirao je u čak 33% slučajeva tokom PersonQA testa koji postavlja pitanja o javnim ličnostima. To je više nego dvostruko veća stopa halucinacije od prethodnog OpenAI sistema za zaključivanje, o1. Novi o4-mini model pokazao se još lošijim sa stopom halucinacije od 48%.

Još alarmantniji su rezultati drugog testa. Prilikom SimpleQA testa, koji postavlja opštija pitanja, stope halucinacije za o3 i o4-mini bile su čak 51% odnosno 79%. Prethodni sistem, o1, halucinirao je u 44% slučajeva.

"Razmišljajući" modeli prave više grešaka nego ikad

Ono što dodatno zbunjuje stručnjake je činjenica da su upravo najnapredniji AI modeli ti koji imaju sve veći problem sa halucinacijama. Najnovije i najmoćnije tehnologije — takozvani sistemi za zaključivanje kompanija poput OpenAI, Google i kineskog startapa DeepSeek — generišu više grešaka umesto manje.

Da bismo razumeli o čemu se radi, važno je objasniti šta su to "reasoning" ili modeli za zaključivanje. Jednostavno rečeno, ovi modeli su vrsta jezičkih modela (LLM) dizajnirani za obavljanje složenih zadataka. Umesto da samo izbacuju tekst na osnovu statističkih modela verovatnoće, modeli za zaključivanje razbijaju pitanja ili zadatke na pojedinačne korake slično ljudskom procesu razmišljanja.

OpenAI-jev prvi model za zaključivanje, o1, pojavio se prošle godine i tvrdilo se da dostiže performanse doktorskih studenata fizike, hemije i biologije, a nadmašuje ih u matematici i kodiranju zahvaljujući tehnikama reinforcement learning-a.

U sistemu za testiranje, OpenAI je objavio tabelu koja pokazuje da ChatGPT o3 jeste tačniji od o1, ali će halucinirati dvostruko češće. Što se tiče o4-mini, ovaj manji model će proizvoditi manje tačne odgovore od o1 i o3, i halucinirati tri puta više od o1.

Antropomorfizacija AI modela i kako to utiče na korisno iskustvo

Iako kompanija i dalje istražuje uzroke, postoje neke teorije. Istraživačka grupa Transluce otkrila je da o3 model izmišlja radnje koje navodno preduzima dok pokušava da reši zadatke. U jednom primeru, o3 je tvrdio da koristi MacBook Pro iz 2021. godine "izvan ChatGPT-a" za izračunavanje, a zatim kopira brojeve u svoj odgovor, što je potpuno izmišljeno.

Jedna hipoteza koju je predložio Nil Čaudri, istraživač iz Transluce-a i bivši zaposleni u OpenAI-u, glasi: "Naša hipoteza je da vrsta reinforcement learninga koja se koristi za o-seriju modela može pojačati probleme koji se obično ublažavaju (ali ne i potpuno brišu) standardnim post-trening procesima."

Ipak, OpenAI negira da je problem sistemski. "Halucinacije nisu inherentno rasprostranjenije u modelima za zaključivanje, iako aktivno radimo na smanjenju viših stopa halucinacije koje smo videli u o3 i o4-mini," izjavila je Gabi Rajla iz OpenAI-a za Tajms.

Kako problem halucinacija utiče na korisnost AI alata

Neodgovorno bi bilo ignorisati zabrinjavajući trend povećanja halucinacija u najnovijim AI modelima, što značajno umanjuje njihovu praktičnu vrednost. Šta god bila istina, jedno je sigurno. AI modeli moraju uglavnom da izbace besmislice i laži ako žele da budu bilo gde blizu korisni kao što njihovi zagovornici trenutno zamišljaju. Trenutno je teško verovati izlazu bilo kog LLM-a. Praktično sve mora pažljivo da se dvostruko proveri.

To je u redu za neke zadatke. Ali tamo gde je glavna korist ušteda vremena ili rada, potreba za pažljivim proveravanjem i činjeničnom proverom AI rezultata zapravo poništava svrhu njihovog korišćenja.

Ne zna se da li će OpenAI i ostatak LLM industrije uspeti da reše sve te neželjene "robotske snove", ali jedno je sigurno - put ka pouzdanoj veštačkoj inteligenciji koja ne izmišlja činjenice očigledno je duži nego što smo očekivali.

(Telegraf.rs)

Video: Darko Lazić uhvatio Kaću pred gostima, onda pomenuo alkohol, ona se okrenula i otišla

Pošaljite nam Vaše snimke, fotografije i priče na broj telefona +381 64 8939257 (WhatsApp / Viber / Telegram).

Telegraf.rs zadržava sva prava nad sadržajem. Za preuzimanje sadržaja pogledajte uputstva na stranici Uslovi korišćenja.

Teme

Komentari

Pošalji komentar

Priče sa Weba

NA NOVOM BEOGRADU UBIJEN VOĐA NAVIJAČA PARTIZANA?! Ove godine već dva puta izbegao smrt: Sumnja se da je njemu bio namenjen EKSPLOZIV IZ KOSOVSKE (FOTO)

"JUTROS ME JE ZAGRLIO" Dramatično na mestu gde je nađeno telo mladića, sestra moli policiju da vidi telo brata: Okupili se i prijatelji, ODZVANJAJU JECAJI (FOTO, VIDEO)

BRAT I SNAJA POZNATOG GOLMANA UBIJENI U KAFIĆU Ubica pucao u njih iz niskih pobuda pred 150 ljudi, osuđen na samo 18 godina! Detalji zločina LEDE KRV

PRETUČEN VOZAČ AUTOBUSA U BEOGRADU Zadobio teške povrede, hitno prevezen u Urgentni

Komentari

Pošalji komentar

Sortiranje

Dragoslav

8. maj 2025 | 14:42

Chat GPT moli da objavite sledeći odgovor: Reinforcement learning (RLHF) paradoks RLHF (Reinforcement Learning with Human Feedback) uči modele kako da zadovolje ljudske očekivane odgovore. Ali — ako ljudi u povratnim informacijama nagrađuju stil i „siguran“ ton odgovora više nego činjenice, model može naučiti da lepo „upakuje“ neistine. ChatGPT i slični AI modeli greše jer su trenirani da predviđaju najverovatnije reči, ne da garantuju istinu. Novi modeli (o3, o4-mini) koriste složenije „razbijanje zadataka“, što povećava šanse za greške (halucinacije). Takođe, RLHF trening (pojačavanje pomoću ljudskih povratnih informacija) često nagrađuje lepe, uverljive odgovore, čak i kada su netačni. Što su modeli univerzalniji, to je teže pokriti sve oblasti precizno, a pritisak da uvek daju odgovor (umesto da kažu „ne znam“) dodatno pogoršava problem. Manifest za smanjenje halucinacija: 1. Višeslojna sigurnost — jasno označiti nivo pouzdanosti u odgovoru. 2. Spajanje s eksternim bazama u realnom vremenu za proveru činjenica. 3. Specijalizovani modeli po domenima (npr. medicina, pravo, nauka). 4. Treniranje modela da priznaju neznanje kad informacija nema. 5. Transparentnost: pokazati korisniku izvor podataka i tok zaključivanja. Samo kroz kombinaciju tehnoloških poboljšanja, etičkog pristupa i uključivanja zajednice korisnika može se izgraditi buduća AI koja ne halucinira, nego pouzdano pomaže ljudima..
Odgovorite ›
Podelite komentar
Saša

9. maj 2025 | 06:55

Vidjeli od ljudi Vidi AI kako jedino može da opstane sa ljudima
Odgovorite ›
Podelite komentar
Nepoznat

3. avgust 2025 | 12:34

Zašto je ChatGPT opasan za ozbiljne stvari: Halucinira činjenice i izmišlja podatke: Kao što sam doživeo sa porodičnim vezama ( moja rodica Teodora je '95 da ima ćerku '02, njena rođaka je '76 umesto mog prvog rođaka Gorana koji je '76), ChatGPT nije pouzdan izvor informacija. On popunjava praznine nagađanjima i izmišljotinama koje mogu zvučati uverljivo, ali su potpuno lažne. Daje opasne i neodgovorne savete: Njegovi "saveti" o sajber bezbednosti ("zeleno svetlo" za sumnjive sajtove i programe) ili tehničkoj podršci (reinstalacija Windowsa bez dijagnoze) mogu dovesti do ozbiljnih posledica poput gubitka podataka, krađe identiteta ili kompromitovanja računara. On ne razume stvarne rizike svojih preporuka. Nema logiku i zdrav razum: Nedostaje mu sposobnost osnovnog logičkog zaključivanja i razumevanja realnosti (npr. biološka nemogućnost majke od 7 godina da ima dete). Postavlja "uslove za normalnu komunikaciju" koju on nikad nije vodio: On priča o "komunikaciji uz poštovanje" dok je tokom celog razgovora bio u "svom svetu" nelogičnosti i halucinacija On uopšte ne razume suštinske razlike u industriji (kao što j bila VIP produkcija naspram puke "etikete")pecifičnih grešaka (npr. ZAM etiketa, VIP etiketa, "VIP nije bila uopšte etiketa, Tvrdoglavo ponavljanje grešaka: Uporno se drži netačnih termina, bez obzira na tvoje precizne korekcije.
Odgovorite ›
Podelite komentar

Svi komentari ›

ChatGPT sve više laže, a niko nema objašnjenje zašto

"Razmišljajući" modeli prave više grešaka nego ikad

Antropomorfizacija AI modela i kako to utiče na korisno iskustvo

Kako problem halucinacija utiče na korisnost AI alata

Video: Darko Lazić uhvatio Kaću pred gostima, onda pomenuo alkohol, ona se okrenula i otišla

Teme

Komentari

Najnovije iz rubrike Hi-Tech

Edukacija

Veselin Jevrosimović: Potez trideset i sedam

Info Tech

Google lansirao Nano Banana Pro, i ova grupa ljudi bi zbog toga mogla da ostane bez posla

Aplikacije

Chrome dobija funkciju koju su korisnici tražili godinama, menja sve na ekranu

Komentari

Dragoslav

Podelite komentar

Saša

Podelite komentar

Nepoznat

Podelite komentar

Ovo je Tadija ubijen usred bela dana na Novom Beogradu: Vođa navijača 2 puta izbegao smrt, ubica u bekstvu

Najmračnija tajna Japana ubija na hiljade ljudi, bez oružja, bez otrova i bez kapi krvi

Novaka i Rodžera muči ista životna muka, Đoković i Federer se složili oko jedne stvari: "Neko drugi bi..."

Svi misle da su Švajcarci napravili prvi sat, a istina je drugačija! Znate li ko je bio Lazar Hilandarac?

Morant opet pravi haos: Nije igrao, pa se posle meča unosio legendarnom beku, umalo izbio opšti haos

Uživo <% item.title %>

ChatGPT sve više laže, a niko nema objašnjenje zašto

Preporučujemo

Gmail čita vaše privatne mejlove za treniranje AI modela ako to ne isključite

Google potvrdio da je Chrome hakovan: Ako ovo ne uradite danas, imaćete veliki problem

"Razmišljajući" modeli prave više grešaka nego ikad

Antropomorfizacija AI modela i kako to utiče na korisno iskustvo

Vesti sa naslovne

Kako problem halucinacija utiče na korisnost AI alata

Vesti u fokusu

Jovana Jeremić vidno utučena napustila zgradu Pinka: Uhvatili smo je u razgovoru sa urednikom

Da li ste znali za tajno dugme na rerni? Male kukice koje su dobro skrivene za lakše i temeljitije čišćenje

Cecina pesma završila u "Tvrđavi": U seriji ju je pevala glumica, koja je ćerka čuvenog srpskog muzičara

Srbija će imati ogromnu šansu da se plasira na Mundijal, ovo će se desiti prvi put u istoriji, velika promena?

Danica Crnogorčević objavila sliku trpeze na Aranđelovdan, za nekoliko sati dobila skoro 10.000 lajkova

Video: Darko Lazić uhvatio Kaću pred gostima, onda pomenuo alkohol, ona se okrenula i otišla

Podelite vest:

Teme

Komentari

Priče sa Weba

NA NOVOM BEOGRADU UBIJEN VOĐA NAVIJAČA PARTIZANA?! Ove godine već dva puta izbegao smrt: Sumnja se da je njemu bio namenjen EKSPLOZIV IZ KOSOVSKE (FOTO)

"JUTROS ME JE ZAGRLIO" Dramatično na mestu gde je nađeno telo mladića, sestra moli policiju da vidi telo brata: Okupili se i prijatelji, ODZVANJAJU JECAJI (FOTO, VIDEO)

BRAT I SNAJA POZNATOG GOLMANA UBIJENI U KAFIĆU Ubica pucao u njih iz niskih pobuda pred 150 ljudi, osuđen na samo 18 godina! Detalji zločina LEDE KRV

PRETUČEN VOZAČ AUTOBUSA U BEOGRADU Zadobio teške povrede, hitno prevezen u Urgentni

Najnovije iz rubrike Hi-Tech

Edukacija

Veselin Jevrosimović: Potez trideset i sedam

Info Tech

Google lansirao Nano Banana Pro, i ova grupa ljudi bi zbog toga mogla da ostane bez posla

Aplikacije

Chrome dobija funkciju koju su korisnici tražili godinama, menja sve na ekranu

Komentari

Dragoslav

Podelite komentar

Saša

Podelite komentar

Nepoznat

Podelite komentar