Može li mašina da shvati balkanski inat i sarkazam? Upoznajte tim koji uči AI da čita između redova

   
Čitanje: oko 7 min.
  • 0

Dok globalni tehnološki giganti iz Silicijumske doline pokušavaju da mapiraju svest čovečanstva kroz masivne jezičke modele, na periferiji njihove pažnje ostaju digitalni prostori poput našeg, odnosno mesta gde su jezik, sleng i društveni kontekst previše složeni za generičke algoritme. Kada algoritam projektovan u Kaliforniji pokuša da moderira komentar na nekom balkanskom portalu ili da izmeri sentiment javnog mnjenja u našem regionu, on gotovo po pravilu promašuje metu. On ne razume naš pasivno-agresivni ton, lokalne političke metafore, niti nijansu između prave pretnje i specifičnog lokalnog humora.

U tom međuprostoru, gde tehnologija nailazi na zid kulturološkog konteksta, nastao je Peitho, AI startap iz Crne Gore koji je ime dobio po grčkoj boginji mudre predaje i ubeđivanja. Smešten u inovativnom čvorištu Naučno-tehnološkog parka Crne Gore, ovaj tim inženjera i entuzijasta ne pokušava da se takmiči sa kompanijama poput OpenAI ili Google na globalnom planu. Umesto toga, oni rade nešto daleko preciznije. Oni grade naprednu veštačku inteligenciju koja je "prohodala" na regionalnim jezicima bivše Jugoslavije.

Peitho razvija inteligentnu platformu za analizu digitalnog sadržaja i automatsku moderaciju online prostora. Njihovi modeli u realnom vremenu skeniraju okeane tekstualnih podataka sa portala i društvenih mreža, prevodeći haos internet komentara u jasne, poslovno upotrebljive uvide za brendove, korporacije i medijske kuće. U eri u kojoj sekcija za komentare ispod vesti neretko postaje toksično bojno polje, njihova tehnologija nudi balans kroz automatsko prepoznavanje govora mržnje i štetnog sadržaja, bez gušenja slobode govora.

Ali, kako zapravo izgleda dresirati mašinu da prepozna balkanski sarkazam? Gde prestaje sloboda izražavanja, a počinje algoritamska cenzura? I kako jedan regionalni startap uspeva da odbrani svoju teritoriju pred naletom globalnog kapitala?

U potrazi za odgovorima na ova pitanja, razgovarali smo sa timom koji stoji iza platforme Peitho o tehnologiji, etici internet prostora i budućnosti regionalnog AI ekosistema.

Peitho AI startap iz Crne Gore Foto: Privatna arhiva
  • Kako je izgledao proces treniranja vaših modela za specifičnosti regionalnih jezika i koji su bili najveći lingvistički izazovi sa kojima ste se suočili pri prepoznavanju lokalnog slenga, ironije i sarkazma?

Kako je projekat krenuo kao medijski startap sa fokusom na automatizaciju moderacije komentara, baza za trening nam je bila cca 200.000 anotiranih komentara sa lokalnog portala (0-1 klasifikacija). Međutim, kako je bio pristuan moderator bias, uzeli smo 5.000 komentara iz svih kategorija, i njih anotirali sa profesionalnim lingvistom sa Filološkog fakulteta. Što je podiglo preciznost modela na cca 90%. U planu je dodatna anotacija još 5.000.

  • Platforma ima dvostruki fokus: praćenje reputacije brendova i automatsku moderaciju komentara za medije. Koji od ova dva segmenta trenutno beleži veći rast na tržištu i kako tehnološki balansirate razvoj između analitike sa jedne i filtriranja sadržaja sa druge strane?

Definitivno praćenje reputacije i generalni kliping/istraživanje tržišta jer je ta niša značajno šira u odnosu na samo modul za medije. Ono što povezuje sve jeste da, nevezano koja je vrsta sadržaja, model konstantno uči i unapređuje. To se onda reflektuje i za istraživanja i moderaciju komentara kroz bolji output i znanje našeg jezika. Što se razvoja tiče, tu prosto pratimo sta tržište traži i prilagođavamo se, što mislimo da je ključno s obzirom na prirodu i inovativnost proizvoda.

  • Praćenje digitalnog prostora u realnom vremenu zahteva ozbiljnu infrastrukturu. Kako arhitekturalno rešavate problem skalabilnosti platforme kada dođe do naglih skokova u količini online diskusija tokom kriznih situacija ili velikih društvenih događaja?

Trenutno posjedujemo dva servera, od kojih jedan hostuje web aplikaciju i SaaS modul, dok je drugi server zadužen za hosting samog modela i inference. Dodatno, arhitektura je optimizovana tako da daje brz odgovor, a sami sadržaj se onda asinhrono ažurira u bazama, i on, ako i nije sačuvan “isti tren”, dovoljno brzo se i kod nas sačuva.

  • Kod automatske moderacije online komentara linija između uklanjanja govora mržnje i ugrožavanja slobode govora je vrlo tanka. Na koji način vaši AI modeli prepoznaju tu granicu i koliki je procenat ljudske supervizije (human-in-the-loop) i dalje potreban u tom procesu?

Ovo pitanje često dobijamo i od klijenata i generalno od svih koji su imali neko 'iskustvo' sa softwareom. U pocetku, kada onbordujemo klijenta, uvijek podesimo 'strogoću' (threshold) modela kako bismo izbjegli bilo kakve propuste. Kako vrijeme odmiče, taj limit se smanjuje i stvara se balans gdje će moderatori sigurno moći da automatizuju sve zabranjene komentare bez njhovog ličnog angažmana (ručne moderacije). Uvijek, moderator ima posljednju riječ, i može da promijeni odgovor modela, koji onda na osnovu toga uči dalje. Ukoliko je model nesiguran, može highlightovati komentar moderatoru za brzu intervenciju. Ovih situacija kako vrijeme odmiče je sve manje.

  • Tržište alata za social listening već ima etablirane globalne igrače. Osim same jezičke lokalizacije, koja je ključna funkcionalna ili tehnološka prednost Peitho platforme zbog koje bi se klijent odlučio za vas, a ne za neko veliko globalno rešenje?

Najveća prednost je upravo lokalizacija i fokus na naše jezike zbog konteksta, nijansi i sarkazma koji detektujemo. Takođe, custom pristup klijentima – ne razvijamo samo SaaS (sem za moderaciju komentara za medije) vec istraživanja prilagođavamo potrebama klijenta i dosta smo fleksibilni u slučaju promjene pravca i ciljeva.

  • Nedavno ste postali stanar Naučno-tehnološkog parka Crne Gore. Na koji način ta vrsta institucionalne i ekosistemske podrške utiče na vaš svakodnevni rad, validaciju proizvoda i planove za privlačenje tech talenata?

Od skoro smo stanari i cijelo iskustvo sa NTP-om je fenomenalno. Skroz je drugačija atmosfera jer si okružen inovatorima, kolegama koji razvijaju svoje startapove i energija je fenomenalna. Pored toga, ukoliko je potrebno, NTP organizuje i veliki broj radionica, edukacija koje su dosta korisne za mlade firme.

  • Sentiment analiza često nailazi na kritike da ne može stoprocentno tačno da izmeri ljudske emocije kroz tekst. Kako Peitho algoritam kvantifikuje nijanse u stavovima javnosti kada su komentari pretežno neutralni ili pasivno-agresivni?

Koristimo par kombinacija za analizu kako bi dosli do najboljih rezultata. To je miks naše baze podataka i ručno anotirane analize sa kontekstom i nekih open-source rjesenja i modela kao što su ROBerta, dok sad istražujemo i novi BERTić. Takođe, naš software ne izoluje samo komentar ili dio teksta, vec analizira cjelinu kako bi dobio kontekst, i samim tim i bolje rezultate. Naravno, iz dosadašnjeg iskustva (najviše u Crnoj Gori), nailazimo na pretežno neutralne tonove i emocije, koje potom gledamo da dodatno raščlanimo i otkrijemo motive i razloge iza toga.

Peitho AI startap iz Crne Gore Foto: Privatna arhiva

Trenutno je vaš fokus primarno na tekstualnim podacima sa portala i društvenih mreža. S obzirom na to da se komunikacija mlađih generacija masovno seli na video-formate (TikTok, Reels), planirate li integraciju multimodalnog AI-ja koji bi analizirao audio i video sadržaje u realnom vremenu?

  • Trenutno je vaš fokus primarno na tekstualnim podacima sa portala i društvenih mreža. S obzirom na to da se komunikacija mlađih generacija masovno seli na video-formate (TikTok, Reels), planirate li integraciju multimodalnog AI-ja koji bi analizirao audio i video sadržaje u realnom vremenu?

To nam je u dugoročnom planu upravo iz tih razloga – multimedija dominira a posebno kod mlađih generacija je i jedini način informisanja. U Srbiji i svijetu postoji par startapova koji se bave time pa pratimo njihov rad takođe.

  • Analiza javnih diskusija podrazumeva prikupljanje i obradu velikih količina podataka sa interneta. Kako Peitho balansira između potrebe za dubokom analitikom za potrebe klijenata i poštovanja privatnosti korisnika, kao i usklađenosti sa pravnim regulativama o zaštiti podataka?

Manje više sve platforme gdje se odvijaju diskusije (društvene mreže, portali, blogovi) imaju dosta dobre politike privatnosti i ne dozvoljavaju vam da preuzimate bilo kakve privatne podatke. Ćak nema ni geografskih podataka. Dobijate obicno engagement metrike i sam sadržaj komentara i posta/teksta. Ostalo je zaštićeno i samim tim se platforme ograđuju od bilo kakvih propusta.

  • Iako su regionalni jezici vaša trenutna komparativna prednost, to tržište ima svoje geografske granice. Da li je Peitho dugoročno zamišljen isključivo kao regionalni lider za ex-Yu prostore ili planirate da primenite isti model hiper-lokalizacije i na neka druga, veća, a jezički zanemarena područja u svetu?

Ne bismo bili u ovome ako ne sanjamo veće tržiste i širenje. Mislim da je nase tržište idealno za validaciju digitalnih proizvoda s obzirom da je i dalje dosta zatvoreno za nove ideje. S druge strane, naš jezik je jedan od najkompleksnijih za ovu vrstu analiza i baš zbog toga je idealna kombinacija za pronalaženje tržista jer smatramo da ako uspijete da se probijete ovdje, dosta ćete biti spremniji i za razvoj van ovog regiona. Neki naš plan razvoja jeste region, zatim Istočna Evropa pa dalje okret ka zapadnim tržištima.

(Telegraf.rs)

Video: Sajam automoila BG Car show 2026, počinje sutra, u sredu, 18. marta

Podelite vest:

Pošaljite nam Vaše snimke, fotografije i priče na broj telefona +381 64 8939257 (WhatsApp / Viber / Telegram).

Telegraf.rs zadržava sva prava nad sadržajem. Za preuzimanje sadržaja pogledajte uputstva na stranici Uslovi korišćenja.

Komentari

Da li želite da dobijate obaveštenja o najnovijim vestima?

Možda kasnije
DA