Tip:
Highlight text to annotate it
X
Bilo bi dobro da predstavimo neku osnovnu terminologiju
koja cesto koristi u vestackoj inteligenciji da razlikuje razlicite vrste problema.
Prva rec koju cu vas nauciti je potpnuno u odnosu na delimicno posmatrano.
Okruzenje se naziva potpuno posmatrano ako sta agent moze da oseti
u bilo kojem trenutku je dovoljno za donosenje optimalnog resenja.
Tako, na primer, u mnogim igrama sa kartama,
kada su sve karte na stolu, trenutan pogled na sve te karte
je zaista dovoljan da se donese optimala izbor.
To je suprotno od nekih drugih okruzenja gde vam je potrebna memorija
na strani agenta da bi se donela najbolja moguca odluka.
Na primer, u igri pokera, karte nisu otvorene na stolu,
i memorisanje prethodnih poteza ce pomoci u donosenju bolje odluke.
Da bi potpuno razumeli razliku, posmatrajte interakciju agenta
sa okruzenjem svojim senzorima i pokretacima,
i ova interakcija se odvija tokom mnogih ciklusa,
cesto nazvanim ciklus percepcije-akcije.
Za mnoga okruzenja, je pogodno podrazumevati
da okruzenje ima neku vrstu unutranjeg stanja.
Na primer, u igri kartama gde karte nisu otvorene na stolu,
stanje moze da se odnosi na osnovu karata u tvojoj ruci.
Okruzenje je u potpunosti posmatrano ako senzori uvek mogu videti
celokupno stanje okruzenja.
Delimicno je posmatrano ako senzori mogu da sagledaju samo deo stanja,
dok memorisanje prethodnih merenja daje dodatne informacije o stanju
koje ne mozemo sagledati sada.
Dakle bilo koja igra, na primer, gde prethodni potezi sadrze informacije o
tome sta bi moglo biti u ruci osobe, takve igre su delimicno posmatrane,
i one zahtevaju drugaciji tretman.
Veoma cesto agenti koji se bave delimicno posmatranim okruzenjima
treba da imaju unutrasnju memoriju da shvate sta
je stanje okruzenja, a mi cemo intenzivno pricati
kada budemo govoriti o skrivenim Markov modelima o tome kako ova struktura
ima takvu unutrasnju memoriju.
Druga terminologija za okruzenje se odnosi da li je okruzenje
deterministicko ili stohasticko.
Deterministicko okruzenje je ono u kome akcije vaseg agenta
jedinstveno odredjuju ishod.
Tako, na primer, u sahu, zaista nema slucajnosti kada se pomera figura.
Evekat pomeranja figure je potpuno unapred odredjen,
i bez obzira gde cu da pomerim istu figuru, ishod je isti.
To mi zovemo deterministicko.
Igre sa kockicama, na primer, kao backgammon, su stohasticke.
Dok jos uvek mozete deterministicki da pomerate figure,
ishod akcije takodje podrazumeva bacanje kocke,
i njih ne mozete predvideti.
Postoji odredjena kolicina slucajnosti ukljucena u ishodu kocke,
i stoga, mi zovemo ovo stohasticki.
Dozvolite mi da pricam o diskretnom u odnosu na kontinuirano.
Diskretno okruzenje je gde imate ograniceno mnogo izbora akcija,
i ograniceno mnogo stvari koje mozete osetiti.
Tako, na primer, u sahu, opet, postoji ogranicen broj pozicija na tabli,
i ogranicen broj stvari koje mozete uraditi.
To se razlijuje od kontinuiranog okruzenja
gde prostor mogucih akcija ili stvari koje mozete osetiti mogu biti neograniceni.
Tako, na primer, ako bacite pikado strelicu, postoji neogranicen broj nacina za podesavanje ugla strelica
i njihovog ubrzanja.
Na kraju, mozemo razlikovati benigna u odnosu na suparnicka okruzenja.
U benignim sredinama, okruzenje moze biti slucajno.
Moze biti stohasticko, ali nema svoj cilj
koji bi bio suprotan svom cilju.
Tako, na primer, vreme je benigno.
Moze biti slucajno. To moze uticati na ishod vasih akcija.
Ali nije zaista tamo da utice na vas.
Uporedite ovo sa suparnickim okruzenjima, kao sto su mnoge igre, kao sah,
gde je protivnik zaista tamo da vas pobedi.
Ispostavilo se da je mnogo teze naci dobre akcije u suparnickim okruzenjima
gde protivnik aktivno posmatra vas i sprecava ono sta pokusavate da postignete
u dnosu na benigno okruzenje, gde okruzenje je samo stohasticko
ali nije zaista zainteresovano za zagorcavanje vaseg zivota.
Dakle, hajde da vidimo u kojoj meri ovi izrazi imaju smisla za vas
sa odlaskom na nas sledeci kviz.
Dakle, evo 4 pojma ponovo: delimicno posmatrano u odnosu na potpuno,
stohasticko u odnosu na deterministicko, neprekidno u odnosu na diskretno,
suparnicki u odnosu na benigni.
I dozvolite mi da vas pitam o igri "checkers".
Oznacije jedan ili sve atribute koji su primenljivi.
Dakle, ali mislite da je "checkers" delimicno posmatrano, oznacite ovaj.
U suprotnom, nemojte ga oznaciti.
Ako mislite da je stohasticki, oznacite ovaj,
kontinuirano, oznacite ovaj, suparnicki, oznacite ovaj.
Ako ne znate o "checkers", mozeta na web-u proveriti na Google-u
pronadjite vise informacija o "checkers".