Reinforcement learning

REINFORCEMENT LEARNING

= rozhodovanie na základe plánu a) budúcej akcie z terajšej (exploration) a predikcie jej účinku (ocenenia akcie (odmeny) (exploitation), dopamín (neurologia/kognitívna veda), úžitok (ekonómia), výsledok hry (matematika). Schéma nižšie ukazuje, že RL sa psychologicky hlási ku Skinnerovi, čiže ku behaviouristickému bezmodelovému rozhodovaniu – v computer science je to machine learning, v engineeringu je to optimálne rozhodovanie (robota)…

Na rozdiel od machine learningu, nie je v nej supervízor, ale iba signál odmeny.

MODELOVÉ ROZHODOVANIE

Hneď v prvej prednáške kurzu Davida Silvera, pribúda aj modelové rozhodovanie. Čiže behaviourizmus (watson, pavlov, skinner) sa integruje s konštruktivizmom (piaget, vygotsky),

https://planspace.org/20170je429-from_behaviorist_to_constructivist_ai

HLAVNA LITERATURA

http://www.incompleteideas.net/book/bookdraft2017nov5.pdf

Structures of machine learning

Stochastic predictions

DALSIA LITERATURA

https://medium.freecodecamp.org/deep-reinforcement-learning-where-to-start-291fb0058c01

https://gym.openai.com/envs/#classic_control

http://web.stanford.edu/class/cs234/index.html

http://rail.eecs.berkeley.edu/deeprlcourse/

http://www0.cs.ucl.ac.uk/staff/d.silver/web/Teaching.html

Reinforcement learning in the brain

 

 

 

Ak ťa oslovuje konzistencia, spoluutváraj túto stránku

Zadajte svoje údaje, alebo kliknite na ikonu pre prihlásenie:

WordPress.com Logo

Na komentovanie používate váš WordPress.com účet. Odhlásiť sa /  Zmeniť )

Google photo

Na komentovanie používate váš Google účet. Odhlásiť sa /  Zmeniť )

Twitter picture

Na komentovanie používate váš Twitter účet. Odhlásiť sa /  Zmeniť )

Facebook photo

Na komentovanie používate váš Facebook účet. Odhlásiť sa /  Zmeniť )

Connecting to %s