Programmation Logique - Université Grenoble Alpes
4 juin 2013 ... sionnels de Markov et intelligence artificielle, Hermes, pp.19-50, ... Page 4 ....
Différences temporelles avec traces d'éligibilité : TD(?) . ... Etapes de l'opérateur
de programmation dynamique . ... Définition et équilibre d'un jeu stochastique .
..... r() est la fonction de récompense sur les transitions entre états.
Un extrait du document