Programmation Logique - Université Grenoble Alpes

4 juin 2013 ... sionnels de Markov et intelligence artificielle, Hermes, pp.19-50, ... Page 4 .... Différences temporelles avec traces d'éligibilité : TD(?) . ... Etapes de l'opérateur de programmation dynamique . ... Définition et équilibre d'un jeu stochastique . ..... r() est la fonction de récompense sur les transitions entre états.


Un extrait du document