• Aucun résultat trouvé

Apprentissage par renforcement Bayésien de processus décisionnels de Markov partiellement observables : une approche basée sur les processus Gaussiens

N/A
N/A
Protected

Academic year: 2021

Partager "Apprentissage par renforcement Bayésien de processus décisionnels de Markov partiellement observables : une approche basée sur les processus Gaussiens"

Copied!
116
0
0

Texte intégral

Loading

Figure

FIGURE 2.1 - Fonctions échantillonnées à partir de processus Gaussien utilisant la  carré-exponentielle avec différent hyperparamètres
FIGURE  2.5 - Fonctions échantillonnées à partir de processus Gaussien utilisant la fonc- fonc-tion de covariance linéaire avec différents hyperparamètres
FIGURE 2.6 - Fonctions échantillonnées à partir de processus Gaussien utilisant la  fonction de covariance polynomiale
FIGURE 2.9 ­ Fonction de vraisemblance des hyperparamètres d'un processus Gaussien  utilisant la fonction carré­exponentielle où l'ensemble de données a été échantillonnée  avec a = 0.85 et A = 0.65
+7

Références

Documents relatifs

Dans cette étude, nous adopterons l’expression « école inclusive » pour désigner le projet d’une école à la fois régulière et adaptée aux besoins de tous les élèves qui

Quoique notre travail soit un appui pour la compréhension des mécanismes de neutralisation des dopants et de la passivation des défauts dans le silicium

Dans cette thèse, nous nous intéressons essentiellement à l’estimation non paramétrique, par la méthode locale linéaire, de la fonction de hasard conditionnelle lorseque la

Le lexique fait exister un monde que le spectateur voyeur investit d’autant mieux qu’il le voit ou le devine ; à l’espace montré (la scène, cf. 30) s’oppose l’espace

Finally, following our rules, the ideal 160-Gbit/s DDM line would have a number of fiber sections which chromatic dispersion provides a maximum pulse broadening of 0.55 times

[r]

Au-delà d’une motivation d’application en agroécologie, l’objectif de cette thèse est de proposer un cadre et des algorithmes génériques pour résoudre des processus