Apprentissage par renforcement pour l'optimisation de la consommation d'énergie dans un contexte IoT
Texte intégral
Outline
Documents relatifs
Dans de nombreuses situations, le résultat d’une action ne peut être prédit avec certitude. Par
Copyright and moral rights for the publications made accessible in the public portal are retained by the authors and/or other copyright owners and it is a condition of
Par conséquent, la problématique principale de cette thèse est de trouver des politiques para- métriques en environnements continus (actions et états), en temps discrétisé,
– À l’occasion du dépôt des projets de loi sur la gouvernance des cégeps et des universités et de leur étude en commission parlementaire, le Conseil supérieur de
Pour cela, il per¸coit les composants et leurs services pr´esents dans l’environnement ambiant, puis choisit d’´etablir des connexions entre des services requis et des services
Dans Q-learning, lorsque l'état et l'espace d'action sont discrets et que la dimension est faible, une table-Q peut être utilisée pour stocker la valeur-Q de chaque paire
cahiers, le Fribourg artistique reste une source puissante et vive à laquelle tous ceux qui s'intéressent au pays devront venir puiser. Il ne s'écrira rien sur le goût et les mœurs
Au cours d'une exposition d'objets d'art organisée dans la commune de Sakétè, le papa de Kola a acheté un objet d'art dont le dessin est le suivant. mes lO.J