Haut PDF Une approche basée algorithme génétique pour l’apprentissage chez un agent

Une approche basée algorithme génétique pour l’apprentissage chez un agent

Une approche basée algorithme génétique pour l’apprentissage chez un agent

2.6 MODÈLE D’UN AGENT APPRENANT : FONCTIONNEMENT GLOBAL 49 2.6 Fonctionnement global Suite à l’état perçu d’environnement, l’agent essaye d’élaborer la solution adéquate en interrogeant son module de performance, ce dernier fournit des connaissances au module d’apprentissage. Le processus d’apprentissage s’exécute en utilisant les propositions données par le générateur de problèmes, puis, une solution est générée, le module de performance s’occupe à l’exécuter. Selon la décision effectuée et son effet dans l’environnement, un rendement est renvoyé à l’agent, afin que le composant de critique estime un renforcement d’état, transmit ensuite au moteur d’apprentissage. Deux cas sont rencontrés, si le renforcement est positif, cela indique que l’apprentissage est efficace, et comme résultat, ce processus demeure selon les mêmes étapes ; utilisation du croisement classique c’est à dire, choisir de la population deux parents aléatoires, fixer un point de croisement et faire croiser les deux chaînes. Tandis que, si le renforcement est négatif alors le processus d’apprentissage sera modifié, en fait appel au nouvel opérateur de croisement cité auparavant.
En savoir plus

104 En savoir plus

Apprentissage de fonctions visuelles pour un robot mobile par programmation génétique

Apprentissage de fonctions visuelles pour un robot mobile par programmation génétique

Chapitre 4 Principaux résultats et enseignements Ce chapitre a pour but de présenter et d’analyser les principaux résultats obtenus lors de cette thèse. Certains aspects seront décrits de manière plus complète et détaillée en annexe B. Nous allons tout d’abord vérifier l’adaptation des algorithmes évolués au contexte visuel. Nous tenterons pour cela de mettre en évidence les particularités des algorithmes évolués dans différents environnements et de faire le lien entre l’environnement utilisé et ces spécificités al- gorithmiques. Nous montrerons que ces contrôleurs évolués utilisent des primitives visuelles cohérentes mais présentent des performances médiocres, souvent en deçà de ce qui peut être obtenu avec des contrôleurs conçus manuellement. Nous présenterons donc ensuite les résultats obtenus en guidant l’évolution artificiellement pour avoir de meilleures performances, notam- ment en utilisant une méthode basée sur l’imitation d’un comportement pré-enregistré. Nous testerons également les capacités de généralisation de ces contrôleurs et décrirons les adap- tations apportées à la grammaire pour améliorer le compromis entre évitement d’obstacles et déplacement vers la cible. Nous décrirons enfin les expériences que nous avons réalisées pour valider cette approche sur un robot réel. Pour conclure, nous présenterons plusieurs pistes pos- sibles pour améliorer ce système et l’appliquer à d’autres tâches.
En savoir plus

150 En savoir plus

Une approche basée agent pour l’optimisation d’allocation des ressources dans le green cloud.

Une approche basée agent pour l’optimisation d’allocation des ressources dans le green cloud.

E. Algorithme Max-min : ................................................................................................. 42 2. Politiques ..................................................................................................................... 43 V. Les principaux modèles et Framework proposés dans la littérature. ....................... 44 1. Framework basé SLA “service Level agreement” ...................................................... 44

6 En savoir plus

Optimisation de requêtes OLAP en entrepôts de données : Approche basée sur la fragmentation génétique

Optimisation de requêtes OLAP en entrepôts de données : Approche basée sur la fragmentation génétique

D’autre part, si la gestion des contraintes n’a pas être effectuée par le codage des données ou la génération des individus (population initiale, et opérateurs de croisement et mutation), on peut la prendre en charge dans la fonction d’évaluation. Une première solution consiste à attribuer une fitness nulle à un individu qui viole les contraintes du problème, ce qui revient à l’éliminer car il ne sera pas reproduit dans la génération suivante. Cependant il peut être intéressant de conserver des individus qui ne satisfont pas toutes les contraintes, mais qui contiennent des « morceaux » de solutions éventuellement utiles dans les générations ultérieures [ZAQ, 08a]. La technique usuelle est alors d’intégrer à la fonction d’évaluation des pénalités pour les individus qui ne respectent pas les contraintes. Ces pénalités dépendent en général du nombre et/ou de l’ « importance » des contraintes violées. On peut alors espérer que l’algorithme génétique va faire évoluer la population vers des régions qui satisfont les contraintes.
En savoir plus

126 En savoir plus

Une approche basée  agent mobile pour l’internet des choses   (Smart business environnement)

Une approche basée agent mobile pour l’internet des choses (Smart business environnement)

 Le commerce électronique : C'est une application qui se déroule au sein d'un réseau de places de marché électroniques où des agents se rencontrent afin de proposer, rechercher et négocier différents types de services, pour le compte d'utilisateurs individuels ou de sociétés (réservations, achat de biens divers...). Ce type d'application, met en évidence deux types d'agents : agents vendeurs et agents acheteurs. Un agent vendeur est un agent chargé de vendre un produit. Il voyage de serveur en serveur à la recherche d’agents acheteurs de ce même produit. Une fois une rencontre effectuée, un algorithme de marchandage peut se mettre en œuvre. Si un accord d’achat est trouvé, il est réalisé directement ou/et un courrier électronique est envoyé aux propriétaires de ces agents.
En savoir plus

65 En savoir plus

Apprentissage par renforcement Bayésien de processus décisionnels de Markov partiellement observables : une approche basée sur les processus Gaussiens

Apprentissage par renforcement Bayésien de processus décisionnels de Markov partiellement observables : une approche basée sur les processus Gaussiens

5.2 Travaux futurs Les travaux exposés dans ce mémoire ont permis de mettre en lumière une ap- proche permettant l'apprentissage des processus décisionnels de Markov partiellement observables continus. Bien que les résultats présentés au chapitre 3 ont été concluants quant à la validité de l'approche, celle-ci peut évidemment être améliorée. Dans un premier temps, il est impératif d'utiliser une méthode d'approximation du processus Gaussien pour une application à plus grande échelle où la quantité de données se- rait plus large. Au meilleur de nos connaissances, la méthode d'approximation la plus adaptée au problème traité dans ce mémoire est la méthode développée par Snelson [2007]. D'autre part, nous avons aussi soulevé que l'apprentissage par optimisation de la vraisemblance où l'état de croyance n'est représenté que par un point, entraîne une perte d'information. La solution que nous avons proposée consiste à utiliser des distri- butions de probabilités Gaussiennes pour représenter les états de croyance de l'agent. Cependant, cette nouvelle forme d'état de croyance n'est pas adaptée à l'apprentissage par processus Gaussiens qui requiert des entrées certaines. Nous avons donc adapté la régression par processus Gaussien afin de pouvoir identifier un système dynamique à partir de séquences d'états de croyance. Cependant, plusieurs points restent en suspens avant d'aller de l'avant avec un nouvel algorithme d'apprentissage de PDMPO plus efficace.
En savoir plus

116 En savoir plus

Un Algorithme génétique pour le problème de ramassage et de livraison avec fenêtres de temps à plusieurs véhicules

Un Algorithme génétique pour le problème de ramassage et de livraison avec fenêtres de temps à plusieurs véhicules

D’autres travaux traitent le 1-PDPTW, en minimisant le compromis entre la distance totale parcourue, le temps total d’attente et le retard total et ce en utilisant un algorithme évolutionniste avec des opérateurs génétiques spéciaux, la recherche taboue et la Pareto optimalité pour fournir un ensemble de solutions viables. [9] [Kammarti, R et al] Ces travaux ont été étendus, et ce en proposant une nouvelle approche basée sur l’utilisation de bornes inférieures pour l’évaluation des solutions et de leur qualité, minimisant le compromis entre la distance totale parcourue et la somme des retards. [10]
En savoir plus

7 En savoir plus

Une approche multi-agent pour la conception de systèmes d'intelligence ambiante : un modèle formel intégrant planification et apprentissage

Une approche multi-agent pour la conception de systèmes d'intelligence ambiante : un modèle formel intégrant planification et apprentissage

nouveaux plans respectant certains objectifs, développé, entre autres, par Karim et al. [2006]. Ces techniques ont été utilisées aussi pour le renforcement de la sélection des plans parmi les alternatives possibles de l’agent. L’arbre de décision était intro- duit, particulièrement par Guerra-Hernandez et al. [2005] pour représenter les différents contextes dans lesquels l’agent peut s’y trouver. En effet, le comporte- ment de l’agent est appris à partir des succès et des échecs de ses plans. L’idée de tirer profit des expériences passées, relatives aux actions exécutées, a été adap- tée dans [Airiau et al., 2008]. Cela met en évidence une technique en ligne, basée sur la structure hiérarchique But-Plan (Goal-Plan), afin de sélectionner un plan alternatif, parmi ceux qui sont possibles, en fonction des échecs appris.
En savoir plus

118 En savoir plus

Contrôle adaptatif d'un bioréacteur cardiaque par algorithme génétique

Contrôle adaptatif d'un bioréacteur cardiaque par algorithme génétique

15 2.2.2. Méthode de contrôle avancée par réseaux de neurones Le régulateur PID permet de bien contrôler un paramètre, mais permet très difficilement d’obtenir un contrôle optimal de débit et de pression puisqu’il existe un couplage entre ces deux conditions. En agissant sur la pression, on modifie par le fait même le débit et vice versa. Cette caractéristique constitue alors un motif valable pour envisager une autre méthode de contrôle, une méthode dite « intelligente ». Basée sur l’approche par boîte noire, cette méthode apporte un avantage intéressant en détenant une capacité d’apprentissage. De plus, elle offre également la possibilité d’un contrôle multivariable (débit et pression), un des objectifs à long terme de notre programme de recherche pour un conditionnement mécanique optimal. La méthode expérimentée à ce jour avec le bioréacteur cardiaque était basée sur l’utilisation de réseaux de neurones artificiels [22]. Cette approche, très connue à ce jour en intelligence artificielle, s’appuie sur une règle d’apprentissage pour guider la réponse du système [34]. Un réseau de neurones artificiels (Figure 5) est une collection d’unités, appelées neurones, constitués d’unités d’entrée, d’unités intermédiaires et d’unités de sortie. Entre les entrées et les sorties, il y a des liens nommés connexions. Ces liens s’apparentent biologiquement aux synapses et l’intensité de chaque connexion est définie par le poids de la connexion. Ces derniers influencent l’activation des neurones et la sortie du système. Ces activations sont sous forme de fonctions et se situent sur chaque unité. Dans le cas d’un perceptron, considéré comme le premier des réseaux de neurones artificiels, le but consiste à corréler des patrons d’entrées avec des patrons de sorties avec l’aide d’une règle d’apprentissage. Cette règle d’apprentissage optimise le réseau en modifiant le poids des connexions, simulant alors le processus simplifié
En savoir plus

122 En savoir plus

Apprentissage de la structure de réseaux bayésiens : application aux données de génétique-génomique

Apprentissage de la structure de réseaux bayésiens : application aux données de génétique-génomique

Restriction de l’espace de recherche Une autre approche consiste à réduire l’espace des structures possibles, en considérant par exemple l’espace des arbres dont la taille est de p p−2 pour p variables. MWST Apprendre un RB dont la structure est celle d’un arbre se rapproche de la recherche d’un arbre couvrant de poids maximum (MWST pour Maximum Weighted Spanning Tree). Chow and Liu [1968] propose pour cela d’utiliser l’information mutuelle entre chaque paire de variable afin de pondérer l’arête correspondante et d’appliquer un algorithme de recherche de l’arbre couvrant de poids maximum sur la matrice ainsi créée. Le résultat est un arbre non orienté optimal maximisant l’information mutuelle par paire. D’autres mesures peuvent être utilisées pour la pondération, Heckerman et al. [1995] proposent la variation d’un score décomposable provoqué par l’ajout de chaque arête. L’orientation de l’arbre obtenu s’e ffectue par propagation à partir d’une variable racine (généralement choisie aléatoirement) vers les variables les plus éloignées de cette racine. Cette orientation ne créée donc aucune v-structure rendant tout arc inversible ce qui assure de conserver le même score indépendamment du choix de la variable racine. La principale conséquence est donc l’impossibilité de déduire une quelconque causalité dans les réseaux produits.
En savoir plus

220 En savoir plus

Une approche basée agent pour la sécurité dans le Cloud Computing

Une approche basée agent pour la sécurité dans le Cloud Computing

A ce niveau d’infrastructure, on peut trouver un ensemble important d’outils utilisés qui ont pour but de fournir une abstraction du stockage ou du calcul pour une approche orientée virtualisation. Parmi ces outils, le logiciel open source Ceph [26]. Il assure un accès de manière fiable et autonome aux objets de stockage distribué selon l’algorithme CRUSH (Controlled Replication Under Scalable Hashing). Il fournit une gestion dynamique et distribuée des méta- données et une opération de stockage dans un OSD (Object Storage Devices). Chaque OSD utilise un journal d’écriture selon trois stratégies de réplication qui sont: (1) “primary-copy” où le premier OSD transfère les écritures dans les autres OSDs et l’opération de lecture ne sera autorisée que si le dernier OSD a envoyé son acquittement, (2) “chain” où les écritures des objets sont effectuées séquentiellement et l’opération de lecture sera autorisée une fois que le dernier objet a été écrit dans l’OSD correspondant et (3) “splay replication” telque la moitié des objets sont écrits de façon séquentielle, le reste étant effectué en parallèle [27]. Le journal d’écriture est pour accélérer les
En savoir plus

119 En savoir plus

Approche asynchrone dans le plan : un algorithme déterministe polynomial

Approche asynchrone dans le plan : un algorithme déterministe polynomial

Comme nous l’expliquons dans la sous-section précédente, notre solution fonctionne par phases numé- rotées 0, 1, 2, 3, 4, . . . Durant la phase i, chaque agent suppose que D et ` sont tous deux inférieurs ou égaux à 2 i et traite un à un chacun des 2 i premiers bits de son identifiant transformé. Si 2 i est strictement supérieur à la longueur de son identifiant transformé, chaque agent considère que les bits manquants sont des 0. Le traitement d’un bit par un agent consiste à suivre une trajectoire dépendante de la valeur du bit et du numéro de la phase. Les trajectoires associées respectivement au bit 0 et au bit 1 sont différentes et construites de sorte que le rendez-vous a lieu lorsque les conditions suivantes sont remplies. (1) Chaque agent considère une phase correspondant à une borne supérieure sur D. (2) L’un d’eux suit la trajectoire correspondant à 0 tandis que l’autre suit celle correspondant à 1. (3) Ils commencent à suivre ces trajec- toires presque simultanément. À la lumière de cela, si α est le plus petit entier tel que 2 α et supérieur ou
En savoir plus

5 En savoir plus

Sécurité Basée Agent Mobile Dans Les Réseaux Sans Fils

Sécurité Basée Agent Mobile Dans Les Réseaux Sans Fils

 Execution Tracing Execution Tracing enables detection of any possible misbehavior by a platform, that is, improper modification of the mobile agent code, state, and execution flow. This technique assumes that all the involved parties own a public and private key that can be used for digital signatures, in order to identify involved parties. Different parties, such as users and platform owners, communicate by using signed messages. A platform that receives the agent and agrees to execute it produces the associated trace during the agent’s execution. The message that an execution platform attaches to the mobile agent typically contains information such as the unique identifier of the message, the identity of the sender, the timestamp, the fingerprint of the trace, the final state and the trusted third party (which could later be used to resolve disputes). Later, the owner of the agent may suspect that certain platform cheated while executing the agent. If this is the case, the owner will ask the suspicious platform to reproduce the trace. Finally, the agent’s owner validates the execution of the agent by comparing the fingerprint of the reproduced trace against the fingerprint of the trace that is originally supplied by the suspicious platform.
En savoir plus

148 En savoir plus

Techniques d'affectation flexible des ressources : résolution par algorithme génétique monocritère

Techniques d'affectation flexible des ressources : résolution par algorithme génétique monocritère

Dans cet article qui est la suite logique du premier, nous présentons une méthodologie de résolution pour trouver des solutions de la formulation mathématique. Cette méthodologie est basée sur l’utilisation des algorithmes génétiques monocritères qui permettent d’affecter aléatoirement les acteurs sur les différentes charges d’une tâche. Dans cette méthode, nous considérons que les acteurs affectés sur chaque tâche effectuent le même nombre d’heures de travail. Le nombre d’acteurs affectés se fait de manière aléatoire dans la limite du nombre total d’acteurs affectables ; c'est-à-dire, ceux qui ont une efficacité suffisante dans une compétence demandée par la tâche. A partir de ces choix, un calcul est fait pour le travail global périodique de chaque acteur ce qui permet de calculer le nombre global d’heures de l’activité et partant de là son coût.
En savoir plus

24 En savoir plus

Techniques d'affectation flexible des ressources : résolution par algorithme génétique monocritère

Techniques d'affectation flexible des ressources : résolution par algorithme génétique monocritère

Dans cet article qui est la suite logique du premier, nous présentons une méthodologie de résolution pour trouver des solutions de la formulation mathématique. Cette méthodologie est basée sur l’utilisation des algorithmes génétiques monocritères qui permettent d’affecter aléatoirement les acteurs sur les différentes charges d’une tâche. Dans cette méthode, nous considérons que les acteurs affectés sur chaque tâche effectuent le même nombre d’heures de travail. Le nombre d’acteurs affectés se fait de manière aléatoire dans la limite du nombre total d’acteurs affectables ; c'est-à-dire, ceux qui ont une efficacité suffisante dans une compétence demandée par la tâche. A partir de ces choix, un calcul est fait pour le travail global périodique de chaque acteur ce qui permet de calculer le nombre global d’heures de l’activité et partant de là son coût.
En savoir plus

23 En savoir plus

Algorithme génétique optimisant la propulsion de satellites pour le survol de sites terrestres

Algorithme génétique optimisant la propulsion de satellites pour le survol de sites terrestres

Tel qu'introduit, l'optimisation de trajectoires de satellites pour le survol de differents sites terrestres pose deux problemes majeurs : la selection adequate et ordonnee des points [r]

99 En savoir plus

Apprentissage de modalités auxiliaires pour la localisation basée vision

Apprentissage de modalités auxiliaires pour la localisation basée vision

nathan.piasco@u-bourgogne.fr Résumé Dans cet article nous présentons une nouvelle méthode d’apprentissage à partir de modalités auxiliaires pour améliorer un système de localisation basée vision. Afin de bénéficier des informations de modalités auxiliaires dispo- nibles pendant l’apprentissage, nous entraînons un réseau convolutif à recréer l’apparence de ces modalités annexes. Nous validons notre approche en l’appliquant à un pro- blème de description d’images pour la localisation. Les résultats obtenus montrent que notre système est capable d’améliorer un descripteur d’images en apprenant cor- rectement l’apparence d’une modalité annexe. Comparé à l’état de l’art, le réseau présenté permet d’obtenir des ré- sultats de localisation comparables, tout en étant plus com- pacte et plus simple à entraîner.
En savoir plus

9 En savoir plus

Approche clinique et génétique des syndromes autoinflammatoires

Approche clinique et génétique des syndromes autoinflammatoires

des accès inflammatoires intermittents, mais sans régularité, associant de la fièvre à une constellation de signes focaux essentiellement abdominaux, cutanés, articulaires, parfois neurosensoriels, avec un syndrome inflammatoire biologique. Le diagnostic précis est évoqué sur l’origine ethnique, la nature des signes cliniques qui accompagnent la fièvre au cours des accès, le mode de transmission génétique récessif ou dominant. Il est confirmé par la génétique. Le diagnostic génétique renforce le diagnostic clinique et constitue un préalable au conseil génétique. Un diagnostic précis n’est pas uniquement nosologique, il est nécessaire pour une prise en charge appropriée de ces affections, car leurs traitements sont différents. La survenue d’une amylose de type AA est la principale complication évolutive des syndromes auto-inflammatoires. Le rein est le principal organe cible. La colchicine est depuis longtemps le traitement de choix pour la fièvre Méditerranéenne familiale (FMF). Le traitement des autres entités est plutôt décevant. Cependant, l’avènement des biothérapies pourrait constituer un tournant dans l’histoire de la prise en charge de ces maladies. Les résultats des essais thérapeutiques semblent très prometteurs.
En savoir plus

165 En savoir plus

Tétraédrisation de Delaunay basée sur une approche frontale

Tétraédrisation de Delaunay basée sur une approche frontale

Unit´e de recherche INRIA Lorraine, Technopˆole de Nancy-Brabois, Campus scientifique, ` NANCY 615 rue du Jardin Botanique, BP 101, 54600 VILLERS LES Unit´e de recherche INRIA Rennes, Ir[r]

31 En savoir plus

Détection de la terminaison: un algorithme fondé sur une approche observationnelle

Détection de la terminaison: un algorithme fondé sur une approche observationnelle

L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau recherche, publiés ou non, émanant des établissements d’enseignemen[r]

15 En savoir plus

Show all 10000 documents...