Discussion - Prise en compte de la dynamique du contexte pour les systèmes ambiants par système

Dans cette première partie de l’état de l’art, nous avons présenté plusieurs outils pour mettre en oeuvre la sensibilisation au contexte dans un système ambiant. Parmi ces outils, nous distinguons les gestionnaires de contexte qui gèrent la perception et l’interprétation du contexte, en laissant l’aspect utilisation à des processus clients. La propriété de proactivité n’est donc logiquement pas mise en oeuvre dans de tels systèmes.

D’autres systèmes pour mettre en oeuvre la sensibilisation au contexte ne se limitent pas à l’observation et à la mise à disposition des données contextuelles, mais utilisent ces don- nées pour rendre un système ambiant capable d’adapter son état ou sa fonctionnalité. De tels systèmes peuvent être eux-mêmes classés en deux catégories : ceux dont le comportement s’appuie sur une base de règles préétablies, et ceux capables de modifier leur comportement par apprentissage.

L’étude de ces systèmes par rapport à notre grille d’analyse (tableau 1.3), montre que, gé- néralement, un système respectant le critère de généricité ne respecte pas le critère d’expres- sivité, et inversement. Cela peut s’expliquer par le fait que plus la modélisation du contexte tend à fournir un niveau important d’expressivité, plus le modèle utilisé est sophistiqué et spécialisé. Par conséquent, il est difficile d’y intégrer un nouveau type de donnée sans intervention du concepteur devient difficile. D’un autre côté, une donnée exploitée uniquement

Auteurs Système Année Généricité Expressivité Distribution Ouverture Proactivité Confidentialité Explicabilité Franklin Intelligent Classroom 1998 - - -- -- + -- -

Mozer ACHE 1998 -- + -- - ++ -- -

Dey Context Toolkit 2001 ++ -- - ++ -- ++ --

Hofer Hydrogen 2003 + - + ++ -- - -- Hagras iDorm 2004 -- - - -- ++ -- - Chen CoBrA 2005 -- ++ -- ++ -- + - Rey Contexteur 2005 - + ++ ++ + -- -- Spanoudakis ASK-IT 2006 -- ++ - ++ + -- -- Baek SIM 2007 - + - -- + -- -- Tapia … 2008 - - - -- ++ -- - Conan Spaces 2008 - + ++ ++ + -- -- Zaidenberg … 2009 - - - + ++ -- ++ Minker ATRACO 2010 - ++ - ++ ++ ++ + Dujardin … 2011 -- - - -- + -- -

Tableau 1.3 – Respect des critères définis en section 1.2.1 par les différents systèmes

pour sa valeur sera totalement dénuée d’expressivité, mais sera parfaitement générique. Bien qu’ils ne prennent pas en compte le critère de proactivité, plusieurs gestionnaires de contexte (tels que le Context Toolkit ou CoBrA), fournissent de bons résultats concernant les autres critères, notamment la distribution, l’expressivité et l’ouverture. En revanche, dès que nous cherchons à étudier les systèmes respectant le critère de proactivité, les performances de ces systèmes vis-à-vis des autres critères se dégradent. Le comportement des systèmes basés sur des règles ad-hoc est lui-même limité aux situations connues. Enfin, les systèmes dotés de la capacité d’apprentissage, qui nous semblent pourtant les plus intéressants, ont les critères de distribution et d’ouverture généralement pénalisés. Il semble en effet que ces systèmes, malgré leur capacité à modifier leur comportement, ne peuvent que difficilement réagir à la réelle dynamique des systèmes ambiants, notamment lors de l’apparition et de la distribution de dispositifs dans l’environnement.

Nous envisageons la conception d’un système complémentaire à un gestionnaire de contexte. Ce système serait en particulier en charge du respect du critère de proactivité qui n’est pas présent dans les gestionnaires de contexte. Cependant, le respect de ce critère im- plique que ce système complémentaire soit capable d’apprendre dynamiquement le comportement à attribuer à un système ambiant. Or, il est inutile de disposer d’un gestionnaire de contexte gérant par exemple l’aspect ouverture si nous lui associons un système gérant par apprentissage la proactivité qui soit incapable de tenir compte de nouvelles données, ou de fonctionner malgré la disparition d’une donnée. Il est donc nécessaire de disposer d’une méthode d’apprentissage apte à attribuer les bons comportements à un système ambiant sans pour autant dégrader le respect des critères du gestionnaire de contexte sur lequel il sera appliqué.

Dans la section suivante, nous allons donc analyser les principales méthodes d’appren- tissages existantes, en évaluant leur pertinence dans le cadre des systèmes ambiants.

2

Apprentissage d'un

comportement

D

ANSce chapitre, nous nous intéressons aux techniques d’apprentissage utilisables pour

qu’un système ambiant s’enrichisse durant son activité des comportements jugés sa- tisfaisants en temps réel par ses utilisateurs. Dans cette section, nous commençons par défi- nir différents concepts nécessaires à la compréhension du domaine de l’apprentissage artificiel. Nous présentons ensuite les algorithmes d’apprentissage les plus classiques, ainsi que des techniques de filtrage de données inutiles utilisées dans le but d’améliorer les processus d’apprentissage. Nous terminons par une évaluation de la pertinence de ces techniques pour l’apprentissage automatique vis-à-vis de notre problématique.

2.1 Notions relatives à l’apprentissage artificiel

Nous présentons ici plusieurs notions liées au domaine de l’apprentissage artificiel. Ces définitions ne sont qu’une synthèse des concepts fondamentaux de ce domaine, une étude plus détaillée de ces concepts étant proposé par [Cornuéjols et Miclet, 2011].

Notion d’apprentissage artificiel Elle est définie par [Cornuéjols et Miclet, 2011] comme toute méthode permettant de construire un modèle de la réalité à partir de données, soit en amélio- rant un modèle partiel ou moins général, soit en créant complètement le modèle. Pour notre étude, nous conservons cette définition générale, mais en employant le terme d’“environnement” au lieu du terme “réalité”. Un environnement est la sous-partie de la réalité perceptible par un système. Un algorithme d’apprentissage exploite donc les données perçues de son environnement pour se construire un modèle de cet environnement. Un système utilisant un algorithme d’apprentissage pour réaliser un processus d’apprentissage est appelé “système apprenant”.

Il est important de préciser que ce modèle n’est pas un modèle “dans l’absolu”. Le modèle produit est une représentation particulière de l’environnement construite pour ré- pondre à un objectif. Cet objectif dépend quant à lui de la tâche à réaliser. Un système apprenant le comportement d’un utilisateur dans un environnement ambiant ne va pas construire un modèle absolu de tout ce qu’il perçoit (il ne va pas chercher à modéliser la diffusion lu- mineuse entre les pièces quand bien même il possèderait les données pour cela), mais plutôt un modèle plus spécifique du comportement de l’utilisateur.

Une hypothèse inhérente à l’application d’un algorithme d’apprentissage sur un jeu de données est que celui-ci permet de se construire une représentation du monde (un modèle) suffisante pour en extraire l’objectif à apprendre.

Notion de tâche Un processus d’apprentissage dépend fortement de la tâche à réaliser, c’est-à-dire du résultat attendu. Sans être exhaustif, nous présentons un certain nombre de tâches requérant l’application d’algorithmes d’apprentissage.

La tâche la plus classique concerne le problème d’identification. Un algorithme perçoit des données servant d’exemples et cherche à en déduire une règle générale. Par exemple, suppo- sons un algorithme qui perçoit un ensemble d’animaux caractérisés par différents attributs (tels que leurs tailles et leurs couleurs), ainsi que la race de chaque animal. L’algorithme gé- néralise alors les exemples perçus afin de déterminer ce qui fait qu’un animal appartient à telle ou telle race. Par la suite, face à un nouvel exemple d’animal, il devient capable de dire de quelle race il est.

Un autre exemple de tâche concerne l’approximation. À partir d’un jeu de données, un algorithme peut apprendre à approximer une fonction inconnue. Ainsi, face à un nouveau jeu de données, l’algorithme pourra estimer une valeur de sortie probable de cette fonction. De façon plus générale, les tâches d’identification et d’approximation peuvent être vues comme des tâches de généralisation.

L’apprentissage peut aussi servir à réaliser une tâche de prédiction. À partir d’un his- torique d’exemples, un algorithme apprend à prédire l’état futur d’une donnée. Ce type d’apprentissage est notamment appliqué dans le domaine de la finance, pour prédire l’état futur des marchés.

Un dernier exemple d’apprentissage concerne l’amélioration de connaissances. Un joueur d’échec virtuel peut connaître les règles des échecs, et par conséquent savoir jouer, et réaliser un apprentissage pour améliorer sa stratégie de jeu de parties en parties. Cela ne change pas sa connaissance sur les règles du jeu, mais plutôt ses performances dans la réalisation de sa tâche.

Notion de performances L’évaluation de la performance d’un processus d’apprentissage peut porter sur plusieurs critères tels que :

– le taux d’erreur : si le système apprenant est capable de détecter ses erreurs (soit par des capacités d’introspection qui lui permettent de déterminer ses erreurs par lui- même, soit par l’intervention d’un élément extérieur qui possède la connaissance à apprendre), il est possible de déterminer un taux d’erreurs qui exprime la justesse de l’apprentissage réalisé (le nombre d’erreurs par rapport aux nombre de réponses pro- posés par exemple).

– les conséquences en cas d’erreurs : celles-ci varient en fonction de la tâche que doit réaliser le système apprenant. Un système ayant un taux d’erreur faible mais fournis- sant toujours des résultats incorrects dans les cas les plus critiques peut être considéré comme moins performant qu’un système ayant un taux d’erreur plus élevé mais four- nissant des résultats erronés uniquement sur des cas peu critiques.

plique un coût en temps et en processus computationnel, soit au niveau de l’apprentissage lui-même (construction du modèle), soit au niveau de l’exploitation de ce mo- dèle. En fonction de la tâche à réaliser et des ressources disponibles pour la réaliser, ce coût peut avoir une influence plus ou moins forte sur l’évaluation de la performance de l’algorithme d’apprentissage. Par exemple, quand bien même un algorithme d’apprentissage atteint un taux d’erreur nul, si ce résultat nécessite plusieurs heures de traitement alors qu’il est censé être appliqué à une tâche en temps réel, sa performance sera probablement jugée très faible.

– l’intelligibilité : un algorithme d’apprentissage doit être capable de “justifier” le résul- tat de son apprentissage. Un exemple classique est celui d’un système ayant appris à fournir un diagnostic à un patient en fonction des symptômes exprimés par ce dernier : pour être jugé crédible par le médecin, le résultat proposé ne peut se limiter à un diagnostic Il doit nécessairement s’accompagner du raisonnement ayant mené à cette conclusion.

Nous pouvons remarquer que l’évaluation du résultat est liée à la tâche à réaliser. Une comparaison des performances de plusieurs algorithmes d’apprentissage dans l’absolu, par comparaison du taux d’erreurs par exemple, n’a donc pas de sens. Il est nécessaire d’établir un processus d’évaluation tenant compte de la tâche à réaliser, et donc du niveau d’impor- tance accordé au respect de chacun des critères de performance.

Notion de protocole Un algorithme d’apprentissage se caractérise par le protocole qui dé- crit les interactions qu’il entretient avec son environnement. Le protocole inclut la fréquence d’interaction avec l’environnement, le type de données que l’algorithme prend en entrée, et le type de données qu’il retourne en sortie.

Dans le cas d’un apprentissage hors ligne, l’algorithme reçoit la totalité des données et les utilise pour construire son modèle sans interagir avec son environnement. En règle gé- nérale, il parcourt séquentiellement toutes les entrées pour construire son modèle. Une fois la liste des entrées parcourue, l’apprentissage est terminé, et le modèle est alors construit. Un apprentissage hors ligne fonctionne donc en deux phases : la première phase où il reçoit les données depuis l’environnement qu’il utilise pour construire son modèle, et la seconde phase où il applique son modèle déjà construit en fonction des demandes de l’environnement.

Dans le cas d’un apprentissage en ligne, les données arrivent séquentiellement et l’algorithme propose une réponse à chaque réception de nouvelle(s) donnée(s), puis reçoit une réponse de l’environnement. Ensuite, il utilise cette réponse pour faire évoluer son modèle. L’apprentissage se fait donc au travers de l’interaction entre l’apprenant et son environnement. Il n’y a donc pas deux phases distinctes comme pour l’apprentissage hors ligne, l’algorithme enrichissant son modèle au fur et à mesure de ses interactions.

L’identification est un exemple de tâche utilisant généralement un apprentissage hors ligne, tandis que la prédiction est une tâche pour lequel l’apprentissage en ligne est da- vantage applicable. La figure 2.1 illustre les interactions entre un système apprenant et son environnement. À gauche, pour l’apprentissage hors ligne, nous pouvons voir l’apprenant percevant chaque donnée et construisant son modèle répondant aux différentes données au

fur et à mesure qu’il les traite (seule la première phase, celle de l’apprentissage, est illustrée). À droite, pour l’apprentissage en ligne, l’apprenant propose un retour pour chaque entrée perçue, et reçoit ensuite un retour (feedback) de l’environnement lui confirmant la justesse de sa proposition (ici, un feedback booléen).

Figure 2.1 – Illustration du fonctionnement d’un algorithme d’apprentissage hors ligne (à gauche) et d’un algorithme d’apprentissage en ligne (à droite) [Cornuéjols et Miclet, 2011]

Notion de surapprentissage Si nous fournissons un jeu de données à un algorithme d’apprentissage, celui-ci gagnera d’abord en performances au fur et à mesure qu’il construira son modèle, puis commencera à perdre en performances à force de trop vouloir optimi- ser son modèle : il y a surapprentissage. La figure 2.2 illustre ce phénomène. L’algorithme d’apprentissage cherche à séparer deux classes à partir d’un ensemble d’exemples (carrés et ronds). L’image centrale montre le résultat produit par un apprentissage correct, la ma- jorité des exemples étant correctement catégorisée par l’algorithme. Un sous-apprentissage entraîne évidemment un plus grand nombre d’erreurs, comme le montre l’image de gauche. En revanche, l’image de droite montre les effets du surapprentissage, où l’algorithme perd en capacité de généralisation en s’efforçant de produire une parfaite catégorisation pour la totalité des exemples.

La majorité des applications réelles ne présentent pas de séparation clairement défi- nie entre les classes à apprendre. En tentant de produire un résultat correct pour tous les exemples en entrée, un algorithme d’apprentissage finit donc par dégrader ses performances. Pour éviter ce phénomène, plusieurs stratégies ont été proposées. La plus classique, dans le cas d’un apprentissage hors ligne, consiste à séparer l’ensemble des données en entrée en deux sous-groupes : le premier sert à la réalisation de l’apprentissage, et le second sert de jeu de tests. Ainsi, au fur et à mesure que l’algorithme construit son modèle, il vérifie ses performances sur le jeu de test. Dès lors qu’il observe une dégradation de ses performances, il considère qu’il a atteint ses performances optimales. Une telle stratégie requiert bien sûr d’avoir, non seulement assez de données pour réaliser son apprentissage, mais aussi assez de données pour l’évaluer.

Dans le document Prise en compte de la dynamique du contexte pour les systèmes ambiants par systèmes multi-agents adaptatifs (Page 39-46)