• Aucun résultat trouvé

VIl.6.5 Second prototype (MELANIS-2)

VIII.2 L'apprentissage automatique

VIII.2.5 L'apprentissage par l'exemple

L'apprentissage par l'exemple est une des deux formes de l'apprentissage par induction. A partir d'informations de bas niveau qu'il reçoit sous la forme de situations spécifiques et de règles de comportement liées à ces situations, !'enseigné doit appliquer des opérateurs de généralisation, afin d'obtenir des règles générales de comportement pouvant être utilisées dans les situations données [FC82].

Plus précisément, on essaie de caractériser une classe d'événements ob-servés en élevant le niveau d'abstraction des traits communs aux différents membres de cette classe. Une telle classe pouvant contenir un très grand nombre d'éléments, on demande au système d'apprentissage d'effectuer une généralisation à partir d'un nombre restreint d'objets de cette classe (les exemples positifs) et de certains objets n'appartenant pas à la classe (les exemples négatifs ou contre-exemples). Etant donné un ensemble E con-tenant tous les événements observables (E

=

espace d'instanciation), on considère un sous-ensemble E0 , tel que E0 C E, contenant des éléments de E regroupés dans une classe a0 . E0 est appelé région positive de E.

L'ensemble E1

=

E\E0 est appelé région négative de E et contient tous les éléments de E ne faisant pas partie de la classe a0 • Les exemples positifs et négatifs sont appelés les événements observés et sont utilisés par le système pour découvrir une description générale de la classe a0 (fig. VIll.3).

Le problème devient plus compliqué lorsque l'on considère plusieurs classes. On présente au système d'apprentissage des objets de plusieurs classes et il doit trouver une description pour chacune des classes. Ainsi, le programme doit partitioner l'espace d'instanciations et chaque événement observé est un exemple positif d'une de ces classes (fig. VIII.4). Cette situation (apprentissage multiconceptuel) est celle rencontrée par MELANIL

120 CHAPITRE VIII. L'APPRENTISSAGE

E

=

espace d'instanciation

E1

=

exemples négatifs

Figure VIll.3: Apprentissage monoconceptuel

qui doit découvrir des règles de diagnostics à partir d'exemples de plusieurs classes de gels.

VIII.2.5.1 Un problème de recherche

Simon et Lea [S174] décrivent le problème de l'apprentissage par l'exemple comme un problème de recherche dans l'espace des règles2, en étant guidé par des instances tirées de l'espace d'instanciation. L'espace d'instanciation contient tous les événements observables, tandis que l'espace

2011 peut considérer une description sous forme d'une règle : Soit une description D, une classe <7 et une règle R. La correspondance entre la règle et la description est donnée par la définition de la règle :

R : Si la description D décrit l'événement e, alors e appartieilt à la classe <7.

L'apprentissage automatique 121

espace d1nstanciation

D

0

Figure VIll.4: Apprentissage multiconceptuel

des règles contient toutes les généralisations possibles des événements ob-servés. Simon et Lea voient dans un système d'apprentissage un programme sélectionnant des instances dans l'espace d'instanciation, afin de résoudre des ambiguïtés dans l'espace des règles. Ainsi, un système d'apprentissage par l'exemple effectue un va-et-vient entre l'espace d'instanciation et l'es-pace des règles jusqu'à convergence sur une seule règle.

Mitchell [Mit79] étend cette approche et considère que les instances et les règles font partie d'un seul et même espace, qu'il appelle l'espace des règles. Il introduit la relation d'ordre partiel plus-spécifique-que sur les règles. Cette relation est définie de la façon suivante :

Soient deux descriptions D1 et D2 • D1 est plus-spécifiqu e-que D2 , si et seulement si D1 décrit un sous-ensemble des évé-nements décrits par D2 •

Ainsi, la relation plus-spécifique-que impose un ordre partiel sur l'espace des règles de tout problème de généralisation, l'espace d'instanciation (tel

122 CHAPITRE VIII. L'APPRENTISSAGE

description nulle + général

Espace des règles

Espace d'instanciations + spécifique

Figure VIIl.5: Espace de recherche

qu'il a été défini plus haut) constituant le sous-ensemble le plus spécifique de cet espace (fig. VIll.5). La règle la plus générale occupe la place au sommet de la pyramide qui symbolise cet espace. C'est la description nulle, celle qui, n'ayant aucune condition, décrit tous les événements observables.

Cette approche permet de décrire et de comparer aisément les différentes stratégies de l'apprentissage par l'exemple. Les méthodes peuvent ainsi être comparées par les techniques de recherche qu'elles mettent en œuvre.

On distingue deux classes principales de stratégies de recherche em-ployées pour l'apprentissage de concepts : la stratégie dite de recherche dirigée par un modèle ( model-driven search strategy) et celle dirigée par les données ( data-driven search strategy). Dans le premier type de méthode, la recherche est conduite en fonction d'un modèle prédéterminé, construit à partir de connaissances que le système possède déjà. Les hypothèses générées sont testées par rapport aux instances spécifiques, afin d'effectuer la recherche. Par opposition, une recherche data-driven utilise les données

L'apprentissage automatique 123

prospectivement, pour generer de nouvelles hypothèses. Les divergences entre l'hypothèse courante et les données permettent de conduire la recher-che. En général, la recherche model-driven considère en une seule fois toutes les instances à disposition, ce qui la rend relativement insensible aux erreurs des événements individuels ( erreurs parasites), mais complique l'adaptation d'un concept en fonction de données nouvelles. L'approche data-driven, par contre, utilise les données de manière incrémentale. Cette technique, si elle est plus sujette aux erreurs parasites, s'adapte mieux lorsque de nouvelles données deviennent disponibles.

Mitchell [Mit79] propose une description générale des stratégies dirigées par les données :

Dans l'espace des règles on considère le sous-ensemble H des hypothèses plausibles, c'est-à-dire l'espace des solutions pos-sibles. Une hypothèse plausible est une hypothèse de l'espace des règles qui n'a pas encore été invalidée par les données.

L'ensemble H est appelé l'espace de version et contient toutes les hypothèses consistantes avec les instances déjà considérées.

L'ensemble H peut être représenté de manière très compacte au moyen de deux autres sous-ensembles : S, l'ensemble des descriptions maximalement spécifiques et G, l'ensemble des des-criptions maximalement générales. Ainsi, S est initialisé à l'es-pace d'instanciations, tandis que G contient la description nulle. L'espace de version H est donc initialement égal à l'espa-ce des règles. A chaque observation d'un événement, on effectue une recherche bidirectionnelle et on modifie S et G, de manière à éliminer de H les hypothèses inconsistantes avec les exemples, jusqu'à n'obtenir plus qu'une seule hypothèse (fig. VIll.6).

La puissance de cette représentation repose sur le fait que l'ensemble G résume l'information obtenue à partir des exemples négatifs qui limitent la généralisation des descriptions, tandis que S résume l'information prove-nant des exemples positifs qui limitent la spécificité des hypothèses.

L'apprentissage par l'exemple est la stratégie d'apprentissage automa-tique la mieux desservie par la recherche en intelligence artificielle. On

124 CHAPITRE VIII. L'APPRENTISSAGE

description nulle + général

H

Espace d'instanciations + spécifique

Figure VIll.6: Espace de recherche selon Mitchell

tracera ci-dessous certaines des techniques implantées dans des applications réelles. L'apprentissage par l'exemple est aussi la méthode d'apprentissage qui a donné le plus de résultats positifs. C'est pourquoi on s'attardera sur quelques exemples d'applications qui sont nombreuses à être parvenues à des résultats intéressants.

VIII.2.5.2 Quelques exemples