Le cycle du raisonnement à base d’expériences

Le raisonnement à base d’expériences ne se différencie pas véritablement du raisonnement à base de cas quant aux grandes phases de son cycle. Les différences interviennent plutôt au niveau de la nature des étapes composant ces phases. Ces différences sont motivées par une caractéristique générale de l’approche à base d’expériences : on ne fait pas l’hypothèse de l’existence a priori de connaissances abstraites sur le domaine. Cette contrainte implique que les étapes d’évaluation de toutes les phases se trouveront forcément limitées dans la mesure où elles s’appuient par nature assez fortement sur les connaissances du domaine.

Cette limitation est néanmoins partiellement compensée par une autre caractéristique des expériences. Celles-ci se présentent en effet sous la forme d’agrégats au sein desquels il est possible de retrouver chaque expérience mais qui sont également organisés de façon à ce que toutes leurs parties communes soient fusionnées. Ce mécanisme permet de pondérer les éléments composant un agrégat en fonction de leur degré de récurrence. On obtient ainsi une représentation à deux niveaux : on a d’une part le niveau des expériences individuelles, un peu comparable aux cas d’une “classique” base de cas ; d’autre part, on a le niveau des agrégats, au sein duquel on perd l’information que tel élément est véritablement apparu en même temps que tel autre, mais qui contient en revanche une information sur l’importance relative des différents éléments qui le composent. Cette information, qui peut être vue comme une première forme de généralisation, offre également un moyen à la fois pour guider la sélection des éléments à considérer au début de chaque phase, que ce soit avant la recherche en mémoire ou avant le transfert par exemple, et pour évaluer les résultats obtenus en fin de phase.

Phase de recherche

Nous avons vu précédemment (cf. paragraphe traitant de l’apprentissage à partir d’expériences et du raisonnement à base de cas au sein de la partie 2.2.1) que la mémoire des expériences possède une structure “à plat”. Cette caractéristique, conjuguée à l’existence d’une pondération des éléments constitutifs des agrégats, pèse fortement en faveur d’un processus de recherche travaillant sur la base d’une indexation de surface. Compte tenu de cette faiblesse des critères de recherche, il est nécessaire que les cas ainsi sélectionnés soient ensuite examinés plus attentivement. Une mesure de similarité doit donc être définie afin de vérifier que ces cas peuvent être effectivement utiles pour traiter le problème courant. Du fait de l’hypothèse de l’absence de connaissances a priori sur le domaine, cette mesure ne devra s’appuyer que sur des éléments déjà capitalisés au sein de la mémoire des expériences pour approfondir la similarité supposée par la première phase de recherche. En l’occurrence, les meilleurs indicateurs de fiabilité dont on dispose dans un tel contexte sont indiscutablement les pondérations dont sont affublés les constituants des agrégats. La similarité entre un cas de la mémoire et la représentation d’un nouveau problème peut ainsi non seulement être évaluée en fonction de la similarité de leurs traits mais également tenir compte de l’importance relative de ceux-ci.

Phase d’adaptation

Les trois phases du raisonnement à base de cas peuvent profiter de l’existence de connaissances définies a priori sur le domaine. Néanmoins, c’est certainement la phase d’adaptation qui en est la plus dépendante. Son niveau de sophistication est en fait assez directement en rapport avec le degré d’élaboration des connaissances disponibles sur le problème traité. Ces connaissances ne sont d’ailleurs pas tant utiles dans la réalisation même de l’adaptation que pour son contrôle. [Kolodner 1993] montre bien que de nombreuses

42 Chapitre 1 - Exposé du problème et principes de la solution retenue

techniques d’adaptation existent mais qu’elles ne peuvent être appliquées en aveugle, sans direction d’ensemble. Il est donc essentiel de déterminer quel est, ou quels sont, les outils d’adaptation à utiliser dans une situation particulière. C’est l’objet du contrôle, et pour que celui-ci puisse être efficace, il a besoin de savoir ce qui caractérise le domaine considéré, de faire la part entre ce qui est important et ce qui relève du détail.

Compte tenu de sa volonté de ne pas dépendre d’une connaissance a priori sur le domaine, il est assez évident que le raisonnement à base d’expériences se caractérise par une phase d’adaptation peu élaborée. Ce fait est renforcé par un autre trait du raisonnement à base d’expériences.

Dans la réutilisation des cas, Aamodt et Plaza [Aamodt & Plaza 1994] séparent l’opération de copie de celle d’adaptation proprement dite en précisant que les tâches de classement se contentent le plus souvent d’une forme élémentaire de réutilisation ne comprenant que la première opération. Or, dans l’approche à base d’expériences, la dimension raisonnement est largement dominée par la notion de classement. Il s’agit de rattacher les nouvelles expériences à celles que l’on a déjà rencontrées et les opérations effectuées sur ces nouvelles expériences, en améliorant la compréhension que l’on peut en avoir, visent à mettre en évidence les relations qu’elles entretiennent avec celles déjà présentes en mémoire. L’analyse thématique, exemple qui nous intéresse tout particulièrement ici, consiste ainsi essentiellement à reconnaître qu’un ensemble de propositions traitent du même sujet, chose qui est réalisée par comparaison avec des descriptions de situations déjà mémorisées. On peut donc concevoir que dans une grande partie des cas, la phase d’adaptation dans le raisonnement à base d’expériences s’assimile à une copie. Cette copie n’est pas pour autant aveugle et les informations contenues dans les agrégats sur l’importance relative des constituants du domaine sont une fois encore utilisables pour orienter le processus.

Phase d’apprentissage

De par la liaison assez étroite que le raisonnement à base de cas établit entre résolution de problèmes ou interprétation et apprentissage, nous avons déjà eu l’occasion d’examiner dans le paragraphe 2.2.1 les différentes caractéristiques de sa phase d’apprentissage. Aussi nous nous contenterons ici d’en souligner deux aspects majeurs, en liaison avec les principes de l’approche à base d’expériences.

Tout d’abord, la phase d’apprentissage du raisonnement à base d’expériences se caractérise par une étape de généralisation en deux temps. Le premier temps est très étroitement fusionné avec l’étape d’intégration en mémoire. Au sein de la mémoire, nous avons vu que les expériences sont regroupées en agrégats au sein desquels des informations sur la récurrence de leurs traits, donc sur le degré de généralité de ceux-ci, sont déjà présentes. Ces pondérations représentent ainsi une première forme de généralisation, même si elle reste implicite dans la mesure où un choix des éléments à retenir n’est pas réalisé. Ce choix, ainsi que la construction des généralisations proprement dites, font l’objet du second temps. Alors que le premier temps de la généralisation intervient de façon continue et systématique, celui-ci opère ponctuellement et sur des éléments bien ciblés présentant des caractéristiques particulières. Il s’agit alors de faire émerger les connaissances stables contenues dans la mémoire des expériences et de les transformer afin de produire de nouvelles connaissances abstraites. Ce second temps marque donc une rupture, un changement de représentation profond qui s’approche d’une conception plus “classique” de la notion de généralisation.

Le second aspect à souligner concerne l’étape de détermination des éléments à retenir. L’une des spécificités de l’approche à base d’expériences est la volonté de faire émerger progressivement les éléments fondamentaux des expériences au fur et à mesure de l’accumulation de ces dernières et de leur confrontation les unes avec les autres. Ce processus doit intervenir en s’appuyant sur le plus petit ensemble possible de données a priori. L’étape de choix des éléments à retenir est donc par nature à l’encontre de la philosophie adoptée si elle vient en préalable de l’intégration en mémoire. En revanche, elle conserve une justification entière et remplit d’ailleurs un rôle essentiel lorsqu’elle intervient en préambule de l’étape de généralisation

Chapitre 1 - Exposé du problème et principes de la solution retenue 43 visant à construire de nouvelles connaissances abstraites, c’est-à-dire lors du second temps de la généralisation.

Récapitulatif

Dans une première partie, nous avons cherché à cerner le problème que nous posons ici, celui de l’apprentissage automatique de connaissances pragmatiques à partir de textes, et à fixer les grandes lignes de la solution que nous lui apportons. Nous avons ainsi précisé le type des connaissances visées, les connaissances sur les situations prototypiques du monde, et leur intérêt majeur pour la compréhension de textes. Nous avons également exposé en quoi leur grande variété et leur étendue conduisent naturellement dans la voie de l’apprentissage automatique et en quoi les textes constituent pour le moment un support privilégié pour cet apprentissage.

Nous avons ensuite mis en évidence la difficulté, inhérente au problème abordé, que constitue la dépendance étroite entre apprentissage et compréhension. Afin de briser cet apparent cercle vicieux, nous proposons de mettre en œuvre un principe d’amorçage : les connaissances apprises doivent permettre d’améliorer la compréhension qui elle-même contribue à son tour au raffinement des connaissances disponibles. Ce principe premier est soutenu par trois autres : l’apprentissage doit être incrémental ; il doit s’appuyer de façon privilégiée sur la notion de similarité et la compréhension doit être capable de réutiliser les connaissances produites par cet apprentissage. Nous montrons par la suite l’importance de la notion de mémoire, notamment du fait du caractère très progressif du processus d’apprentissage. Une référence dans ce domaine est la théorie de la mémoire dynamique de Schank que nous analysons rapidement afin de montrer pourquoi sa structuration a priori ne s’accorde pas avec nos hypothèses de base.

Dans la seconde partie de ce chapitre, nous avons essayé de donner une vue globale de l’approche retenue. Celle-ci est fondée sur la notion d’expérience que nous définissons comme le résultat, en termes de représentations internes, de l’interaction d’un système avec son environnement. À l’occasion de cette définition, nous montrons les proximités avec la notion de cas ainsi que la filiation avec les travaux de Vygotski sur la formation des concepts.

Nous examinons ensuite l’impact de la notion d’expérience sur l’apprentissage. Les liens avec les formes d’apprentissage reconnues les plus proches sont explorés. Nous nous situons ainsi par rapport au regroupement conceptuel et à l’apprentissage intervenant dans le cadre du raisonnement à base de cas. Nous présentons à la suite MoHA, un modèle d’apprentissage s’appuyant spécifiquement sur la notion d’expérience et qui constitue le cadre global dans lequel nous nous inscrivons pour réaliser l’apprentissage automatique de connaissances pragmatiques.

Enfin, nous analysons ce que la notion d’expérience induit au niveau de la compréhension. Nous montrons que la similarité entre la notion de cas et celle d’expérience conduit à situer le raisonnement à base d’expériences comme très voisin de certaines formes de raisonnement à base de cas, en l’occurrence lorsque celui-ci est employé dans des tâches interprétatives et comme recours en l’absence de connaissances sur le domaine. Nous étudions pour finir plus précisément quelles modifications du cycle du raisonnement à base de cas sont apportées par l’approche à base d’expériences. En particulier, nous établissons que le cycle reste globalement le même mais que la contrainte de limitation des connaissances a priori sur le domaine influence la plupart des étapes, en particulier les étapes d’évaluation.

Chapitre 2 - Les systèmes apprenant des connaissances pragmatiques à partir de textes 45

Chapitre 2

Les systèmes apprenant des connaissances

Dans le document ANTHAPSI : un système d'analyse thématique et d'apprentissage de connaissances pragmatiques fondé sur l'amorçage (Page 48-52)