Mémorisation d’une représentation de texte : l’opération d’agrégation

Détails de la similarité fine des attributs

4.3 Mémorisation d’une représentation de texte : l’opération d’agrégation

4.3.1 Principes généraux de l’agrégation

Quel que soit le niveau considéré, l’agrégation suit dans ses grandes lignes les mêmes principes :

lorsqu’un élément E_txt d’une représentation de texte appartenant à une structure S_txt est trouvé similaire à un élément E_m de la mémoire appartenant à une structure S_m, le premier est fusionné avec le second si S_txt et S_m sont elles-mêmes agrégées¹. Le poids absolu de E_m augmente alors d’une unité tandis que son poids relatif reste stable. Du fait de l’augmentation du poids absolu de la structure S_m englobant cet élément agrégé les autres éléments de cette structure qui n’ont pas d’équivalent au sein de la représentation de texte voient leur poids relatif diminuer par un effet naturel de son mode de calcul. Les éléments de la mémoire s’agrégeant comme Em avec des éléments de la représentation de texte se trouvent donc renforcés par rapport aux autres du fait du simple maintien de leur poids. C’est ainsi que l’on fait émerger les traits récurrents des situations par le traitement d’un ensemble important de textes.

Lorsqu’un élément d’une représentation de texte n’a pas d’équivalent au niveau de la mémoire, il est simplement ajouté à la structure de la mémoire à laquelle sa structure englobante est agrégée. Son poids absolu est alors de 1. Le processus est identique si cette structure englobante est elle-même ajoutée à la mémoire et non agrégée à l’un des éléments déjà existants. L’ajout s’effectue alors dans la nouvelle structure créée en mémoire.

Plus formellement, on peut décrire l’agrégation de la façon suivante. Soient A = {a₁, ..., a_n}, une structure de la mémoire composée des éléments a1 à an ;

T = {t₁, ..., t_m}, une structure d’une représentation de texte composée des éléments t₁ à t_m ; A´ = {a´₁, ..., a´_p}, la structure A à la suite de l’agrégation de T à A.

1 En dehors du cas des UTs, deux éléments ne peuvent être agrégés que si les structures auxquelles ils appartiennent s’agrègent elles aussi. Cela s’applique en particulier aux graphes et à leurs constituants.

Chapitre 6 - La mémoire épisodique 189 On définit alors l’agrégation de T à A par l’algorithme donné ci-après. Cet algorithme se veut très général. En particulier, il ne tient pas compte du fait que dans la pratique, les couples d’éléments similaires sont déjà formés à la suite de la phase d’évaluation de la similarité.

Pour i = 1 a m faire

indSim IDX[

Tantque non indSim et (j Qfaire Si similarité(t_i,a_j) alors a´j IXVLRQQHUWi,aj) indSim YUDL Sinon j M Fin_si Fin_tantque Si non indSim alors

ajouter(ti,A´)

Fin_si Fin_pour

La fonction similarité(ti,aj) fait référence à une similarité déjà évaluée auparavant. La fonction fusionner(ti,aj) renvoie quant à elle à l’opération d’agrégation lorsqu’il s’agit d’une structure non élémentaire et à une fusion en tant que telle lorsqu’il s’agit d’éléments terminaux comme les concepts ou les relations. Enfin, la fonction ajouter(t_i,A´) réalise la création d’un nouvel élément agrégé dans A´ à partir de t_i.

4.3.2 L’agrégation des épisodes

Du fait de l’autonomie des UTs dans la mémoire, l’agrégation des épisodes se démarque du processus général d’agrégation présenté au §4.3.1 sur deux points. Tout d’abord, l’absence de similarité entre une représentation de texte et au moins un épisode agrégé de la mémoire n’entraîne pas nécessairement la création d’un nouvel élément agrégé pour chacun de ses constituants, en l’occurrence les UTs. Une UT textuelle peut en effet s’agréger avec une UT de la mémoire sans que les épisodes dont elles font partie soient similaires. Le second point est en quelque sorte une extension du premier. Il stipule en effet que lors de l’agrégation d’un épisode textuel avec un épisode agrégé, une UT du premier ne trouvant pas à s’apparier dans le second ne donne pas forcément lieu à la création d’une nouvelle UT agrégée au sein de celui-ci mais peut tout à fait s’agréger avec une UT de la mémoire située en dehors de cet épisode si les deux UTs sont similaires.

La mémorisation d’une représentation de texte suit donc le processus suivant. On commence par procéder à l’agrégation de toutes les UTs qu’elle contient, indépendamment de leur relation avec un éventuel épisode agrégé similaire à la représentation de texte. On agrège ainsi chacune de ses UTs avec l’UT de la mémoire qui lui est le plus similaire. Si aucune n’a satisfait les critères de similarité, l’UT textuelle est ajoutée à la mémoire en tant que nouvelle UT agrégée.

La seconde étape consiste à agréger les relations de suivi thématique du nouvel épisode avec celles déjà présentes en mémoire lorsqu’elles sont similaires. Autrement, elles donnent lieu à la création de nouvelles relations thématiques agrégées. Dans le cas où ces relations sont plus finement différenciées que la simple distinction faite ici entre déviation thématique et changement de thème, le type de la relation agrégée peut être abstrait si le sur-type commun minimal des types des deux relations, la relation agrégée et la relation textuelle, est supérieur au type actuel de la relation agrégée.

190 Chapitre 6 - La mémoire épisodique

Les deux étapes précédentes se déroulent systématiquement, que la nouvelle représentation de texte soit similaire ou non à un épisode agrégé de la mémoire. Si une telle similarité a été trouvée, elles sont complétées par l’agrégation au niveau des épisodes. Celle-ci prend corps au travers de trois opérations : l’ajout d’une référence vers les UTs agrégées nouvellement créées à partir de celles de la représentation de texte, la mise à jour du poids absolu par rapport à l’épisode considéré des UTs agrégées ayant intégré une nouvelle UT et enfin, l’évaluation de la similarité des rôles d’épisode entre épisode textuel et épisode agrégé, suivie de leur agrégation (cf. 4.3.5). Si aucun épisode agrégé similaire n’a été trouvé, on crée un nouvel épisode agrégé qui référence toutes les UTs agrégées intégrant une UT de l’épisode textuel. Les rôles de ce nouvel épisode sont alors issus de la transformation directe des rôles de l’épisode textuel en rôles d’épisode agrégé.

4.3.3 L’agrégation des Unités Thématiques

L’agrégation des UTs présente comme celle des épisodes une spécificité par rapport au processus général décrit au §4.3.1. Les constituants les plus directs des UTs sont leurs attributs. Bien qu’une mesure de similarité existe les concernant, la détection d’une absence de similarité entre deux attributs n’entraîne cependant pas leur mémorisation en tant que deux entités distinctes. Un attribut d’une UT textuelle est ainsi systématiquement fusionné avec son homologue de l’UT agrégée à laquelle cette UT textuelle est agrégée, que les deux attributs soient ou non similaires. On impose uniquement à ces deux attributs d’être de même type : on ne peut pas agréger un attribut Circonstances et un attribut Description par exemple, contrainte déjà prise en compte lors de l’évaluation de la similarité des UTs.

Cette fusion systématique des attributs de même type provient de leur nature. Ils structurent les composants véritables des UTs que sont les graphes représentant les propositions mais ne sont pas eux-mêmes de réels constituants. Au sein d’un même attribut, les graphes suivent en revanche le processus d’agrégation général. Les graphes issus du texte similaires à des graphes de l’UT de la mémoire sont agrégés à ces graphes agrégés tandis que les graphes textuels sans équivalent au niveau de l’UT agrégée y sont ajoutés en tant que nouveaux graphes agrégés. C’est ainsi qu’une UT de la mémoire peut à la fois s’enrichir et renforcer ses traits caractéristiques de façon progressive.

Plusieurs spécificités sont à noter à propos de l’agrégation des graphes. La première que nous évoquerons est le cas dans lequel l’attribut X d’une UT A comporte plusieurs graphes dotés de prédicats de même type, i.e. ayant le même type de concept, appelé ici P. En pratique, ces graphes sont rarement plus de deux. Lorsqu’une UT B, similaire à l’UT A, contient dans son propre attribut X un, voire plusieurs graphes ayant un prédicat de type P, se pose le problème de déterminer quel graphe apparier avec quel autre graphe. Pour opérer un choix, on calcule la similarité fine pour tous les couples formés par le produit cartésien des graphes concernés et l’on effectue l’appariement en fonction des plus fortes valeurs obtenues pour cette similarité.

Toujours à propos de l’appariement des graphes possédant des prédicats de même type, il faut citer le cas des graphes ayant été jugés non similaires dans le cadre d’UTs qui, au contraire, sont similaires. Ces graphes ont des prédicats équivalents mais aucun de leurs actants n’est similaire à un actant équivalent de l’autre graphe. La solution la plus évidente consisterait à suivre la logique générale et à créer pour chacun d’entre eux un nouveau graphe agrégé. Néanmoins, du point de vue de la réalité de la situation, la présence de deux événements de même type n’est pas équivalente à la présence d’un seul. Même si la vocation de la mémoire épisodique est davantage de faire émerger de grandes tendances plutôt que de fines distinctions, il nous semble en l’occurrence préférable, notamment pour la simplicité des opérations de généralisation, de ne faire apparaître dans un attribut deux graphes ayant des prédicats de même type que si ces deux graphes étaient présents de manière similaire dans une des représentations de texte ayant servi à construire l’UT concernée.

Chapitre 6 - La mémoire épisodique 191 Ce principe a pour conséquence que deux graphes non similaires ayant des prédicats de même type doivent tout de même être agrégés s’ils appartiennent à deux attributs identiques de deux UTs que l’on agrège. Cette agrégation s’effectue alors sans renforcement, c’est-à-dire sans modification du poids absolu du graphe agrégé, ni du poids absolu des concepts et des relations qu’il contient.

Le dernier point touchant à l’agrégation des graphes vue du niveau des UTs a trait aux graphes similaires n’appartenant pas à des UTs similaires. Nous avons vu que le calcul de la similarité fine des attributs est capable de s’affranchir de certaines différences de structure entre les UTs, en allant chercher éventuellement des graphes similaires dans des UTs déviation. La différence gommée par la mesure de similarité est en revanche conservée par l’agrégation. On se repose en effet sur le processus d’accumulation de la mémoire pour déterminer quel est le niveau adéquat de description à retenir lors de la généralisation de l’UT source de la déviation. Si les graphes recherchés dans une UT déviation sont en fait présents la plupart du temps dans cette UT source, ils apparaîtront directement dans le schéma qui résultera de sa généralisation. Dans le cas contraire, ils feront partie d’une généralisation de l’UT déviation.

Le déroulement de l’agrégation de deux UTs suit globalement le même schéma que celui des épisodes. Après que les constituants ont été agrégés, en l’occurrence les graphes, on peut procéder à l’agrégation des relations intervenant entre ces constituants. Ce sont ici les relations intra-UTs, rendant compte des liens de causalité et d’ordonnancement temporel. Le principe de leur agrégation est exactement le même que celui de l’agrégation des relations de suivi thématique, auquel nous renvoyons le lecteur (cf. §4.3.2). Le fait que certaines ne prennent place qu’entre graphes d’un même attribut ou entre graphes d’attributs différents n’a aucune influence. L’étape suivante de l’agrégation des UTs est l’évaluation de la similarité des rôles d’UT et leur agrégation. Le processus se termine par la mise à jour du poids absolu de l’UT agrégée qui est la cible de l’agrégation. On trouvera au §4.3.6 le résultat de l’agrégation de l’UT TentativeAssassinat et de l’UT agrégée Tentative de meurtre dont on a évalué la similarité au §4.2.4.

4.3.4 L’agrégation des graphes

La figure 6.12 donne le résultat de l’agrégation des graphes de la figure 6.9¹. On y relève les deux traits essentiels de cette opération. Tout d’abord, l’agrégation de deux concepts entraîne la généralisation de leur type. Cette agrégation n’intervient que lorsque des concepts jouent le même rôle dans les deux graphes et qu’ils sont similaires. Dans l’exemple donné, une telle généralisation entraîne un changement de type, par rapport au type présent dans l’un au moins des deux graphes, pour l’agent du prédicat (le concept Transporter) ainsi que pour les concepts occupant le rôle du patient et celui de la destination. Dans les deux premiers cas, Homme et Humain sont généralisés en Humain tandis que dans le dernier cas, Aéroport et Hôpital sont généralisés en Lieu_Public.

À chaque fois, on retient le sur-type commun minimal des deux types s’il est inférieur au type du concept équivalent dans le graphe canonique associé au type du prédicat des graphes. On se reportera au §2.3.2 sur la description des graphes agrégés pour les détails de la généralisation lorsqu’un tel sur-type n’existe pas. Il faut préciser en outre que les mêmes principes s’appliquent pour les relations casuelles entre concepts dans la mesure où il existe une hiérarchie de types de relations. Autrement, on se contente d’une fusion des relations équivalentes.

1 En pratique, on réalise l’agrégation d’un graphe textuel à un graphe agrégé. Néanmoins, comme il s’agit globalement d’un appariement non orienté, au contraire par exemple de la projection, il n’est pas nécessaire de préciser si le graphe agrégé est le graphe (1) ou le graphe (2).

192 Chapitre 6 - La mémoire épisodique manière Urgent Humain Transporter destination Lieu_public patient Humain agent moyen Voiture fonction Taxi

Fig. 6.12 - Graphe résultat de l’agrégation des graphes de la figure 6.9

Le second trait de l’agrégation des graphes consiste comme pour les épisodes et les UTs à ajouter les éléments nouveaux en tant que nouvelles entités agrégées. Ces éléments sont ici des morceaux de graphes, formés au moins d’une relation et d’un concept lui étant lié. Le graphe agrégé de la figure 6.12 est ainsi formé d’un sous-graphe commun aux deux graphes de la figure 6.9 :

[Transporter]

{ (agent) [Humain], (patient) [Humain], (destination) [Lieu_public] }

et de trois morceaux de graphes. Les morceaux (fonction) [Taxi] et (moyen) [Voiture]

viennent du graphe (2) tandis que le morceau (manière) [Urgent] est issu du graphe (1). Les concepts

et les relations de ces morceaux deviennent de nouveaux concepts et relations agrégés, ne rassemblant qu’une seule occurrence.

Plus formellement, l’opération d’agrégation, si on la conjugue à l’évaluation de la similarité des graphes, s’apparente à la jointure maximale que nous avons définie au chapitre 4. Deux différences avec cette dernière opération sont à noter. La plus importante réside dans le fait que les types des concepts et des relations sont généralisés le plus possible dans le cadre de l’agrégation alors qu’ils sont au contraire spécialisés lors d’une jointure maximale. Pour chaque couple de concepts ou de relations équivalents, cette dernière retient en effet le type le plus spécifique.

La seconde différence vient de ce que la conjugaison de l’évaluation de la similarité des graphes et de leur agrégation produit moins de solutions que la jointure maximale. Dans la très grande majorité des cas, la solution est même unique. Au contraire de la jointure maximale, l’opération conjuguant similarité et agrégation est en effet dirigée par un concept spécifique, le prédicat des deux graphes, ce qui limite les possibilités d’appariement. En dehors des spécificités de ces deux opérations, il faut ajouter que la forme des graphes constituant la représentation sémantique des propositions contribue également à l’unicité des solutions. Ces graphes ne comportent en particulier pas de cycles et ne développent pas de branches profondes. De plus, ils ont tous la même allure générale : les concepts sont arrangés en étoile autour du prédicat et possèdent eux-mêmes quelquefois une ou deux ramifications formées d’un seul concept.

Comme pour l’agrégation des UTs et des épisodes, l’agrégation de deux graphes se clôt par la mise à jour de son poids absolu ainsi que par celle du poids absolu de ses constituants, c’est-à-dire ses concepts et ses relations casuelles. Leur poids relatif étant calculé à partir des poids absolus, cette mise à jour touche donc également les poids relatifs. Nous avons vu au §4.3.3 que seule l’agrégation de deux graphes non similaires ayant un prédicat de même type n’entraîne pas cet accroissement des poids.

Chapitre 6 - La mémoire épisodique 193

4.3.5 L’agrégation des rôles

Que ce soit pour les rôles d’épisode ou les rôles d’UT, l’agrégation se déroule exactement selon la procédure décrite par l’algorithme du §4.3.1. Les constituants sont dans ce cas formés par les unités de rôle. Le détail de l’application aux rôles de cet algorithme est plus spécifiquement présenté au §2.3.3, auquel le lecteur pourra se reporter. Le seul point à ajouter est l’étape finale de mise à jour des poids absolus des rôles et des unités qui les composent.

4.3.6 Un exemple

Les figures 6.13.a et 6.13.b nous montrent le résultat de l’agrégation de l’UT TentativeAssassinat de la figure 6.11 à l’UT agrégée Tentative de meurtre du §2.3.1. Globalement, cette agrégation vient confirmer certaines tendances déjà émergentes et apportent des éléments nouveaux dont le devenir sera fixé par des agrégations futures. Parmi les tendances confirmées, il faut citer le renforcement du graphe Poignarder dans l’attribut Description et celui de Être_blessé dans États Incidents. Par effet de contraste, le poids d’une grande partie des graphes de l’UT agrégée diminue. Cette baisse concerne aussi bien des graphes que l’on peut juger comme anecdotiques, tels que SeBaigner dans Description ou Dormir dans Circonstances, que des graphes tels que Arrêter dans Description ou Être_mort dans États Incidents, qu’un jugement extérieur tendrait à sélectionner du fait de leur cohérence vis-à-vis de la situation représentée.

L’hypothèse portée par le principe d’accumulation affirme que sur un grand nombre d’agrégations, ces graphes significatifs seront présents plus souvent que les autres, même s’ils ne figurent pas dans toutes les représentations de texte. Il ne faut donc pas s’arrêter à une tendance locale mais juger à partir de l’évolution globale des poids. Sous cet angle d’ailleurs, l’hypothèse semble être confirmée puisque les poids des graphes comme Arrêter ou Être_mort sont supérieurs aux poids des graphes purement anecdotiques.

L’apport d’éléments nouveaux concerne le graphe Être_fou dans l’attribut Circonstances, Transporter dans Description et Être_dans dans États Incidents. Le premier apparaît trop spécifique pour être confirmé par la suite, bien que tout dépende des textes qui seront traités, mais les deux suivants, parce qu’ils font intervenir le type de concept Hôpital, font partie des enrichissements candidats à un renforcement ultérieur.

L’agrégation de deux UTs conduit également à renforcer les relations intra-UTs comme ici la relation de causalité entre le graphe Poignarder de Description et le graphe Être_blessé de États Incidents. Ce renforcement ne se traduit en tant que tel qu’au niveau de son poids absolu, son poids relatif ayant plutôt pour vocation à rendre compte du degré de nécessité de sa présence.

L’analyse d’une agrégation particulière, impliquant une UT agrégée à un stade de développement déjà avancé comme celle de la figure 6.3, conduit à s’interroger sur l’évolution plus globale des UTs agrégées ainsi que sur l’impact de l’agrégation à cette échelle. Un des angles d’analyse intéressant à considérer à cette occasion est celui de l’ordre dans lequel les UTs sont considérées. Une étude a priori laisse en effet penser que cet ordre est particulièrement important dans les premières étapes de la constitution d’une UT agrégée dans la mesure où les contours de celle-ci se figent souvent assez rapidement et ce, ainsi que nous l’avons vu

Dans le document ANTHAPSI : un système d'analyse thématique et d'apprentissage de connaissances pragmatiques fondé sur l'amorçage (Page 195-200)