Formalisme d‘extraction des éléments de la connaissance dans les MP

CHAPITRE 4 GESTION DES CONNAISSANCES DANS LES MP

4.4 Modélisation et extraction de la connaissance dans les MP

4.4.4 Formalisme d‘extraction des éléments de la connaissance dans les MP

d‘un modèle de processus. Il présente également l‘approche d‘extraction des concepts de la connaissance (ECC). ECC est basée sur le modèle conventionnel de vecteur spatial (Vector Space Model : VSM) (Salton et al., 1975). La connaissance est ainsi représentée par un vecteur projeté dans un espace à n dimensions. Cette approche utilise des expressions de premier ordre (booléen), ce qui signifie que le poids de chaque concept est à 1 lorsque le concept est nécessaire et 0 dans le cas inverse.

Chaque projet fait référence à une ontologie principale1 constituée d‘un ensemble fini et non vide de concepts pertinents identifiés par un nom symbolique, et ce, pour l'ensemble du processus. Cette ontologie est flexible dans le sens où l‘utilisateur peut l‘étendre et la modifier afin de l‘adapter au contexte du projet. Dans ce contexte, le concept est l'unité cognitive de base qui représente la connaissance. L‘arbre des concepts, qui constitue cette ontologie, peut être représenté par le vecteur suivant :

(1)

Les connaissances sont exprimées sous la forme d‘un vecteur à n dimensions, que ces connaissances soient requises pour la réalisation d‘une tâche ou soient fournies par les éléments SPEM (rôle, artéfact, guides) liés en entré à cette tâche.

L‘exemple de la Figure 4.5 illustre la représentation vectorielle de la connaissance. Comme on peut le constater, chaque concept constitue un axe de l‘espace. À titre d‘exemple, l‘élément SPEM E1 est le vecteur de coordonnées (2, 3, 7) dans cet espace vectoriel à base de concepts. Les N-uplets (2, 3, 7) constituent en fait le poids de chaque concept.

E1 = 2c1 + 3c2 + 7c3

E2 = 3c1 + 5c2 + 1c3

T = 0c1 + 0c2 + 1c3

Figure 4.5 : Exemple d‘une représentation vectorielle de la connaissance

Pour évaluer la mise en correspondance (mappage) entre les concepts fournis et ceux requis, considérons d‘abord l‘ensemble des connaissances fournies par chaque élément SPEM lié en entrée à la tâche, ces vecteurs sont représentés dans la matrice suivante :

Où Wij représente le poids (la pertinence) du concept. Nous présentons un formalisme généralisé, mais nous avons retiré de notre implémentation la considération de la pertinence. La raison est due à la subjectivité de cette variable. Ainsi, Wij est traitée comme une variable booléenne (0,1). Dans le but d‘évaluer l‘écart de connaissance entre chaque tâche et les éléments SPEM qui lui sont liés, nous avons utilisé deux approches, chacune avec une finalité différente. La première approche met l‘accent sur l‘évaluation du mappage entre les concepts et se fixe comme objectif un tableau de mappage (voir Figure 4.6). La seconde met l‘accent sur la mesure de la qualité de mappage (angle entre les vecteurs) et se fixe comme objectif une évaluation quantitative de l‘écart entre les connaissances associées à une tâche (voir Figure 4.7).

 Première approche : Évaluation du mappage

Afin d‘évaluer le mappage des concepts de connaissance exigés par la tâche avec ceux fournis par les éléments SPEM autour de cette tâche, un calcul de la similarité entre les vecteurs correspondant est réalisé dans un espace préhilbertien1 (Inner Product).

Sim (Ej , T) = Ej

.

T =

(3)

Où Wij est la pertinence du concept i dans l‘élément SPEM Ej qui le fourni et Wiq est la pertinence

du concept Ci requis pour la réalisation de la tâche T.

 Dans le cas d‘une pertinence booléenne des concepts (c.-à-d. vecteur binaire), la mesure de la similarité est égale au nombre de concepts mappés dans l‘élément SPEM.

 Dans le cas d‘une pertinence non booléenne (chaque concept à un poids), la mesure est égale à la somme des produits des poids de tous les concepts mappés.

Ainsi, une des caractéristiques de cette approche d‘évaluation tient du fait qu‘il est possible d‘avoir un nombre très grand de concepts et que le calcul retourne uniquement les concepts mappés. L‘exemple suivant illustre le calcul :

- Cas d’un exemple où les concepts sont binaires Concept 1 Concept 2 Concept 3 Concept 4 Concept 5 Concept 6 Concept 7 E = 1 0 0 1 1 0 1 T = 1 1 0 1 0 1 1

La taille des vecteurs est égale à 7. La valeur 1 indique que le concept est présent et 0 sinon. Sim (E,T) = 3

- Cas d’un exemple où les concepts sont pondérés

E1 = 2 C1 + 3 C2 + 5 C3

E2 = 3 C1 + 7 C2 + 1 C3

T = 0 C1 + 0 C2 + 2C3

Dans ce cas, nous avons choisi uniquement trois concepts pour illustrer le calcul de la similitude. Sim (E1, T) = 2*0 + 3*0 + 5*2 = 10

Sim (E2, T) = 3*0 + 7*0 + 1*2 = 2  Deuxième approche : Évaluation de qualité du mappage

Pour cette deuxième approche, l‘intérêt est de savoir de combien diverge le mappage de la situation idéale. Dans ce cas, la mesure de la similarité cosinus indique le cosinus de l‘angle entre les deux vecteurs.

CosSim(ej, t) = (4) Exemple : E1 = 2C1 + 2C2 + 5C3 E2 = 3C1 + 7C2 + 1C3 T = 0C1 + 0C2 + 2C3 CosSim (E1, T) = CosSim (E2, T) =

Dans cet exemple, le mappage de l‘élément E1 est six (6) fois meilleur1

que celui de l‘élément E2. Au niveau de l‘implémentation, l‘algorithme suivant est utilisé :

- Extraire l‘ensemble des concepts nécessaires à la réalisation de chaque tâche en les présentant dans un vecteur pondéré t.

- Ensuite, extraire l‘ensemble des concepts fournis par les éléments SPEM (vecteur ej)qui

sont en liaison avec la tâche en les présentant dans une collection E. - Pour chaque ej dans E, faire : calcul du résultat rj = CosSim (ej, t)

- Assigner une icône à chaque type de résultat et présenter le tableau de bord.

Concrètement, le calcul de mappage (i.e., l‘inadéquation) est la différence entre les deux vecteurs des concepts requis et celui des concepts fournis pour une tâche donnée. Cinq résultats sont possibles comme indiqué au Tableau 4.4.

Tableau 4.4: Description des icônes dans le tableau de bord de mappage des concepts

Même si l‘échelle n‘est pas linéaire, le but est d‘ordonner quantitativement le mappage des concepts.



       n i n i n i

w

t

e

t

e

iq ij iq ij j j 1 1 2 2 1 ) (

. 



Résultat Description Icône

Non pertinent Importe peu puisqu‘il n‘est ni requis ni fourni. Il est visible juste pour indiquer sa présence.

Néant

Non utilisé Est fourni sans être requis par une tâche. Non mappé Requis mais non fourni par les éléments

en entrée de la tâche. Inadéquatement

mappé

Est fourni mais pas dans le bon format. Il y a une non-concordance dans la valeur d‘un des attributs du concept (ex. procédural et déclaratif).

Complètement mappé

Est requis par la tâche et fourni dans le bon format par un des éléments en entrée liés à la tâche. Il y a concordance dans ce cas.

Les icônes du Tableau 4.4 constituent les indicateurs visuels qui supportent l‘analyse des tableaux de bord présentés à la section suivante.

4.4.5 Mise en œuvre : tableaux de bord liés à la gestion des connaissances

Dans le document Cadre de conception multi-perspectives pour la modélisation des processus de génie logiciel (Page 111-116)