• Aucun résultat trouvé

Chapitre 4 : Assistance à la construction de techniques de diagnostic des connaissances

II. Modélisation des traces et des connaissances

Comme expliqué précédemment, le choix d’un algorithme semi-automatique est dû à trois limites de l’apprentissage automatique non supervisé : le manque de données dans les traces, les variables cachées et la difficulté à interpréter et à utiliser les résultats de l’apprentissage. Le concepteur guide l’apprentissage par un apport a priori de sémantique experte sur le diagnostic. Cet apport de sémantique doit satisfaire les contraintes suivantes : - être suffisamment proche de notre formalisation FMD pour pouvoir guider la construction de tous les modèles de diagnostic considérés, qui sont des instances de FMD,

- être peu coûteux pour être effectué par le concepteur, puisque l’objectif est de guider l’algorithme de construction semi-automatique et non de construire les techniques manuellement.

La première contrainte requiert que le concepteur puisse modéliser des connaissances et des observables via un modèle aussi expressif que les graphes, puisque FMD peut être représenté comme un graphe. Ce modèle doit être lié aux traces pour leur apporter de la sémantique. D’un point de vue technique, cela peut être un graphe, une ontologie, une carte conceptuelle… La seconde contrainte impose de proposer une modélisation qui permet de définir peu d’éléments et qui est suffisamment explicite pour guider le concepteur.

Dans la littérature, plusieurs travaux proposent la modélisation de connaissances et d’observables via des ontologies ou des graphes acycliques. Toutefois, Gertner intègre la modélisation de buts des exercices et la succession des connaissances et actions à mobiliser pour atteindre les buts, ce qui ne nous intéresse pas ici. Murray intègre une modélisation riche et peu contrainte du domaine et des connaissances, or, nous ne souhaitons pas modéliser tous les concepts d’un domaine mais seulement décrire les observables et connaissances dans les traces et apporter les connaissances manquantes dans les traces. Nkambou intègre une modélisation fine des connaissances et des ressources en lien avec ces connaissances. Leur modèle basé sur une ontologie nommée CREAM-C correspond mieux à

68

nos contraintes : il permet au concepteur de modéliser des connaissances de façon guidée sous forme de graphe (ontologie).

1. CREAM-C

L’ontologie conçue par le concepteur doit donc étendre CREAM-C (Nkambou et al., 2003, 1997), qui apporte le vocabulaire de base. CREAM-C est une ontologie visant à modéliser les « capacités » d’un domaine. Une capacité se définit comme « une connaissance, acquise ou développée, permettant à une personne de réussir dans l'exercice d'une activité physique ou intellectuelle ». Elle se caractérise principalement par son type, au nombre de neuf : loi, proposition, ensemble de propositions, concept défini, concept concret, règle, règle d’ordre supérieur, stratégie de résolution de problèmes et stratégie d’apprentissage (voir Figure 14).

Figure 14 : Taxonomie des capacités utilisée dans CREAM-C (Nkambou et al., 1997).

Les lois et propositions sont « des capacités permettant à l'individu de se représenter la réalité et de communiquer ces représentations à d'autres individus. La possession de ce type de capacité signifie que l'individu peut énoncer, sous forme de proposition, expliquer ou décrire ce qu'il a appris. Par exemple, “énoncer la loi d'Ohm”. »

Les concepts, règles et stratégies sont « constitués d'opérations mentales à exécuter pour agir (intérieurement) sur la réalité. Elles permettent de manifester des comportements du type démontrer, prouver, exécuter, reconnaître, identifier, procéder… ».

Les stratégies sont « des capacités utilisées dans les processus cognitifs mis en œuvre pour apprendre (dans ce cas on parle de stratégies d'apprentissage) ou pour résoudre des problèmes (on parle de stratégies de résolution de problèmes). Leur utilisation nécessite un contrôle de la part de l'étudiant en fonction de la situation. »

69

Quatre types de relations entre les capacités sont possibles : d'analogie (A), de généralisation (G), d'agrégation (Ag) et de déviation (D).

Le modèle des capacités se définit comme le triplet suivant1 : - l'ensemble C de capacités,

- la partition (Ci) i∈I de C correspondant aux types de capacités, - l'ensemble Rc = {A, G, Ag ,D} des relations définies sur les capacités.

2. Conception de l’ontologie des connaissances

L’ontologie des connaissances que doit concevoir le concepteur se compose de deux parties : les capacités (telles que définies ci-dessus au sein de CREAM-C) et les transitions exprimant les informations observables dans les traces. Le terme « transition » est utilisé pour suggérer la transition d’un problème d’un état observable à un autre. Deux niveaux d’ontologies peuvent être construits :

- ontologie de haut niveau, où les classes de l’ontologie représentent les variables présentes dans les traces ;

- ontologie détaillée, où les classes peuvent représenter les variables des traces ainsi que des exemples de valeurs de ces variables dans les traces.

Figure 15 : Deux exemples d’ontologie, de haut niveau à gauche, détaillée à droite. Les ronds désignent les classes de haut niveau et les losanges les classes du niveau détaillé. Les flèches pleines épaisses sont les relations d’héritage, les flèches pointillées les relations objets et les flèches grises fines les relations d’appartenance d’un individu à une classe. La partie dans le cadre gris correspond à l’ontologie par défaut, et les éléments hors du cadre sont les apports du concepteur, qui apportent de la sémantique sur ses traces. « CognitiveHability » correspond au « habilité intellectuelle » sur la Figure 14 selon la traduction de Nkambou et al.

La Figure 15 montre deux exemples d’ontologies, une de haut niveau (gauche) et une détaillée (droite), dans le domaine de la chirurgie orthopédique. Les classes héritent des deux classes Capacity et Transition, exprimant le lien entre éléments observables et connaissances. L’ontologie détaillée montre trois exemples d’individus, un pour la classe Operator (action) et deux pour la classe Skill (connaissance). Les flèches pleines sont les relations d’héritage et les fines flèches grises les relations d’appartenance d’un individu à une classe. Les flèches pointillées expriment les relations objet entre classes ; des relations objet sont proposées par défaut, comme « a une capacité » de Transition à Capacité, et la

70

relation inverse « a une transition », ou la relation « a pour préalable » de Capacité vers Capacité. Le concepteur peut définir de nouvelles relations pour enrichir la sémantique.

3. Association entre l’ontologie et les traces

Le concepteur crée ensuite une mise en correspondance entre l’ontologie et les traces : une ou plusieurs classes ou individus de l’ontologie sont associés à un ou plusieurs éléments observés dans les traces. Cette mise en correspondance permet de lier aux traces la sémantique apportée par l’ontologie. Plusieurs degrés d’informations expertes sont possibles en fonction : du niveau de l’ontologie (haut niveau ou niveau détaillé) ; de la complétude de l’ontologie ; de la complétude de la mise en correspondance. Notre plateforme ne permet pas d’estimer la quantité d’information experte requise pour instancier les techniques de diagnostic, mais l’approche automatique permet de tester et évaluer plusieurs degrés de complétude de l’ontologie, d’abord de haut niveau puis au niveau détaillé.

Prenons un exemple de traces ci-dessous :

ID Apprenant Exercice Phase Connaissance

St1 Opération L3 Réglage Pédicule symétrique

St1 Opération L3 Réglage Disques visibles

Une association entre ces traces et l’ontologie détaillée de la Figure 15 est la suivante : - La variable Problem de l’ontologie est associée à Exercice dans les traces. - La variable Skill de l’ontologie est associée à Connaissance dans les traces.

- La variable PedicleSym de l’ontologie est associée à la valeur Pédicule symétrique de la variable Connaissance dans les traces.

III. Algorithme semi-automatique d’instanciation des