• Aucun résultat trouvé

Chapitre II : Méthode générale

II.4 Méthode d'explication des patrons de marche digitigrade

La méthode utilisée pour expliquer les patrons de marche digitigrade est illustrée par la Figure 27 et présentée dans les paragraphes suivants. Cette méthode d'ECD fait référence à

un apprentissage inductif supervisé où l'apprentissage se fait à partir d'un ensemble d'exemples. Les étapes de la méthode sont présentées dans les paragraphes suivants.

Figure 27 : Illustration de la méthode d'ECD utilisée pour expliquer les patrons de marche digitigrade identifiés

II.4.1 Données considérées

Le but de la première étape est de sélectionner les données pertinentes qui pourraient expliquer la ou les cause(s) des patrons de marche digitigrade identifiés à l'étape précédente. Comme nous l'avons vu au paragraphe (p. 38), les causes possibles d'une marche digitigrade sont, pour la plupart, évaluées au cours de l'examen clinique réalisé pendant l'AQM. La saisie informatique de cet examen est réalisée depuis 2002 à l'aide d'une interface graphique spécifique créée sous Access (cf. Annexe E). Le nombre d'AQM réalisées entre 2002 et 2004, avec l'examen clinique saisi informatiquement, est de 358.

Les variables cliniques utilisées pour expliquer les patrons de marche digitigrade sont reportées dans le Tableau 3, elles concernent essentiellement le plan sagittal.

Codage flou des données Données transformées Arbres de décision flous Détermination des patrons Appartenance stricte aux patrons Ensemble d’apprentissage Mise en forme Mise en forme 1 0.5 0.4 0.3 0.6 0.7 0.9 0.7 0.6 1 0.2 0.3 0.5 0.7 0.2 1 0.4 0.1 0.4 0.8 0.1 1 1 0 0.3 0.2 0.2 0.1 0.2 0.4 0.1 0.1 0 0.3 0.4 0.5 1 0.5 0.4 0.3 0.6 0.7 0.9 0.7 0.6 1 0.2 0.3 0.5 0.7 0.2 1 0.4 0.1 0.4 0.8 0.1 1 1 0 0.3 0.2 0.2 0.1 0.2 0.4 0.1 0.1 0 0.3 0.4 0.5 AQM

Cf. § II.4.1 p. 68 Cf. § II.4.2 p. 69 Cf. § II.4.3 p. 71 Cf. § II.5.4 p. 71

Validation Utilisation Cf. § II.4.5 p. 76 Cf. § II.4.6 p. 78 Examen Clinique Règles SI - ALORS

Variables cliniques Faible Moyen Important Unités Flexion Hanche 100 120 140 Degrés (°) Extension Hanche -30 -10 10 Degrés (°) Flexion Genou 110 130 150 Degrés (°)

Extension Genou -20 0 20 Degrés (°)

Flexion dorsale (Cheville) -20 10 40 Degrés (°)

A m pl itu de d e m ou ve m en t

Flexion plantaire (Cheville) 0 30 60 Degrés (°)

Quatriceps 0 2 4 Echelle d'Ashworth

Ischio-jambiers 0 2 4 Echelle d'Ashworth Triceps surae 0 2 4 Echelle d'Ashworth

Sp

as

tic

ité

Tibias anterior 0 2 4 Echelle d'Ashworth

Quatriceps 1 3 5 Echelle

Ischio-jambiers 1 3 5 Echelle

Triceps surae 1 3 5 Echelle

Fo

rc

e

Tibias anterior 1 3 5 Echelle

Différence de longueur de jambe 0 2 4 cm Tableau 3 : Variables cliniques avec les limites des fenêtres pour le codage flou

Nous avons choisi de prendre seulement les variables cliniques du côté latéral au défaut de marche digitigrade afin de limiter la complexité des règles expliquant ces patrons et ainsi préserver leur interprétabilité. De plus, le coefficient de corrélation calculé sur les 358 examens cliniques entre chaque variable clinique du coté latéral et controlatéral au défaut de marche digitigrade est supérieur à 0.8 (p<0.00001).

Les AQM où les patients avaient une marche digitigrade ont été sélectionnées et liées aux patrons de marche digitigrade manuellement. Cette sélection a été réalisée deux fois à une semaine d'intervalle dans un ordre aléatoire à partir de la courbe cinématique de la cheville et de la vidéo de marche des patients. Quatre cas pouvaient se produire :

- marche non digitigrade;

- marche digitigrade avec un des patrons identifiés;

- marche digitigrade non reproductible (alternance entre plusieurs patrons); - marche digitigrade avec patrons différents de ceux identifiés.

Seuls les examens ayant une marche digitigrade reproductible avec un patron identifié et ayant été classés les deux fois avec le même patron sont sélectionnés pour la suite de l'analyse.

II.4.2 Transformation des données

L'examen clinique réalisé sur table présente une variabilité intra et inter expérimentateurs (Blackburn et al. 2002; Van Gheluwe et al. 2002). Blackburn et al.

2( ) M V µ 1( ) M V µ x Variable Appartenance

Faible Moyen Important

entre deux examinateurs (Tau de Kendall égal à 0.062) et une reproductibilité moyenne pour le même examinateur lors de deux examens différents (Tau de Kendall égal à 0.567). Pour la mesure des amplitudes des angles articulaires, Van Gheluwe et al. (Van Gheluwe et al. 2002) rapportent un coefficient de corrélation classe (ICC) bon pour l'évaluation intra-examinateur (ICC > 0.8) mais moyen pour l'évaluation inter-intra-examinateurs (ICC < 0.51). Les données de cet examen sont donc relativement imprécises et incertaines. Pour faire face à la difficulté de traitement de ce type de données, Zadeh en 1965 (Zadeh 1965) a introduit la théorie des sous-ensembles flous. Nous allons utiliser cette théorie pour obtenir des règles intelligibles et limiter l'influence de l'imprécision et de l'incertitude de l'examen clinique sur notre méthode explicative. Les valeurs cliniques sont donc codées en modalités floues permettant ainsi d'obtenir des variables linguistiques.

Les variables linguistiques sont communément définies par un triplet constitué de la variable (ex. : force du quatriceps), de l'ensemble des valeurs prises par cette variable (ex. : {0, 1, 2, 3, 4, 5}) et de l'ensemble des sous-ensembles flous associés aux dénominations linguistiques (ex. : {Faible, Moyen, Important}). La valeur d'appartenance à un sous-ensemble flou prise par une variable est généralement comprise entre 0 et 1. Dans ce cas, la somme des valeurs d'appartenance aux variables linguistiques prises par une variable est égale à 1. La

Figure 28 montre un exemple du codage flou en trois modalités pour lesquelles les fonctions d’appartenance sont de forme triangulaire et trapézoïdale. Elles sont caractérisées par l’ensemble de valeurs {a, b, c}. Prenons l'exemple d'une force musculaire V prenant la valeur x=2. Avec les bornes {a, b, c}={1, 3, 5}, les valeurs d'appartenance seront 0.5 pour "faible", 0.5 pour "moyen" et 0 pour "important".

Figure 28 : Illustration du codage flou avec un fenêtre triangulaire au centre et deux fenêtres trapézoïdales sur les extrémités.

Soit x une valeur donnée de la variable V. La valeur d’appartenance µMi( )V de x à la modalité Mi est : Mi( ) max(min(V x a,1,c x),0)

b a c b

µ =

− − (5)

Le nombre de fenêtres ainsi que leurs bornes (Tableau 3) sont définies en collaboration avec le clinicien réalisant l'examen clinique et en étudiant l'histogramme d'amplitude des valeurs prises par la variable clinique considérée. Le nombre de trois fenêtres permet de caractériser les données de façon satisfaisante (Loslever et al. 2003) et de limiter la complexité des règles.

II.4.3 Construction de l'ensemble d'apprentissage

Dans notre application, les données d'entrée du système explicatif sont donc les variables cliniques codées en valeurs d'appartenance aux modalités floues de ces variables. Chaque exemple de l'ensemble d'apprentissage correspond à une AQM d'un patient présentant un des patrons de marche digitigrade identifiés dans la première étape. L'ensemble d'apprentissage constitue un tableau où chaque ligne correspond aux valeurs d'appartenance cliniques et à l'appartenance de la marche à un des patrons identifiés. Le Tableau 4 présente la mise en forme des données de l'ensemble d'apprentissage avec le patient ayant réalisé l'examen 1 appartenant au patron 1 (P1), le patient ayant réalisé l'examen 2 appartenant au patron 2 (P2).

Tableau 4 : Mise en forme de l'ensemble d'apprentissage pour l'induction des arbres de décision

II.4.4 Induction des règles explicatives

A la suite de la préparation des données, nous allons aborder le cœur de la méthode de l'ECD en apprentissage automatique supervisé : l'induction de règles explicatives des patrons de marche digitigrade à partir des arbres de décision flous.

Caractéristiques cliniques

AdM Flexion cheville Force Triceps (classes) Patrons Exemples

Faible Moyen Important Moyen Faible Important … P1 P2 …

Examen 1 0.53 0.47 0.00 0.00 0.70 0.30 1 0 …

Examen 2 0.00 0.60 0.40 0.20 0.80 0.00 0 1

II.4.4.1Définition des termes

Dans la partie propre aux arbres de décision, nous utiliserons le vocabulaire spécifique à ce domaine :

- un arbre est constitué d'une racine, de nœuds, de branches et de feuilles (cf. Figure

17, p. 50);

- une forêt est constituée de plusieurs arbres;

- une classe désigne un patron de marche digitigrade pouvant aussi être appelé groupe,

groupement, pattern ou expression;

- un individu désigne un examen clinique mis en forme dans l'ensemble

d'apprentissage pouvant aussi être appelé objet, observation ou patient suivant le contexte;

- un exemple désigne un individu appartenant à une classe (donc un examen clinique

appartenant à un patron de marche digitigrade);

- l'ensemble des exemples constitue l'ensemble d'apprentissage;

- un attribut désigne une variable nominale ou plus exactement, dans notre cas, une

variable clinique découpée en modalités floues;

- une condition désigne un attribut discriminant à un nœud;

- une règle est constituée des conditions rencontrées sur le parcours d'une branche

depuis la racine jusqu'à une feuille de l'arbre; - l'ensemble des règles consitue une base de règles.

II.4.4.2Les arbres de décision flous

Le principe général de génération d'un arbre de décision a été présenté dans le paragraphe (p. 49). De nombreuses publications décrivent une méthode d'induction d'arbres de décision flous (Yuan et Shaw 1995; Janikow 1998; Marsala 1998; Wang et al. 2000; Chiang et Hsu 2002; Olaru et Wehenkel 2003) schématisé sur la Figure 29. Cette partie ne détaille pas ces méthodes mais présente les choix effectués concernant la construction de l'arbre d'après les trois points caractéristiques de l'algorithme de création d'un arbre de décision qui sont :

- le mesure de discrimination; - la stratégie de partitionnement; - le critère d'arrêt.

Figure 29 : Illustration de l'induction d'arbres de décision