• Aucun résultat trouvé

La deuxième étude de ce travail de thèse s’est intéressée à l’interprétation de la mesure obtenue lors de l’utilisation d’un instrument de mesure subjective et en particulier, à l’interprétation de son évolution au cours du temps à l’aide de la DMCP. Lorsque la CTT est utilisée, il existe un phénomène de dépendance de la DMCP du questionnaire au score observé initial des sujets. L’hypothèse de ce deuxième travail était que ce phénomène était dû au défaut de propriété d’intervalle de l’échelle du score observé en CTT. Ainsi, si l’échelle du

110

vrai score est une échelle d’intervalle où le vrai score du sujet est noté S, son score observé S* peut être considéré comme entaché d’une erreur de mesure dont l’importance dépend du vrai score S. Le biais d’information engendré lors de l’utilisation d’une telle échelle dans une étude épidémiologique est donc au minimum non-différentiel.

Si, dans cette étude épidémiologique, c’est l’évolution du score d’un même sujet au cours du temps qui est évaluée, la mesure est donc répétée au cours du temps. Cette situation est schématisée à l’aide d’un DAG dans la partie A de la figure 20. Les erreurs de mesure, ε1* et ε2*, des scores observés S1* et S2* aux temps 1 et 2 respectivement sont corrélées car c’est le même instrument de mesure qui est utilisé à chaque temps. Par ailleurs, leur dépendance au vrai score correspondant à chaque temps, S1 et S2, due au défaut de propriété d’intervalle de l’échelle de mesure est représentée (S1 ε1* et S2ε2*). La DMCP est calculée comme la moyenne de la différence de score observée entre le temps 1 et le temps 2, DMCP*, dans la strate des sujets ayant répondu « un peu meilleur » (ou « un peu moins bon ») à la QT. A l’aide du DAG représenté dans la partie A de la figure 20, il est possible de repérer quatre chemins pouvant expliquer la dépendance de la DMCP* au vrai score initial S1 :

 S1 S1*DMCP*  S1

ε

1* S1*DMCP*  S1 S2 S2*DMCP*  S1 S2

ε

2* S2*DMCP*

Dans la partie B de cette figure, la même situation est schématisée dans le cas où l’échelle utilisée pour la mesure de S1 et S2 est celle du TL. Cette échelle étant supposée d’intervalle dans l’IRT, aucune dépendance des erreurs de mesure ε1** et ε2** aux vrais niveaux S1 et S2 des sujets pour le phénomène subjectif n’est représentée. Ainsi, il n’existe dans ce cas plus que deux chemins reliant S1 à la DMCP** observée sur l’échelle du TL :

 S1 S1**DMCP**  S1 S2 S2**DMCP**

111

Figure 20 : Graphe orienté acyclique représentant le calcul de la Différence Minimale Cliniquement Pertinente (DMCP) à l’aide A) d’une échelle n’ayant pas les propriétés d’intervalle (*représente les estimations observées), B) d’une échelle d’intervalle ; (**représente les estimations observées) ; ε est l’erreur de mesure, U12 représente la cause commune – méthode d’évaluation identique - responsable de la corrélation entre ε1et ε2)

L’utilisation de DAG dans cette situation permet d’apporter des éléments de discussion supplémentaires concernant les résultats obtenus dans la deuxième étude de ce travail de thèse. La dépendance de la DMCP au score initial engendrée par le défaut de propriété d’intervalle de l’échelle du score est visible dans la partie A de la figure 20, cependant, il faut noter que la situation schématisée dans la partie B est idéalisée. En effet, aucune flèche n’a été représentée entre S1 et ε1** ou S2 et ε2** pour souligner la propriété d’intervalle de l’échelle du TL mais la précision des mesures sur cette échelle par un modèle IRT est plus faible pour des niveaux extrêmes (Embretson, 1991). Formellement, ces flèches représentant la dépendance des erreurs de mesure au vrai niveau sur le phénomène mesuré devraient donc aussi figurer dans la partie B mais pour une raison différente que dans la partie A, l’imprécision existant sur les valeurs extrêmes. Les faibles différences de résultats observées dans cette deuxième étude sont

A) B)

ε

2*

ε

1* S1* S1 S2* S2 U12 DMCP* DMCP

ε

2**

ε

1** S2** S1** U12 DMCP** DMCP S1 S2

112

probablement en partie dues à l’intensité des liens représentés par ces différentes flèches et dont les forces peuvent se compenser d’un cas à l’autre.

Enfin, un des points les plus intéressants mis en évidence par ces DAG nécessite de ne raisonner qu’à partir des vraies valeurs des niveaux sur le phénomène mesuré S1, S2 et DMCP. En examinant le triangle situé dans la partie basse de chacun de ces deux DAG concernant ces vraies valeurs, il est possible de montrer que la dépendance de la différence de score au score initial observée empiriquement ne découle pas seulement de la méthode de mesure. En effet, lorsque qu’une mesure est répétée chez un même individu, il est très souvent (quasi systématiquement dans le domaine de la psychométrie) possible de faire l’hypothèse d’un lien causal entre la valeur initiale et les valeurs ultérieures. Ce lien est responsable d’une dépendance de la vraie DMCP à la vraie valeur initiale S1. Dans ce triangle, la DMCP est définie à l’aide de S1 et S2 or S2 est défini à l’aide S1 grâce au lien causal. Il est donc possible en connaissant la valeur de S1 de connaître la valeur de la DMCP. Ainsi, ce raisonnement causal met en évidence, en accord avec les résultats de cette deuxième étude, le fait qu’il n’existe pas d’unique valeur de DMCP par questionnaire. Comme certains auteurs l’ont recommandé dernièrement, la DMCP d’un questionnaire devrait être définie comme un ensemble de valeurs en fonction du score initial du sujet (Copay et al., 2007; Crosby et al., 2004, 2003; Revicki et al., 2008; Tubach et al., 2005).

Dans une étude épidémiologique, le défaut de propriété d’intervalle d’une échelle de mesure entrainera systématiquement au moins un biais d’information non-différentiel (cf. figure 4, partie A dans le chapitre 1). Comme discuté ci-dessus, en cas de schéma longitudinal, un biais sur l’estimation de la relation entre deux mesures répétées peut en résulter et ainsi conduire à des conclusions erronées concernant l’évolution au cours du temps du phénomène subjectif. Cependant, la vérification de la propriété d’intervalle d’une échelle ayant été validée à l’aide de la CTT est peu envisageable en pratique. En revanche, si un modèle à variables latentes est utilisé pour étudier la structure de l’échelle, il sera possible de pondérer chaque item afin de permettre le calcul d’un score respectant la propriété d’intervalle de l’échelle de la variable latente. Ces poids seront fonction des charges factorielles dans le modèle en facteurs communs et spécifique ou des paramètres d’items des modèles IRT.

113

Une autre solution s’offre aux épidémiologistes et est encore peu utilisée en pratique dans ce domaine : les modèles d’équations structurelles (SEM : Structural Equation Modeling) (Arlinghaus et al., 2012; Beran et Violato, 2010; Tu, 2009). Ces modèles font partie des modèles d’analyse causale mais, à la différence des DAG, ce sont des modèles d’analyse statistique où des hypothèses sont faites sur la distribution des variables et sur la forme des liens entre variables (Dumas et al., 2014). Dans un SEM, il existe deux parties : 1/ le modèle de mesure définissant les liens entre les variables observées et les variables latentes (selon le modèle en facteurs communs ou spécifique ou selon un modèle IRT) et 2/ le modèle structurel représentant les hypothèses sur les liens causaux directs ou indirects entre les variables latentes (ou entre variables latentes et certaines variables observées) (R. B. Kline, 2005). La figure 21 représente le diagramme de chemin et la transcription mathématique d’un SEM avec trois variables latentes. Dans le modèle structurel, représenté par les flèches en gras, les hypothèses sont qu’un lien causal direct de la variable latente vers la variable latente existe mais que l’effet de sur est aussi issu d’un lien causal indirect passant par la variable latente intermédiaire . A l’aide des SEM, il est donc possible de travailler directement sur la variable latente à partir des variables observées sans passer par le calcul d’un score risquant de compromettre la propriété d’intervalle de l’échelle de mesure utilisée. Le défaut de cette propriété ne peut donc pas être une source de biais lors de l’estimation des coefficients structurels dans ce type de modèle.

114

Figure 21 : Exemple de diagramme de chemin et de sa transcription mathématique pour un modèle d’équations structurelles à trois variables latentes ( ) et neuf items ( ). Les résidus sont notés , les charges factorielles , les constantes , les coefficients structurels et les erreurs structurelles . Les flèches en gras représentent le modèle structurel, i.e. les hypothèses sur les liens causaux existant entre les variables latentes

Modèle de mesure (issu du modèle en facteurs communs et spécifique) = + + avec ~ 0, , = 1 à 9, = 1 à 3 = = = 1 et ~ (0, ) Modèle structurel = + + + = + + avec ~ (0, ) pour ≠ 1

115