• Aucun résultat trouvé

2.2 Présentation des modèles IRT

2.2.1 Modèles IRT pour données dichotomiques

Les modèles IRT pour items dichotomiques correspondent aux modèles probabi-listes dont la variable réponse Y est binaire, codée 0 versus 1 respectivement pour une réponse dite négative ou positive. Parmi ces modèles IRT pour données dichoto-miques (binaires), il en existe plusieurs qui se distinguent par différentes paramétri-sations (déclinaisons du prédicteur linéaire). Étant donné un questionnaire composé de J items (questions), la probabilité que l’individu i (i = 1, . . . , N) réponde positi-vement (yi(j) = 1) à l’item j (j = 1, . . . , J) dépend du niveau de la variable latente θi de l’individu i et des paramètres d’item. Le plus connu, notamment pour son appellation, est le modèle de Rasch(1960) :

Pr Yi(j)= 1|θi  = exp (θi− δj) 1 + exp (θi− δj), (2.1) où θi ∼ N 0, σ2

. Il modélise la probabilité que l’individu i a de répondre positive-ment (réponse 1) à l’item j suivant sa valeur de la variable latente θi et le paramètre d’item δj. Une extension du modèle (2.1) appelée le Two-Parameter logistic (2PL) model (Lord,1980) est plus complète. Le modèle 2PL est défini tel que :

Pr

Yi(j)= 1|θi



= expji− δj)}

1 + exp{αji− δj)}, (2.2) où (δj, αj) les deux types de paramètre d’item, avec αj > 0 est le paramètre d’incli-naison (de pente) de l’item j(j = 1, . . . , J) et δj le paramètre de position (ou seuil) de l’item j. Afin que le modèle (2.2) soit identifiable, il est nécessaire de fixer un paramètre. Il est courant de fixer la variance de la variable latente (par exemple, σ2= 1), mais un des J paramètres de discrimination peut également être fixé.

La notion de difficulté de l’item est portée par le paramètre δj. Il est également appelé paramètre de difficulté de l’item j. Il correspond à la valeur de la variable latente pour laquelle l’individu i a la même chance de répondre positivement (yi(j)= 1) que négativement (yi(j)= 0), soit Pr

Yi(j)= 1|θi



= 0.5 (voir Figure 2.3a). Dans le contexte d’un questionnaire composé de J items, le paramètre δj indique la difficulté de répondre positivement à l’item j par rapport aux autres items sachant la valeur du trait latent. La Figure 2.3a permet de mettre en évidence cette notion. Sachant un θ fixé, il est plus difficile de répondre positivement à l’item 2 (en vert) qu’à l’item item 1 (en rouge), et plus difficile de répondre positivement à l’item 3 (en bleu) qu’aux deux autres items. Autrement dit, il est attendu plus de réponse 1 pour les items dits faciles et plus de réponse 0 pour les items associés à un fort paramètre de difficulté. Le second paramètre d’item α est le paramètre dit de discrimination. Il représente le degré pour lequel les réponses à l’item varient en fonction de la variable latente θ. Pour un ensemble d’item, αj indique le pouvoir discriminant de l’item j, où plus le paramètre est élevé, plus l’item permet de discriminer deux individus ayant une valeur du trait latent proche (voir Figure 2.3b).

(a) Paramètres de difficulté (b) Paramètres de discrimination

Figure 2.3: Courbes caractéristiques aux items (ICC, item characteristic curves) pour

modèles IRT associés à des données dichotomiques. La Figure 2.3a montre les ICC des trois items pour le modèle (2.1), avec αj = 1 quel que soit j = 1, 2, 3 et les paramètres de difficulté prenant les valeurs -2, 0 et 2. La Figure 2.3a montre les ICC des trois items pour le modèle (2.2), avec δj = 0 quel que soit j = 1, 2, 3 et les paramètres de discrimination prenant les valeurs 1

3, 1 et 3.

Le modèle (2.1) correspond au modèle (2.2) avec la contrainte αj = 1 (j = 1, . . . , J). Un modèle intermédiaire, le One-parameter model (1PL), est également proposé, dans lequel le paramètre d’item α serait le même quel que soit l’item consi-déré, mais non fixé au préalable. La Figure 2.4 montre les différentes contraintes des paramètres d’item pour ces modèles par rapport à la variation de la variable latente. Une extension du modèle (2.2) comprenant un nouveau paramètre d’item (noté

(a) Modèle de Rasch (b) Modèle 1PL (c) Modèle 2PL

Figure 2.4: Courbes caractéristiques aux items pour le modèle de Rasch, le modèle 1PL

et le modèle 2PL. Dans chaque cas, il y a deux items (j = 1, 2) ayant pour paramètre de difficulté δ1=−1 et δ2= 1. Pour le modèle de Rasch (2.4a), α1= α2 = 1 ; pour le modèle 1PL (2.4b), α1= α2= 0.5 ; pour le modèle 2PL (2.4c), α1= 0.5 et α2= 2.

γ), appelé paramètre de pseudo-chance, permet d’inclure le potentiel à deviner une bonne réponse (Titman et al.,2013). Ce modèle appelé dans la littérature le Three-Parameter logistic (3PL) model (De Ayala,2009) est le suivant :

Pr

Yi(j)= 1|θi



= γj+ (1− γj) expji− δj)}

1 + exp{αji− δj)}. (2.3) Ce modèle (2.3) permet de prendre en compte la possibilité qu’a un individu de donner au hasard une bonne réponse à une question à choix multiples. Le paramètre γj ∈ [0, 1] représente la plus faible probabilité qu’a un individu de donner une réponse correcte à l’item j. Pour les données de HRQoL, il n’y a pas de bonne ou de mauvaise réponse car ce sont des questions concernant le ressenti des patients. Le modèle (2.3) n’est donc pas adapté pour cette analyse.

Hypothèses de l’IRT

Ces modèles réfèrent à une famille de modèles mathématiques et trois hypo-thèses sous-jacentes doivent être respectées. La première implique la dimensionnalité de l’espace latent. L’IRT suppose que la probabilité de répondre positivement pour un individu découle de son positionnement sur les k traits latents (capacités, statuts) considérés. Géométriquement, sa position sur chacun de ces traits latents peut être conceptualisée comme un point dans l’espace à k-dimension. Cependant, pour beau-coup d’applications de modèle IRT, il est supposé que l’espace du trait latent est unidimensionnel. La première hypothèse est donc l’unidimensionnalité de la variable latente : l’ensemble des items considérés mesure une et une seule variable (capa-cité, connaissance, habilité, trait personnel). Pour la HRQoL, l’analyse par approche IRT s’effectue par dimension de HRQoL où pour chacune d’entre elles, une variable latente est considérée. Si l’analyse doit être réalisée sur un ensemble d’items caracté-risant plusieurs dimensions de HRQoL, alors la variable latente sera caractéristique de l’ensemble des dimensions considérées.

La seconde hypothèse est l’indépendance locale. Conditionnellement à θ, les ré-ponses aux différents items sont indépendantes. Pour un individu donné, les réré-ponses aux différents items sont indépendantes les unes des autres telles que :

Pr (Yi= yii, δj) = J Y j=1 Pr Yi(j)= yi(j)i, δj , où Yi= Yi,1:J est le vecteur aléatoire réponse de l’individu i.

La troisième et dernière hypothèse est la monotonicité : les probabilités de ré-pondre positivement doivent être non décroissantes en θ, c’est-à-dire qu’elles véri-fient :

d Pr

Yi(j)= y(j)ii, δj



i ≥ 0.