• Aucun résultat trouvé

Partie 3 – Étude du renoncement aux soins des femmes sans logement personnel

3. Modèle à équations structurelles

3.1. Principe

Les modèles à équations structurelles (SEM : structural equation modeling) servent à tester et à estimer des relations causales entre une ou plusieurs variables indépendantes et une ou plusieurs variables dépendantes. C’est une combinaison entre les DAG (Direct Acyclic Graphs) pour la construction d’un modèle conceptuel et les analyses de régression pour tester ces modèles (Tu 2009; Mansiaux et al. 2015). Bien que les équations structurelles aient été développées au début des années 1900 avec le développement de l’analyse factorielle58 (Spearman 1904) et de l’analyse causale59 (Wright 1918, 1921, 1934), le premier livre les introduisant n’a été publié qu’en 1984 (Saris et Stronkhorst 1984). Les premières études utilisant cette méthode se sont multipliées à partir des années 1980 dans le domaine des sciences humaines et sociales (particulièrement en psychologie et en économétrie) (MacCallum et Austin 2000; Amorim et al. 2010; Beran et

57 Puisque la question sur le renoncement portait sur les douze mois précédents l’enquête, il fallait que les femmes interrogées soient arrivées en France depuis au moins un an.

58 L’analyse factorielle est un ensemble de techniques permettant d’étudier les relations entre des variables mesurées et des facteurs non observés.

147 Violato 2010). L’utilisation des SEM en épidémiologie est en augmentation depuis les années 2000 (Amorim et al. 2010) et les méthodes ont également évolué60(Beran et Violato 2010).

Les SEM permettent de représenter, d’estimer et de tester des relations entre un ensemble de variables. Ces variables peuvent être des variables mesurées (observées), ou variables non observées (latentes) qui représentent des concepts construits à partir de variables observées. Ces modèles peuvent donc servir à tester, valider des scores dimensionnels61, et à mesurer des relations complexes où la variable explicative peut être expliquée aussi.

Les SEM sont constitués (1) d’un modèle de mesure qui comprend les relations entre les variables latentes et leurs variables indicatrices et (2) d’un modèle structurel qui comprend les relations entre les variables latentes (Figure 16).

Figure 16 – Schéma théorique d'un modèle à équations structurelles.

Source : Beran TN, Violato C. Structural equation modeling in medical research: a primer. BMC Research Notes. 2010;3:267. doi:10.1186/1756-0500-3-267. Légende : A, B, et C sont des variables latentes. Var 1, Var 2, Var 3, Var 4, Var 5, Var 6, Var 7 sont des variables observées. A est constituée de 1 et 2, B de 3,4 et 5 et C de 6 et 7.

60 À leur création, leur utilisation était limitée : les outcomes devaient être continus et les relations non linéaires ne pouvaient être testées

61 Par exemple, le SDQ (Strengths and Difficulties Questionnaire) est un questionnaire comportant 5 items (variables latentes) mesurés à partir de 25 questions (variables observées) donnant un score total mesurant les troubles du comportement chez l’enfant (Goodman 1997).

148

3.2. Élaboration d’un modèle à équations structurelles.

À partir de plusieurs articles ou documents méthodologiques traitant des équations structurelles (Anderson et Gerbing 1988; MacCallum et Austin 2000; McDonald et Ho 2002; Suhr 2006; Amorim et al. 2010; Beran et Violato 2010), nous avons construit le modèle de la manière suivante :

1. Construction du modèle théorique. À partir de l’étude de la littérature, nous avons émis des hypothèses et élaboré des relations entre des « concepts théoriques » (=variables latentes) et le renoncement aux soins. Les variables latentes ont été construites à partir des variables disponibles (et donc observées) dans l’enquête ENFAMS (voir plus bas).

2. Construction et estimation du modèle de mesure

(i) Estimation des corrélations entre les variables observées d’une

variable latente. Les corrélations ont été estimées à l’aide du calcul de la

matrice de corrélation pondérée (inversion de la matrice pondérée de covariance). Les corrélations deux à deux devaient être globalement supérieures à 0,30 sinon la ou les variables n’étaient pas retenues.

(ii) Test de l’unidimensionnalité de chaque variable latente à l’aide de

scree plots (en français : « diagramme en cône »). Le scree plot affiche les

valeurs propres associées à une composante dans l'ordre décroissant, en fonction du nombre de facteurs. Comme dans une analyse en composantes principales, cela permet d'évaluer visuellement le nombre de facteurs qui expliquent la majeure partie de la variabilité des données. Dans notre cas, on a cherché à vérifier si les facteurs constituaient bien une seule dimension. Sur le graphique, le point d’abscisses x=2 devra donc se situer sous l’axe passant par l’ordonnée y=1.

(iii) Estimation du modèle de mesure par analyse confirmatoire. Cette étape est la vérification de la capacité du modèle théorique à expliquer la variance commune entre plusieurs variables à l’aide d’une variable latente identifiée à priori. Chaque lien a été testé entre chaque variable observée et la variable latente à laquelle elle appartient.

149 3. Estimation du modèle complet. L’ensemble des relations (entre variables latentes) est estimé à l’aide de l’estimateur WLSMV (Weighted least squares means and variance). Les coefficients estimés sont pondérés et standardisés (afin de pouvoir les comparer entre eux), leur valeur se situe entre -1 et 1.

4. Déterminer le bon ajustement du modèle. Plusieurs indices peuvent être calculés afin de déterminer la qualité de l’ajustement entre le modèle théorique et le modèle observé. Ce sont les indices les plus utilisés dans la littérature qui ont été choisis dans ce travail :

- RMSEA (Root Mean Square Error of Approximation) permet d’évaluer les écarts normalisés entre la matrice observée et la matrice estimée. Si la valeur du RMSEA est égale ou inférieure à 0,08 ; cela traduit un bon ajustement du modèle. - Le CFI (Comparative Fit Index) est un indice qui est basé sur l’écart au modèle d’indépendance. On considère qu’il indique un bon ajustement à partir de valeurs de l’ordre de 0,90.

5. Re-spécifier le modèle. À l’aide des indices et des p-values de chaque relation estimée entre les variables latentes, nous avons réalisé une sélection pas à pas descendante en enlevant les variables dont la p-value était la plus élevée.