• Aucun résultat trouvé

Test de l’hypothèse de proportionnalité

Effets cumulés et santé : analyse des données

6.5 Résultats : satisfaction de la santé

6.5.2 Test de l’hypothèse de proportionnalité

Avant d’aller plus loin dans la comparaison des différents modèles, nous tes-tons, comme pour la santé auto-évaluée, l’hypothèse de proportionnalité des cotes pour les variables socio-démographiques introduites dans les modèles précédents.

La figure 6.5 représente le test pour la variable recodée en cinq catégories, tandis que la figure 6.6 représente le test pour la variable recodée en 10 catégories. Les résultats semblent indiquer un respect de l’hypothèse de proportionnalités des cotes dans le cas du recodage de la satisfaction en cinq catégories, puisque les prédic-tions du modèle multinomial et du modèle ordinal sont relativement proches. En revanche, dans le cas du recodage de la satisfaction en dix catégories, le test est moins concluant. On observe en effet que les prédictions des probabilités d’appar-tenir aux trois catégories les plus hautes, 8, 9 et 10, divergent parfois de manière considérable. Pour comparer les écarts de prédiction entre modèle ordinal et multi-nomial suivant le type de recodage utilisé pour la variable dépendante, nous avons représenté la distribution de la valeur absolue des différences de prédiction à l’aide d’un boxplot (voir Figure 6.7). On remarque effectivement qu’il y a davantage de prédictions très éloignées dans le modèle se basant sur la variable en dix catégories, même si la médiane de la distribution est plus petite (0.004 pour le modèle en dix catégories, 0.006 pour le modèle en cinq catégories). La décision de rejeter ou d’accepter ce postulat de proportionnalité des cotes est difficile à prendre. Même si

Figure 6.5 – Test de l’hypothèse de proportionnalité pour la satisfaction de la santé en 5 catégories

le modèle se basant sur une variable en cinq catégories se montre plus satisfaisant sur ce point, il a le désavantage de réduire considérablement l’information et par la même occasion de rendre non-significatives les variations inter-individuelles de la pente, alors que celle-ci fait partie de notre interrogation de départ sur les effets cumulés.

Modèles avec effets cumulés : comparaison

Pour continuer la réflexion entamée dans la section précédente, nous nous inté-ressons ici à l’influence du choix du type de modèles, en l’occurrence un modèle de régression linéaire sur une variable continue, ou un modèle de régression ordinale sur une variable en cinq ou en dix catégories, sur les résultats et les conclusions que l’on tire de ces modèles. Pour faire cette comparaison, nous avons réuni dans le tableau 6.27 trois modèles introduisant une interaction entre le sexe et l’âge pour mesurer une éventuelle accumulation d’effets sur la satisfaction de la santé en fonc-tion du sexe. Le premier modèle est une régression linéaire avec comme variable dépendante la variable de satisfaction de la santé "brute", c’est-à-dire avec 11 va-leurs possibles ; la distribution de cette variable est représentée graphiquement dans

Figure 6.6 – Test de l’hypothèse de proportionnalité pour la satisfaction de la santé en 10 catégories

la figure 6.8 et semble relativement éloignée d’une distribution normale. Ce premier modèle se trouve dans la colonne « Continue » du tableau 6.27. Le deuxième mo-dèle est estimé en utilisant comme variable dépendante la satisfaction de la santé recodée en cinq catégories (voir tableau 6.6). Le troisième modèle utilise comme variable dépendante la satisfaction de la santé recodée en dix catégories au lieu de onze, ce qui permet de la considérer comme une variable catégorielle avec Mplus.

Etant donné que ces trois modèles se basent sur des variables dépendantes dif-férentes, il n’est pas possible de comparer les vraisemblances, et par extension les indices basés sur la vraisemblance comme le BIC. Les coefficients de régression ne sont pas comparables entre le modèle qui considère la variable comme une variable continue et ceux qui la considèrent comme une variable ordinale car ils ne sont pas à la même échelle. Si l’on regarde de manière assez générale l’ordre de grandeur des effets, les résultats sont à peu près équivalents dans les trois cas et sans sur-prise particulière. En revanche, la significativité du terme d’effets cumulés est plus élevée dans le cadre du modèle continue et du modèle en dix catégories. Ceci est certainement dû aux mêmes raisons que le manque de significativité de la variance de la pente : en réduisant l’information à cinq catégories, on réduit artificiellement la variabilité de la pente. Malgré un postulat de proportionnalité des cotes

discu-Figure6.7 – Distribution des écarts absolus entre le modèle ordinal et multinomial (satisfaction de la santé)

table (voir section 6.5.2), il nous semble plus raisonnable de conserver un modèle de régression ordinale en raison de la non-normalité de la variable dépendante. No-tons tout de même que le modèle ordinal avec dix catégories de réponse s’estime en 3 minutes 29 secondes, tandis que le modèle linéaire avec la variable continue ne s’estime qu’en 18 secondes : il y a donc un coût pour l’utilisation de modèles ordinaux qui peut être non-négligeable suivant la complexité du modèle.

Si l’on s’intéresse plus particulièrement au modèle de régression ordinale sur la variable en dix catégories du tableau 6.27, on observe que l’interaction est signifi-cative et négative. Ceci indique que le taux de décroissance de la satisfaction de la santé pour les femmes est plus rapide que pour les hommes.

Spécifications alternatives de la relation au temps Une relation quadra-tique entre la satisfaction de la santé et l’âge a été testée et ne s’est pas révé-lée significative. De la même manière que pour les modèles concernant la santé auto-évaluée, nous testons si on peut observer une discontinuité de la pente de la

Satisfaction de la santé

De pas du tout satisfait (0) à tout à fait satisfait (10)

fréquence

0 2 4 6 8 10

020004000600080001000012000

Figure6.8 – Distribution de la satisfaction de la santé sur les 10 vagues satisfaction de la santé à l’aide de variables temporelles telles que celles définies dans le tableau 6.17. Avec le découpage de l’âge en 7 groupes, le modèle est claire-ment plus mauvais que le modèle avec seuleclaire-ment une relation linéaire à l’âge. Par ailleurs, aucun des paramètres introduits dans le modèle n’est signicatif (résultats non reproduits). En revanche, si l’on simplifie la spécification en ne créant que trois groupes (moins de 64 ans, de 65 à 74 et plus de 74 ans), le groupe des retraités a un niveau de satisfaction de la santé significativement plus élevé que le groupe de référence (0.183, p-valeur de 0.025). Ceci indique à nouveau une particularité de cette population post-retraite et pré-troisième âge.