• Aucun résultat trouvé

4.3 Résultats de l’étude de simulation

4.3.2 Identifiabilité du modèle d’appartenance aux classes latentes : Effets

pour les deux scénarios

Au sein de notre premier scénario la génération des données est faite de telle façon que l’appartenance aux classes latentes soit indépendante du sexe du sujet en question, l’estima- tion du coefficient associé à la covariable sexe dans notre modèle logistique doit donc être d’un effet non-significatif : ζ11sc1= 0. Quant au deuxième scénario, l’appartenance aux classes latentes est conditionnelle au sexe du sujet. En effet, nous avons considéré que le coefficient associé à la covariable sexe est d’une valeur égale à log(2), correspondant au log du rapport de cotes pour le sexe : ζ11sc2 = log(RC) = log(2). Dans un premier temps, nous avons calculé l’erreur quadratique moyenne des deux coefficients ζ11sc1et ζ11sc2, définie précédemment, tel que :

(

EQM ( ˆζ11sc1) = V (ζ11sc1) + (E( ˆζ11sc1) − ζ11sc1)2,

EQM ( ˆζ11sc2) = V (ζ11sc2) + (E( ˆζ11sc2) − ζ11sc2)2 (4.24) Où :

EQM ( ˆζsc1

11 ),EQM ( ˆζ11sc2) sont les erreurs quadratiques moyennes pour le coefficient as-

socié à la covariable sexe du premier et deuxième scénario respectivement. • E( ˆζsc2

11 ), E( ˆζ11sc2) et V (ζ11sc1), V (ζ11sc2) sont les espérances et les variances échantillonales

Nous remplaçons dans l’équation 4.25par les valeurs trouvées et nous trouvons que : ( EQM ( ˆζ11sc1) = 0.120 + (−0.393)2 = 0.274, EQM ( ˆζsc2 11 ) = 0.233 + (1.003 − log(2))2 = 0.324 (4.25)

D’après les calculs, il s’ensuit que les erreurs quadratiques moyennes des deux coefficients ne sont pas tout à fait faibles. En effet, elles sont de valeurs de 27.4% et 32.4% respectivement. Nous avons opté encore pour la construction des deux intervalles de confiance à 95% pour les deux rapports de cotes pour le sexe pour chacun des deux scénarios, notées RCscei(i = 1, 2). Comme ζ11scei = log(RCscei), avec ζ11scei (i = 1, 2) est l’ effet du sexe sur l’appartenance aux classes latentes pour le scénario i, on passe par le biais du calcul des deux intervalles de confiance à 95% des deux moyennes des effets du sexe sur l’appartenance aux classes latentes pour chacun des deux scénarios.

En effet, en se référant à l’équation 4.22, on trouve que les deux intervalles à 95% des deux moyennes en question peuvent se présenter comme suit :

( IC(ζsce1 11 ) = [−0.393 − 1.96 × 0.34710 , −0.393 + 1.96 × 0.347 10 ] = [−0.461, −0.325] IC(ζ11sce2) = [1.003 − 1.96 ×0.48310 , 1.003 + 1.96 ×0.48310 ] = [0.907, 1.097] (4.26) On trouve donc que les deux intervalles de confiance à 95% des deux rapports de cotes pour le sexe pour chacun des deux scénarios sont comme suit :

(

IC(RCsce1) = IC(exp(ζ11sce1)) = [exp(−0.461), exp(−0.325)] = [0.62, 0.71]

IC(RCsce2) = IC(exp(ζ11sce2)) = [exp(0.907), exp(1.097)] = [2.48, 2.99] (4.27) Encore une fois, bien que les vraies valeurs des deux rapports de cotes du premier et deuxième scénario, ne soient pas incluses dans les deux intervalles de confiance ainsi construits, on voit bien d’abord que les bornes ne sont pas loin des vraies valeurs des deux rapports, soient 0 et 2 respectivement et encore qu’il y a une différence significative entre les estimations des deux rapports de cotes des deux scénarios de simulation.

Tel que présenté précédemment, nous avons généré les données au sein du deuxième scénario de sorte que l’appartenance aux classes latentes soit fonction du sexe du sujet. La modélisation des données a été faite, en premier lieu, en incluant l’effet du sexe. Par la suite et à titre de comparaison, nous avons tenté de modéliser ces mêmes données sans l’inclure. Nous avons, de même, calculé l’effet du sexe sur l’appartenance aux classes latentes a postériori et ce par le biais d’une régression logistique de la classe d’appartenance sur le sexe du sujet en question. Cet effet, nous a été utile pour le calcul du rapport de cotes pour le sexe pour ce deuxième plan de simulation. En effet, l’intervalle de confiance à 95% pour la moyenne de cet effet, noté

ζ11sce20, peut se présenter ainsi :

IC(ζ11sce20) = [0.802 − 1.96 ×0.368

10 , 0.802 + 1.96 × 0.368

L’intervalle de confiance à 95% de la moyenne du rapport de cotes, noté RCsce20 est comme suit donc :

IC(RCsce20) = IC(exp(ζ11sce20)) = [exp(0.730), exp(0.874)] = [2.075, 2.396] (4.29) Le calcul des deux intervalles de confiance des deux moyennes des rapports de cotes, nous montre encore une fois, qu’on a une bonne distinction entre les deux estimations de ce rapport obtenues pour le deuxième scénario de simulation.

Les probabilités d’appartenance a postériori aux classes latentes

Afin de valider la performance du modèle en termes de distinction des classes latentes, nous avons opté pour le calcul des probabilités moyennes d’appartenance a posteriori pour les sujets qui sont réellement dans la classe g (g = {1, 2}) et ce, au sein de chaque scénario de simulation i (i = {1, 2}), notéées πsceig , ainsi que leurs intervalles de confiance à 95%, se présentant ainsi : IC(πgscei) = IC(πsce1g ) =    IC(πsce1 1 ) = [0.982 − 1.96 × 0.006 10 , 0.982 + 1.96 × 0.006 10 ] = [0.981, 0.983] IC(πsce1 2 ) = [0.919 − 1.96 ×0.02110 , 0.919 + 1.96 × 0.021 10 ] = [0.915, 0.923]    IC(πsce2 g ) =    IC(πsce2 1 ) = [0.981 − 1.96 × 0.012 10 , 0.981 + 1.96 × 0.012 10 ] = [0.978, 0.983] IC(πsce2 2 ) = [0.895 − 1.96 × 0.032 10 , 0.895 + 1.96 × 0.032 10 ] = [0.888, 0.901]    (4.30) Les bornes des intervalles de confiance des probabilités moyennes d’appartenance a posteriori à chacune des deux classes pour chaque scénario de simulation, sont aux alentours de 0.9, signifiant ainsi une forte distinction des deux classes en question par le modèle.

4.4 Conclusion du chapitre

Dans ce chapitre, nous avons présenté l’étude de simulation effectuée pour évaluer la performance du modèle conjoint à classes latentes. Bien que les résultats suggèrent des biais des estimations des différents effets des deux sous-modèles, à savoir celui d’appartenance aux classes latentes et longitudinal, une bonne distinction des estimations en question entre les deux scénarios de simulation considérés a été obtenue à l’aide de ce même modèle. Encore et concernant les probabilités d’appartenance a posteriori à chacune des deux classes consi- dérées, les résultats nous montrent que le modèle performe bien en termes de distinction des deux classes latentes. Finalement et bien qu’on ait les présents biais pour les estimations des paramètres présentés, la prédiction du marqueur longitudinal est aussi bonne à son tour.

Chapitre 5

Étude de prédiction de la

schizophrénie et des troubles

bipolaires chez les enfants à risque

5.1 Introduction du chapitre

L’objectif de ce chapitre est la prédiction de l’évolution des deux troubles du cerveau étudiés chez les sujets de notre échantillon tout en ayant recours au modèle mixte linéaire à classes latentes (JLCM), présenté précédemment. Pour cela, nous commençons d’abord par présenter notre échantillon de données, quelques statistiques descriptives ainsi que les quatre domaines cognitifs étudiés. Ensuite, nous présentons le critère AICcmJ LCM, construit et adapté à notre propre contexte d’étude, utilisé pour la sélection des modèles statistiques. Dans un troisième lieu, nous avons exposé les problèmes de convergence rencontrés lors de l’ajustement des modèles ainsi que les multiples pistes exploitées à titre de résolution. Par la suite, nous avons exposé sommairement l’ensemble des modèles ajustés ainsi qu’intégralement les résultats des modèles retenus, notamment la classification a postériori des sujets étudiés par classe de risque ainsi que la prédiction du risque d’une conversion ultérieure vers l’un des deux troubles du cerveau étudiés. Enfin, nous avons tenté de valider la performance des modèles retenus, et ce par le biais d’une mesure externe, à savoir celle du GAF.

5.2 Présentation des données réelles et quelques statistiques

Documents relatifs