• Aucun résultat trouvé

Analyse de l’évolution du taux d’hémoglobine entre 3 et 18 mois par un modèle de trajectoires latentes

Carte 3 : Les neufs villages d’étude et les trois dispensaires du projet TORI

1.4. Analyses des données

1.4.2. Stratégie générale d’analyse

1.4.2.3. Analyse de l’évolution du taux d’hémoglobine entre 3 et 18 mois par un modèle de trajectoires latentes

Nous avons effectué une analyse par classes latentes pour tenter d’identifier des trajectoires pour l’évolution de l’hémoglobine au sein de notre population d’enfants et pour étudier les associations entre les variables explicatives et les trajectoires identifiées. Par la suite, les termes « groupe », « classe » ou encore « trajectoire » sont équivalents. Le taux d’hémoglobine mesuré entre 3 et 18 mois représente notre variable dépendante. Les variables explicatives étudiées sont identiques à celles utilisées dans le modèle mixte pour l’étude des conséquences de l’anémie maternelle sur le taux d’hémoglobine du nourrisson entre trois et dix huit mois. Les modèles à classes latentes sont une extension des modèles mixtes et dans le présent travail notre modèle s’écrit de la façon suivante :

it pt j p t j it j it j it j j

it

Age Age Age X X

y

0

+ β

1

+ β

2 2

3 3

1 1

+...+α +ε

i : indice de l’enfant (i=1 à 542) t : temps (3 à 18 mois)

j : le groupe (j=1 à n)

y

it : Taux d’hémoglobine de l’enfant i au temps t

j

0

β : constante dans le groupe j

j

1

β …. β : coefficients associés à la modélisation de l’effet de l’âge de l’enfant sur le taux 3j

d’hémoglobine dans le groupe j.

j k

69

X1t …. Xpt : les variables explicatives de l’enfant (t indique que cette variable peut dépendre du temps).

eit˜Ν (0, σ2) où σ2

représente la variance résiduelle

L’analyse statistique a été réalisée en quatre étapes.

- Au cours de la première étape nous avons identifié le nombre de trajectoires d’hémoglobine au sein de notre population. Pour cela, nous avons tout d’abord modélisé l’effet de l’âge de l’enfant sur le taux d’hémoglobine en utilisant une fonction polynomiale du temps de degré 3. Nous avons ensuite introduit successivement dans le modèle deux, puis trois, puis quatre … trajectoires. Au cours de cette étape, aucune variable explicative n’a été ajoutée au modèle. La sélection de modèles permettant la détermination du nombre de groupes a reposé sur le critère bayésien d’information (BIC pour Bayesian Information Criterion, utilisé dans la suite du manuscrit). Le principe du BIC consiste à pénaliser la vraisemblance des paramètres estimés associée aux données, traduisant la qualité de l’ajustement, par le nombre de paramètres indépendants du modèle et la taille de l’échantillon. Ce critère permet la sélection du modèle réalisant le meilleur compromis entre ajustement aux données et parcimonie. Nous avons néanmoins également tenue compte du pourcentage de sujets constituant les différentes classes. Bien qu’aucune règle n’ait, à notre connaissance, clairement été énoncée pour cela, certains auteurs dont Andruff et al. (2009) ont proposé de ne pas retenir une trajectoire qui ne correspondrait pas a priori à une part « suffisante » de la population. Pour une interprétation raisonnable, nous avons suivi la recommandation d’Andruff et al. (2009) qui propose de ne retenir

70

une classe que si elle correspond au minimum à 5% de la population (Andruff H et al. 2009).

- Au cours de la seconde étape nous avons étudié l’effet des différentes variables explicatives sur l’évolution du taux d’hémoglobine du nourrisson. Toutes les variables significatives au seuil de 20% lors de l’analyse univariée ont été incluses comme effet fixe dans l’analyse multivariée. Le seuil de significativité a été fixé à 5%. Durant cette étape nous avons examiné la stabilité de nos trajectoires lorsque les variables explicatives étaient successivement introduites dans le modèle. Là encore, à notre connaissance aucune règle ne semble admise mais Nagin propose que le pourcentage d’individus dans chaque groupe ne soit pas fortement influencé par l’introduction de covariables dans le modèle (Nagin DS 2005). Nous avons appliqué cette proposition pour retenir le nombre final de trajectoires. Nous avons ensuite estimé les probabilités a posteriori d’appartenance à une trajectoire. Dans le modèle final, chaque sujet est affecté dans la trajectoire pour laquelle sa probabilité a posteriori d’appartenance (ou prédiction d’appartenance) est suffisamment élevée. Ici encore, la littérature ne fournit pas de règle de décision formelle. Nous avons à nouveau suivi une recommandation de Andruff et al. (2009) qui considère qu’une probabilité a posteriori supérieure ou égale à 0,7 d’appartenir à une trajectoire est raisonnable (Andruff H et al. 2009). Ces deux derniers critères nous ont permis de retenir définitivement le modèle final. Au cours de cette seconde étape, nous avons appliqué une seconde stratégie pour confirmer ou non notre choix de trajectoires d’hémoglobine. Il s’agit d’une méthode non paramétrique du maximum de vraisemblance, la méthode « Gateaux » (Rabe-Hesketh, Skrondal, and Pickles 2004). Cette méthode part d’un nombre restreint de classes (par exemple 2) et introduit une nouvelle classe en maintenant constants les autres paramètres. Si,

71

dans ces conditions, la vraisemblance est augmentée alors cette troisième classe est introduite et la vraisemblance maximisée en estimant tous les autres paramètres laissés constants précédemment. Cette procédure est répétée jusqu’à ce que la vraisemblance ne soit plus améliorée. La méthode « Gateaux » permet de déterminer le nombre de groupes dans la population en retenant le modèle pour lequel la vraisemblance des données est la plus élevée et qui tienne compte également de l’existence de maxima locaux (Heckman and Singer 1984; Rabe-Hesketh et al. 2004). Pour cette méthode nous avons appliqué également le critère d’Andruff qui propose de ne retenir une classe que si elle correspond au minimum à 5% de la population Les résultats de cette méthode ont été confrontés aux résultats précédents.

- Dans la troisième étape de notre analyse, nous nous sommes intéressés à l’anémie maternelle en regardant son effet prédictif d’appartenance à une trajectoire.

- Ensuite nous avons étudié l’effet des différentes covariables sur l’évolution du taux d’hémoglobine au sein de chacune des trajectoires identifiées et non plus en effet fixe, commun à l’ensemble de la population, quelle que soit la trajectoire d’appartenance des individus