• Aucun résultat trouvé

Chapitre 2 : Analyse spatiale du VIH/SIDA au Burundi

2.6. Méthodologie

2.6.4. Explicitation du modèle spatial utilisé dans l’étude

La variable réponse Yisqui désigne le statut VIH (positif ou négatif) d’un individu i de

la province ssuit une loi de Bernoulli :

(

)

~ 1,

is is

Y Bernoulli p avec pis =E Y

[ ]

is =P Y

(

is =1

)

une probabilité inconnue (2.1)

Le modèle de régression logistique binaire géo-additive convient pour établir des associations entre le statut VIH et une série de variables explicatives qualitatives

1, ,

i iq

Dans notre étude, toutes les variables explicatives sont catégorielles. L’équation (1.47) du premier chapitre peut alors s’écrire [91,158]:

(

)

0 1 1

(

)

logit pis = β +β Xi +!+βqXiq+ fspat Provinces (2.2) où

β

isont les paramètres du modèle, Xi les variables indépendantes et où l’effet

aléatoire est mis sur la province. Dans ce modèle, les variables indépendantes sont des effets fixes.

Le modèle logistique contenant un effet aléatoire qui désigne la province et les

variables catégorielles cat

j

X sans le terme d’erreur s’écrit :

( )

0 1

(

)

1

log is j ijcat spat Pr s j it p X f ovince ν

β

β

= = +

!

+ (2.3)

fspat

(

Provinces

)

est une fonction spatiale non linéaire des provinces et des effets

aléatoires, pisla probabilité, pour un individu idonné résidant dans la province s d’être de statut VIH+, étant donné que les individus sont distribués indépendamment

l’un de l’autre dans la province,

(

)

1

0, 1, ,

t

υ

β = β β ! β le vecteur des paramètres

associés aux variables catégorielles. Un a priori non informatif est mis sur les effets fixes, ce qui veut dire que les effets fixes sont constants :

(

catj

)

tan

p Xcons te

(2.4)

Aux variances inconnues 2

j

τ , il leur est assigné des lois a priori Gamma-inverse,

conjuguées à la loi desβj : 2

(

)

~ ,

j IG a bj j

τ

de paramètres ,a bj j > avec des valeurs 0

par défaut aj =bj =0, 001 pour un a priori non informatif de densité [159] :

( )

( )

2 1 2 2 1 exp j j j a j j b p τ τ τ + " # ∝ $$− %% & ' (2.5)

Différentes valeurs de aj et bj ont été utilisées en analyse de sensibilité. Cette

analyse n’a pas montré de différences avec les résultats obtenus avec les paramètres par défaut, sachant que les valeurs de ces paramètres ont une faible influence sur la distribution a posteriori des paramètres [159]. L’effet aléatoire se décompose en une somme de l’effet aléatoire spatial fstruc

( )

. , effet dit « structuré »

qui tient compte de l’effet spatiale «Province » et d’un effet aléatoire non spatial

( )

.

unstruc

f , dit « non structuré » qui tient compte du fait que dans le modèle il y a des

effets fixes :

(

Pr

)

(

Pr

)

(

Pr

)

spat s struc s unstruc s

f ovince = f ovince + f ovince (2.6)

Les effets aléatoires spatiaux fstruc

(

Provinces

)

sont modélisés comme des champs

aléatoires de Markov (une généralisation d’une marche aléatoire de premier ordre) défini par la matrice des voisinages/proximité entre les provinces et non par la matrice des distances entre les grappes. La valeur du paramètre est donc constante dans une province donnée. Deux provinces sont voisines si elles ont une limite commune. Les effets aléatoires non spatiaux funstruc

(

Provinces

)

sont, quant à eux,

modélisés comme des effets aléatoires gaussiens.

Une loi a priori est définie sur les paramètres du modèle, appelés aussi effets spatiaux des provinces, de façon à ce que ces paramètres soient conditionnellement indépendants et normalement distribués avec une espérance mathématique

conditionnelle égale à la moyenne des effets des provinces voisines et une variance

inversement proportionnelle au nombre Nsde provinces s voisines :

(

)

' ' ' 2 ' ' 2 1 | | , , ~ , spat s s s s s s f s s s s N N N τ β β τ " β # = ≠ $ % &

!

' (2.7) où 2

τ est la variance qui est un paramètre de lissage spatial.

Les effets fixes sont le sexe, l’âge (en 6 classes telles que définies dans l’EDS), le niveau d’éducation codé en deux catégories (aucune, primaire ou plus), le statut marital (célibataire, marié, concubin, veuf, divorcé ou séparé), la religion (catholique, protestant, adventiste, musulman, témoin de Jéhovah, autre, aucune), le quintile du bien-être économique codé en deux catégories (riche, autre), l’activité sexuelle récente durant les 4 dernières semaines codée en 3 catégories (aucune, active durant les 4 dernières semaines, non active durant les 4 dernières semaines), le nombre de partenaires sexuels autre que le conjoint durant les 12 derniers mois (0, 1, !2) et les infections sexuellement transmissibles (IST) durant les 12 derniers mois codées en deux catégories (non, oui). La variable qui indique la province n’a pas été utilisée dans un modèle spatial mais plutôt dans un modèle de régression logistique simple afin de comparer les prévalences du VIH observées dans les provinces par rapport à la province de Ruyigi, la province avec la plus faible prévalence du VIH.

Nous avons d’abord comparé un modèle avec uniquement un effet spatial (Provinces) et un modèle avec un effet aléatoire (Provinces) décomposé en une

somme d’un effet structuré fstruc

(

Provinces

)

et d’un effet non structuré

(

Pr

)

unstruc s

f ovince .

Ces modèles peuvent s’écrire :

(

)

1 0 fstruc Provinces

η =β + (2.8)

(

)

(

)

2 0 fstruc Provinces funstruc Provinces

Le premier modèle permet d’évaluer les variations géographiques de l’infection par le VIH dues uniquement à l’effet spatial « Provinces », c’est-à-dire uniquement au fait que les individus appartiennent à une province donnée, sans tenir compte de leurs autres caractéristiques décrites plus haut. Le deuxième modèle ajuste sur l’effet aléatoire non spatial « Provinces » et permet donc d’évaluer les variations géographiques de l’infection par le VIH dues à l’effet conjoint d’un effet spatial et d’un effet aléatoire liés à la province d’appartenance des individus.

Nous avons comparé ces deux modèles à l’aide d’un BIC conditionnel (cBIC). Le premier modèle a un cBIC égal à 2252.29 et le deuxième modèle un cBIC égal à 2240.95. Au vu de ces résultats, nous avons retenu le modèle avec un effet structuré et un effet non structuré, et cela pour tous les autres modèles.

Nous avons ensuite effectué des analyses spatiales univariées et les variables significatives au seuil de p<0.20 ont été mises dans le modèle complet. Les individus présentant des observations manquantes ont été exclus de l’analyse.

Les 9 modèles spatiaux univariés sont donc :

(

)

(

)

3 0 1Sexe fstruc Provinces funstruc Provinces

η = β +β + + (2.10)

(

)

(

)

4 0 1Age fstruc Provinces funstruc Provinces

η =β +β + + (2.11)

(

)

(

)

5 0 1Education fstruc Provinces funstruc Provinces

η =β +β + + (2.12)

(

)

(

)

6 0 1Marital fstruc Provinces funstruc Provinces

η =β +β + +

(2.13)

(

)

(

)

7 0 1Religion fstruc Provinces funstruc Provinces

η =β +β + + (2.14)

(

)

(

)

8 0 1Quintile fstruc Provinces funstruc Provinces

η =β +β + + (2.15)

(

)

(

)

9 0 1Activité fstruc Provinces funstruc Provinces

η =β +β + + (2.16)

(

)

(

)

10 0 1Partenaire fstruc Provinces funstruc Provinces

η = β +β + + (2.17)

(

)

(

)

11 0 1IST fstruc Provinces funstruc Provinces

Les variables retenues dans le modèle complet sont le sexe, l’âge, le niveau d’éducation, le statut marital, le quintile du bien-être économique, l’activité sexuelle durant les 4 dernières semaines, et les IST.

Le modèle final s’écrit alors :

(

)

(

)

3 0 1 2 3 4 5 6 7 int Pr Pr struc s unstruc s

Sexe Age Education Marital Qu ile

Activité IST f ovince f ovince

η β β β β β β

β β

= + + + + +

+ + + + (2.19)

Pour tous ces modèles, chaque paramètre est un vecteur de paramètres à l’exception de la constante. Le cBIC de ce modèle vaut 2103.29. L’estimation des paramètres était basée sur les simulations de MCMC et le maximum de vraisemblance restreinte. L’inférence sur les paramètres était empirique bayésienne. Les résultats sont fournis sous forme d’un tableau contenant, pour chaque paramètre y compris l’intercept, le mode a posteriori, la déviation standard, la p- value et l’intervalle de crédibilité des modes des distributions a posteriori des paramètres. La Figure 48 montre la distribution des modes a posteriori des effets spatiaux ajustés des provinces.

Figure 48 : Modes a poster

Cette figure montre que, en comportementaux, le risque de Bujumbura-Mairie, Bujum provinces de Makamba, Cib élevé sont frontalières de B sont reliées par des routes populations, des biens et modes a posteriori des para

teriori des effets spatiaux

en ajustant sur les déterminants sociodém ue d’infection par le VIH est plus élevé da jumbura-Rural, Muramvya et Mwaro et plu Cibitoke, Muyinga et Kirundo. Les provinces

Bujumbura (où la prévalence du VIH est él es nationales caractérisées par une circula et des services. La figure 49 montre la aramètres.

démographiques et dans les provinces plus faible dans les ces où le risque est t élevée) ou bien lui ulation intense des la distribution des

Figure 49 : Modes a poster

2.7. Article « Spatial an