D. Analyses statistiques
3. Mesu es d’asso iatio
En fonction des variables que nous cherchions à expliquer, les analyses multivariées ont été
réalisées selon quatre stratégies. Nous avons considéré la régression linéaire multiple, la régression
logistique non conditionnelle, la régression polytomique et le modèle de Cox.
Page | 132
3.1. Régression linaire multiple
Extension de la régression linaire simple, la régression linaire multiple est utilisée pour
exprimer la relation entre une variable quantitative et des variables (quantitatives ou
qualitatives). Ce modèle statistique suppose que la relation entre et est correctement
représentée par une droite.
( | ) ∑
( | )=espérance mathématique de conditionnellement à
En faisant apparaitre la valeur individuelle de chaque individu de façon équivalente, il est
possi le d’ i e :
=te e d’e eu o espo da t à l’ a t e t e la valeu i dividuelle de et la valeur moyenne de
(ŷ) avec µ(Ԑ
i)=0 et Var(Ԑ
i= σ².
L’esti atio des pa a t es a t i i alis e via la thode des oi d es a s. Cette
méthode consiste à identifier les valeurs des paramètres qui minimisent la somme des carrés des
résidus dit aussi la somme des carrés des écarts (SCE).
∑ ∑ ̂ ̂ ̂
L’utilisatio du od le de g essio li ai e se ase su les h poth ses suivantes: a)
linéarité du modèle ; dist i utio des va ia les et des te es d’erreurs selon la loi normale, c)
Page | 133
3.2. Régression logistique non conditionnelle
La g essio ou od le logisti ue est u od le statisti ue ui pe et d’exp i e la
relation entre une variable dichotomique d’i t t et une ou plusieurs variables qualitatives ou
ua titatives les va ia les d’expositio p i ipales et les va ia les d’ajuste e t . Cette thode
traditionnelle des études cas-témoins peut être utilisée chaque fois que le paramètre de santé
esu s’exp i e e deux at go ies : =1 individu ayant déclaré la maladie et =0 individu sain.
Ce modèle statistique permet de calculer la probabilité de survenue de la maladie quand la valeur
des variables est connue :
∑
La g essio logisti ue s’ it o e u od le li ai e e i t oduisa t le Logit de P:
∑
Les coefficients ui exp i e t l’effet p op e de ha ue va ia le i d pe da te sont ici
estimés par la méthode du maximum de vraisemblance. Le principe de cette méthode consiste à
choisir, pour estimateurs de et , les valeurs ̂ et ̂ qui rendent la vraissemblance notée V
maximum.
∏
∏
La fo tio de lie Logit pe et d’i te p te ais e t les oeffi ie ts β estimés avec le
al ul de l’Odds-‘atio O‘ . Da s le as si ple d’u od le à u e seule va ia le di hoto i ue, ue
l’o o e pa exe ple X
1, ave β
1son coefficient, et si est la p o a ilit d’ t e alade hez les
Page | 134
exposés (X
1=1), et la p o a ilit d’ t e alade hez les o expos s X
0= , l’O‘ se d fi it o e
suit :
Cette fo ule se g alise da s le as d’u od le logisti ue ultiva i ave variables et
β les coefficients associés.
A ote ue l’utilisatio d’u e va ia le explicative quantitative dans un modèle logistique
i pli ue l’h poth se de li a it ave le Logit. Cette h poth se stipule ue l’expo e tielle du
pa a t e asso i à la va ia le expli ative ep se te l’O‘ pou la va iatio d’u e u it de la
variable, et e u’elle ue soit sa valeu . Afi de v ifie ette h poth se, il est o seill d’esti e et
de comparer les OR estimés par deux modèles : un modèle M1 avec la variable quantitative et un
modèle M2 avec la variable exprimée en catégorie.
3.3. Régression logistique polytomique
La g essio logisti ue adapt e à la od lisatio d’u e va ia le di hoto i ue se g alise
au as d’u e va ia le Y à K modalités. On parle de régression logistique polytomique ou régression
logistique ordinale quand les modalités de la variable qualitative sont ordonnées. Le modèle
logisti ue pol to i ue pe et de al ule la p o a ilit d’u i dividu d’appa te i à u e atégorie k
soit de modéliser (K-1) rapport de probabilité. La stratégie de modélisation consiste à prendre une
modalité comme référence et exprimer (K-1) Logit par rapport à cette référence. Pour chaque k
modalité nous avons :
Page | 135
L’esti atio et l’i te p tatio des oeffi ie ts de la g essio e va ie t gu e de elle de
la régression logistique binomiale.
3.4. Modèle de Cox
Le modèle de régression de Cox est un modèle fréquemment utilisé en épidémiologie pour
l’a al se des e u tes de oho te. Ce od le dit aussi od le à is ue p opo tio elle de Cox
permet de modéliser un phénomène dépendant du temps [Bouyer et coll., 1995 . L’o je tif de e
od le de g essio est d’esti e la elatio e t e le fa teu d’expositio et la su ve ue d’u
évènement.
Da s le as d’u od le ultiva i , le is ue i sta ta de d la e l’ v e e t d’i t t à
l’i sta t t pou u i dividu est :
( | ) ∑ )
( | )= i ide e i sta ta e de l’ v e e t o ditio elle e t aux aut es
variables.
= i ide e i sta ta e de l’ v e e t pou les uels toutes les ova ia les so t ulles
ou u’il ’ e a pas dit is ue de ase
Dans ce modèle, la formule peut être décomposée en deux parties : dépendante du
te ps ais do t la fo e ’est pas p is e dite pa tie « non-paramétrique » ; et
dépendant uniquement des covariables et non pas du temps dite partie « paramétrique ».
Pour ces raisons, le modèle de Cox est souvent qualifié de modèle semi-paramétrique.
L’ valuatio du is ue e t e deux i dividus a a t u fa teu d’expositio diff e t est
pe ise. Si l’o s’i t esse à u fa teu d’expositio pa ti ulie ot pour sa présence chez un
individu et pour son absence chez un autre individu. Par définition le risque relatif à
Page | 136
[ ]
Le risque relatif qui est égale au rapport des incidences instantanées ne dépend pas du
temps ( = ). Le risque est donc dit proportionnel. Cette hypothèse de proportionnalité des
risques est une des deux hypothèses importantes dans l’appli atio du od le de Cox. Pa d fi itio
même le modèle de Cox implique que :
[ ( )] [ ( )] { ∫ }
En pratique, cette hypothèse de proportionnalité des risques est vérifiée graphiquement en
traçant les courbes [ ( )] hez les expos s et les o expos s. Et l’h poth se est v ifi e
si les courbes sont parallèles.
La se o de h poth se da s l’utilisatio du od le est la log-linéaire entre la fonction de
risque instantané et les variables. Celle si peut t e v ifi e pa l’a al se des sidus de a ti gales.
Cette h poth se i pose u’il est u odage oh e t des va ia les.
( | ) ( ) ∑
Page | 137
Dans le document
Polluants Organochlorés et Risque de Survenue du Cancer de la Prostate. Interactions Gène-Environnement
(Page 132-138)