• Aucun résultat trouvé

D. Analyses statistiques

3. Mesu es d’asso iatio

En fonction des variables que nous cherchions à expliquer, les analyses multivariées ont été

réalisées selon quatre stratégies. Nous avons considéré la régression linéaire multiple, la régression

logistique non conditionnelle, la régression polytomique et le modèle de Cox.

Page | 132

3.1. Régression linaire multiple

Extension de la régression linaire simple, la régression linaire multiple est utilisée pour

exprimer la relation entre une variable quantitative et des variables (quantitatives ou

qualitatives). Ce modèle statistique suppose que la relation entre et est correctement

représentée par une droite.

( | ) ∑

( | )=espérance mathématique de conditionnellement à

En faisant apparaitre la valeur individuelle de chaque individu de façon équivalente, il est

possi le d’ i e :

=te e d’e eu o espo da t à l’ a t e t e la valeu i dividuelle de et la valeur moyenne de

(ŷ) avec µ(Ԑ

i

)=0 et Var(Ԑ

i

= σ².

L’esti atio des pa a t es a t i i alis e via la thode des oi d es a s. Cette

méthode consiste à identifier les valeurs des paramètres qui minimisent la somme des carrés des

résidus dit aussi la somme des carrés des écarts (SCE).

̂ ̂ ̂

L’utilisatio du od le de g essio li ai e se ase su les h poth ses suivantes: a)

linéarité du modèle ; dist i utio des va ia les et des te es d’erreurs selon la loi normale, c)

Page | 133

3.2. Régression logistique non conditionnelle

La g essio ou od le logisti ue est u od le statisti ue ui pe et d’exp i e la

relation entre une variable dichotomique d’i t t et une ou plusieurs variables qualitatives ou

ua titatives les va ia les d’expositio p i ipales et les va ia les d’ajuste e t . Cette thode

traditionnelle des études cas-témoins peut être utilisée chaque fois que le paramètre de santé

esu s’exp i e e deux at go ies : =1 individu ayant déclaré la maladie et =0 individu sain.

Ce modèle statistique permet de calculer la probabilité de survenue de la maladie quand la valeur

des variables est connue :

La g essio logisti ue s’ it o e u od le li ai e e i t oduisa t le Logit de P:

Les coefficients ui exp i e t l’effet p op e de ha ue va ia le i d pe da te sont ici

estimés par la méthode du maximum de vraisemblance. Le principe de cette méthode consiste à

choisir, pour estimateurs de et , les valeurs ̂ et ̂ qui rendent la vraissemblance notée V

maximum.

La fo tio de lie Logit pe et d’i te p te ais e t les oeffi ie ts β estimés avec le

al ul de l’Odds-‘atio O‘ . Da s le as si ple d’u od le à u e seule va ia le di hoto i ue, ue

l’o o e pa exe ple X

1

, ave β

1

son coefficient, et si est la p o a ilit d’ t e alade hez les

Page | 134

exposés (X

1

=1), et la p o a ilit d’ t e alade hez les o expos s X

0

= , l’O‘ se d fi it o e

suit :

Cette fo ule se g alise da s le as d’u od le logisti ue ultiva i ave variables et

β les coefficients associés.

A ote ue l’utilisatio d’u e va ia le explicative quantitative dans un modèle logistique

i pli ue l’h poth se de li a it ave le Logit. Cette h poth se stipule ue l’expo e tielle du

pa a t e asso i à la va ia le expli ative ep se te l’O‘ pou la va iatio d’u e u it de la

variable, et e u’elle ue soit sa valeu . Afi de v ifie ette h poth se, il est o seill d’esti e et

de comparer les OR estimés par deux modèles : un modèle M1 avec la variable quantitative et un

modèle M2 avec la variable exprimée en catégorie.

3.3. Régression logistique polytomique

La g essio logisti ue adapt e à la od lisatio d’u e va ia le di hoto i ue se g alise

au as d’u e va ia le Y à K modalités. On parle de régression logistique polytomique ou régression

logistique ordinale quand les modalités de la variable qualitative sont ordonnées. Le modèle

logisti ue pol to i ue pe et de al ule la p o a ilit d’u i dividu d’appa te i à u e atégorie k

soit de modéliser (K-1) rapport de probabilité. La stratégie de modélisation consiste à prendre une

modalité comme référence et exprimer (K-1) Logit par rapport à cette référence. Pour chaque k

modalité nous avons :

Page | 135

L’esti atio et l’i te p tatio des oeffi ie ts de la g essio e va ie t gu e de elle de

la régression logistique binomiale.

3.4. Modèle de Cox

Le modèle de régression de Cox est un modèle fréquemment utilisé en épidémiologie pour

l’a al se des e u tes de oho te. Ce od le dit aussi od le à is ue p opo tio elle de Cox

permet de modéliser un phénomène dépendant du temps [Bouyer et coll., 1995 . L’o je tif de e

od le de g essio est d’esti e la elatio e t e le fa teu d’expositio et la su ve ue d’u

évènement.

Da s le as d’u od le ultiva i , le is ue i sta ta de d la e l’ v e e t d’i t t à

l’i sta t t pou u i dividu est :

( | ) ∑ )

( | )= i ide e i sta ta e de l’ v e e t o ditio elle e t aux aut es

variables.

= i ide e i sta ta e de l’ v e e t pou les uels toutes les ova ia les so t ulles

ou u’il ’ e a pas dit is ue de ase

Dans ce modèle, la formule peut être décomposée en deux parties : dépendante du

te ps ais do t la fo e ’est pas p is e dite pa tie « non-paramétrique » ; et

dépendant uniquement des covariables et non pas du temps dite partie « paramétrique ».

Pour ces raisons, le modèle de Cox est souvent qualifié de modèle semi-paramétrique.

L’ valuatio du is ue e t e deux i dividus a a t u fa teu d’expositio diff e t est

pe ise. Si l’o s’i t esse à u fa teu d’expositio pa ti ulie ot pour sa présence chez un

individu et pour son absence chez un autre individu. Par définition le risque relatif à

Page | 136

[ ]

Le risque relatif qui est égale au rapport des incidences instantanées ne dépend pas du

temps ( = ). Le risque est donc dit proportionnel. Cette hypothèse de proportionnalité des

risques est une des deux hypothèses importantes dans l’appli atio du od le de Cox. Pa d fi itio

même le modèle de Cox implique que :

[ ( )] [ ( )] { ∫ }

En pratique, cette hypothèse de proportionnalité des risques est vérifiée graphiquement en

traçant les courbes [ ( )] hez les expos s et les o expos s. Et l’h poth se est v ifi e

si les courbes sont parallèles.

La se o de h poth se da s l’utilisatio du od le est la log-linéaire entre la fonction de

risque instantané et les variables. Celle si peut t e v ifi e pa l’a al se des sidus de a ti gales.

Cette h poth se i pose u’il est u odage oh e t des va ia les.

( | ) ( ) ∑

Page | 137

Documents relatifs