• Aucun résultat trouvé

Applications des modèles marginaux structuraux en épidémiologie 

Dans le document en fr (Page 76-81)

L’étude  de  nombreuses  maladies  chroniques  s’oriente  vers  l’épidémiologie  « vie  entière »,  qui  implique des données longitudinales, et des schémas causaux sous‐jacents complexes [249]. L’étude  des relations causales possibles dans ces études implique dans un grand nombre de cas la possibilité  de confusion dépendant du temps. Les modèles marginaux structuraux se sont révélés efficaces pour  traiter  des  problèmes  particulièrement  difficiles  en  épidémiologie,  impliquant  des  relations  de  causalité inverse, comme des biais d’indication [247, 250, 251], ou, comme nous allons le voir par la  suite, le biais du travailleur sain. 

Bien que ce modèle soit spécialement utile dans les études observationnelles, il peut aussi permettre  de  traiter  des  problèmes  de  confusion  dépendant  du  temps  pouvant  intervenir  dans  des  essais  randomisés contrôlés, par exemple si les sujets, bien qu’assignés au hasard à un groupe traité ou non  traité,  modifient  leur  comportement  (de  manière  non  contrôlée)  en  fonction  de  l’apparition  de  symptômes [252].  

La  méthode  a  été  généralisée  aux  analyses  de  survie  [253].  L’équivalent  d’un  modèle  de  Cox,  mais  permettant  de  prendre  en  compte  la  confusion  dépendant  du  temps,  a  été  développé.  Cette  méthode passe par une estimation de poids prenant en compte la censure, en plus des poids prenant  en  compte  la  confusion.  Ces  deux  types  de  poids  sont  multipliés  pour  obtenir  le  jeu  de  poids  final  déterminant la pseudo‐population. 

On  trouve  également  des  études  utilisant  des  modèles  marginaux  structuraux  pour  étudier  l’effet  direct  de  plusieurs  expositions  sur  l’évènement  d’intérêt,  en  contrôlant  les  interrelations  dans  le  temps  entre  les  expositions  étudiées,  et  entre  les  expositions  et  des  covariables  dépendant  du  temps. Ainsi, Tager et al. [254] ont étudié simultanément les effets de la composition corporelle et de 

l’activité  physique  sur  la  limitation  fonctionnelle  chez  des  personnes  âgées,  en  contrôlant  la  confusion  induite  par  l’interrelation  de  ces  deux  variables  dans  le  temps,  et  leurs  relations  avec  d’autres  covariables.  Nandi  et  al.  [249]  ont  étudié  l’effet  direct  des  conditions  socio‐économiques  dans  l’enfance  et  à  l’âge  adulte  sur  l’apparition  de  maladies  cardio‐vasculaires  à  l’âge  adulte,  en  contrôlant la confusion et la médiation induite par les relations entre conditions socio‐économiques  dans l’enfance et à l’âge adulte, et avec d’autres covariables (caractéristiques socio‐démographiques,  et facteurs de risque pour les maladies cardio‐vasculaires à l’âge adulte). Dans ces exemples, un jeu  de  poids  est  calculé  pour  chaque  exposition  d’intérêt  (avec  des  modèles  appropriés  pour  prédire  chacune des expositions), et le produit de ces poids est utilisé pour construire la pseudo‐population.  Suarez  et  al.  [255]  ont  proposé  une  revue  de  la  littérature  des  études  ayant  utilisé  des  modèles  marginaux structuraux depuis 2000. Au total, 118 articles ont été identifiés, (le nombre d’articles est  passé  de  2  par  an  en  2002  à  29  par  an  en  2008).  Parmi  les  articles  ayant  comparé  les  résultats  obtenus  avec  des  modèles  marginaux  structuraux  et  avec  des  méthodes  traditionnelles,  11%  ont  trouvé des résultats menant à des interprétations opposées. Quand les effets allaient dans la même  direction, les associations estimées par les deux méthodes différaient d’au moins 20% pour 40% des  études. Ces résultats montrent que des différences importantes sont observées quand les méthodes  utilisées tiennent ou ne tiennent pas compte de la possibilité de confusion dépendant du temps.    

Conclusion 

Il  n’y  a  pas  en  science  un  concept  unanime  de  la  causalité,  et  souvent  le  scientifique,  face  à  sa  question de recherche, va définir ce qu’il entend par causalité pour la question donnée [222]. Cette  définition  est  souvent  difficile  en  sciences  sociales  et  de  la  santé  car  les  phénomènes  étudiés  sont  complexes.  Dans  le  cadre  de  la  recherche  sur  des  maladies  hétérogènes  et  multifactorielles,  les  schémas causaux impliquent souvent des causes et des effets multiples [234]. 

Nous avons décrit plusieurs outils qui ont été construits pour l’analyse causale en épidémiologie et  dans des domaines apparentés. Le tableau 4 résume les caractéristiques principales de ces différents  modèles,  en  faisant  apparaître  les  « modèles  causaux »  comme  un  cheminement  associant  une  réflexion sur la question de recherche, une représentation/formulation d’hypothèses causales et le  choix d’une technique statistique. Le choix de l’approche permettant de traiter la causalité dépend  de questions pratiques (à quelles données on a accès) et de la question de recherche (expliquer un 

phénomène  dans  sa  globalité,  mesurer  l’effet  de  causes  connues,  décider  d’actions,…)  [222].  Des  auteurs  [256,  257]  ont  souligné  l’importance  de  distinguer,  d’un  point  de  vue  terminologique  et  conceptuel, ce qui est parfois appelé « modèle causal » (ou « modèle structural »), de  la technique  statistique  utilisée.  Le  terme  « modèle  causal »  renvoie  à  un  ensemble  de  relations  causales  supposées en lien avec une question de recherche, guidant un raisonnement, la construction d’une  étude,  et/ou  l’application  de  méthodes  statistiques  particulières.  En  revanche,  aucune  méthode  statistique  n’est  causale  en  elle‐même  [221].  Par  ailleurs,  même  quand  une  approche  causale  est  choisie, elle est toujours assortie d’hypothèses a priori, souvent fortes, qui doivent être clairement  spécifiées et justifiées [256, 257]. 

 

Les  méthodes  présentées  dans  ce  chapitre  ont  été  développées  par  différents  auteurs  et  dans  des  domaines  de  recherche  variés,  et  il  est  difficile  de  les  synthétiser  dans  une  vision  d’ensemble.  L’approche contrefactuelle apparaît comme unificatrice puisque des auteurs ont montrés que toutes  les  méthodes  présentées  ici  pouvaient  être  formulées  en  termes  contrefactuels :  les  décisions  déduites  des  DAG  pourraient  être    déduites  d’une  écriture  en  termes  contrefactuels  des  relations  entre  les  variables,  mais  l’outil  graphique  est  beaucoup  plus  facile  d’utilisation,  en  particulier  dans  des problèmes impliquant de nombreuses variables [231]. Un modèle à équations structurelles peut‐ être vu comme une représentation compacte d’un grand nombre de questions contrefactuelles [221,  231].  Les  relations  entre  modèles  contrefactuels  et  modèle  à  causes  composantes  suffisantes  ont  également été décrites [230]. Pearl [232] a récemment proposé une approche unifiée de la causalité  (« théorie  structurale  de  la  causalité »),  regroupant  des  caractéristiques  des  modèles  à  équations  structurelles, du cadre contrefactuel, et des modèles graphiques. Il a ainsi montré que ces différents  systèmes  de  raisonnement  sur  la  causalité,  développés  indépendamment,  reposent  sur  une  base  logique  équivalente  [241].  Ce  chapitre  ne  mentionne  pas  certaines  questions  d’inférence  causale  particulières  comme  les  biais  de  sélection  dans  l’échantillon  étudié,  les  données  manquantes  pas  complètement  au  hasard,  les  facteurs  de  confusions  non  mesurés,  ou  les  erreurs  de  mesures.  Des  solutions  qui  ont  été  développées  pour  traiter  ces  problèmes  incluent  des  méthodes  d’analyse  bayésienne, des méthodes de gestion des données manquantes, l’utilisation de variables latentes, ou  l’utilisation de variables instrumentales [243, 258]. 

Toutes les approches qui ont été présentées dans ce chapitre illustrent le principe de « no causes in,  no causes out » [229], puisqu’elles reposent toutes  initialement  sur un schéma causal supposé (les  « causes in ») qui sera la base pour tout le raisonnement causal qui aidera à produire de nouvelles  connaissances (les « causes out »). La phase de construction du schéma causal supposé apparaît ainsi  comme  la  plus  importante  et  est  généralement  considérée  comme  une  phase  difficile  (justification  des hypothèses, multiplicité des schémas possibles,…). Au‐delà de cette phase, des outils d’analyse  statistique  ont  récemment  été  développés  et  ouvrent  un  champ  nouveau  d’études  possibles,  notamment en épidémiologie vie entière. 

 

Tableau 4. Synthèse des approches causales  

Objectif  Outils graphiques  Ecritures mathématiques  Techniques statistiques 

(1) Représenter/formuler des relations  causales  ‐ Modèles à causes  composantes suffisantes  ‐ DAG  ‐ Diagramme des chemins  (SEM)  ‐ Langage contrefactuel  ‐ Equations structurelles    (2)Selon la question de recherche :          • Contrôler la confusion induite par L  dans l’étude de l’effet de E sur Y  (Y l’évènement d’intérêt, E une ou  plusieurs expositions d’intérêt, L une ou  plusieurs variables mesurées)  DAG : choix des facteurs de  confusion, choix de la  technique statistique    ‐ Pas de confusion dépendant du temps :  Standardisation  Appariement  Score de propension  Régression multivariée  ‐ Confusion dépendant du temps :  Pondération par l’inverse de la probabilité  (Modèle marginal structural)  G‐estimation    • Etudier de manière globale relations  causales entre plusieurs variables  (variables mesurées, ou variable latentes  existant au travers de variables mesurées) Diagramme des chemins  (SEM)  Equations structurelles  Extension de la régression linéaire et de  l’analyse factorielle  DAG, Directed Acyclic Graph (Graphe acyclique orienté) ; SEM, Structural Equations Model (modèle à équations structurelles). 

III ­ OBJECTIFS 

 

L’objectif général de la thèse est d’approfondir les connaissances actuelles sur les relations entre les  expositions  professionnelles  et  l’asthme,  avec  un  intérêt  particulier  pour  l’étude  du  rôle  des  expositions professionnelles aux produits de nettoyage et pour des aspects méthodologiques liés à la  prise en compte du biais du travailleur sain. 

 

L’objectif  traité  dans  la  première  partie  est  l’étude  des  relations  entre  les  expositions  professionnelles aux produits de nettoyage et l’asthme, avec pour objectifs spécifiques :  1/ Mieux caractériser les produits en cause dans cette relation  2/ Déterminer les relations entre les expositions aux produits de nettoyage et différents phénotypes  d’asthme caractérisant son expression clinique et ses composantes allergique et inflammatoire.    L’objectif traité dans la deuxième partie est l’étude de l’impact et la prise en compte du phénomène  de sélection lié au biais du travailleur sain, avec deux objectifs spécifiques :  1/ Evaluer la présence d’un biais de sélection à l’embauche (hire effect) et ses déterminants cliniques  et sociodémographiques. 

2/  Quantifier  et  contrôler  l’impact  du  biais  du  travailleur  sain  dans  les  associations  entre  les  expositions professionnelles et l’asthme par l’utilisation de modèles marginaux structuraux. 

    

Dans le document en fr (Page 76-81)