L’étude de nombreuses maladies chroniques s’oriente vers l’épidémiologie « vie entière », qui implique des données longitudinales, et des schémas causaux sous‐jacents complexes [249]. L’étude des relations causales possibles dans ces études implique dans un grand nombre de cas la possibilité de confusion dépendant du temps. Les modèles marginaux structuraux se sont révélés efficaces pour traiter des problèmes particulièrement difficiles en épidémiologie, impliquant des relations de causalité inverse, comme des biais d’indication [247, 250, 251], ou, comme nous allons le voir par la suite, le biais du travailleur sain.
Bien que ce modèle soit spécialement utile dans les études observationnelles, il peut aussi permettre de traiter des problèmes de confusion dépendant du temps pouvant intervenir dans des essais randomisés contrôlés, par exemple si les sujets, bien qu’assignés au hasard à un groupe traité ou non traité, modifient leur comportement (de manière non contrôlée) en fonction de l’apparition de symptômes [252].
La méthode a été généralisée aux analyses de survie [253]. L’équivalent d’un modèle de Cox, mais permettant de prendre en compte la confusion dépendant du temps, a été développé. Cette méthode passe par une estimation de poids prenant en compte la censure, en plus des poids prenant en compte la confusion. Ces deux types de poids sont multipliés pour obtenir le jeu de poids final déterminant la pseudo‐population.
On trouve également des études utilisant des modèles marginaux structuraux pour étudier l’effet direct de plusieurs expositions sur l’évènement d’intérêt, en contrôlant les interrelations dans le temps entre les expositions étudiées, et entre les expositions et des covariables dépendant du temps. Ainsi, Tager et al. [254] ont étudié simultanément les effets de la composition corporelle et de
l’activité physique sur la limitation fonctionnelle chez des personnes âgées, en contrôlant la confusion induite par l’interrelation de ces deux variables dans le temps, et leurs relations avec d’autres covariables. Nandi et al. [249] ont étudié l’effet direct des conditions socio‐économiques dans l’enfance et à l’âge adulte sur l’apparition de maladies cardio‐vasculaires à l’âge adulte, en contrôlant la confusion et la médiation induite par les relations entre conditions socio‐économiques dans l’enfance et à l’âge adulte, et avec d’autres covariables (caractéristiques socio‐démographiques, et facteurs de risque pour les maladies cardio‐vasculaires à l’âge adulte). Dans ces exemples, un jeu de poids est calculé pour chaque exposition d’intérêt (avec des modèles appropriés pour prédire chacune des expositions), et le produit de ces poids est utilisé pour construire la pseudo‐population. Suarez et al. [255] ont proposé une revue de la littérature des études ayant utilisé des modèles marginaux structuraux depuis 2000. Au total, 118 articles ont été identifiés, (le nombre d’articles est passé de 2 par an en 2002 à 29 par an en 2008). Parmi les articles ayant comparé les résultats obtenus avec des modèles marginaux structuraux et avec des méthodes traditionnelles, 11% ont trouvé des résultats menant à des interprétations opposées. Quand les effets allaient dans la même direction, les associations estimées par les deux méthodes différaient d’au moins 20% pour 40% des études. Ces résultats montrent que des différences importantes sont observées quand les méthodes utilisées tiennent ou ne tiennent pas compte de la possibilité de confusion dépendant du temps.
Conclusion
Il n’y a pas en science un concept unanime de la causalité, et souvent le scientifique, face à sa question de recherche, va définir ce qu’il entend par causalité pour la question donnée [222]. Cette définition est souvent difficile en sciences sociales et de la santé car les phénomènes étudiés sont complexes. Dans le cadre de la recherche sur des maladies hétérogènes et multifactorielles, les schémas causaux impliquent souvent des causes et des effets multiples [234].
Nous avons décrit plusieurs outils qui ont été construits pour l’analyse causale en épidémiologie et dans des domaines apparentés. Le tableau 4 résume les caractéristiques principales de ces différents modèles, en faisant apparaître les « modèles causaux » comme un cheminement associant une réflexion sur la question de recherche, une représentation/formulation d’hypothèses causales et le choix d’une technique statistique. Le choix de l’approche permettant de traiter la causalité dépend de questions pratiques (à quelles données on a accès) et de la question de recherche (expliquer un
phénomène dans sa globalité, mesurer l’effet de causes connues, décider d’actions,…) [222]. Des auteurs [256, 257] ont souligné l’importance de distinguer, d’un point de vue terminologique et conceptuel, ce qui est parfois appelé « modèle causal » (ou « modèle structural »), de la technique statistique utilisée. Le terme « modèle causal » renvoie à un ensemble de relations causales supposées en lien avec une question de recherche, guidant un raisonnement, la construction d’une étude, et/ou l’application de méthodes statistiques particulières. En revanche, aucune méthode statistique n’est causale en elle‐même [221]. Par ailleurs, même quand une approche causale est choisie, elle est toujours assortie d’hypothèses a priori, souvent fortes, qui doivent être clairement spécifiées et justifiées [256, 257].
Les méthodes présentées dans ce chapitre ont été développées par différents auteurs et dans des domaines de recherche variés, et il est difficile de les synthétiser dans une vision d’ensemble. L’approche contrefactuelle apparaît comme unificatrice puisque des auteurs ont montrés que toutes les méthodes présentées ici pouvaient être formulées en termes contrefactuels : les décisions déduites des DAG pourraient être déduites d’une écriture en termes contrefactuels des relations entre les variables, mais l’outil graphique est beaucoup plus facile d’utilisation, en particulier dans des problèmes impliquant de nombreuses variables [231]. Un modèle à équations structurelles peut‐ être vu comme une représentation compacte d’un grand nombre de questions contrefactuelles [221, 231]. Les relations entre modèles contrefactuels et modèle à causes composantes suffisantes ont également été décrites [230]. Pearl [232] a récemment proposé une approche unifiée de la causalité (« théorie structurale de la causalité »), regroupant des caractéristiques des modèles à équations structurelles, du cadre contrefactuel, et des modèles graphiques. Il a ainsi montré que ces différents systèmes de raisonnement sur la causalité, développés indépendamment, reposent sur une base logique équivalente [241]. Ce chapitre ne mentionne pas certaines questions d’inférence causale particulières comme les biais de sélection dans l’échantillon étudié, les données manquantes pas complètement au hasard, les facteurs de confusions non mesurés, ou les erreurs de mesures. Des solutions qui ont été développées pour traiter ces problèmes incluent des méthodes d’analyse bayésienne, des méthodes de gestion des données manquantes, l’utilisation de variables latentes, ou l’utilisation de variables instrumentales [243, 258].
Toutes les approches qui ont été présentées dans ce chapitre illustrent le principe de « no causes in, no causes out » [229], puisqu’elles reposent toutes initialement sur un schéma causal supposé (les « causes in ») qui sera la base pour tout le raisonnement causal qui aidera à produire de nouvelles connaissances (les « causes out »). La phase de construction du schéma causal supposé apparaît ainsi comme la plus importante et est généralement considérée comme une phase difficile (justification des hypothèses, multiplicité des schémas possibles,…). Au‐delà de cette phase, des outils d’analyse statistique ont récemment été développés et ouvrent un champ nouveau d’études possibles, notamment en épidémiologie vie entière.
Tableau 4. Synthèse des approches causales
Objectif Outils graphiques Ecritures mathématiques Techniques statistiques
(1) Représenter/formuler des relations causales ‐ Modèles à causes composantes suffisantes ‐ DAG ‐ Diagramme des chemins (SEM) ‐ Langage contrefactuel ‐ Equations structurelles (2)Selon la question de recherche : • Contrôler la confusion induite par L dans l’étude de l’effet de E sur Y (Y l’évènement d’intérêt, E une ou plusieurs expositions d’intérêt, L une ou plusieurs variables mesurées) DAG : choix des facteurs de confusion, choix de la technique statistique ‐ Pas de confusion dépendant du temps : Standardisation Appariement Score de propension Régression multivariée ‐ Confusion dépendant du temps : Pondération par l’inverse de la probabilité (Modèle marginal structural) G‐estimation • Etudier de manière globale relations causales entre plusieurs variables (variables mesurées, ou variable latentes existant au travers de variables mesurées) Diagramme des chemins (SEM) Equations structurelles Extension de la régression linéaire et de l’analyse factorielle DAG, Directed Acyclic Graph (Graphe acyclique orienté) ; SEM, Structural Equations Model (modèle à équations structurelles).
III OBJECTIFS
L’objectif général de la thèse est d’approfondir les connaissances actuelles sur les relations entre les expositions professionnelles et l’asthme, avec un intérêt particulier pour l’étude du rôle des expositions professionnelles aux produits de nettoyage et pour des aspects méthodologiques liés à la prise en compte du biais du travailleur sain.
L’objectif traité dans la première partie est l’étude des relations entre les expositions professionnelles aux produits de nettoyage et l’asthme, avec pour objectifs spécifiques : 1/ Mieux caractériser les produits en cause dans cette relation 2/ Déterminer les relations entre les expositions aux produits de nettoyage et différents phénotypes d’asthme caractérisant son expression clinique et ses composantes allergique et inflammatoire. L’objectif traité dans la deuxième partie est l’étude de l’impact et la prise en compte du phénomène de sélection lié au biais du travailleur sain, avec deux objectifs spécifiques : 1/ Evaluer la présence d’un biais de sélection à l’embauche (hire effect) et ses déterminants cliniques et sociodémographiques.
2/ Quantifier et contrôler l’impact du biais du travailleur sain dans les associations entre les expositions professionnelles et l’asthme par l’utilisation de modèles marginaux structuraux.