• Aucun résultat trouvé

objectifs de la thèse

8.2. Les analyses statistiques

Tout d’abord la composition des groupes de randomisation à l’inclusion a été comparée sur la base des mesures sociodémographiques, sociocognitives et tabagiques, en utilisant un test du Chi2 ou U de Mann-Whitney, selon la nature de la variable analysée.

L’attrition a ensuite été étudiée en comparant les caractéristiques sociodémographiques, sociocognitives et tabagiques à T0 des sujets absents à tous les temps après l’inclusion, par rapport à ceux présents à au moins un temps post-intervention. La présence d’un biais d’attrition entre les bras de randomisation a ensuite été recherchée en comparant ces variables entre les groupes de randomisation, d’abord chez les sujets sortis de l’étude après T0, puis chez ceux qui ont été revus. Nous avons réalisé pour cela un test du Chi2 ou U de Mann-Whitney, selon la

nature de la variable analysée.

Analyse de l’ajustement du modèle TPB

Afin de tester le bon ajustement de nos données au modèle de la TPB, nous avons effectué une analyse en pistes causales (équations structurelles). Nos données respectaient les hypothèses de taille de l’échantillon (n > 200, voire n > 500 si possible), de données manquantes (au moins MAR et n > 200, voire n > 500 de données disponibles) et d’absence d’outliers (Hampton,

179 2015). Toutes ne respectaient pas les hypothèses de données continues (échelles ordinales) et normalement multivariées (sur la base des indices Skewness > 2, Kurtosis > 2 et Kurtosis multivarié de Mardia > 5). La discontinuité des données ne provoque qu’un biais minime dans les résultats, d’autant plus lorsque le nombre de modalités est important (au moins 4 modalités, le plus étant le mieux), que ces modalités sont approximativement équidistantes et que la taille de l’échantillon est suffisante, comme c’est le cas dans cette étude (Byrne, 2010, p. 143̻ 160; Hampton, 2015). La non-normalité multivariée peut quant à elle être à l’origine d’un biais plus important de tous les estimateurs (Byrne, 2010, p. 143̻ 160; Hampton, 2015). Nous avons donc suivi la procédure de bootstrapping proposée par Byrne (2010, p. 143̻ 160) pour toutes nos analyses en pistes causales. Nous avons réalisé à chaque fois un bootstrap de 2000 échantillons en sélectionnant l’estimateur Maximum-Likelihood avec un intervalle de confiance corrigé des biais de 90%. Les indices d’ajustement du modèle proposés par le logiciel SPSS Amos ne sont cependant pas recalculés suite à l’utilisation de cette procédure de bootstrapping et peuvent être biaisés. Nous nous sommes donc basés sur les indices absolus et incrémentaux les plus robustes disponibles : RMSEA, SRMR, CFI et TLI, en gardant à l’esprit que les valeurs CFI et TLI peuvent être sous-estimées dans notre contexte (Byrne, 2010, p. 329̻ 352).

Pour déterminer l’amélioration du modèle complet de la TPB par rapport au modèle « central » (sans les croyances), nous avons calculé la différence d’ajustement des 2 modèles structurels à l’aide du test de différence delta-Chi2 (Δχ2) dont la significativité était déterminée à l’aide d’une

table du Chi2. En cas de différence significative, le modèle ayant le rapport χ2/ddl le plus faible

était le mieux ajusté (Byrne, 2010, p. 257̻ 271; de Bruijn, Brug, & Van Lenthe, 2009; Matterne, Diepgen, & Weisshaar, 2011). En complément, nous avons suivi la méthode de de Bruijn et al, (2009) consistant à comparer les critères de parcimonie AIC : le modèle ayant le plus petit AIC ayant le meilleur ajustement parcimonieux.

180 Pour tester l’invariance du modèle selon le stade de tabagisme, les 5 modalités tabagiques à T0 ont été regroupées en 2 modalités afin d’avoir un effectif de plus de 200 sujets par groupe, nécessaire à nos analyses. Les modalités : « n’ayant jamais fumé », « ayant juste essayé » et « ancien fumeur » ont été regroupées en « non-fumeur » et « fumeur occasionnel » et « fumeur

quotidien » en « fumeur ».

Le modèle a ensuite été comparé entre les sujets fumeurs et non-fumeurs au moment de leur inclusion, en réalisant une analyse d’équations structurelles multi-groupes (Multi-sample

Structural Equation Modeling) (Arbuckle, 2013; Byrne, 2010, p. 257̻ 274; Nigg, Lippke, &

Maddock, 2009). Cette analyse fournit un indice χ2 d’ajustement basé sur un ensemble de

paramètres d’un jeu de modèles (un pour chaque groupe). L’hypothèse que plusieurs sous- échantillons sont équivalents implique la similarité de tous les paramètres du modèle (appelé « fully constrained » model) entre les différents jeux. Dans cette logique, les différences d’ajustement entre les groupes sont déterminées en « libérant » les paramètres au fur et à mesure. Cela permet aux groupes de varier sur les paramètres « libérés ». Si ces paramètres sont équivalents entre les groupes, l’ajustement du modèle reste équivalent également. Les différences inter-groupales sont donc démontrées lorsque l’ajustement au modèle change en fonction des paramètres « libérés ». Le modèle doit être le même entre tous les groupes et doit donc s’ajuster correctement sur chacun.

La première étape consiste donc à vérifier l’ajustement du même modèle sur tous les sous- échantillons. Ce modèle non-contraint (« unconstrained model ») sert ensuite de base à l’évaluation des modèles de plus en plus contraints, imbriqués les uns dans les autres. Parmi ces modèles, celui servant à comparer les pistes entre les groupes est donc le modèle le plus contraint parmi ceux dont l’ajustement ne diffère pas du modèle non-contraint. Cela permet d’identifier les paramètres ne variant pas entre les groupes puis d’étudier les autres un à un. Nous avons comparé l’ajustement des modèles à l’aide du test Δχ2 et du ΔTLI ≤ 0,05. Nous

181 avons ensuite étudié une à une les différences entre les pistes à l’aide des coefficients critiques de différences (critical ratio for differences), en repérant les seuils de 1,96 et -1,96 pour p ≤ 0,05, de 2,58 et -2,58 pour p ≤ 0,01 et de 3,29 et -3,29 pour p ≤ 0,01.

Analyse de l’efficacité de l’intervention

Afin de répondre à l’hypothèse d’efficacité de l’intervention sur l’évolution entre T0, T1 et T2 des statuts tabagiques, nous avons commencé par regrouper les réponses des anciens fumeurs, des non-fumeurs initiés et de ceux n’ayant jamais fumés afin d’obtenir 3 modalités (« non- fumeur », « fumeur occasionnel », « fumeur quotidien »). Ce regroupement a été nécessaire pour pouvoir prendre en compte l’effet du cluster établissement dans l’analyse tout en conservant des résultats interprétables. En effet, nous avons effectué une régression logistique binomiale à effets mixtes qui permet d’analyser l’effet de plusieurs variables indépendantes sur l’évolution longitudinale d’une variable dépendante binaire, tout en prenant en compte la structure hiérarchique des données (en l’occurrence, les temps d’évaluation sont nichés dans les sujets, ces derniers étant nichés dans un établissement, les établissements étant à leur tour nichés dans un département). Ces analyses ont tout d’abord été menées en comparant non- fumeurs et fumeurs (occasionnels ou quotidiens). Ces analyses ont été répétées pour comparer l’évolution au cours du temps entre : - non-fumeurs et fumeurs occasionnels - non-fumeurs et fumeurs quotidiens - fumeurs occasionnels et fumeurs quotidiens - fumeurs quotidiens et tous les autres.

Pour ces régressions logistiques à effets mixtes, nous avons introduit l’établissement et le sujet comme effets aléatoires (considérant que les établissements et les sujets auraient pu être autres puisqu’ils avaient été affectés aléatoirement par la randomisation). En revanche, nous n’avons pas introduit d’aléa sur le groupe de randomisation (contrôle ou intervention), le département et le temps, qui ont été considérés comme des effets fixes. Au lieu d’estimer un effet individuel,

182 ce type d’analyse s’intéresse à un effet sur l’échantillon des sujets, considérant que ces derniers ont été affectés à un groupe de façon aléatoire, tout comme leur établissement (ce qui répond à la randomisation qui a été réalisée) et que les effets individuels sont aléatoires au sein d’un même groupe. Cette analyse en mesures répétées permet en outre de prendre en compte tous les sujets présents à chaque temps sans exclure ceux n’ayant pas participé à un ou deux temps sur les trois.

Les mêmes paramètres d’effets fixes et aléatoires ont ensuite été utilisés dans un modèle linéaire mixte pour tester l’efficacité de l’intervention sur le critère de niveau de tabagisme récent.

Pour chacune de ces analyses, les variables d’âge, de sexe, de situation financière familiale et le niveau basal du critère choisi ont été introduit dans les modèles en tant que variables d’ajustement, les groupes de randomisation ayant démontré un déséquilibre sur le sexe et la situation financière familiale aux analyses précédentes.

Analyse du rôle de la TPB pour expliquer l’impact de l’intervention

Afin d’évaluer dans quelle mesure l’intervention avait impacté les comportements tabagiques en modifiant les éléments psychologiques sous-jacents synthétisés dans le modèle de la TPB, nous avons utilisé une analyse en pistes causales avec les paramètres identiques aux analyses précédentes pour l’hypothèse 1 (échantillon analysé : n > 200 sujets, sans données manquantes, avec bootstrapping de 2000 échantillons, estimateur Maximum Likelihood, utilisation des RMSEA, SRMR, CFI, TLI).

L’objectif étant cette fois-ci, d’évaluer l’évolution des variables de la TPB de façon longitudinale entre T0 et T1, nous avons utilisé un design d’analyse de type cross-lagged

structural equation model (Berrington, 2006; Hagger, Chatzisarantis, Biddle, & Orbell, 2001;

183 d’estimer la stabilité/variation d’une même variable mesurée à plusieurs temps (effets autorégressifs), ainsi que l’effet que les différentes variables du modèle ont entre elles d’un temps t à un temps t+1 (effets cross-lagged).

Une première étape a donc consisté à vérifier la stabilité ainsi que l’impact réciproque des déterminants de la TPB entre T0 et T1 ainsi que leur impact sur le niveau de tabagisme récent à T1 et T2, auprès des sujets ayant des données à T0, T1 et T2. Durant la seconde étape, la variable « groupe » a été intégrée au modèle afin d’analyser l’effet de l’intervention sur toutes les variables à T1 et sur le niveau tabagique à T2. Durant la dernière étape, la variable « groupe » était remplacée par la variable « complétion de la TPB » dont le score avait été imputé de 0 pour les sujets du groupe contrôle, afin de déterminer si le niveau de complétion permettait de mieux expliquer l’efficacité de l’intervention que la simple affectation à un bras de l’essai. Une analyse similaire, uniquement auprès des sujets du bras intervention ensuite réalisée.

Note explicative concernant la dernière étape d’analyse de la complétion de la TPB :

L’objectif de cette étape de l’analyse consistait à évaluer si les variables cognitives et comportementales visées étaient d’autant plus affectées par l’intervention que la quantité d’éléments TPB était importante. Cela peut donc laisser penser qu’il s’agit de réaliser un test classique d’effet de modération. Ce n’était pourtant pas le cas.

En effet, un tel test de modération consiste à vérifier si deux variables peuvent avoir isolément un effet différent de leur effet combiné (Baron & Kenny, 1986; Rascle & Irachabal, 2001). Cela implique donc que la variable « complétion » devrait avoir un effet sur les variables dépendantes en dehors de la présence de l’intervention. Par exemple, l’efficacité de l’intervention pourrait être modérée par le sexe des participants étant donné que les 2 groupes sont composés à la fois de filles et de garçons. Le test consisterait alors à vérifier si l’intervention a entraîné une différence de tabagisme plus importante entre les filles du groupe intervention et leurs homologues du groupe témoin, par rapport à la même différence observée chez les garçons. Cet exemple appliqué à notre contexte deviendrait alors de vérifier si

184 l’intervention a entraîné des changements entre les groupes, et ce d’autant plus que les sujets étaient des filles, alors qu’il n’y aurait eu que des garçons dans le groupe témoin. Cet illogisme se retrouve du point de vue pratique puisque la méthode statistique de modération nous aurait amené à vérifier dans un premier temps l’effet conjoint des variables « groupe » et « complétion » sur les différents critères, impliquant dès cette étape une très forte colinéarité entre « groupe » et « complétion ». Mais surtout, dans un second temps, nous aurions dû intégrer au modèle une variable représentant l’interaction de ces deux termes, soit la multiplication des scores de groupe (0 ou 1) par ceux de complétion (différant de 0 uniquement pour le groupe intervention). Cette nouvelle variable aurait donc eu une distribution strictement identique à celle de la variable « complétion » elle-même, déjà présente dans le modèle.

Une analyse de médiation n’était pas non plus adaptée pour des raisons similaires, puisque cela serait revenu à vérifier si l’augmentation du score de « groupe » était associée à l’augmentation du score de « complétion » alors même que l’effet de « complétion » n’existe pas sans présence de l’intervention (Baron & Kenny, 1986; Rascle & Irachabal, 2001).

Deux possibilités s’offraient donc à nous :

- analyser l’effet sur l’ensemble de l’échantillon en imputant le score de 0 à la variable « complétion » pour les sujets du groupe contrôle, afin de vérifier la tendance linéaire des critères à évoluer en fonction de la quantité d’éléments TPB impliqués. Le groupe contrôle recevant ainsi une quantité égale à zéro.

- analyser cet effet uniquement sur le sous-échantillon du bras ayant reçu l’intervention.

Si la première alternative peut entraîner un biais de surreprésentation d’une modalité (dans notre cas, le score 0, ce qui conduira donc à surestimer l’erreur α de type I, ou dit autrement à sous- estimer l’effet de la complétion), la deuxième méthode amène à réduire la taille de l’échantillon de moitié. Cette dernière alternative ne permet pas non plus de conclure quant à l’effet ajouté par rapport à l’absence d’intervention. Elle permet par contre de conclure quant à l’effet du niveau de complétion au sein du seul groupe intervention et apporte donc des informations complémentaires (par exemple, si les actions les moins bien implémentées ont un impact délétère et que les mieux implémentées ont un effet bénéfique, un effet linéaire de la complétion sera observable au sein du groupe intervention, mais pas forcément en comparaison du groupe contrôle).

185 Cette question méthodologique renvoie à celle de l’effet d’un traitement en fonction de la dose reçue, dans des essais randomisés de type reduced design, et plus précisément, de sous-type

single-factor design, consistant à comparer un groupe dont un facteur varie d’intensité, face à

un groupe contrôle (pour plus de détails concernant ces questions, y compris dans des essais d’intervention comportementale, voir Collins, Dziak, & Li, 2009; Voils et al., 2014).

Si une variable de la TPB était écartée du modèle analysé, suite à un ajustement incorrect du modèle testé, une régression linéaire hiérarchique était réalisée afin de déterminer l’effet de l’ajout de la variable « groupe » sur l’évolution à T1 de la variable extraite du modèle. Le sexe, la situation financière familiale, le niveau de tabagisme récent et le niveau basal des croyances comportementales, normatives et de contrôle, tous à T0, étaient rentrés dans le premier bloc. La variable « groupe » était ensuite ajoutée au second bloc, afin de déterminer la part supplémentaire de variance expliquée par son introduction. La même opération était ensuite reproduite en remplaçant la variable « groupe » par celle de « complétion de la TPB » imputée du score 0.

Les résultats ont ensuite été comparés entre les sujets fumeurs et non-fumeurs au moment de leur inclusion, en réalisant une analyse d’équations structurelles multi-groupes (Multi-sample

Structural Equation Modeling) (Arbuckle, 2013 ; Byrne, 2010, pp.257-274 ; Nigg, Lippke, &

Maddock, 2008) selon les mêmes modalités que pour l’hypothèse 2.

Toutes les analyses ont été réalisées en intention de traiter (ITT) : chaque participant était analysé dans son bras de randomisation. Elles ont été effectuées à l’aide de SPSS Statistics 20®,

186

Partie III : Résultats

C3PO à Han Solo :

« - Capitaine, les chances de traverser un champ d'astéroïdes avec succès sont approximativement de une sur trois mille sept cent vingt ! - Tu sais, moi et les probabilités... » L’Empire contre attaque, Georges Lucas (1980)

187

1. Caractéristiques de l’échantillon