• Aucun résultat trouvé

Chapitre 2: RECENSION DES ÉCRITS

4.3. ANALYSE DES DONNÉES

4.3.3. PLAN D’ANALYSE

Les données colligées ont été saisies à l’aide du logiciel épi-info version 3.4.3. excepté pour les rappels de 24h qui étaient rentrées dans CANDAT 2007, un logiciel intégrant le Fichier Canadien des Eléments Nutritifs, Premières Nations, Inuits et Métis (FCEN), version 2007). L’analyse des données s’est faite à l’aide de la version 9,1 du logiciel « Statistical Analysis Software » (SAS).

Les analyses ont été stratifiées par sexe car, d’après des recherches précédentes, les femmes et les hommes rapporteraient différemment leur IMC (Kuczmarski et al., 2001; Shields et al., 2008), leur alimentation (Braam et al., 1998; Weber et al., 2001) ou même leur perception de l’insécurité alimentaire (Beardsworth et al., 2002; Kiefer et al., 2005).

Comme mentionné plus haut, de nombreux auteurs ont suggéré que les mesures autodéclarées devraient être ajustées si une différence significative était observée entre elles et celles mesurées (Kuczmarski et al., 2010; Shields et al., 2008; Spencer et al., 2002). Cependant dans cette étude, les différences n’étant pas significatives entre les données autodéclarées (environ 70% des participants) et celles mesurées (environ 30% des participants) pour l’IMC (Chan et al., 2011), l’ajustement n’était pas nécessaire.

Pour vérifier s’il n’y a pas eu sous-déclaration généralisée des consommations alimentaires, nous avons comparé les apports énergétiques aux besoins énergétiques quotidiens (Black et al., 1993). Pour cela, nous avons utilisé le facteur de Goldberg, un rapport entre l’apport énergétique moyen total et le métabolisme basal (Black, 2000a), ce dernier ayant été déterminé par les formules de Schofield (Schofield, 1985). Les facteurs de Goldberg calculés dans notre étude (1,17 pour les femmes et 1,20 pour les hommes) sont proches du ratio de 1,35 décrit comme adéquat dans les circonstances de vie normale (Goldberg et al., 1991). Considérant qu’en plus nous avons choisi de ne pas intégrer la consommation d’alcool dans le calcul de l’apport énergétique total (pour les raisons évoquées à la section 2.4.1.1.1.4 portant sur l’alcool), ce qui aurait pu majorer les facteurs de Goldberg, nous avons conclu qu’il n’y avait pas de sous-déclaration majeure et que les données ainsi colligées pouvaient être analysées et les résultats interprétés en toute confiance.

Pour l’analyse des données, nous avons suivi les cinq étapes présentées ci-après:

4.3.3.1. Analyses univariées et bivariées

Dans des premières analyses descriptives, des tests préliminaires de signification ont été réalisés. Nous avons croisé successivement les trois niveaux d’excès de poids (variable dépendante) avec toutes les variables indépendantes, c’est-à-dire de la QA, de l’IA incluant l’accès aux AT, et les variables sociodémographiques et du mode de vie, potentiellement confondantes ou explicatives du modèle conceptuel. A cette fin, la statistique chi-carré de Pearson a été utilisée pour la QA et l’IMC, les variables indépendantes étant catégorielles (Downs et al., 2009; Straume et al., 2002). La procédure ANOVA a été utilisée pour les tableaux de contingence afin de vérifier la distribution des variables de la QA selon les groupes d’IA et d’accès aux AT.

Les valeurs p calculées ont permis d’identifier les associations bivariées, au seuil de 0,15 (Bouyer et al., 1995; Mickey et Greenland, 1989). Bien que plus élevé que les seuils conventionnels de 0,01 ou de 0,05, ce seuil a été choisi afin de minimiser le risque d’erreur du type 2 dans la sélection des variables (Mickey et Greenland, 1989). Certains auteurs suggèrent même le seuil de 0,20 ou plus; en effet, en utilisant les seuils conventionnels de signification, des variables importantes de confusion risqueraient de ne pas apparaître dans le modèle final (Greenland, 1989). Ces dernières ont donc été forcées dans les modèles.

4.3.3.2. Régression logistique (IMC*QA)

Nous avons ensuite procédé aux analyses multivariées. Ainsi, les différentes dimensions de la QA ayant montré une association avec l’IMC en analyses bivariées ont été introduites comme variables indépendantes dans des modèles de régression logistique (Tarasuk et Beaton, 1999) avec l’embonpoint ou l’obésité comme variables dépendantes, et des facteurs démographiques (l’âge, l’éducation, la taille du ménage, l’emploi, le RDM) et du mode de vie (l’activité physique, le tabagisme, le régime amaigrissant, la participation aux activités traditionnelles), comme facteurs explicatifs ou de confusion potentiels (Guo et al., 2004) (Hypothèse 1).

Des rapports de côtes significatifs permettaient de prédire les associations entre les variables de la QA et l’embonpoint ou l’obésité (Panagiotakos, 2008), à travers des modèles simples ou de base, ajustés seulement pour l’âge et les écozones, et des modèles complets, ajustés pour toutes les variables explicatives ou de confusion potentielles. La vraisemblance des modèles, c’est-à-dire leurs capacités à prédire les associations entre la variable dépendante et les variables indépendantes, était estimée sur base du ratio de vraisemblance (Likelihood ratio ou LR), mesure qui prend en compte le nombre de paramètres du modèle et sa capacité à reproduire les données (Robins et Greenland, 1986).

4.3.3.3. Analyses MANOVA (IA*QA)

Dans cette troisième étape, l’IA a été croisée avec la QA (Hypothèse 2). Conformément au modèle conceptuel, il s’agissait d’étudier les associations des variables sélectionnées pour la QA (variables dépendantes, en continu), en fonction du niveau d’IA (Variable indépendante, catégorielle). La procédure ANOVA (ici le MANOVA suite à la multiplicité des variables dépendantes) a été utilisée pour évaluer les différences entre les groupes pour les variables continues (Downs et al., 2009). Les valeurs p associées aux moyennes ajustées ainsi obtenues ont permis d’identifier des aspects de la qualité de l’alimentation qui seraient liés, modifiés ou coexistant avec l’insécurité alimentaire.

Comme pour l’étape précédente, nous avons construit des modèles MANOVA simples ou de base (ajustés seulement pour l’âge et les écozones) et complets (ajustés pour les variables sociodémographiques et du mode de vie sélectionnées).

4.3.3.4. Analyses MANOVA (Accès aux AT*QA)

L’étape 3 (Hypothèse 2) a été reproduite pour étudier les changements dans les variables de la QA (variables dépendantes, en continu) en fonction de l’accès des ménages aux aliments traditionnels (Variable indépendante, catégorielle). Des modèles MANOVA simple (ajustés pour l’âge et les écozones) et complet (ajustés pour les variables sociodémographiques et du mode de vie sélectionnées) étaient également décrits.

4.3.3.5. Régression logistique (IMC * (QA+IA+Accès aux AT))

Enfin, l’IA et son complément, l’accès aux AT, ont été introduits comme variables indépendantes dans le modèle de régression logistique de l’IMC (variable dépendante) en fonction de la QA, avant de terminer par l’inclusion des variables potentiellement explicatives de l’IA (Hypothèse 3). Des rapports de côtes significatifs permettaient de prédire les associations entre les variables de la QA et de l’IA et l’excès de poids (embonpoint et obésité), à travers des modèles simples ou de base, ajustés seulement pour

l’âge et les écozones, et des modèles complets, ajustés pour toutes les variables explicatives ou de confusion potentielles sélectionnées.

En lien avec les effectifs, deux niveaux de comparaison ont été définis pour l’IMC, la catégorie normale étant prise comme référence: « normal contre embonpoint » et « normal contre obésité». De même, les classes d’insécurité modérée et grave ont été regroupées en une seule catégorie (Stuff et al., 2004; Tarasuk, 2001), conduisant à deux groupes distincts, les individus normaux ou en sécurité alimentaire, et ceux en insécurité alimentaire, un seul niveau de comparaison a été retenu, en l’occurrence « Sécurité alimentaire contre Insécurité alimentaire ». Pour les raisons mentionnées plus haut, l’IA chez les enfants n’était pas étudiée séparément de celle chez les adultes (Willows et al., 2009).

Au cours des analyses multivariées, tous les modèles de base ont été ajustés pour l’âge et les strates géographiques ou écozones (Beydoun et Wang, 2008). Les résultats des analyses multivariées sont présentés en termes de rapports de côtes avec leurs intervalles de confiance à 95%, les catégories de référence ayant été attribuées la valeur 1 (Roos et al., 1998). Pour la régression logistique le test du ratio de vraisemblance était utilisé pour tester l’effet de l’ajout d’une nouvelle variable au modèle et pour mesurer l’importance des facteurs inclus dans un modèle, comparé au modèle de base ajusté seulement pour l’âge et les écozones (Roos et al., 1998). La statistique R2 ou coefficient de détermination indique la proportion de la variation totale de la variable dépendante due au modèle de régression choisi. Pour les MANOVA, la valeur p associée au coefficient de Wilks- Lambda (WL) était utilisée pour estimer la validité du modèle.

Dans une étape supplémentaire, pour tenter de distinguer les associations causales de celles non causales, nous nous sommes référés aux critères suivants proposés par Hill en 1965: la force de l’association, la consistance, la spécificité, la temporalité, le gradient biologique ou effet dose-dépendant, la plausibilité biologique, la cohérence, l’évidence

expérimentale et l’analogie (Rothman et Greenland, 2005). Il est vrai qu’il n’existe aucun critère absolu pour la validité de l’évidence scientifique, mais selon Rothman et Greenland (2005), il reste possible d’évaluer la validité de l’étude. Certains auteurs prônent plutôt une approche déductive visant une évaluation quantifiée de l’erreur totale affectant l’étude (Rothman et Greenland, 2005) ou transformant ces critères en tests déductifs des hypothèses causales (Weed et Gorelic, 1996) au lieu d’appliquer seulement une liste des critères, mais certains autres continuent à promulguer ces critères comme aide à l’inférence causale (Susser, 1991), ce qui nous a motivé à les utiliser dans cette étude pour établir une présomption de causalité. Nous avons choisi les trois critères jugés principaux (la force de l’association, la consistance et la plausibilité biologique); les deux supplémentaires (la temporalité et le gradient biologique) sont parfois évoqués, sachant toutefois qu’ils ne peuvent pas être établis dans une étude transversale (Hennekens et al., 1998) mais qu’il est possible de s’en rapprocher, comme dans le cas de la relation entre le régime amaigrissant et l’IMC.

Les résultats de ces analyses sont présentés sous forme de tableaux, dans le chapitre 5 plus bas, séparément pour les femmes et les hommes.