• Aucun résultat trouvé

Chapitre 2. Objectifs et méthodologie

2.3. Méthodologie

2.3.6. Analyses statistiques

Les analyses descriptives et les régressions logistique multiniveau réalisées dans l’étude sont présentées dans cette section.

Analyses descriptives

Tableaux de fréquences

Des tableaux de fréquences du SGA en fonction de chacune des variables explicatives catégoriques ont été produits à des fins exploratoires. Ils ont permis notamment de confirmer le nombre de naissances incluses et exclues de l’étude décrites à la section 2.3.1.

Analyse factorielle exploratoire

Une analyse factorielle exploratoire a été réalisée au début des travaux. Ce type d’analyse a mis en évidence la structure latente de l’ensemble de données combinées (Last, 2001; SAS Institute Inc., 2009a; Yates, 1987). Elle a dégagé trois variables latentes non-observées qui représentent une part importante de la variance partagée dans ces données. Ces variables reflétaient globalement la défavorisation matérielle, la rareté des contacts sociaux et l’origine ethnique. La méthode a calculé ces dernières variables latentes en tant que combinaisons linéaires des variables observées dans le jeu de données, ce qui a permis de réduire le nombre de variables.

Régressions logistique multiniveau

Les analyses de régression univariées et multivariées ont été effectuées pour les deux phases de l’étude, soient celle de l’identification des facteurs de risque contextuels et celle de l’évaluation de l’efficacité des interventions prénatales. Dans les deux cas, des modèles logistiques multiniveau ont été employés : le premier niveau étant le couple mère-enfant et le deuxième, le CLSC. La méthode par « Équations d’estimations généralisées » (GEE (Liang et al., 1986)) a permis de tenir compte de la structure hiérarchique des données. Ainsi, la corrélation entre les variables réponse des individus du même CLSC a été modélisée et des estimateurs de variance corrigés pour cette corrélation ont été produits. Les estimateurs de variance ont été basés sur la corrélation empirique; ils sont donc robustes au choix de structure de corrélation posée a priori51 (Hardin et al., 2002).

Le modèle employé, « modèle GEE des moyennes populationnelles » (« population average GEE model » ou « marginal GEE model ») visait à décrire les changements de moyenne dans la population selon les valeurs des variables explicatives (Hardin et al., 2002). Le « modèle GEE des moyennes populationnelles » offre de meilleures approximations des effets qu’un modèle appelé «°modèle mixte°» qui, en plus, repose sur des hypothèses non-vérifiables à propos de la distribution sous-jacente aux données (Hubbard et al., 2010). Le « modèle GEE des moyennes populationnelles » a été utilisé à l’aide de la procédure Genmod de SAS (SAS Institute Inc., 1999) de SAS). Des rapports de cotes bruts et ajustés pour les variables confondantes ont été calculés avec un intervalle de confiance à 95 %52.

51 S’ils étaient basés sur la corrélation de travail d’indépendance, alors ils seraient les mêmes que ceux issus de

l’ajustement d’un modèle logistique standard.

52 Les analyses du premier article font exception en faisant intervenir des intervalles de confiance à 99 %. Cet article a

Comme l’inclusion de toutes les variables dans des modèles multivariés rendait l’interprétation ardue, les variables des modèles multivariés ont été sélectionées par des méthodes de sélection automatique (backward, best subset ou stepwise). Ces méthodes ont été utilisées parce que les associations entre les variables explorées et le SGA n’étaient pas connues a priori.

Les données individuelles et les mesures agrégées qui étaient manquantes ont été imputées à l’aide de la procédure MI de SAS, procédure basée sur l’hypothèse selon laquelle les données manquantes sont dues au hasard (SAS Institute Inc., 2009b; Truxillo, 2005). Un total de 200 itérations ont été complétées (« burn-in ») avant d’obtenir l’ensemble de données employé. Les estimations issues de l’algorithme expectation-maximization qui maximisaient la densité des données finales ont été utilisées comme données de départ dans une procédure itérative d’imputation par chaîne de Markov de Monte Carlo pour imputer les années de scolarité et le statut de mère née au Canada53. Le nombre d’années de scolarité a été subséquemment catégorisé selon le diplôme obtenu. Dans le cas des mesures agrégées, des proportions ont été imputées à l’aide de l’algorithme expectation-maximization et de la transformation logit54. Elles ont par la suite été catégorisées à l’aide des centiles d’exposition contextuelle (exposition faible, moyenne ou élevée).

Phase 1 : identification des facteurs contextuels

Les variables du contexte social incluses dans les régressions de la première phase des travaux ont été listées à la section 2.3.4. Un seul ensemble de variables individuelles a été employé pour l’ajustement de chacune des variables contextuelles55.

Phase 2 : évaluation de l’efficacité des interventions prénatales

L’information sur les interventions nutritionnelles et psychosociales prodiguées aux femmes éligibles du CLSC (jeunes ou défavorisées) était accessible et incluse dans les régressions de la

53 La proportion de valeurs d’années éducation de la mère et de statut de mère née au Canada imputées est 8,7% et

1,2 % (Tableau 15). L’imputation est basée sur le postulat que les données étaient manquantes au hasard. Ce postulat nous semblait raisonnable, du moins pour la scolarité au niveau du CLSC : il nous semble peu probable que la non-complétion de la scolarité ait eu lieu plus fréquemment dans des CLSC plus défavorisés. Si tel a été le cas, un biais de confusion vers la valeur nulle a pu impacter les résultats.

54 Plus de 5 % des CLSC ont une proportion manquante pour chacune des variables suivantes : proportion de

résidents avec de l’insécurité alimentaire au cours des 12 derniers mois, proportion avec un faible soutien social (soutien concret et soutien émotionnel) et proportion qui qualifie son accès aux soins de santé de “faible” ou “pauvre” (Tableau 15).

55 En effet, l’objectif des travaux ajustés pour les variables individuelles était de présenter des associations

contextuelles ajustées qui étaient comparables pour ensuite identifier quelles étaient les variables contextuelles pertinentes à inclure dans un modèle multivarié au niveau contextuel.

deuxième phase des travaux. Pour ces données, les associations entre le faible poids pour l’âge gestationnel et l’intensité avec laquelle le programme d’intervention était prodigué dans le CLSC ont été évaluées.

Les données disponibles permettaient de comparer la santé des nouveau-nés avant et après l’implantation de l’intervention et de comparer la santé des nouveau-nés ayant eu des interventions prénatales de différentes intensité pour la même période. La deuxième comparaison a été priorisée, car elle garantissait que les femmes aient reçu exactement la même formule de services prénataux et qu’elles aient vécu les mêmes situations socioéconomiques au fil du temps.

Chapitre 3. A study of the association between characteristics

of the CLSCs and the risk of Small for

Gestational Age births among term and preterm

births in Quebec, Canada

3.1. Résumé

Objectif

L'objectif de cette étude était d’investiguer si le contexte social du territoire de résidence est associé au retard de croissance fœtale.

Méthode

Les nouveau-nés de 143 Centres locaux de services communautaires (CLSC) du Québec, 2000- 2008 ont été inclus dans cette étude (n = 667 254). Les caractéristiques sociales ont été obtenues à partir de l'Enquête sur la santé dans les collectivités canadiennes etdu recensement de 2001 et de 2006. Un compromis entre deux méthodes, « pas-à-pas » et « meilleur sous-ensemble », a été utilisé pour sélectionner chaque variable du modèle de régression logistique multivarié.

Résultats

Un risque accru de SGA a été observé s’il y a défavorisation matérielle, présence de sous-groupes selon l’ethnicité, rareté des contacts sociaux ou sédentarité des résidents.

Conclusion

Certaines caractéristiques du CLSC ont été associées au retard de croissance fœtale. Des travaux complémentaires sur le sujet pourraient aider à identifier des groupes-cibles pour l’intervention.

3.2. Abstract

Objectives

The objective of this study was to describe whether the social environment of the territory of residence is associated with foetal growth retardation.

Methods

Newborns from 143 Centres locaux de services communautaires (CLSC) territories of Quebec, 2000-2008 were included in this study (n=667 254). Social characteristics were obtained from the Canadian Community Health Survey and the 2001 and 2006 Canadian census. A compromise between two methods, stepwise and best subset, was used to select variables for multivariate logistic modelling.

Results

An increased adjusted risk of SGA was observed where there was material deprivation, racial isolation, social isolation or sedentary of the residents.

Conclusion

Some CLSC characteristics were associated with foetal growth retardation. Further work on the subject could help to identify groups for intervention.

3.3. Introduction

Interest on how the social environment influences health is growing (1;2). Results of contextual analyses depend on factors investigated, but also on the geographic levels at which they are assessed as well as the type of measurement (3). Generally, the geographic level of the analysis is determined by administrative boundaries (1) even though further health promotion intervention at this level might be questionable.

Studied factors are mostly drawn from censuses although some authors have also used complementary surveys (4). Census-derived variables proxy social processes, whilst surveys provide information more directly; both types of information are useful to study foetal health (5).

Small-for-gestational age (SGA) birth is a proxy of foetal growth retardation. Individuals born SGA are at increased risk of neonatal death and chronic illnesses (6;7). Risk factors of SGA include maternal age, parity, low weight gain, and smoking (6). Contextual factors were reported: socioeconomic deprivation, race, immigration and social isolation (8-11). Almost all of them were census-derived (2). Measures from complementary surveys were used less frequently (2;4;12;13) even though large Canadian surveys are available.

We hypothesized that the social environment of the mothers is associated with weight at birth and that a better knowledge of this environment could help to identify groups for efficient prenatal intervention. Our objectives were to study economic, racial, social and other contextual features of the territories of residence that are widely available in the public health practice in relation to the outcomes of SGA, very small for gestational age (VSGA) and SGA among premature births in Quebec.

3.4. Methods

Study population and setting

The population of this observational study consisted of live singleton births to mothers living in Quebec, Canada from 2000 to 2008. Because survey data from northern territories (Nord-du- Québec, Terres-Cries-de-la-Baie-James and Nunavik) were not comparable to other territories, they were excluded. Births of less than 22 or more than 43 completed weeks of gestational age or with an implausible weight for age according to a criteria table presented in Alexander et al. (14) were also excluded.

Territory definition

Territories were the 143 Centres locaux de services communautaires (CLSC, local community health and social services centres). CLSCs vary in size (average of 46 727 individuals), each being a mix of similar-sized sub-territories (urban, rural). The CLSC is the first level at which Quebec health services and prenatal interventions are organized.

Outcomes

Neonates with a weight for gestational age below the 10th and 5th percentile were identified as SGA and VSGA using the Canadian standard reference (15). SGA births occurring before 37 weeks were qualified as SGA-preterm.

Independent variables

CLSC portraits were drawn from responses to Statistics Canada’s Canadian Community Health Survey (CCHS) (16) and from census profiles. Variables were selected if a link was suspected with birth outcomes and they were of public health interest (Table 1). Individual variables were used in a sensitivity analysis (mother’s age, marital status, parity, academic degree, Canadian- born).

Source of data

Birth certificates from Quebec’s registry of demographic events of 2000 to 2008 were used56.

The CCHS is a cross-sectional survey that has been conducted in four year-cycles (2000-2001, 2003, 2005 and 2007-2008). Those were pooled (17) and CLSC proportion-like values were built using the 100 832 CCHS responses in a logistic regression model that accounted for the sampling design (respondents sampling weights) and controlled for data collection method and cycle effects (16-18) .

Profile values of the CLSC sub-territories (2001 and 2006 census tracts in urban setting and census subdivisions otherwise) were aggregated by CLSC by weighting by number of residents (19).

56

Missing CLSC values from either the CCHS or the census were imputed as implemented in the SAS MI procedure (20;21) (expectation-maximization option, logit transform for proportions).

Table 1. Available variables for CLSC portraits from Census and Survey data and associated latent variable

Variable Latent variable

Census

Proportion of people without high school degree Material deprivation

Mean age

Mean household size Social isolation

Proportion of households of size of one Social isolation

Proportion of immigrants Racial isolation

Mean income Material deprivation

Proportion of people with low income* Social & racial isolation

Proportion of people speaking a non-official language at home Racial isolation

Proportion of people not married Social isolation

Proportion of workers walking or biking to work Type of territory (urban/urban and rural/rural)

Survey

Proportion † having five alcohol drinks on one occasion once a week Proportion † that had food insecurity in the past 12 months

Proportion † eating fruit and vegetables less than five times per day Proportion † with low emotional support (<29 on MOS‡)

Proportion † with low tangible social support (<15 on MOS‡) Proportion † without physical activity in the past 3 months

Proportion † rating their availability of health care as “fair” or “poor”

Proportion † smoking cigarettes daily Material deprivation

Proportion † having someone smoking in home almost every day Material deprivation * According to Statistics Canada’s low income cut-off.

† Those proportions of people are proportion-like values built with the results of a regression on CCHS data (exclude year-cycle and data collection effects).

‡ Medical Outcome Study subscale.

3.5. Statistical Analysis

An exploratory factor analysis was performed to highlight the concepts (latent variables) measured by contextual data. The independent and inappropriately-represented variables (no communality exceeding |0.5|) were removed, and the Heywood method was used when anomalies about communality estimates were encountered (22).

CLSC portraits were linked to births based on the mother’s place of residence. Then, the association between the outcome of SGA and different categories of the exposure gradient was evaluated with logistic regression. The type of CLSC territory was categorized as “rural”, “urban and rural” and “urban” (reference). Other explanatory variables were treated as tertiles (1, 2 and 3, for the lower, middle and upper part of the distribution), with the first tertile being the reference category (except for mean income and mean household size for which third tertile was the

reference). Tertile values yielded results that were easier to interpret than those obtained by using either CLSC proportions or the latent variables resulting from the factor analysis as explanatory variables. Odds ratios (OR) were used to estimate relative risks.57

Table 2. Description of birth data from the 143 CLSC territories

N CLSC

Mean (s.d.) [Min; Max] Total births (no.) 143 4 666 (3 369) [113; 15 819]

SGA (%) 143 8.22 (1.34) [ 2.93; 13.54]

VSGA (%) 143 3.77 (0.74) [ 1.21; 6.56 ]

Premature (%) 143 6.32 (0.92) [ 4.48; 9.32 ]

SGA among preterm (%) 143 9.28 (3.65) [ 0.00; 33.33 ] N: number of CLSC territories.

Univariate model fit yielded crude ORs. Subsequently, a multivariate model was built. For variable selection, a compromise between a stepwise and best subset selection method was used since objections relating to the bias-variance trade off had been brought forth for both methods (23;24). The Schwarz information criterion for the comparison of non-nested models (23;24) indicated the optimal number of variables k from the complete stepwise sequence. We fitted three best-subset models of k, k+1 and k-1 terms. The end model was chosen from the best-subset models that presented an acceptable goodness-of-fit Hosmer and Lemeshow statistic58. The latter was adjusted to SGA as well as to VSGA and SGA-preterm. Each explanatory variable was reported with its underlying latent variable as determined in the factor analysis to facilitate comparisons with other work using either variables or latent variables.

Sensitivity to imputation of the CLSC data, robustness of the results to the addition of individual explanatory variables, sensitivity to the territory definition as well as sensitivity to the final model selection were assessed. For the sensitivity analysis to the territory definition, we incorporated the census variables which were at first aggregated at the sub-territory level (2 368 tract or subdivision areas) to the CCHS variables that were only aggregated at the CLSC level in the

57 Une limite est émise à ce sujet par les auteurs car l’interprétation des rapports de cotes en risques relatifs viole le

postulat d’échangeabilité des groupes d’exposition (Pang et al., 2013).

58Le modèle choisi a été celui qui avait le meilleur khi deux d’ajustement de Hosmer et Lemeshow, parmi les

modèles choisis avec la méthode du meilleur sous-ensemble (3 de 5,3 de 6 et 3 de 7 variables) qui ne rejetaient pas l’hypothèse à priori du bon ajustement du modèle.

model. Robust variances that capture the inter-CLSC variability were used for both the analysis with individual variables and the analysis with the data aggregated at the sub-territory level.

The Commission d’Accès à l’Information du Québec and Université Laval’s Ethics Committee approved this research project. Analysis was carried out using SAS 9.2 MI, FACTOR, LOGISTIC (model selection) and GENMOD procedures (final model fitting). Regression results were considered significant at p < 0.01.

3.6. Results

Participants

Of the 676 165 singleton births, 7 379 were from excluded CLSCs, 850 could not be assigned a CLSC and 682 had no SGA status (163 of those had an implausible birth weight or gestational age), leaving 667 254 births (Table 2). There were on average 8.22 % and 3.77 % SGA and VSGA births on each CLSC territory, illustrating that the importance of SGA has slightly lowered in Canada since the reference scale was built (7;15).

Factor analysis

Three latent variables account for 97.2 % of the total variance in the factor analysis: material deprivation, racial isolation and social isolation (Table 1). Interestingly, mean income and low income belong to different latent variables. Explanatory variables that do not belong to a specific latent variable are referred to as “Social environment variables” in the rest of this text.

Regression

The crude ORs of SGA for the third tertile of each census variable differ from the null value of 1, except for age, marital status and type of territory (Table 3). CLSCs with third tertiles of the variables food insecurity, without physical activity and cigarette smoking from the CCHS have 20 %, 17 % and 11 % higher risks of SGA.

Our variable selection method led to the multivariate model with 7 explanatory variables presented in Table 4. Results on SGA birth show that, with all other variables being adjusted for, CLSCs with middle and important material deprivation have 8 % and 19 % higher risks of SGA. Similar conclusions can be drawn with important racial isolation, important social isolation (variable household of size of one) and high proportion of the variable without physical activity.

Those CLSCs also have higher adjusted risk of VSGA, whilst CLSCs with important material deprivation, important proportion without physical activity and middle access of health care services have higher adjusted risks of SGA-preterm birth.

Table 3. Crude odds ratios of SGA birth according to tertile values of CLSC variables

CLSC territory variable N

(% Imputed)

Category OR [99 % C.I.]

Census*

Without academic degree 143 (0.00) Low prop. [0.04; 0.15] 1.00

Middle prop. [0.15; 0.20] 1.02 [0.94; 1.10]

High prop. [0.20; 0.37] 1.13 [1.02; 1.26]

Age (years) 143 (0.00) Low mean [25.92; 38.30] 1.00

Middle mean [38.30; 40.52] 0.98 [0.89; 1.08]

High mean [40.52; 51.75] 1.08 [0.99; 1.18]

Household size (people) 143 (0.00) High mean [4.45; 2.46] 1.00

Middle mean [2.46; 2.31] 1.02 [0.94; 1.11]

Low mean [2.31; 1.70] 1.14 [1.05; 1.25]

Households of sizes of one 143 (0.00) Low prop. [0.12; 0.26] 1.00

Middle prop. [0.26; 0.30] 1.07 [1.00†; 1.15]

High prop. [0.30; 0.54] 1.20 [1.11; 1.29]

Immigrants 143 (0.70) Low prop. [0.00; 0.01] 1.00

Middle prop. [0.01; 0.05] 0.98 [0.91; 1.06]

High prop. [0.05; 0.62] 1.09 [1.00†; 1.19]

Income ($) 143 (0.00) High mean [28 798; 56 036] 1.00

Middle mean [25 269; 28 797] 1.07 [0.99; 1.15]

Low mean [16 144; 25 268] 1.17 [1.06; 1.29]

Low income 143 (0.00) Low prop. [0.00; 0.07] 1.00

Middle prop. [0.07; 0.09] 1.06 [0.99; 1.14]

High prop. [0.09; 0.26] 1.21 [1.12; 1.31]

Non-official language 143 (0.00) Low prop. [0.00; 0.00] 1.00

Middle prop. [0.00; 0.02] 1.01 [0.92; 1.10]

High prop. [0.02; 0.71] 1.13 [1.03; 1.23]

Not married 143 (0.00) Low prop. [0.44; 0.58] 1.00

Middle prop. [0.58; 0.62] 0.94 [0.84; 1.05]

High prop. [0.62; 0.86] 1.03 [0.94; 1.14]

On foot/biking to work 143 (0.00) Low prop. [0.02; 0.07] 1.00

Middle prop. [0.07; 0.10] 1.07 [1.00†; 1.15]

High prop. [0.10; 0.64] 1.15 [1.04; 1.27]

Type of territory 143 (0.00) Only urban sub-territories 1.00

Rural and urban sub-territories 0.97 [0.90; 1.05]

Only rural sub-territories 0.93 [0.86; 1.02]

N Number of CLSCs; OR Odds Ratio; C.I. Confidence interval. * Variable presented is a proportion unless otherwise mentioned;

Similar ORs were obtained when the model was fitted on SGA with non-imputed data (135 CLSCs). ORs did not change after the inclusion of individual variables59 in the model, and would have been similar had we used other territorial limits. Another plausible final model included tangible social support instead of access to services and physical activity (not shown). ORs resulting from this model were similar to those presented.

Table 4. Crude odds ratios of SGA birth according to tertile values of CLSC variables (continued)

CLSC territory variable

N

(% Imputed)

Category OR [99 % C.I.]

Survey*

Five or more alcohol drinks/one

Documents relatifs