• Aucun résultat trouvé

Gestion et description des données .1 Saisie et traitement des données

Dans le document en fr (Page 89-92)

Matériels et méthodes

II.4 Gestion et description des données .1 Saisie et traitement des données

Les données de chacun des enfants sont anonymisées par deux numéros distincts, l’un attribué au moment de l’inclusion par l’enquêteur et l’autre attribué par incrémentation automatique au niveau de la base de gestion de la cohorte lors de l’enregistrement de l’enfant par l’équipe administrative.

Les données des questionnaires sanitaires et environnementaux sont saisies par la cellule adminis-trative de la DASES sur le logiciel EpiData R. Tout au long de la saisie des données, des contrôles aléatoires sont réalisés afin d’évaluer la qualité de saisie, qui s’est avérée très satisfaisante. Les fichiers sont ensuite adressés au laboratoire de Santé publique et environnement (EA 4064) où est réalisé l’ensemble de l’exploitation statistique des données. Pour cela, les informations sont exportées au format STATA R.

Les données relatives aux mesurages des différents polluants ont été saisies par le LHVP sur un fichier Excel R et l’ensemble de ces données a été validé par un ingénieur hygiéniste du LHVP. Les prélèvements non effectués, ininterprétables ou non correctement réalisés ainsi que les analyses non validées sont traités en tant que données manquantes. La moitié de la valeur de la LD a été attribuée aux échantillons dont le niveau de polluant était non détectable.

L’exploitation statistique des données a été conduite avec le logiciel STATA R, version SE 11.1, le logiciel R 2.13[266]et le logiciel WinBUGS 1.4[267].

II.4.2 Analyse descriptive des données des investigations environnementales et de la cohorte PARIS

II.4.2.1 Cadre et mode de vie des enfants de la cohorte

Les caractéristiques des logements, du cadre et du mode de vie sont résumées pour les variables quantitatives par leur moyenne et l’écart-type associé (présenté entre parenthèses). Pour les variables qualitatives, la répartition des logements et des individus sera donnée par modalité et sera illustrée par des graphiques tels que des histogrammes.

Afin d’évaluer la représentativité des logements de l’investigation environnementale par rapport aux autres logements de la cohorte PARIS, leurs caractéristiques qualitatives seront comparées à l’aide du test du Chi-2 et par le test t de Student pour les variables quantitatives.

II.4.2.2 Niveaux de pollution dans les logements de l’investigation environ-nementale et les crèches

Pour les deux investigations environnementales, logements et crèches, la proportion d’échan-tillons présentant des niveaux en polluants détectables est déterminée et les distributions des niveaux des polluants sont décrites.

La normalité des distributions, avec ou sans transformation mathématique (logarithmique, inverse, inverse de racine carrée, etc.), des niveaux de polluants est évaluée par le test de Shapiro-Wilk et par la méthode graphique de la droite de Henry. Les distributions étant la plupart du temps asymétriques sans transformation, les niveaux des polluants sont résumés par leurs moyennes géométriques (MG) et l’écart-type géométrique associé (ETG) ainsi que par la médiane, l’étendue interquartile (EIQ : écart entre le premier et le troisième quartile) et les percentiles. Les distributions des niveaux des polluants sont illustrées par des boîtes à moustaches résumant quelques caractéristiques de position, telles que la médiane et l’EIQ.

Afin d’étudier la répétabilité des mesures, les distributions des duplicats sont comparées par le test t de Student apparié. Les corrélations entre les séries de duplicats sont évaluées par le

II.4.2. Description des données des investigations environnementales et de la cohorte 63

coefficient de corrélation de Pearson (r). De plus, la concordance entre les deux séries de mesures est appréciée par le coefficient de corrélation intra-classe (CCI)[268].

L’étude de la variabilité des niveaux entre les visites est évaluée à l’aide du calcul du rapport de la variance intra-logement sur la variance inter-logement et du CCI.

Cette analyse est réalisée à l’aide d’un modèle linéaire mixte où le logement est modélisé comme un effet aléatoire :

Modèle 1 : effet aléatoire « logement »

Yij = g(Xij) = µy+ βi+ εij (1)

avec Xij, la concentration du polluant mesurée à la jème répétition dans le logement i, µy, la moyenne des niveaux des polluants (selon la transformation g), βi∼ N (0, σ2b)et εij ∼ N (0, σw2). Le modèle estime respectivement la variance intra-logement (σ2

w) et inter-logement (σ2 b).

La contribution de la saison à cette variabilité intra-logement est évaluée en intégrant, comme effet fixe, la saison dans le modèle mixte suivant :

Modèle 2 : effet aléatoire « logement » et effet fixe « saison »

Yij = g(Xij) = µy+

3

Ø m=1

δm1m+ βi+ εij (2)

avec δm, le coefficient de régression associé à la variable indicatrice saison1m définie par : 1m =

I

1 si on se place dans la saison m

0 sinon

Les saisons sont définies en regroupant les mois suivants : janvier-mars, avril-juin, juillet-septembre et octobre-décembre, βi ∼ N (0, σb2)et εij ∼ N (0, σw2).

En utilisant les variances intra-logement estimées par les deux modèles (1) et (2) :σâ2w(1)et â

σ2w(2), la variabilité associée à la saison est, selon Rappaport et coll. [269]:σâ2s =σâw(1)2 -σâw(2)2 . Il définit la contribution saisonnière à la variabilité intra-logements par le ratio (exprimé en pourcentage) : RRapp= âσ2 s â σ2 w(1) .

Enfin pour chacun des polluants, un niveau annuel sera défini comme étant la moyenne des deux niveaux saisonniers (niveaux en saison froide, mesures réalisées entre octobre et mars et niveaux en saison chaude, entre avril et septembre) afin d’étudier via une modélisation un niveau de pollution reflétant une année d’exposition au polluant. La corrélation entre ces niveaux annuels est évaluée par le coefficient de corrélation de Spearman.

Pour les enfants gardés en crèche au cours de leur première année, les niveaux annuels dans ces lieux de garde sont comparés aux niveaux annuels domestiques par le test non paramétrique de Wilcoxon.

II.4.2.3 Évaluation de l’exposition à la FTE : comparaison des mesurages et des informations recueillies par questionnaires

La nicotine, indicateur de la FTE, fait l’objet d’une analyse spécifique en vue de valider les informations recueillies par questionnaire dans le cadre de la cohorte. Cette analyse se justifie par le fait que certains auteurs ont montré une sous-déclaration du tabagisme chez des jeunes

64 Gestion et description des données

parents[270,271]. Pour cette analyse, la présence de fumeur(s) au domicile et la quantité de cigarettes fumées seront comparées aux niveaux de nicotine retrouvés dans le logement à l’aide de tests non paramétriques tels que le test de Kruskal-Wallis et le test de corrélation de Spearman. La variable « présence d’au moins un fumeur régulier au domicile » définie sur l’année sera croisée avec la variable dichotomique des niveaux quantifiés (oui/non) de nicotine afin d’en évaluer la sensibilité, la spécificité et les valeurs prédictives positive et négative.

II.5 Modélisation des concentrations domestiques annuelles en

Dans le document en fr (Page 89-92)