• Aucun résultat trouvé

4.2.1 Comparaison globale On a s2 Mobs = vM obs 1 27−1 = 0.8003 × 26 = 20.808 et L(C0 − 1) = 2 × 2 = 4 (cf. p.94), d’où le seuil observé approché : peobs = p(χ

2

4 ≥ 20.808) = .00035 (à comparer avec le seuil exact pobs = 50 0003 = 6 × 10−5).

Le test approché conduit à la même conclusion que le test exact.

A titre illustratif, nous avons représenté sur la figure 4.24 la distribution de la statistique S2

M (ici S

2

M = VM× 26). A cette distribution est superposée celle du χ2 à 4 degrés de liberté

Figure 4.24 – Exemple des Races canines, comparaison globale. Distribution de la statistique S2M

(s2Mobs = 20.808) et du χ2 à 4 degrés de liberté (en rouge).

4.2.2 Comparaisons associées à des contrastes orthogonaux

En utilisant le test approché, nous effectuons maintenant la comparaison partielle des groupes 2 et 3 puis la comparaison globale de la réunion des groupes 2–3 et du groupe 1 (comme au paragraphe précédent).

Comparaison partielle des groupes 2 et 3.

Seuil observé approché. On a t2

obs = 27−1 27 × 1 1 9+ 1 8 × d2 Mobs = 26 27× 1 1 9+ 1 8 × 1.017 = 4.147 et

L = 2 (cf. p.109), d’où le seuil observé approché : peobs = p(χ

2

2 ≥ 4.147) = .1257 (à comparer

avec le seuil observé exact pobs = 50 0006303 = .1261).

Le test approché conduit à la même conclusion que le test exact.

A titre illustratif, nous avons représenté sur la figure 4.25 la distribution de la statistique T2 (ici T2 = 27−1 27 × 1 1 9+ 1 8 × D2

M). A cette distribution est superposée celle du χ

2 à 2 degrés

de liberté (en rouge).

Figure 4.25 –Exemple des Races canines, comparaison partielle des groupes 2 et 3. Distributions

(p.110), la zone–limite approchée de compatibilité est l’ellipse de centre O, définie par l’en- semble des points P tels que |−→OP|Y =

s 27 27−1×( 1 9+ 1 8)×5.991 1−(279+278)×279×8 27× 27 27−1×( 1 9+ 1 8)×5.991 = 1.272 (à comparer avec κ = 1.349 obtenu ci–avant).

Figure 4.26 – Exemple des Races canines, comparaison partielle des groupes 2 et 3. Zone de

compatibilité approchée au seuil .95 (κ = 1.272, en violet).

Le point Dobs est situé à l’intérieur de la zone de compatibilité, les points O et Dobs sont compatibles au seuil .05.

Comparaison entre la réunion des groupes 2 et 3 et le groupe 1.

Le seuil du test approché comparant la réunion des groupes 2 et 3 et le groupe 1 est égal à peobs = 2.4 × 10

−4, résultat significatif au seuil .05.

En conclusion, les deux comparaisons à 1 degré de liberté (binaires) associées aux con- trastes orthogonaux (0, 1, −1) et (−1, n2

n2+n3,

n3

n2+n3) permettent de dire que la significativité

du test approché comparant les trois groupes (peobs = .00035) est essentiellement due aux

différences entre les groupes 1 et 2 et entre les groupes 1 et 3.

4.3

Test du bootstrap

Nous effectuons ici le test du bootstrap dans le cas de la comparaison globale.

Nous choisissons de tirer B = 1 000 échantillons bootstrap. Parmi les 1 000 nuages M∗b construits (cf. p.113), il y en a 1 pour lequel la valeur de la statistique V∗ est supérieure ou égale à la valeur observée vobs∗ = 1027 |−−→OG1|2

W+ 9 27| −−→ OG2|2 W+ 8 27 | −−→ OG3|2 W = 2.398 (la distribution

de la statistique de test V∗ est donnée sur la figure 4.27). D’où le seuil observé du test du bootstrap19 : p

obs = 1 0001 = 0.001.

Le test du bootstrap conduit à la même conclusion que le test exact pour lequel

pobs = 6 × 10−5.

19. Afin de s’assurer de la stabilité des résultats obtenus par bootstrap, nous avons effectué 10 tests indépendants dont les seuils observés sont donnés dans le tableau suivant :

Figure 4.27 – Exemple des Races canines, comparaison globale. Distribution de la statistique V ∗

L’absentéisme dans les IEG de 1995 à

2011 : étude statistique de la cohorte

EPIEG

Introduction

Rappelons que cette thèse a été effectuée dans le cadre d’une Convention Industrielle de Formation par la Recherche (CIFRE), mise en place entre le Centre de Recherche en Mathématiques de la Décision (CEREMADE) et le Service Général de Médecine de Contrôle (SGMC) des Industries Electriques et Gazières (IEG).

Les salariés des Industries Electriques et Gazières bénéficient d’un « statut » particulier qui leur confère notamment l’assurance d’un régime spécial de sécurité sociale1. Ce dernier

leur permet de continuer à percevoir un plein salaire dès le premier jour de l’arrêt médical, ceci pouvant se prolonger pendant 5 ans en cas de longue maladie. Les médecins conseils du SGMC sont les garants médico–administratifs de ces prestations, ils ont pour mission principale de vérifier systématiquement le bien fondé de l’absentéisme médical, de décider le placement en longue maladie (LM) ou en invalidité, d’évaluer les séquelles en vue de la réparation des accidents du travail (AT) et des maladies professionnelles (MP) et de défendre l’intérêt des entreprises et des agents dans les accidents avec tiers. Parallèlement à cette activité « métier », le SGMC dispose également d’une cellule santé publique visant à promouvoir des actions favorables à la santé et d’une cellule épidémiologie ayant pour principale mission d’analyser la santé des salariés.

Ce doctorat a été effectué au sein de la cellule épidémiologie. L’activité du SGMC en épidémiologie a été initialement motivée par la singularité du positionnement du SGMC : un « service de sécurité sociale intégré en entreprise ». L’observation des événements de santé entraînant une absence médicale, une indemnisation ou une pension est étudiée pendant toute la période d’emploi de l’agent. La possibilité de mesurer correctement l’incidence des pathologies vient, d’une part, de la connaissance de la population étudiée, et d’autre part, de l’enregistrement de la survenue des pathologies et de leur codage par les médecins conseils. Une base de données épidémiologique est exploitée à la cellule épidémiologie depuis 1978 (cf. Goldberg & al., 1980 [40]). Cette dernière permet de décrire la santé de la population sala-

1. En 2012, la branche des IEG regroupe 156 entreprises de production, de transport, de distribution et de commercialisation de l’énergie en France. Les documents relatifs au statut des IEG (décret n˚46–1541 du 22 juin 1946) sont téléchargeables à l’adresse : http ://sgeieg.fr.

riée des IEG dès les années 1980, au moyen d’indicateurs d’absence médicale (cf. Chevalier & al., 1987 [14] [15] ; Godard, 1987 [37]) ou d’indicateurs divers relatifs aux accidents du travail (cf. Pouplet & al., 1987 [67] ; Luce & al., 1997 [56]), à la mise en longue maladie ou en in- validité (cf. Savelli & al., 1994 [80]), aux maladies professionnelles (cf. Coulondre & al., 1999 [19]), à la mortalité en activité (cf. Poncet & al., 2003 [66]), à l’incidence des cancers (cf. Chevalier & al., 1996 [16]) et des cardiopathies ischémiques (cf. Chevalier & al., 2001 [18]). Ces études ont pour première vocation de surveiller la santé, elles conduisent parfois à orienter la prévention (cf. Godard & al., 2007 [39]). La base de données alimente également les données d’absence relatives aux 20 000 volontaires de la cohorte professionnelle GAZEL depuis 1989 (cf. Goldberg & al., 1991 [41]).

Jusqu’en 2009, les études temporelles fournies par la cellule épidémiologie étaient es- sentiellement des études transversales répétées, effectuées sur données agrégées (cf. Godard (mémoire), 2009 [38] et Gault (thèse), 2009 [34]). Les effectifs étaient calculés à partir des statistiques du personnel (aggrégées), éditées chaque année par les services de ressources hu- maines. En effet, la cellule épidémiologie ne disposait pas de fichiers individuels administratifs harmonisés dans le temps. Pour pallier ce problème, la cellule épidémiologie entreprend en 2009 la création d’une cohorte, baptisée cohorte EPIEG (EPidémiologie dans les Industries Electriques et Gazières). Elle permet de contrôler précisément la population salariale au cours du temps et de suivre les évolutions socio–démographiques de chaque salarié.

Dans la suite de ce chapitre, nous décrivons d’abord la cohorte EPIEG en détaillant notamment les étapes de sa construction. Puis, nous exploitons ces données dans le but d’étudier la santé de la population salariale depuis 1995. Nous appliquons en particulier des méthodes d’analyse des données multidimensionnelles à divers tableaux de données issus de la cohorte EPIEG, que nous construisons spécialement pour étudier l’absentéisme de courte durée et de longue maladie. L’ensemble des analyses permet notamment d’identifier des groupes d’agents sensibles et des pathologies émergentes.

1

La cohorte EPIEG

A la suite d’un protocole de mise à jour des données, initié courant 2008, la cellule épidémiologie dispose, depuis décembre 2009, de fichiers annuels regroupant l’ensemble des données socio-démographiques des salariés présents en décembre des années 1995 à 2009, statutaires, et bénéficiant par conséquent du régime particulier de sécurité sociale des IEG2.

Les fichiers regroupant l’ensemble des salariés ayant quittés les entreprises ainsi que le motif et la date de leurs départs ont également été fournis. C’est à partir de ces données que la cellule épidémiologie entreprend en 2009 la création de la cohorte EPIEG3.

Un travail de gestion de données très conséquent fût nécessaire afin d’harmoniser les données au cours du temps, d’identifier les doublons, de corriger les valeurs erronées/aber- rantes/manquantes, etc4.

Les données des années 2010 et 2011 ont ensuite été ajoutées, elles proviennent des fichiers administratifs des entreprises et du nouveau système d’information du SGMC : Aramis. L’ensemble des sorties de l’emploi de 1995 à 2011 a également été contrôlé rigoureusement5.

2. Contrôle de la sélection des salariés effectué en liaison avec la Direction Informatique et Telecom. 3. Les données de la cohorte EPIEG sont strictement confidentielles.

4. Construction de la base de données effectuée sur une période d’un an par Solène Bienaise et Catherine Godard.

le temps une population définie (la cohorte) et à étudier l’incidence d’un événement, par exemple la survenue d’un problème de santé donné.

Pour cette étude, nous considérons les données de la cohorte EPIEG relatives aux années 1995 à 20116.