• Aucun résultat trouvé

d’association séquentielles

4.2 Préparation des données

Nous utilisons dans ce chapitre les données du Panel suisse de ménages, déjà présentées dans la section 2.7.3. La méthode de sélection de règles d’association séquentielle présentée dans le chapitre précédent se base sur les modèles de durée, également appelés modèles de survie. Ce type de modèle a été développé essentiel-lement dans le but de s’accommoder des individus avec des observations censurées, c’est-à-dire des individus qui, au terme de la période d’observation, n’ont pas en-core vécu l’événement auquel on s’intéresse. Ce type de modèle permet d’éviter la solution la plus simple qui consiste à faire du « listwise deletion », c’est-à-dire d’éli-miner complètement chaque individu pour qui l’événement ne s’est pas produit.

Dans cette application, cette solution n’est pas pertinente puisqu’elle conduirait à ne conserver que les individus ayant subi des événements, ce qui provoquerait un biais important de nos estimations.

Grâce à l’utilisation de ces modèles, l’utilisation de données de panel, qui com-portent un grand nombre de données censurées en raison de l’attrition et de la courte période d’observation, ne pose pas de problèmes particuliers. Il est en ef-fet possible d’intégrer, grâce à la gestion des données tronquées à gauche, tous les individus présents à au moins une vague du panel Suisse de ménage à partir de celle de 2000, ce qui nous donne un total de 14’032 individus, répartis entre 6’473 hommes et 7’559 femmes.

Le lien entre événements de vie négatifs et santé a déjà fait l’objet d’une étude sur les mêmes données par Zimmermann et al. (2006). L’approche est cependant très différente de la nôtre, à la fois d’un point de vue conceptuel et d’un point de vue méthodologique. Dans le travail de Zimmermann et al. (2006), les événements de vie sont inclus dans un modèle de régression logistique comme une variable qui représente le nombre d’événements survenus. En revanche, dans notre analyse, chaque événement exerce une influence propre sur la santé, tout en permettant qu’elle soit conditionnelle à la survenue d’un ou de plusieurs événements. De plus, notre méthode permet de prendre en compte toutes les vagues disponibles grâce au traitement des données censurées.

Evénements retenus Les événements retenus pour l’analyse sont répertoriés dans le tableau 4.1 avec à chaque fois le nom de la variable d’origine dans les données du Panel suisse de ménages, le signe $$ indiquant qu’il s’agit d’une variable que l’on retrouve à chaque vague. Parmi les 14’032 individus ayant répondu à au moins un questionnaire individuel entre 00 et 09, 12’240 ont déclaré avoir vécu au moins un des événements présentés dans le tableau 4.1. Dans la plupart cas, les réponses sont déjà binaire (oui/non) et par conséquent directement utilisables comme des indicateurs de l’occurrence ou non de l’événement.

Néanmoins, trois de ces événements ont été créés à partir de variables qui n’étaient pas dichotomiques. C’est le cas pour l’événement G, créé à partir de la question « Changement d’emploi/employeur durant 12 derniers mois » : les ré-ponses « oui, chez le même employeur », « oui, changement d’employeur, même emploi » et « oui, changement d’employeur et d’emploi » sont considérées comme des changements d’emploi. L’événementH a été créé à partir de la question « Chan-gement dans l’état de santé : 12 derniers mois » : une réponse inférieure à 4 (sur une échelle allant de 0=fortement détériorée à 10=grandement améliorée) est considérée comme une dégradation notable de la santé. Enfin, on considère pour l’événement J, créé à partir de la question « Amélioration ou baisse du niveau de vie », qu’une détérioration sensible du niveau de vie a eu lieu lorsque la réponse est inférieure à 5 (sur une échelle allant de 0=fortement détériorée à 10=grandement améliorée).

év. variable description

maladie P$$L06 Maladie, accident d’un proche

mort P$$L11 Mort d’un proche

fin P$$L16 Fin d’une relation

conflit P$$L21 Conflit avec ou entre des proches probenf P$$L26 Problèmes avec ses enfants educomp P$$E03 Fin d’une formation chemploi P$$W18 Changement d’emploi

degrsanté P$$C03 Détérioration de la satisfaction de santé naiss NBB_$$ Naissance d’un enfant

degrsati H$$H01 Détérioration du niveau de vie TABLEAU 4.1 – Liste des événements retenus

Le tableau 4.2 est un récapitulatif du nombre d’individu ayant déclaré au moins

une occurrence pour chaque événements et en séparant les individus en fonction de leur sexe. Un individu qui a subi plusieurs fois le même événement n’est comptabi-lisé qu’une fois. Le pourcentage par sexe représente la proportion d’individus parmi les individus du même sexe ayant déclaré au moins une occurrence de l’événement.

On remarque que les femmes sont systématiquement plus nombreuses à déclarer un événement, à l’exception des événements « fin de formation » et « changement d’emploi ».

femmes hommes total

maladie 4572 (60.5%) 3331 (51.5%) 7903 (56.3%) mort 4416 (58.4%) 3459 (53.4%) 7875 (56.1%) fin 1987 (26.3%) 1437 (22.2%) 3424 (24.4%) conflit 2365 (31.3%) 1472 (22.7%) 3837 (27.3%) probenf 1689 (22.3%) 972 (15%) 2661 (19%) educomp 1248 (16.5%) 1130 (17.5%) 2378 (16.9%) chemploi 1864 (24.7%) 1656 (25.6%) 3520 (25.1%) degrsanté 1308 (17.3%) 778 (12%) 2086 (14.9%)

naiss 523 (6.9%) 451 (7%) 974 (6.9%)

degrsati 2234 (29.6%) 1736 (26.8%) 3970 (28.3%)

TABLEAU 4.2 – Nombre d’individu avec au moins une occurrence de l’événement, par sexe et total

Le tableau 4.3 présente, dans sa partie gauche, le nombre total d’événements déclarés, chaque occurrence d’un événement étant comptabilisé. Il est important de prendre en compte le léger déséquilibre de l’échantillon en faveur des femmes (53.87% de femmes) dans la lecture des résultats de ce tableau. La partie droite du tableau 4.3 donne une meilleure image des différences dans le nombre moyen d’évé-nements déclarés par chacun des sexes ; on remarque à nouveau qu’en moyenne, les femmes déclarent un plus grand nombre d’événements que les hommes, sauf pour les événements « fin de formation » et « changement d’emploi ». Le nombre moyen d’événements « naissance d’un enfant » est quasiment identique dans les deux cas.

Certains de ces événements doivent être considérés commeexogènes, c’est-à-dire que ceux-ci ne peuvent pas être interprétés comme étant la conséquence d’un autre des événements pris en compte. Ceci concerne notamment les événements qui ne concernent pas directement l’individu mais quelqu’un de son entourage. Ce serait accorder trop de poids au principe des vies liées que de postuler que le fait de chan-ger d’emploi puisse entraîner la mort ou l’accident d’un proche. Ces événements ne seront ainsi considérés que comme de potentiels facteurs de risque mais jamais en tant que conclusion d’une règle. Les événements que nous considérons comme entièrement exogènes sont :

– la maladie ou l’accident d’un proche (maladie), – la mort d’un proche (mort),

– la fin d’une formation (obtention d’un diplôme) (educomp).

Nombre d’occurrence Nombre moyen femmes hommes total femmes hommes total

maladie 10218 6519 16737 1.352 1.007 1.193

mort 8209 6164 14373 1.086 0.952 1.024

fin 2963 2029 4992 0.392 0.313 0.356

conflit 4099 2286 6385 0.542 0.353 0.455

probenf 3077 1580 4657 0.407 0.244 0.332

educomp 1678 1509 3187 0.222 0.233 0.227

chemploi 2726 2404 5130 0.361 0.371 0.366

degrsanté 1827 1036 2863 0.242 0.160 0.204

naiss 691 595 1286 0.091 0.092 0.092

degrsat 3971 2870 6841 0.525 0.443 0.488

TABLEAU 4.3 – Nombre d’occurrence et nombre moyen, par sexe et total

A B C D

A B C D

Figure4.1 – Modèle d’enchainement de risques

Ainsi, même si ces événements sont inclus dans l’extraction automatique des règles d’association, nous avons systématiquement exclu les règles dont ils étaient la conclusion.

L’analyse est menée en deux temps. Premièrement, nous procédons à une ex-traction de règles d’association séquentielle à partir de toutes les sous-séquences ob-tenues préalablement par une fouille de séquences avec un support très bas (1%).

Deuxièmement, nous nous concentrons sur les règles dont la conclusion est une dégradation notable de la satisfaction de la santé et nous nous intéressons aux différences d’impact des événements de vie sur la santé entre hommes et femmes.

Nous nous penchons également sur le rôle modérateur du soutien émotionnel dans l’effet des événements de vie.

Ces modèles sont une manière d’opérationnaliser le modèle théorique de l’en-chaînement de risques présenté dans le premier chapitre. En effet, on s’intéresse à l’enchaînement des événements qui amène à un événement cible. De plus, on permet à chaque événement contenu dans la prémisse de la règle d’influencer directement l’événement de la conclusion : il s’agit par conséquent de la deuxième variante du modèle de l’enchaînement des risques, dont le schéma est reproduit dans la Fig.

4.1) qui est opérationnalisée par cette méthode.