• Aucun résultat trouvé

2.3 Trajectoires d’arrˆets maladie

2.3.3 Typologie de trajectoires

L’objectif de cette section est d’identifier les salari´es `a risque d’arrˆets maladie longue dur´ee. Les donn´ees utilis´ees sont tr`es pauvres en variables explicatives et, comme nous l’avons montr´e auparavant, les variables sociod´emographiques sont tr`es insuffisantes pour identifier des salari´es `a risque. Nous allons donc devoir identifier des signaux faibles en travaillant les donn´ees diff´eremment. Nous avons d´ecid´e, dans un premier temps, d’analyser les trajectoires d’absence des salari´es afin d’observer si certaines trajectoires m`enent avec une probabilit´e plus grande vers des arrˆets de longue dur´ee.

2.3.3.1 M´ethode : analyse de s´equences

Afin d’´evaluer si des trajectoires d’arrˆets de travail pourraient mener plus certainement que d’autres vers des arrˆets de longue dur´ee, nous allons proc´eder en trois ´etapes :

Construction des trajectoires d’arrˆet de travail Pour chaque salari´e, nous construisons une trajec-toire d’absence/pr´esence d’un an. Une trajectrajec-toire est d´efinie, dans notre analyse, comme une succession d’´etat absence et pr´esence, chaque ´etat repr´esentant la situation hebdomadaire du salari´e. La situation hebdomadaire est d´efinie comme absence si le salari´e est absent au moins un jour de la semaine ou comme pr´esent sinon.

Pour chaque salari´e, une fenˆetre al´eatoire d’un an est s´electionn´ee sur sa p´eriode de suivi dans la base de donn´ees.

Construction d’une typologie de trajectoires Pour l’ensemble des salari´es ayant eu un arrˆet de plus d’un mois dans les trois mois suivant la fin de l’ann´ee suivie (et donc de la trajectoire construite), nous allons effectuer une classification des trajectoires. Notre objectif est ainsi d’identifier des motifs r´ecurrent de trajectoires d’absence qui pourraient mener vers un arrˆet de longue dur´ee.

2.3. TRAJECTOIRES D’ARRˆETS MALADIE

Afin de construire cette typologie de trajectoire, une matrice de distance entre chaque trajectoire va ˆetre calcul´ee.

La distance choisie est la distance LCS pour Longest Common Subsequence [45, 46]. Nous avons choisi cette m´ethode puisqu’elle permet de conserver la notion de s´equence qui est importante dans nos donn´ees (deux semaines d’arrˆets de travail cons´ecutives n’ont pas le mˆeme sens que deux semaines ´etal´ees entre le d´ebut de l’ann´ee et la fin de l’ann´ee) mais aussi parce qu’elle est plus flexible en d´etectant des similarit´es mˆeme s’il n’y a pas un parfait alignement entre les deux s´eries.

Une classification ascendante hi´erarchique par la m´ethode de Ward [47] sera ensuite effectu´ee afin de regrouper les diff´erentes trajectoires dans une typologie que nous choisirons selon deux crit`eres. Le premier crit`ere est un crit`ere de distance : la distance entre les deux derni`eres classes qui ont ´et´e fusionn´ees ne doit pas ˆetre trop grande. Le second crit`ere est un crit`ere d’interpr´etabilti´e : le nombre de classe doit ˆetre raisonnable pour pouvoir les d´efinir et le nombre de salari´es par classe doit ˆetre assez ´elev´e.

Les analyses sont effectu´ees en utilisant le package TraMineR sur R [45] pour la construction de la matrice de distance et la visualisation des donn´ees et en utilisant le package cluster [48] pour la construction de la typologie. Le calcul de la matrice de distance ´etant tr`es long, nous avons d´ecid´e d’effectuer ces analyses sur un ´echantillon de 2400 salari´es tir´es al´eatoirement.

Evaluation de la capacit´e pr´edictive de la typologie Afin d’´evaluer la pertinence de cette typologie de trajectoire, nous allons ´evaluer la puissance de pr´ediction d’un mod`ele en introduisant cette variable. Nous allons attribuer `a un ensemble de salari´es, ayant des absences de longue dur´ee ou non, ces cat´egories d’absence. Nous tenterons ensuite de pr´edire l’occurrence d’arrˆet de travail de ces salari´es en utilisant un mod`ele de forˆet al´eatoire, comme dans la section pr´ec´edente, en ajustant sur ces cat´egories d’absence mais aussi sur des crit`eres socio´economiques identifi´ees dans les DSN (ˆage, sexe, r´emun´eration, cat´egorie socioprofessionnel et secteur d’activit´e de l’entreprise). Nous ´evaluerons la capacit´e pr´edictive du mod`ele avec et sans les cat´egories de trajectoire grˆace au crit`ere de l’AUC, pr´esent´e pr´ec´edemment.

Pour faciliter les calculs, nous travaillerons `a nouveau sur des ´echantillons de population en utilisant les 2400 salari´es avec un arrˆet long s´electionn´e pr´ec´edemment et un ´echantillon de 6000 salari´es sans arrˆet long.

2.3. TRAJECTOIRES D’ARRˆETS MALADIE

Figure 2.2 – Saut de distances entre deux classes fusionn´ees pour la construction de la classification.

2.3.3.2 R´esultats

Typologie de trajectoire Nous avons construit une typologie de 4 cat´egories de trajectoire d’arrˆet de travail `a partir de cette classification. La distance induite par la fusion de deux de ces classes ´etaient en effet trop grandes comme cela peut ˆetre lu en Figure 2.2. Nous aurions aussi pu choisir une classification en 8 classes selon ce crit`ere mais cela aurait rendu plus difficile l’interpr´etation et, comme nous le verrons plus tard, certaines cat´egories de trajectoires d´ecrivent un nombre d´ej`a faible de salari´es.

Des exemples de salari´es de chacune des quatre cat´egories sont pr´esent´ees en Figure 2.3. Les quatre classes peuvent ˆetre d´ecrites ainsi :

1. Le premier groupe rassemble 88% des salari´es avec des arrˆets de longue de dur´ee et ce sont des salari´es qui n’ont presque pas d’arrˆet l’ann´ee pr´ec´edent leur arrˆet long. Leur arrˆet de travail long pourrait ainsi ˆetre d´efini comme accidentel puisqu’il n’y a pas de signes pr´ecurseurs. Ils repr´esentent 96,4% de la population g´en´erale.

2. Le second groupe rassemble 7,5% des salari´es avec un arrˆet long et d´ecrit des salari´es qui ont un arrˆet maladie dans les quelques mois pr´ec´edents l’arrˆet long. On pourrait d´efinir ces salari´es comme les salari´es ayant eu des signes avant-coureurs d’un arrˆet long. Ils repr´esentent 1,4% de

2.3. TRAJECTOIRES D’ARRˆETS MALADIE

Figure 2.3 – Typologie de trajectoires

la population g´en´erale.

3. 2% des salari´es sont pr´esents dans la troisi`eme cat´egorie qui ressemble des salari´es qui ont d´ej`a eu un arrˆet de longue dur´ee de plusieurs mois avant leur nouvel arrˆet de longue dur´ee. Ce sont des arrˆets qui ont une rechute d’arrˆet maladie de longue dur´ee. Il repr´esente 1,4% des salari´es en population g´en´erale.

4. Enfin, 2,2% des salari´es avec un arrˆet long sont pr´esents dans la derni`ere cat´egorie. Ce sont des salari´es qui sont tr`es souvenr en arrˆet pendant l’ann´ee et l’on pourrait ainsi les d´efinir comme des absents chroniques. Ils repr´esentent 0,5% de la population g´en´erale.

Ces diff´erentes trajectoires montrent des motifs r´ecurrent d’absence parmi les salari´es ayant des arrˆets graves. Cependant, la premi`ere cat´egorie, qui repr´esente 88% de la population g´en´erale, montre que mˆeme les arrˆets de longue dur´ee semblent arriver de mani`ere accidentelle et sans signe avant-coureur.

Puissance pr´edictive de la typologie Nous avons construits deux forˆets al´eatoires : une forˆet al´eatoire avec et une forˆet sans les trajectoires d’absence. L’introduction des cat´egories de trajectoires permettent d’augmenter l’AUC du mod`ele de 0.644 `a 0.651 ce qui est une puissance pr´edictive assez pauvre. Pour rappel, le mod`ele bas´e sur les donn´ees d’enquˆete permettait d’obtenir un AUC de 0.82.

2.3.3.3 Discussion

La description des trajectoires d’absence a permis d’identifier diverses trajectoires typiques qui peuvent mener vers un arrˆet grave. Ces travaux ont surtout permis de mettre en lumi`ere que la

2.3. TRAJECTOIRES D’ARRˆETS MALADIE

plupart des arrˆets graves n’´etaient pas pr´ec´ed´es de trajectoires bien identifiables (ou, tout du moins, que cette m´ethode d’analyse ne permettait pas de les identifier) : la plupart des salari´es ayant un arrˆet de longue dur´ee n’ont pas vraiment d’´ev´enement pr´ecurseur bien que, dans un certain nombre de cas, certaines trajectoires peuvent se dessiner.

La m´ethode utilis´ee apporte quelques ´el´ements d’interpr´etations mais est peut-ˆetre trop restrictive pour notre analyse : en effet, la m´ethode nous contraint `a uniquement regarder une ann´ee d’absence fix´ee alors que nos donn´ees sont parfois tronqu´ees et que nous n’avons pas assez d’historique (ou bien parfois un historique trop grand dont on ne profite pas assez).

Documents relatifs