• Aucun résultat trouvé

des comparaisons efficaces et en d´eveloppant un mod`ele de surveillance afin d’identifier clairement les entreprises qui peuvent avoir besoin d’investigations quand `a leur niveau d’absent´eisme. La m´ethode d’identification et de hi´erarchisation des d´eterminants des arrˆets maladie a permis de produire des r´esultats synth´etiques pour les communiquer aux entreprises mais permet aussi de reproduire ces analyses sur d’autres donn´ees pour les entreprises le souhaitant.

Une attente de Malakoff Humanis et des personnes ayant particip´e `a la mise en place de cet outil ´etait de d´evelopper un moteur de pr´ediction des arrˆets de travail pouvant permettre aux entreprises d’anticiper les mouvements d’absence pouvant impacter leur organisation. Nous avons men´e des tra-vaux utilisant diverses m´ethodes des s´eries temporelles ou de machine learning afin d’analyser les donn´ees agr´eg´ees au niveau de l’entreprise et ces travaux ont toujours men´e `a des r´esultats d´ecevants. R´ecemment, des mod`eles ont aussi ´emerg´es dans la litt´erature scientifique et utilisent des m´ethodes assez r´ecentes d’apprentissage profond sur des donn´ees invididuelles mais surtout plus riches en va-riables explicatives que les nˆotres et ont produit des r´esultats assez moyens [99]. Les arrˆets maladie sont un ph´enom`ene tr`es h´et´erog`enes qui semblent mal se prˆeter `a la pr´ediction. Nous avons tout de mˆeme propos´e quelques travaux pour estimer le risque d’arrˆet maladie `a partir de trajectoires d’ar-rˆets et quelques pistes d’exploration bas´es sur des mod`eles multi-´etats pouvant permettre d’´evaluer la proportion esp´er´ee de salari´e absent dans le temps.

4.3 Limites

Apr`es avoir synth´etis´e nos travaux et avoir d´ecrit leurs applications en pratique, penchons nous plus s´erieusement sur les m´ethodes propos´ees dans cette th`ese pour en identifier les limites.

Hi´erarchisation des facteurs d´eterminants La hi´erarchisation des arrˆets maladie a permis de syn-th´etiser facilement et avec peu d’hypoth`eses les d´eterminants de ces arrˆets. La m´ethode choisie soul`eve tout de mˆeme quelques limites.

Nous avons d´ej`a soulev´e la probl´ematique de l’introduction de la sant´e per¸cue dans le mod`ele. Les arrˆets maladie ´etant pris pour raison de sant´e, il est logique que cette variable soit un d´eterminant important, voire mˆeme le plus important. Dans notre mod`ele, il pourrait plutˆot s’agir d’une variable m´ediatrice que d’une variable vraiment d´eterminante des arrˆets maladie. Cependant, des salari´es

4.3. LIMITES

n´eralement en bonne sant´e peuvent avoir des arrˆets maladie et des salari´es en mauvaise sant´e peuvent ne pas avoir d’arrˆets maladie : en contrˆolant sur la sant´e, nous pouvons donc aussi expliquer ce qui pousse ces salari´es `a prendre ou ne pas prendre des arrˆets, ind´ependamment de leur condition de sant´e initiale. Mˆeme si sa pr´esence dans le mod`ele peut ˆetre discut´e, l’importance de cette variable dans la pr´ediction des arrˆets maladie d´emontre tout de mˆeme que l’indicateur de sant´e per¸cue est un indicateur important pour comprendre l’´evolution des arrˆets maladie : il s’agit de plus d’un indicateur pertinent pour ´evaluer la qualit´e des vie des personnes [100] et suivre la sant´e per¸cue dans le temps pr´esente ainsi de nombreux int´erˆets. Nous pouvons formuler une derni`ere remarque vis-`a-vis de cet indicateur : la sant´e per¸cue, telle que recueillie dans le questionnaire, ne d´ecrit pas la sant´e per¸cue juste avant l’occurrence de l’arrˆet maladie mais plutˆot une sant´e moyenne l’ann´ee o`u a pu avoir lieu cet arrˆet. Le mod`ele ne montre donc pas juste que les arrˆets maladies sont pris lorsque que les gens sont malades mais plutˆot qu’une qualit´e de vie d´egrad´ee va causer plus d’arrˆets maladie.

Un deuxi`eme probl`eme est m´ethodologique : les forˆets al´eatoires sont des m´ethodes puissantes pour la pr´ediction mais ne sont pas des outils tr`es pratiques pour l’explication. Les r´esultats fournis par notre ´etude permettent de hi´erarchiser les d´eterminants selon leur importance dans la classification absent/non-absent mais ne donnent pas d’information sur le sens de l’impact. Le sens de l’impact est souvent ´evident (une mauvaise sant´e d´etermine la prise d’arrˆets maladie) mais ce n’est pas toujours le cas et, parfois, l’impact d’une variable peut interagir avec d’autres variables. Des m´ethodes diff´erentes d’´evaluation de l’importance de variables pourraient ˆetre utilis´ees, comme la m´ethode SHAP [43, 44] qui permet d’´evaluer le sens de l’impact mais aussi les interactions entre les diff´erentes variables. Cette m´ethode est relativement r´ecente et nous n’en avions pas connaissance lorsque nous avons d´evelopp´es nos travaux sur les forˆets al´eatoires. Nous avons cependant essay´e d’explorer ces m´ethodes dans le cadre d’un stage qui ont valid´e notre hi´erarchisation des d´eterminants et qui a confirm´e nos intuitions sur le sens des impacts.

Pr´ediction des arrˆets maladie Nous avons bri`evement trait´e du sujet de la pr´ediction des arrˆets maladie dans notre m´emoire en tentant deux approches bas´ees sur les trajectoires d’absence :

1. Une premi`ere approche a consist´e `a se concentrer sur les variables explicatives du mod`ele en tentant de construire de nouvelles variables bas´ees sur la trajectoire des salari´es puis en utilisant des m´ethodes classiques de pr´ediction en classifiant des salari´es selon leur statut d’absence ;

4.3. LIMITES

2. Une seconde approche a consist´e `a se concentrer sur une mod´elisation multi-´etats pour pouvoir ´evaluer les probabilit´es de transition qui m`enent les salari´es `a l’absence. Ce mod`ele n’est pas `a proprement parler un mod`ele de pr´ediction des arrˆets maladie d’un salari´e mais il peut servir `a estimer le volume d’absence attendu pour une entreprise.

Ces deux m´ethodes ne permettent pas de pr´edire convenablement, pour un salari´e, l’occurrence de nouveaux arrˆets maladie dans un futur proche. Cet objectif semble de toute fa¸con illusoire avec des donn´ees aussi pauvres : des mod`eles sur des donn´ees plus compl`etes ont permis d’atteindre des r´esultats l´eg`erement meilleurs [99] mais toujours pas satisfaisants.

Le mod`ele multi-´etat, bien que rudimentaire tel que pr´esent´e dans ce m´emoire, semble tout de mˆeme bien s’ajuster sur les donn´ees d’absence et pourrait permettre d’anticiper, pour l’entreprise et pas pour le salari´e, des volumes d’absence futur. De nombreuses am´eliorations devraient cependant ˆetre prise en en compte et principalement concernant la mod´elisation probabilit´es de transition. Les transitions sont en effet mod´elis´es par des mod`eles de Cox qui reposent sur une hypoth`ese de risques proportionnelles tr`es contraignantes. Nos donn´ees pr´esentent en effet quelques caract´eristiques qui peuvent aller `a l’encontre de cette hypoth`ese. Premi`erement, beaucoup de salari´es n’auront jamais d’arrˆets maladie ce qui pose le probl`eme des survivants de longue dur´ee [56]. De plus, le risque d’arrˆet maladie n’est pas constant dans le temps mais est saisonnier, ce qui ne peut pas ˆetre capt´e dans le mod`ele de Cox. Nous sommes donc bien conscients que le mod`ele pr´esent´e est assez faible mais il permet tout de mˆeme de proposer un premier brouillon pour anticiper les volumes d’absence.

Surveillance des arrˆets maladie Le m´emoire a pr´esent´e deux ´etudes bas´ees sur la surveillance des arrˆets maladie.

La premi`ere ´etude a consist´e au d´eveloppement d’un algorithme de surveillance pour identifier les entreprises en d´erive d’arrˆets maladie. L’algorithme propos´e est une adaptation des mod`eles de Farrington et Farrington-flexible [18, 75] au cadre de donn´ees multi-sites grˆace `a l’introduction d’effet al´eatoire. Le mod`ele pr´esente des r´esultats similaires au mod`ele Farrington-flexible et permet mˆeme un calcul plus simple des bornes d’alerte. Ce mod`ele pose cependant des probl`emes de calcul puisque le temps de calcul n´ecessaire d’une borne d’alerte semble relativement prohibitif lorsque le nombre de sites `a ´evaluer est grand : nous aurions dˆu, d’ailleurs, ´evaluer plus pr´ecis´ement le temps de calcul n´ecessaire en fonction du nombre de sites, de p´eriodes d’observation et de covariables.

Documents relatifs