Article
Reference
Techniques de régression pour l'analyse des facteurs de risque de chute
HERRMANN, François, PETITPIERRE, Nicolas Julien
Abstract
La nature récurrente de l'événement « chute » constitue un paradigme permettant de décrire un large éventail de techniques d'analyses statistiques classiques. Le choix du modèle à utiliser dépend d'abord de la question de recherche, qui détermine le dessin de l'étude et le type de la variable dépendante. En effet, ce type peut être, soit binaire (chuteur ou non-chuteur), soit catégoriel ordonné (non-chuteur, chuteur unique ou récidiviste), soit continu indépendant du temps (nombre de chutes sur la période d'observation), soit encore dépendant du temps (date et heure de chaque chute), et détermine ainsi le modèle de régression correspondant : soit respectivement, logistique, polytomique ordinale, de Poisson ou binomiale négative et modèle de Cox modifié selon Andersen-Gill, ou bien les modèles linéaires généralisés qui peuvent être appliqués en toutes circonstances. Ces modèles sont illustrés et commentés à partir de l'analyse de 7 795 chutes collectées en routine durant une période de 10 ans, lors de 23 966 séjours dans un environnement hospitalier universitaire gériatrique. Les [...]
HERRMANN, François, PETITPIERRE, Nicolas Julien. Techniques de régression pour l'analyse des facteurs de risque de chute. Annales de gérontologie , 2009, vol. 2, no. 4, p. 225-229
Available at:
http://archive-ouverte.unige.ch/unige:27502
Disclaimer: layout of this document may differ from the published version.
François R. Herrmann Nicolas J. Petitpierre Département de Réhabilitation et Gériatrie, Hôpitaux Universitaires de Genève et Université de Genève, Suisse
<francois.herrmann@hcuge.ch>
Tirés à part :F. Herrmann
Techniques de régression pour l ’ analyse des facteurs de risque de chute
Résumé ■
La nature récurrente de l’événement « chute » constitue un paradigme permettant de décrire un large éventail de techniques d’analyses statistiques classiques.Le choix du modèle à utiliser dépend d’abord de la question de recherche, qui détermine le dessin de l’étude et le type de la variable dépendante. En effet, ce type peut être, soit binaire (chuteur ou non-chuteur), soit catégoriel ordonné (non-chuteur, chuteur unique ou récidiviste), soit continu indépendant du temps (nombre de chutes sur la période d’obser- vation), soit encore dépendant du temps (date et heure de chaque chute), et détermine ainsi le modèle de régression correspondant : soit respectivement, logistique, polytomique ordinale, de Poisson ou binomiale négative et modèle de Cox modifié selon Andersen-Gill, ou bien les modèles linéaires généralisés qui peuvent être appliqués en toutes circon- stances. Ces modèles sont illustrés et commentés à partir de l’analyse de 7 795 chutes collectées en routine durant une période de 10 ans, lors de 23 966 séjours dans un environ- nement hospitalier universitaire gériatrique. Les résultats produits par les différents types de régression sont proches : le risque de chute est augmenté de 1,2 à 1,5 fois chez les hommes et s’accroît de 1,2 à 2,6 % pour chaque année d’âge.
Mots clés
chute, facteurs de risque, humain, régression, sujet âgéL
a démarche épidémiologique repose sur les postulats que les problèmes sanitaires ne surviennent pas aléatoi- rement et qu’il est possible de mettre en évidence des facteurs de risque par la comparaison de groupes d’individus.Si les méthodes d’analyse classiques peuvent révéler des asso- ciations statistiques entre variables dépendantes et facteurs de risque, le caractère étiologique de ces derniers ne peut être confirmé que par l’application des critères de causalité de Bradford Hill [1].
Les facteurs de risque de chutes, qu’elles surviennent à domi- cile, en établissement médicaux sociaux ou en milieu hospita- lier, font l’objet de nombreuses publications faisant appels à différentes méthodes statistiques [2-4]. La nature récurrente de l’événement « chute » constitue un paradigme permettant de décrire un large éventail de techniques d’analyse statistique classiques. En effet, suivant l’unité statistique considérée (patient ou séjour hospitalier), la variable dépendante étudiée peut être soit :
–binaire (non-chuteurversuschuteur) ;
–catégorielle ordonnée (non-chuteur, chuteur unique, chuteur récidiviste) ;
–continue indépendante du temps (nombre de chutes sur la période d’observation) ;
–dépendante du temps (date et heure de chaque chute ou de la survenue d’une fracture).
Le type de l’unité statistique détermine le modèle de régression correspondant, soit respectivement :
–régression logistique ;
–régression logistique polytomique ordinale ; –régression de Poisson ou binomiale négative ; –modèle de Cox modifé selon Andersen-Gill.
L’objectif de ce travail est donc de décrire, en termes simples, les méthodes statistiques permettant de répondre à différentes questions cliniques en relation avec les chutes et d’illustrer leur interprétation sur les données collectées par un observa- toire hospitalier des chutes [5].
Méthodologie
Il s’agit d’une étude cas-témoins rétrospective, sur une durée de 10 ans, réalisée à partir de données collectées prospective- ment en routine.
Source des données
En ce qui concerne la description des chutes, les calculs sont basés sur l’ensemble des événements survenus entre le 1erjanvier 1997 et le 31 décembre 2006. Afin de n’avoir que des séjours complets pour l’analyse, ne sont considérés que les patients sortis de l’Hôpital des Trois-Chêne, un établissement de 298 lits faisant partie du Département de réhabilitation et gériatrie des Hôpitaux universitaires de Genève, en Suisse.
Les bases de données concernant les chutes sont tirées du
doi:10.1684/age.2009.0078
formulairePrévention des chutes du patient de notre départe- ment, rempli systématiquement par le personnel infirmier et médical lors de chaque constat de chute et informatisé [5].
Statistiques
Tous les modèles de régression ont comme variables indépendan- tes le sexe (codé de manière binaire : femme = 0 ; homme = 1) et l’âge à l’admission exprimé en années. Le fait que les chutes surviennent de manière récurrente chez un même patient a été pris en compte dans chacun des modèles.
–L’issue binaire (séjour sans chute versusavec chute) a été analysée par régression logistique (modèle 1 ; m1), permettant l’obtention des odds ratios (rapport de cote), et par un modèle linéaire généralisé (modèle 2 ; m2), qui permet d’obtenir direc- tement une mesure du risque relatif.
–L’issue ordinale (séjour sans chuteversusavec chute unique versus multiples) a été analysée par régression logistique ordinale (modèle 3 ; m3), permettant l’obtention d’odds ratios (rapport de cote).
–L’issue ordinale (nombre de chutes sur la période d’observa- tion) a été analysée par régression de Poisson (modèle 4 ; m4) et par régression binomiale négative avec (modèle 5 ; m5) et sans ajustement (offset) (modèle 6 ; m6) par le logarithme naturel de la durée de séjour.
–L’issue binaire à occurrence multiple et dépendante du temps (date et heure de chaque chute) a été analysée par régression de Cox (ou modèle de régression à taux relatifs de décès proportionnels de Cox) modifié selon Andersen-Gill (modèle 7 ; m7) [6].
Les moyennes sont présentées avec écarts types. Toutes les analyses et les graphiques ont été réalisés à l’aide du logiciel Stata® version 10.1 [7]. Le tableau 1 présente les variables dépendantes, leurs unités statistiques et la syntaxe des com- mandes pour chaque modèle.
Résultats
Durant la période de 10 ans, objet de l’étude, 13 949 patients ont réalisé 23 966 séjours complets. Les patients étaient majoritaire- ment de sexe féminin (70,9 % en moyenne) et ce, de manière croissante. L’âge moyen à l’entrée était de 84,3 ± 7,1 ans (84,9 pour les femmes et 83,1 pour les hommes). Les âges extrê- mes variaient entre 60,6 et 103,8 ans pour les hommes et entre 59,0 et 105,5 ans dans la population féminine. Sur les dix ans, l’âge moyen des patients a discrètement augmenté, mais de manière significative (p< 0,001). La durée de séjour moyenne sur dix ans était de 42,5 ± 46,0 jours, alors que la médiane se trouve à 29,0 jours. Sur l’ensemble des séjours complets consécu- tifs, 4 651 (soit 19,41 %) ont été marqués par une chute ou plus.
Letableau 1montre, dans sa troisième colonne, les effectifs de chaque unité statistique, alors que letableau 2affiche les résul- tats produits par les différents types de régression : l’estimation du risque de chute est augmentée de 1,2 à 1,5 fois chez les hommes par rapport aux femmes et s’accroît de 1,2 à 2,6 % pour chaque année d’âge en plus. Lafigure 1présente la proba- bilité prédite par chaque modèle respectif d’être chuteur (m1, m2), d’être un chuteur unique ou multiple (m3), de subir un nom- bre de chutes donné (m4 et m5) en fonction de l’âge et du sexe.
Discussion
Les résultats produits par les différents types de régression sont relativement similaires en raison de la taille importante du collectif.
Déterminants du risque de chuter
Afin de répondre à la question« quels sont les déterminants du risque de chuter ? », deux choix d’analyses sont possibles. Dans une étude, où les données sont collectées prospectivement
Tableau 1. Variables dépendantes, unités statistiques, effectifs (N), modèle de régression et syntaxe.
Variable dépendante Unité statistique
de la variable dépendante
N Modèle
No
Modèle de régression Syntaxe de commande1
Binaire Séjour sans chute 19 315 m1 Logistique logistic nbchuteb sexe ageentree,
cluster(nopatient)
Séjour avec chute 4 651 m2 Modèle linéaire
généralisé glm nbchuteb sexe ageentree, family(bin) link(log) eform vce(cluster nopatient) Ordinale Séjour sans chute 19 315 m3 Logistique ordinale ologit nbchute2 sexe ageentree , or
cluster(nopatient) Séjour avec chute unique 3 033
Séjour avec chutes multiples 1 618
Discrète Nombre de chutes 7 795 m4 Poisson poisson nbchute sexe ageentree ,
irr cluster(nopatient)
m5, m6 Binomiale négative nbreg nbchute sexe ageentree , irr cluster(nopatient) offset(logdursj) Binaire dépendante
du temps
Date et heure des chutes 23 966 m7 Cox modifié selon Andersen-Gill
stset tbf3, fail(nbchuteb==1) exit(time .) id(nopatient) enter(time 0) ///
stcox sexe ageentree, vce(cluster nopatient)
1Stata®version 10.1 pour l’obtention des divers modèles de régression [7].
FRANÇOISR. HERRMANN, NICOLASJ. PETITPIERRE Ann Gerontol 2009 ; 2(4) : 225-9
comme c’est le cas ici, le modèle linéaire généralisé, paramétré pour donner des risques relatifs, est à préférer car les odds ratios obtenus par régression logistique ont tendance à surestimer le risque réel si la prévalence de l’événement excède 10 % [8].
Dans une étude cas-témoins, la régression logistique est alors le seul choix valide.
Déterminants du risque de chuter une fois ou plus
Pour répondre à la question «quels sont les déterminants du risque de chuter une fois ou à plusieurs reprises ?», le modèle logistique ordinal est le seul existant.
Déterminants du nombre de chutes
La réponse à la question « quels sont les déterminants du nombre de chutes ? » peut être obtenue par un modèle de régression de Poisson. Toutefois, ce dernier n’est valide que si la moyenne du nombre de chutes est égale à sa variance.
Si cette dernière, qui mesure la dispersion des résultats, est plus grande que la moyenne, comme c’est le cas dans notre collectif (moyenne 0,325, variance 0,792 chutes par séjour), le modèle binomial négatif permet d’obtenir un résultat d’autant plus correct qu’il est possible de l’ajuster(offset)pour la durée d’observation, ce qui est souhaitable pour l’analyse d’un événement récurrent. En effet, la probabilité d’observer un événement augmente avec la durée d’observation.
Vitesse de chute
Enfin, le modèle de régression de Cox modifié selon Andersen- Gill pour tenir compte de la répétition des événements permet d’adresser la question «À quelle vitesse les patients vont-il chuter ?» [6]. Il s’agit du modèle qui utilise toute l’information disponible et donc le plus précis. Pour qu’il soit valide, il faut néanmoins s’assurer que le risque instantané est bien
proportionnel. En raison de la répétition des événements, la représentation graphique ne peut pas être réalisée par des courbes de survie usuelles selon Kaplan-Meier.
Répétition des mesures
Pour des raisons de commodité d’analyse, la survenue de la première occurrence d’événements multiples est souvent la seule considérée, mais cette pratique entraîne une perte d’information. Il est donc préférable d’appliquer aux types de régression décrits ci-dessus des options prenant en compte la répétition des événements en les rattachant à un même indi- vidu (modèles dit « à mesures répétées »).
Revue de la littérature
Robertsonet al.recommandent, en 2005, l’usage de la régression négative binomiale car plus pratique d’utilisation que les modèles de Cox [9]. De son côté, l’article de Meghan Donaldsonet al., publié en 2009, va dans le même sens que nos recommandations et relève que moins d’un tiers seulement des 83 articles reportant des essais cliniques randomisés pour la prévention de chutes, systématiquement revus entre 1994 et 2006, ont appliqué des méthodes statistiques adéquates [10]. Il précise que la« compa- raison des proportions de chuteurs ou l’analyse des délais jusqu’à la première chute peut conduire à des résultats erronés »et pro- pose l’établissement de« guide à l’instar de Consort pour l’analyse des essais cliniques randomisés ayant comme issue un événement récurrent ».
Les techniques de régression appliquées en mode univarié et multivarié permettent de quantifier la magnitude de l’effet de chaque facteur de risque, ajusté pour tous les autres présents dans le modèle et, pour certains d’entre eux, d’estimer la valeur prédictive de ce dernier à l’aide du coefficient de déter- mination R2 (coefficient de corrélation de Pearson élevé au carré), qui quantifie la proportion de la variance expliquée.
Tableau 2. Résultats des paramètres calculés par types de régression, tous les modèles prenant en compte la répétition des chutes chez un même sujet.
Paramètre Paramètre Sexe Âge à l’admission
No Modèle de régression Français Anglais Abréviation Valeur IC 95 % Valeur IC 95 %
m1 Logistique Rapport de cote Odds ratio OR 1,3193 1,226-1,419 1,0259 1,021-1,031
m2 Modèle linéaire généralisé Risque relatif Risk ratio RR 1,2459 1,176-1,319 1,0206 1,017-1,025 m3 Logistique ordinale Rapport de cote Odds ratio OR 1,3359 1,242-1,437 1,0257 1,021-1,031
m4 Poisson Rapport de taux
d’incidence
Incidence rate ratio IRR 1,3997 1,296-1,512 1,0197 1,015-1,025
m5 Négative binomiale Rapport de taux d’incidence
Incidence rate ratio IRR 1,4005 1,296-1,514 1,0203 1,015-1,026
m6 Négative binomiale* Rapport de taux
d’incidence Incidence rate ratio IRR 1,5284 1,419-1,647 1,0123 1,007-1,017 m7 Cox modifié selon
Andersen-Gill Risque instantané Hazard ratio HR 1,5117 1,398-1,635 1,0165 1,011-1,022
* Avec offset : ajusté pour le log naturel de la durée de séjour.
Conclusion
Le choix du modèle statistique à utiliser dépend d’abord de la question de recherche, qui détermine le dessin de l’étude et la nature de la variable dépendante. En raison de l’étiologie multifactorielle des chutes, et afin de diminuer les erreurs
statistiques de type I (détection d’un effet faussement significatif), des analyses multivariées doivent être utilisées. Afin d’éviter la perte d’information, les modèles à mesures répétées sont à privi- légier. Enfin, un nombre suffisant d’observations de bonne qualité (mesures fiables, valides, avec un minimum de données man- quantes) devront être réunies pour diminuer les erreurs de type II et ainsi augmenter la puissance statistique de l’étude.
0 .2 .4 .6 .8 1
0 .2 .4 .6 .8 1
0 .2 .4 .6 .8 1
0 .2 .4 .6 .8 1
0 .2 .4 .6 .8 1
60 70 80 90 100 110
Probabilité de chute
Âge m1
60 70 80 90 100 110
Probabilité de chute
Âge m2
0 chute
1 chute
2 chutes et plus
60 70 80 90 100 110
Probabilité de chute
Âge m3
60 70 80 90 100 110
Probabilité de chute
Âge m4
60 70 80 90 100 110
Probabilité de chute
Âge m5
Figure 1.Probabilités de chute en fonction de l’âge et du sexe (homme– – – –, femme -———) prédites par les différents modèles de régressions (m1 : logistique ; m2 : modèle linéaire généralisé ; m3 : logistique ordinale ; m4 : Poisson ; m5 : binomiale négative sansoffset).
FRANÇOISR. HERRMANN, NICOLASJ. PETITPIERRE Ann Gerontol 2009 ; 2(4) : 225-9
RÉFÉRENCES
1.Hill AB. The environment and disease: association or causation?Proc R Soc Med 1965 ; 58 : 295-300.
2.Tinetti ME, Speechley M, Ginter SF. Risk factors for falls among elderly persons living in the community.N Engl J Med1988 ; 319 : 1701-7.
3.Ganz DA, Bao Y, Shekelle PG, Rubenstein LZ. Will my patient fall?JAMA2007 ; 297 : 77-86.
4.Gates S, Fisher JD, Cooke MW, Carter YH, Lamb SE. Multifactorial assessment and targeted intervention for preventing falls and injuries among older people in community and emergency care settings: systematic review and meta-analysis.BMJ2008 ; 336 : 130-3.
5.Loew F, Registe-Rameau Y, Kressig R, Marcant D, Herrmann F, Michel J. Epidemio- logy of falls in a geriatric ward: rationale for a quality program. In : Michel JP, ed.Mana- gement of Aging. The University of Geneva Experience, Vol 30. Karger, 1999 : 44-52.
6.Andersen P, Gill R. Cox’s regression model for counting processes: a large sample study.Ann Statist1982 ; 10 : 1100-20.
7.Stata Statistical Software: Release 10[computer program]. Version 10. College Station, Texas, USA: Stata Corporation, 2007.
8.Herrmann FR. Geriatric epidemiology: practical considerations when involving elderly subjects in studies.Swiss Med Wkly2004 ; 134 : 117-25.
9.Robertson MC, Campbell AJ, Herbison P. Statistical analysis of efficacy in falls prevention trials. J Gerontol A Biol Sci Med Sci2005 ; 60 : 530-4.
10.Donaldson MG, Sobolev B, Cook WL, Janssen PA, Khan KM. Analysis of recurrent events: a systematic review of randomised controlled trials of inter- ventions to prevent falls.Age Ageing2009 ; 38 : 151-5.