• Aucun résultat trouvé

Approche méthodologique pour une étude des facteurs de risques cardiovasculaires, d'après une enquête effectuée auprès des patients du centre médical I. P. C. de 1970 à 1975

N/A
N/A
Protected

Academic year: 2022

Partager "Approche méthodologique pour une étude des facteurs de risques cardiovasculaires, d'après une enquête effectuée auprès des patients du centre médical I. P. C. de 1970 à 1975"

Copied!
6
0
0

Texte intégral

(1)

J OURNAL DE LA SOCIÉTÉ STATISTIQUE DE P ARIS

P AUL D AMIANI

Approche méthodologique pour une étude des facteurs de risques cardiovasculaires, d’après une enquête effectuée auprès des patients du centre médical I. P. C. de 1970 à 1975

Journal de la société statistique de Paris, tome 120, n

o

3 (1979), p. 198-202

<http://www.numdam.org/item?id=JSFS_1979__120_3_198_0>

© Société de statistique de Paris, 1979, tous droits réservés.

L’accès aux archives de la revue « Journal de la société statistique de Paris » (http://publications-sfds.math.cnrs.fr/index.php/J-SFdS) implique l’accord avec les conditions générales d’utilisation (http://www.numdam.org/conditions). Toute uti- lisation commerciale ou impression systématique est constitutive d’une infrac- tion pénale. Toute copie ou impression de ce fichier doit contenir la pré- sente mention de copyright.

Article numérisé dans le cadre du programme Numérisation de documents anciens mathématiques

http://www.numdam.org/

(2)

DE RISQUES CARDIOVASCULAIRES

d'après une enquête effectuée auprès des patients du Centre médical I. P. C. de 1970 à 1975

Paul

DAMIANI

administrateur de VI. N. S. E. E.

Les Investigations Pré-Cliniques (I. P. C.) (

1

) ont développé, grâce à la coopération d'universitaires et de médecins praticiens, un instrument de recherche en épidémiologie et en prévention médicale, notamment cardiovasculaire.

Le recueil informatisé de 600 variables cliniques et biologiques chez de nombreux sujets (100 000) commence à autoriser certaines déductions statistiques destinées à guider cette prévention médicale.

Une analyse statistique des facteurs de risques cardiovasculaires a été réalisée à partir des données recueillies auprès des patients du Centre I. P. C , de 1970 à 1975. On a exclu de l'étude les personnes se sachant malades ou suivant un traitement au moment de l'examen et on n'a retenu que les hommes de 40 à 69 ans et les femmes de 50 à 69 ans, soit au total 29 400 personnes.

Les variables étudiées, au nombre de 16 (

2

), représentent les résultats de certaines investigations cliniques et biologiques, ainsi que les réponses à quelques interrogations du questionnaire médical.

Parmi les sujets, on a distingué un groupe de personnes présentant des symptômes ou des signes de pathologie cardiovasculaire et un groupe de personnes n'en présentant pas.

Cette sélection a été faite d'après les résultats de l'électro-cardiogramme, de la radio-photo- graphie cardio-aortique et d'après les réponses au questionnaire médical.

Le Comité Scientifique des I. P. C. (

3

) n'ignore pas que le choix des patients et le choix des variables peuvent faire l'objet de critiques.

1. Représentées p a r MM. J . R. D E B R A Y , J . C H R É T I E N , M. G U E N I O T , J . P . H A R D O U I N , J . H I M B E R T ( t ) , P. P I C H O T , G. R I C H E T , Cl. R O U S S E L , A. R Y C K E W A E R T , il y a d i x a n s , le 12 m a i 1969, à la Société Médicale des

H ô p i t a u x de Paris, sous le titre : « Une nouvelle conception de la médecine préventive utilisant le t r a i t e m e n t a u t o m a t i q u e de l'information p a r ordinateur ». Ann. Méd. int., 1969, 120, 391 et 589.

2. Les variables retenues : antécédents familiaux, tabac, alcool, surmenage, cholestérol, glycémie, acide urique, urée, phosphatases alcalines, hémoglobine, capacité vitale, volume expiratoire maximal p a r seconde, surcharge pondérale, pression artérielle diastolique, pression artérielle systolique, pli c u t a n é .

3. Composé de : Dr J . R. DEBRAY de l ' I n s t i t u t , Prof. J a c q u e s C H R É T I E N , Prof. Maurice G U E N I O T , Prof. Ag. Louis G U I Z E , Prof. Ag. J . P. H A R D O U I N , Prof. Pierre PICHOT, Prof. Gabriel R I C H E T , Prof. A. R Y C K E - WAERT, Dr Claude R O U S S E L ; assisté de Ariane BABOK, F o u a d B E N J E L L O U N , Jean-Marie C H R É T I E N , Robert

MOYAL, A n d r é S A L E M .

Journal de la Société de statistique de Paris, tome 120, n° 3, 1979.

(3)

APPROCHE MÉTHODOLOGIQUE D E S F A C T E U R S D E R I S Q U E S C A R D I O V A S C U L A I R E S 1 9 9

La définition des groupes de sujets présentant des symptômes ou signes de pathologie cardio-vasculaire demande à être nuancée et pourra, grâce à des études ultérieures, trouver de nouveaux fondements.

La publication de ce travail répond au souci d'une équipe pluridisciplinaire de faire connaître la méthodologie utilisée sous l'égide de Paul Damiani.

Le but de l'étude est d'analyser statistiquement, à partir des valeurs des différentes données les raisons pour lesquelles les individus sont classés dans l'un ou l'autre groupe définis ci-dessus.

S'il n'y avait qu'un seul facteur de risque, il suffirait de comparer les valeurs moyennes de ce facteur dans chacun des groupes. Comme on dispose de plusieurs variables, on opère de la façon suivante.

On cherche une moyenne des valeurs des différentes variables qui explique le mieux la dispersion des sujets dans les deux groupes; dans cette moyenne, chaque variable est affectée d'un coefficient d'autant plus élevé que l'importance de la variable dans l'explication du phénomène est plus grande.

Pour déterminer cette moyenne, on applique la méthode d'analyse statistique appelée

« régression pas à pas ». Avec cette méthode, on sélectionne les variables ayant une action significative dans la dispersion des sujets entre les deux groupes et on établit un modèle permettant de mesurer l'action des différents facteurs de risque retenus. La valeur de ce modèle est estimée par la part de la dispersion qu'il explique.

Une première sélection des variables, parmi les plusieurs centaines dont on dispose, avait auparavant été obtenue : 1° à partir de comparaisons univariées de variables entre le groupe pathologique et le groupe témoin (comparaison de moyennes entre variables quanti- tatives, comparaison de taux de réponses entre variables qualitatives), 2° à partir d'analyses factorielles des correspondances qui ont permis de sélectionner les variables indépendantes les plus représentatives parmi les variables redondantes et celles qui avaient la plus faible variabilité analytique.

L'étude a été réalisée par sexe et par groupe d'âge décennal. Les résultats obtenus sont les suivants :

Pour le sexe masculin

Le modèle explique entre 24 % et 28 % de la dispersion, ce qui correspond aux pour- centages trouvés en appliquant la méthode dans d'autres domaines des sciences humaines.

Les facteurs de risque les plus significatifs sont, par groupe d'âge :

40-49 ans : la capacité vitale (1

), la pression artérielle systolique, le surmenage,

50-59 ans : aux trois facteurs précédents (2

) s'ajoutent : l'hémoglobine et la surcharge

pondérale,

60-69 ans : la capacité vitale et le surmenage disparaissent, restent : la pression

artérielle systolique, l'hémoglobine, la surcharge pondérale.

Autrement dit, il existe un facteur de risque cardio-vasculaire présent quel que soit l'âge, c'est la pression artérielle systolique; les facteurs de risque capacité vitale et surmenage

1. A elle seule la capacité vitale explique 18 % de la dispersion.

2. La capacité vitale est remplacée par le volume expiratoire maximal, variable en forte corrélation avec elle.

(4)

o n t u n e i m p o r t a n c e qui décroît avec l'âge et d i s p a r a i s s e n t à 60 a n s (1) ; les f a c t e u r s h é m o - globine et s u r c h a r g e p o n d é r a l e o n t u n e a c t i o n qui a u g m e n t e avec l'âge et n ' a p p a r a i s s e n t q u ' a p r è s 50 a n s .

Pour le sexe féminin

Le modèle est moins s a t i s f a i s a n t q u e pour, le sexe m a s c u l i n p u i s q u ' i l e x p l i q u e e n t r e 11 % et 20 % de la d i s p e r s i o n ; c'est un r é s u l t a t q u e l'on r e n c o n t r e s o u v e n t d a n s des é t u d e s a n a l o g u e s (2).

P a r m i les f a c t e u r s de risques r e t e n u s , le s u r m e n a g e et l ' h é m o g l o b i n e s o n t p r é s e n t s d a n s les d e u x groupes d ' â g e .

On t r o u v e en plus : le v o l u m e e x p i r a t o i r e m a x i m a l et la glycémie e n t r e 50 et 59 a n s ; l'uricémie, la pression artérielle s y s t o l i q u e , le pli c u t a n é et le cholestérol, e n t r e 60 et 69 a n s . On n o t e r a q u e les coefficients relatifs à c e r t a i n s facteurs (capacité v i t a l e , s u r m e n a g e , hémoglobine...) s o n t négatifs c'est-à-dire q u e plus un de ces f a c t e u r s a une v a l e u r élevée et plus la p r o b a b i l i t é d ' ê t r e classé d a n s le g r o u p e p a t h o l o g i q u e est faible.

P a r ailleurs, on observe q u e , d a n s c e t t e é t u d e , d e u x f a c t e u r s de risque f r é q u e m m e n t r e t e n u s n ' a p p a r a i s s e n t p a s d i s c r i m i n a n t s : la cholesterolémie et la c o n s o m m a t i o n t a b a g i q u e d o n t nous possédons une meilleure a n a l y s e d a n s les q u e s t i o n n a i r e s i t é r a t i f s .

Il f a u t é g a l e m e n t savoir q u e lorsque d e u x v a r i a b l e s sont f o r t e m e n t corrélées e n t r e elles et o n t u n e a c t i o n c o m p a r a b l e sur la d i s t i n c t i o n des d e u x g r o u p e s , ce modèle de régres- sion ne fait a p p a r a î t r e q u ' u n e seule de ces d e u x v a r i a b l e s ; c'est le cas, p a r e x e m p l e , de la pression artérielle d i a s t o l i q u e face à la pression artérielle s y s t o l i q u e .

L ' i n t é r ê t de la m é t h o d e est de r e m p l a c e r les v a l e u r s relevées p o u r différents f a c t e u r s de risque a u cours d ' u n e x a m e n p a r un indice calculé sur un n o m b r e r é d u i t de f a c t e u r s les plus significatifs. A p a r t i r de cet indice, il est possible d ' é v a l u e r la p r o b a b i l i t é p o u r u n i n d i v i d u d ' a p p a r t e n i r à u n e p o p u l a t i o n p r é s e n t a n t des signes de p a t h o l o g i e c a r d i o - v a s c u l a i r e et de m e s u r e r la v a r i a t i o n de p r o b a b i l i t é due à une v a r i a t i o n d o n n é e d ' u n f a c t e u r . Il s'agit d ' u n e p r o b a b i l i t é calculée à p a r t i r de s t a t i s t i q u e s relevées sur une p o p u l a t i o n n o m b r e u s e , elle ne doit être considérée q u e c o m m e u n e i n d i c a t i o n p o u r u n m é d e c i n .

Ces r é s u l t a t s ne r e p r é s e n t e n t q u ' u n e p r e m i è r e a p p r o c h e et d o i v e n t n é c e s s a i r e m e n t être vérifiés et c o m p l é t é s p a r les é t u d e s fondées sur le suivi des sujets au m o y e n des e x a m e n s i t é r a t i f s .

ANNEXE

D O N N É E S DE BASE

Variable à expliquer

La variable à expliquer y représente le fait d'appartenir ou non à la sous-population présentant des symptômes ou des signes de pathologie cardiovasculaire. Elle peut prendre deux valeurs :

y = 1, si l'individu appartient à la sous-population pathologique, y = 0, si l'individu appartient à la sous-population de référence.

1. La capacité vitale apparaît dans cette première étude plus discriminante que les réponses aux questions sur le tabagisme, mais ces deux variables sont très liées. De même le surmenage est fortement lié à la note d'hypocondrie qui n'a pas été retenue ici mais apparaîtra dans une étude ultérieure.

2. Il faut se rappeler que dans d'autres travaux de la littérature la définition de la pathologie cardio- vasculaire à partir d'un questionnaire et d'un électro-cardiogramme est moins performante chez la femme que chez l'homme.

(5)

APPROCHE MÉTHODOLOGIQUE D E S F A C T E U R S D E R I S Q U E S C A R D I O V A S C U L A I R E S 2 0 1

Variables explicatives

On a retenu les 16 variables explicatives xi suivantes (î = 1, 2, . . ., 16) représentant les principaux facteurs de risque.

x-y : antécédents familiaux; cette variable peut prendre 3 valeurs suivant l'importance des antécédents familiaux;

x2 : t a b a c ; cette variable peut prendre 4 valeurs suivant la quantité de tabac fumée;

xz : alcool; cette variable peut prendre 3 valeurs suivant la quantité d'alcool bue;

.r4 : surmenage; cette variable peut prendre 2 valeurs suivant que l'individu estime être ou n'être pas surmené;

x5 : cholestérol, en g/1;

XQ : glycémie, en g/1, dosage 45 minutes après absorption de 50 g de glucose;

x7 : urée dans le sang, en mg/1;

x8 : uricémie, en mg/1;

xQ : phosphatases alcalines, en unités internationales;

x10 : hémoglobine, en g/100 ml;

xn : pression artérielle systolique, en mm de Hg;

xX2 : pression artérielle diastolique, en mm de Hg;

.r13 : capacité vitale mesurée, en mm3/]; c'est une mesure du volume d'air contenu dans les poumons;

:r14 : volume expiratoire maximal par seconde, en mm3/l; c'est une mesure du volume d'air expiré en un temps donné après inspiration;

xlb : pli cutané, en m m ;

c16 : surcharge pondérale; cette variable représente le rapport du poids de l'individu consi- déré au poids moyen ajusté de la population étudiée de même taille, pour le même groupe d'âge et le même sexe.

M O D È L E

On suppose qu'il existe un modèle de régression linéaire entre y et les variables X{, par groupe d'âge décennal et par sexe :

y = a + b1x1 + . . . + btXi + . . . + biex1B

Les coefficients b% et la constante a sont calculés par la méthode des moindres carrés.

On a appliqué la méthode régression pas à pas qui permet de ne retenir dans le modèle que les variables explicatives dont l'action sur y est jugée significative.

La valeur du modèle est mesurée par la proportion R2 de la variante de y expliquée p a r l e modèle.

RÉSULTATS

Les résultats obtenus figurent dans le tableau ci-après qui indique, par groupe d'âge et par sexe, les variables retenues, la proportion cumulée de variance expliquée par le modèle et le modèle sous deux formes. On a donné l'expression du modèle avec des variables brutes (en lettres minuscules), puis son expression avec des variables centrées réduites (en lettres majuscules) afin de permettre de comparer l'action des différents facteurs.

(6)

M O D È L E S D E RÉGRESSION PAR S E X E ET GROUPE D'ÂGE

Groupe d'âge et facteurs

Proportion cumulée de variance

expliquée

Modèles (1)

40-49 ans

xl3 : capacité vitale A i

a-, :

50-09

•Tll 3*14

xt ar,8

60-69

»"10 a-ii

pression artérielle systolique surmenage

pression artérielle systolique volume expiratoire maximal . surmenage

hémoglobine . . . . surcharge pondérale ans

: hémoglobine . . . . pression artérielle systolique . surcharge pondérale . . . .

0.184 0.260 0.280

0.112 0.164 0.205 0.225 0.236

0.137 0.222 0.239

S E X E MASCULIN

y = 0.49985 — 0.0003 xi3 + 0.0082 r „ + 0.0163 xt

(0.0000) (0.0023) (0.0079) Y = —0.4370 Xia + 0.2550 A'„ + 0.1468 Xt

(0.0706) (0.0707) (0.0712)

y = 0.09705 + 0,0051 a'n — 0.0001 a14 + 0.0246 xt

(0.0013) (0.0000) (0.0073)

—0.00030 as o + 0,0035 .r18

(0.0012) (0.0021) Y = 0.2528 X — 0.1803 Xu + 0.2040 Xt

(0,0633) (0,0633) (0.0606)

- 0 , 1 5 2 2 Xl0 + 0,1058 Xlt

(0.0626) (0.0625) U = —0.1095 — 0.0064 .'io + 0.0059./^, + 0,0049 a1,,

(0.0012) (0.00 L4) (0.0023) Y = —0.3297 Ar10 4 0.2678 A'u + 0.1335 Xlt

(0.0628) (0.0640) (0.0636)

51-59 ans

xlt : volume expiratoire maximal xt : surmenage .

10 : hémoglobine .re : glycémie . .

a'8 : uricémie

xn : pression artérielle systolique .

•r16 : pli cutané . xlt : hémoglobine xt : surmenage .

«rs : cholestérol .

0.048 0.079 0.092 0,106

0.076 0.136 0.153 0.169 0.182 0.198

S E X E FÉMININ

y = 1.0598 — 0.0002 xu + 0.0242 xA — 0.0038 x10 + 0.0015 xt

(0.0001) (0.0101) (0.0025) (0.0011) Y = —0.1685 X14 + 0.2115 Xt — 0.1345 Xl0 + 0.1201 A",

(0.0914) (0.0885) (0.0912) (0.0893)

y = —0,6069 + 0,0095 x9 + 0.0053 xu — 0.0037 .r15 — 0.0306 a;10

(0.0028) (0.0013) (0.0023) (0,0021) + 0.0173 xt 4- 0.0016 x&

(0.0091) (0.0008)

V = 0.2323 3*8 + 0.2768 A ' u — 0 , 1 1 3 3 Xl6 — 0.1180 A1 0 + 0.1315 X« + 0.1302X, (0.0694) (0.0703) (0.0692) (0.0693) (0.0692) (0.0701)

1. Deux modèles sont indiqués : avec variables brutes (lettres minuscules), avec variables centrées réduites (lettres majuscules).

Sous chaque coefficient du modèle figure l'erreur-type correspondante.

Références

Documents relatifs

Le risque relatif ou odds ratio calculé pour l’allèle A du variant rs9349379 est représenté dans les diffé- rentes cohortes de patients présentant un SCAD (Dissection spontanée

Phenotypic characteristics of the popula- tion studied ar rO and t5 and longitudinal variations are summarized in TABLE 1 (me an values ± standard deviation

Quant aux sujets du deuxième groupe, ils n'étaient pas impliqués dans un plus grand nombre de délits violents ou non violents lorsqu'ils démontraient des traits

Revenons au système linguistique, qui est lui-même un système spécifique, vu sa nature complexe par rapport aux autres systèmes. Les données linguistiques sont traitées

On s’attend alors à une relation négative entre l’évolution des taux d’intérêt mondiaux et l’intégration financière : plus les taux

J'ai raconté un épisode, mais ce qui a été le plus important pour moi c'est d'avoir connu le monde de la coopération, le travail de groupe, qui m'a aidé dans mes rapports avec

Si n est un entier au moins égal à 2, on considère dans le plan les n 2 points de coordonnées (i, j) avec.. Trouver pour n variant de 2 à 10 de bonnes valeurs pour

Lorsqu’un parcours est obtenu pour une valeur n=p, avec un départ D et une arrivée A, il suffit de trouver un parcours avec les seuls points du périmètre de p+2 et de prévoir