UNIVERSITE SALAH BOUBNIDAR CONSTANTINE 3 FACULTE DE MEDECINE DE CONSTANTINE
DEPARTEMENT DE MEDECINE ANNEE UNIVERSITAIRE : 2020-2021
STATISTIQUE DESCRIPTIVE
Dr S. AMAROUCHE
Maître assistante en Epidémiologie
Université Constantine 3SEMEP CHU Constantine
Page 1
Dr S.
A M A R O U C H E M a î t r e A s s i s t a n t e
- Epidémiologie-
Université3 de C o n s t a n t i n e- Janvier 2021
La stafistique est iune méthode scentu fique qui consiste à reurnir des cionnées chi ffrées Sur des ensembles nombreux. Iis à analyser, àcommenter et å critiquer ces données
l ne faut pas confondre la stalistique qui est la science qui vient d'être définie ef ene
sTatistique qui est un ensemble de données chiffrées sur un sujei précis
Les premières statistiques correctement elaborées ont été celles des recemsements
démographiques. Ainsi fe vocabulaire statistique est essentiellement celui de la démograpie OBJET DE LA
STATISTIQUE
Le bui dc la
siatistique
est desynthétiser
et de résumer desgrands
voluIes de doRDCes,e
grandes nmatrices d' informations. La méthode statistique comporte piusieurs etapes 1. La
statistique descriptive
oudéductive
C'est l'ensemble des méthodes à
partir desquelles
o nrecueille, ordonne, réduit,
etcodense e données.
A cettefin,
lastatistique descriptive
utilise desparamètres,
ousynthétiseurs,
degraphiques et des méthodes dites d'analyse des données (l'ordinateur a facilité Be développement de ces méthodes).
2. La
statistique inférentielle ou inductive
C'est
l'ensemble
desméthodes qui permettent
de faire desprévisions,
desinkexpoiatiors
une
population
àpartir
des résultatsrecueillis
sur unéchantilion.
NousRtikisons
desraisonnements
inductifs c'est-à-dire des raisonnements de passage deaparticuier
augévéo
Cette
statistique utilise
desrepères
deréférence qui
sont lesmodeles théoriques (lois
deprobabilités).
II. STATISTIQUE DESCRIPTTVE:
Elle est la méthode de
description
desensembles nombreux (popu:latims).
La
statistique descriptive
vise àsimplifier,
à résumer et àsynthétiser
besrésuadtaks oienus.
U cours d'une étude: elle a pour butd'aider
àréaliser
unportrait.
Pour avoir des
informations chiffrées
etutilisables,
suite à uneobsrtaticon (enqacke),
onprocède
à un certainnombre d'opérations logiques qui caractériseni
ka Ekcnaki:stadistiqac.
En d'autre terme c'est
l'ensemble
desméthodes permettant
de décriE WEepogoeulantiosn gparie
biais des individus qui la composent. La statistique descriptive s'susooersse dae ai deorIeE caractériser un ensemble d'individus représenté la plupart du temyes sOES ia kormae de tablcaas (tableaux de données), à résumer et synthétiser ces tableaux par finicronédiaire de graphagE et de paramétres appropriés (fréquences, distribution, o y e n , disaeso, c.).
IV.
TERMINOLOGIE ET NOTATION STANDARD DE LA STATISTIQUE :
Comme toute seience, la
statistique
a son vocabulaire,qu'il
est primordial de définir defaçon
rigoureuse afin d'indiquer le groupe surlequel
porte l'étude, les caractères ou variables relevés sur chacun des individus et les différents types de caractères.1.
Population :
ensemble des individus (ou unitésstatistiques)
présentant un caractèrec o m m u n . Pour une thématique donnée, la
population
regroupetoujours
la totalité des individus relatifs à cettethématique
(notion d'exhaustivité).Exemple: La
population
de lawilaya de
Constantine2. Unité
statistique (ou individu) :
élément de base constitutif de lapopulation
àlaquelle il appartient.
Exemple: Pour la
population
dela commune
de Constantine, l'unité d'observation (U.O.) est représentée par la personneâgée
entre 0(zéro)
an etplus
de 100 (cent) ans et habitant laditec o m m u n e .
3. Echantillon
:
sous-ensemble construit et représentatif d'unepopulation
donnée.Lorsque l'on
parle
d'échantillon onparle
en général de population mère, c'est-à-dire de lapopulation dont est issu l'échantillon.
4. Caractère
: Chaque
individu d'une population peut être décrit relativement à un ouplusieurs caractèreso u variablesstatistiques.
Exemple
:
la couleur, le sexe, lepoids,
la taille ...etc5. Modalité: Chacun des caractères, étudiés, peut présenter deux o u plusieurs aspects
(Valeurs) dits modalités.
Pour le sexe, deux modalités (valeurs): "Féminin" et "Masculin".
Pour
1'âge,
u n e infinité de modalités:l'âge
d'une personne est compris entre zéro etplus
de 100(cent)
ans.6. Variable qualitative:
Un caractère est dit qualitatif quand ses diverses modalités n e s'expriment pas en valeur numérique mais e n
qualité.
Les modalités sont exhaustives et mutuellement exclusives.Chaque
individu doitpouvoir
être classé dans une et une seule modalité.Pour le caractère "sexe": Les modalités sont expriméeS par un mot: "féminin" ou "masculin"
ct n o n par une valeur numérique.
Les modalités d'une variable qualitative peuvent être classées s u r deux types d'échelle
:
nominale o u ordinale. A c e s deux types d'échelle correspondent deux types de variables qualitatives.
Les opérations arithmétiques que l'on peul réaliser s u r ce type de
variable sont
r e l a t i v e m e n t
réduites et s e limitent a u
comptage des e l f e c t i f s par modalité (fréquences absolues) et au calcul de p o u r c e n t a g e(fréquencesrelatives)
Page 3
Dr S. A M A R O U C H E
Maître A s s i s t a n t e -
E p i d é m i o l o g i e -
Université3 de C o n s t a n t i n eJ a n v i e r 2021
A- Variable qualitative nominale:
Il s'agit des variables dont les modalités sont exprimées par des noms et ne sont pas
hiérarchisées.
Exemple: Groupage sanguin:
A,B, AB,
OUn caractère nominal est dit binaire s'il ne peut prendre que deux modalités. Ce type de variable est très utilisé dans les sciences de la vie notamment en épidémiologie
Exemple
- Etat de santé : malade, sain
- Statut vaccinal : vacciné, non vacciné
B- Variable qualitative ordinale:
Une variable qualitative ordinale possède toutes les propriétés de la variable qualitative nominale avec en plus l'ensemble de ses modalités peut être doté d'une relation d'ordre.
*Exemple:
-
Complication
d'une maladie : modérée, moyenne, sévère- Niveau d'étude
: primaire, secondaire, supérieur.
7. Variable quantitative:
Une variable statistique est dite quantitative si ses modalités sont exprimées en valeurs numériques. Les modalités d'une variable quantitative sont des nombres liés à 1'unité choisie, qui doit toujours être précisée.
Toutes les opérations arithmétiques simples et complexes sont applicables aux variables quantitatives, du dénombrement (fréquences absolues) et autre calcul de pourcentage (fréquences relatives) en passant par la moyenne, la médiane et l'écart-type jusqu'à la modélisation numérique.
Exemples:
L'âge (ans): 0, 1, . , 19, ..., 41, etc...
- La taille
(cm):
120, 121, . . I65, etc..- La
glycémie (gr/l):
0.90,1.00, .. 2.10,
etc.Iexiste deux types de variables quantitatives les variables discrètes et les variables
continues.Dr S. AMAROUCHE Maître Assistante -Epidémiologie- Université 3 de Constantine Janvier 2021 Page 4
A- Variable quantitative continue:
Un caractère quantiiatif cst dit continu: orsque ses valeurs sont en nombres infinis dans un intervalle de valeurs.
Evemple:
Laglycémic.
une inlinité de valeurs entre. parexemple.
10 ans et 11 ans.Classe:
Le
plus
souvent. pour l'étude de tels caractères. on définit. par regroupement des modalites.des classes qui constitueront les nouvelles modalités (valeurs) du caractère.
Exemple:
Les ages de 0 an. 1 an. 2 ans, 3 ans, 4 ans seront regroupés dans un intervalle ou classe de [0
an-5 ans (10-4]).
Cette classe (ou tranche
d'åge)
sera considérée c o m m e étant la nouvelle modalité du caractereage.
Chaque classe est définie par:
son amplitude,
- ses extrémités ou limites: inférieure et supérieure - son centre de classe.
B- Variable quantitative discontinue (ou diserète)
Un caractère quantitatif est dit discontinu, lorsque les valeurs de ses modalités sont exprimées par des nombres isolés, le
plus
souvent des nombres entiers.*Exemple:
Taille de la famille (nombre de frères et sæurs): la taille ne peut être que 0 enfant. 1 enfant. 2 enfants. 3 enfants., ctc... et non pas 0.5 ou 3,75!
Les modalités de ce type de caractère peuvent, elles aussi, ètre regroupées en classe. selon les mémes principes que pour le caractère quantitatif continu.
8- Effectifs et fréquences:
Une des premières opérations de la statistique consiste à recenser le nombre etou le pourcentage d'individus qui présentent une modalité determinee d'une variable. C'est ainst qu'a chaque modalité est associé un effectif et/ou une fréquence.
A- L'effectif: (aussi appelé fréquenee absolue) de la modalité, désigne le nombre d'individus de la population présentant la modalité
B- La
fréquencerelative
La fréquence relative est le rapport entre deux tréquences absolues: numerateur denuanateu
Ele peut être exprimée par
Page 5 D r S. AMAROUCHE Maître Assistante Epidémiologie- Université 3 de Constantine-Janvier 2021
Proportion:
lcnumérateur est
une partdu dénominateur.
Elcs'exprime
sous formed'un nombre compris entre 0 et ou bien sous forme d'un pourcentage (ou pour mille. pour dix mille..ctc)
Exemple : 5300 enfants vaccinés 7500 enfants= 0.70- 70
Ratio
le numérateur et le dénominateur sont de même nature mais sont exclusifs l'un de 'autre. Il s'exprime sans unitéExemple 2000 hommes/1000 femmes. Le ratio H/F (sex ratio)=.
2 hommes pour une femnme
Le taus: il s'agit d'un rapport qui prend en considération le temps: il mesure la probabilité de survenue d' un événement au cours du temps.
L'indice: c'est le rapport de deux effectifs qui sont de nature différente. On l'utilise surtout comme indicateur de fonctionnement
*Exemple dans un hôpital 850 lits, 10 médecins done 85 lits pour un médecin
9-Série ou distribution
Les unités d'observation (U.0.) d'une population, peuvent être étudiées à travers un ou plusieurs caractères.
Pour chaque U.O. nous observeront une modalité du caractère étudié.
Pour l'ensemble des U.0. nous auront un ensemble de modalités observées (de valcurs observées), relatives au caractère étudié.
Cette ensemble de modalités observées s'appelle série ou distribution statistique à un caractère.
La distribution statistique peut, aussi, être à deux. trois ou n caractères (selon le nonmbre de caractères étudiés par unité
d'observation).
V.
PRESENTATION DES DONNEES
Il existe
plusieurs
niveaux dedescription statistique :
laprésentation
brute des données, desprésentations par tableaux numériques. des représentations graphiques et des résumes numériques
fournis par unpetit
nombre deparamètres caractéristiques.
Présentation tabulaire:
Il est
primordial
de définir lapopulation
et depréciser
aveerigueur
la ou les variables relevées sur chacun des individus de lapopulation
ou del'échantillon
lareprésentant.
Easuite.quand
les observations ont élé recueillies, lepremier
travail eonsiste à lespresenter, aus
clairement que
possible,
sous lome de tableustatistique
Dr S. AMAROUCHE Maitre Assistante Fpidémiologie- Université de Constantine Ja ier 2021 Page 6
Tableau brut des donnéesS:
Le tableau brut est le tableau élémentaire de travail. T'outes les donnéesy figurent unité par unité et variable par variable.
Les individus ou unités statistiques sont en ligne et les variables en colonnes
Eremple:
Numéro Prénonm sexe Date de
Taille (cm) Poids(Kg) naissance
30/06/1978 24/04/1965 163 12/03/1982 165
23/05/0974 180
Mohamed M 170 70
Souad
75Lamia karim
F
56
M
69
Tableau de fréquence:
Le tableau de distribution de fréquences est un mode synthétique de présentation des données Chaque tableau est précédé par son titre comprenant les caractéristiques de personnes, de temps et de lieu
Exemple: Population algérienne -Recensement 2008
Effectif (n) Fréquence relative (%) Sexe 72
Masculin 17 232 747
Féminin 16 847 283 69
Total 34 080 030 100
Source: O.N.S. / Exploitation exhaustive du recensement général de la population et de l'habitat - RGPH 2008 -
2- Présentation graphique:
Un graphique - étymologiquement « qui figure par le dessin » - est une représentation visuelle
et simplifiée d'une réalité appréhendée sous une forme essentiellement numérique (série,
tableau).
L'apparition des graphiques statistiques, liée à l'utilisation des coordonnées, doit
essentiellement son origine au philosophe et mathématicien René Descartes (1596-1650). Ces graphiques constituent une synthèse visuelle indispensable de 1'information contenue dans le tableau statistique. Les graphiques utilisés dépendent de la nature de la variable
3- Présentation paramétrique:
C'est un des
objectifs
fondamentaux et LE défis de lastatistique descriptive: résumer de
façon simple de grandes séries statistiques tout en en conservant au mieux le contenu informationnel en limitant au maximum la perte
d'informations
inhérente à ceprocessus
réducteur. Afin d'y parvenir. la statistique a développé un certain nombre d'outils pour d'une part caractériser et résumer au mieux des disuributions statistiques et pour d'autre part mettre
en évidence, voire exacerber, le cas écheant, leurs dilférences. Deux groupes complenentares
Dr S. AMAROUCHE Maître Assistante - Epidémiologie- Université 3 de Constantine - Janvier 2021 Page 7
de param tres permettent d'atteindre ees objectilis: Les paramètres de tendance centrale Les paramétres de dispersion Ces dcus groupes de paramètres sont complémentaires pour la deseription et le résumé de distributions statistiques et on ne saurait faire abstraction de l'un
ou de l'autre pour ces oprations.
Paramètres de tendance centrale (mode, moyenne, médiane.
quantiles,
etc.).paramètres
dedispersion
(variance. écart-type. coefficient de variation, standardisation. etc.).La
présentation
des données. sous la forme de tabulaire,graphique
etparamètres
de réduction.n o u s permet (en première
conclusion)
d'avoir unportrait
duphénomène
étudiéUn
portrait signifie
uneréponse,
à travers le recueil(l'observation)
et le traitement (regroupement etprésentation)
des données, auxquestions
suivantes:*Qui
sont concernés
par lephénomène? (caractéristiques
depersonnes)
*Quand
Où le lephénomène est-il
survenu?(caractéristiques
de temps)phénomène
est-il survenu?(caractéristiques
de lieu)gadetmaodogue- laiversité 3 de unstantine Javier 2021 Page