• Aucun résultat trouvé

STATISTIQUE DESCRIPTIVE

N/A
N/A
Protected

Academic year: 2022

Partager "STATISTIQUE DESCRIPTIVE"

Copied!
8
0
0

Texte intégral

(1)

UNIVERSITE SALAH BOUBNIDAR CONSTANTINE 3 FACULTE DE MEDECINE DE CONSTANTINE

DEPARTEMENT DE MEDECINE ANNEE UNIVERSITAIRE : 2020-2021

STATISTIQUE DESCRIPTIVE

Dr S. AMAROUCHE

Maître assistante en Epidémiologie

Université Constantine 3

SEMEP CHU Constantine

Page 1

Dr S.

A M A R O U C H E M a î t r e A s s i s t a n t e

- Epidémiologie-

Université3 de C o n s t a n t i n e- Janvier 2021

(2)

La stafistique est iune méthode scentu fique qui consiste à reurnir des cionnées chi ffrées Sur des ensembles nombreux. Iis à analyser, àcommenter et å critiquer ces données

l ne faut pas confondre la stalistique qui est la science qui vient d'être définie ef ene

sTatistique qui est un ensemble de données chiffrées sur un sujei précis

Les premières statistiques correctement elaborées ont été celles des recemsements

démographiques. Ainsi fe vocabulaire statistique est essentiellement celui de la démograpie OBJET DE LA

STATISTIQUE

Le bui dc la

siatistique

est de

synthétiser

et de résumer des

grands

voluIes de doRDCes,

e

grandes nmatrices d' informations. La méthode statistique comporte piusieurs etapes 1. La

statistique descriptive

ou

déductive

C'est l'ensemble des méthodes à

partir desquelles

o n

recueille, ordonne, réduit,

et

codense e données.

A cette

fin,

la

statistique descriptive

utilise des

paramètres,

ou

synthétiseurs,

de

graphiques et des méthodes dites d'analyse des données (l'ordinateur a facilité Be développement de ces méthodes).

2. La

statistique inférentielle ou inductive

C'est

l'ensemble

des

méthodes qui permettent

de faire des

prévisions,

des

inkexpoiatiors

une

population

à

partir

des résultats

recueillis

sur un

échantilion.

Nous

Rtikisons

des

raisonnements

inductifs c'est-à-dire des raisonnements de passage dea

particuier

au

gévéo

Cette

statistique utilise

des

repères

de

référence qui

sont les

modeles théoriques (lois

de

probabilités).

II. STATISTIQUE DESCRIPTTVE:

Elle est la méthode de

description

des

ensembles nombreux (popu:latims).

La

statistique descriptive

vise à

simplifier,

à résumer et à

synthétiser

bes

résuadtaks oienus.

U cours d'une étude: elle a pour but

d'aider

à

réaliser

un

portrait.

Pour avoir des

informations chiffrées

et

utilisables,

suite à une

obsrtaticon (enqacke),

on

procède

à un certain

nombre d'opérations logiques qui caractériseni

ka Ekcnaki:

stadistiqac.

En d'autre terme c'est

l'ensemble

des

méthodes permettant

de décriE WEe

pogoeulantiosn gparie

biais des individus qui la composent. La statistique descriptive s'susooersse dae ai deorIeE caractériser un ensemble d'individus représenté la plupart du temyes sOES ia kormae de tablcaas (tableaux de données), à résumer et synthétiser ces tableaux par finicronédiaire de graphagE et de paramétres appropriés (fréquences, distribution, o y e n , disaeso, c.).

(3)

IV.

TERMINOLOGIE ET NOTATION STANDARD DE LA STATISTIQUE :

Comme toute seience, la

statistique

a son vocabulaire,

qu'il

est primordial de définir de

façon

rigoureuse afin d'indiquer le groupe sur

lequel

porte l'étude, les caractères ou variables relevés sur chacun des individus et les différents types de caractères.

1.

Population :

ensemble des individus (ou unités

statistiques)

présentant un caractère

c o m m u n . Pour une thématique donnée, la

population

regroupe

toujours

la totalité des individus relatifs à cette

thématique

(notion d'exhaustivité).

Exemple: La

population

de la

wilaya de

Constantine

2. Unité

statistique (ou individu) :

élément de base constitutif de la

population

à

laquelle il appartient.

Exemple: Pour la

population

de

la commune

de Constantine, l'unité d'observation (U.O.) est représentée par la personne

âgée

entre 0

(zéro)

an et

plus

de 100 (cent) ans et habitant ladite

c o m m u n e .

3. Echantillon

:

sous-ensemble construit et représentatif d'une

population

donnée.

Lorsque l'on

parle

d'échantillon on

parle

en général de population mère, c'est-à-dire de la

population dont est issu l'échantillon.

4. Caractère

: Chaque

individu d'une population peut être décrit relativement à un ou

plusieurs caractèreso u variablesstatistiques.

Exemple

:

la couleur, le sexe, le

poids,

la taille ...etc

5. Modalité: Chacun des caractères, étudiés, peut présenter deux o u plusieurs aspects

(Valeurs) dits modalités.

Pour le sexe, deux modalités (valeurs): "Féminin" et "Masculin".

Pour

1'âge,

u n e infinité de modalités:

l'âge

d'une personne est compris entre zéro et

plus

de 100

(cent)

ans.

6. Variable qualitative:

Un caractère est dit qualitatif quand ses diverses modalités n e s'expriment pas en valeur numérique mais e n

qualité.

Les modalités sont exhaustives et mutuellement exclusives.

Chaque

individu doit

pouvoir

être classé dans une et une seule modalité.

Pour le caractère "sexe": Les modalités sont expriméeS par un mot: "féminin" ou "masculin"

ct n o n par une valeur numérique.

Les modalités d'une variable qualitative peuvent être classées s u r deux types d'échelle

:

nominale o u ordinale. A c e s deux types d'échelle correspondent deux types de variables qualitatives.

Les opérations arithmétiques que l'on peul réaliser s u r ce type de

variable sont

r e l a t i v e m e n t

réduites et s e limitent a u

comptage des e l f e c t i f s par modalité (fréquences absolues) et au calcul de p o u r c e n t a g e(fréquencesrelatives)

Page 3

Dr S. A M A R O U C H E

Maître A s s i s t a n t e -

E p i d é m i o l o g i e -

Université3 de C o n s t a n t i n eJ a n v i e r 2021

(4)

A- Variable qualitative nominale:

Il s'agit des variables dont les modalités sont exprimées par des noms et ne sont pas

hiérarchisées.

Exemple: Groupage sanguin:

A,

B, AB,

O

Un caractère nominal est dit binaire s'il ne peut prendre que deux modalités. Ce type de variable est très utilisé dans les sciences de la vie notamment en épidémiologie

Exemple

- Etat de santé : malade, sain

- Statut vaccinal : vacciné, non vacciné

B- Variable qualitative ordinale:

Une variable qualitative ordinale possède toutes les propriétés de la variable qualitative nominale avec en plus l'ensemble de ses modalités peut être doté d'une relation d'ordre.

*Exemple:

-

Complication

d'une maladie : modérée, moyenne, sévère

- Niveau d'étude

: primaire, secondaire, supérieur.

7. Variable quantitative:

Une variable statistique est dite quantitative si ses modalités sont exprimées en valeurs numériques. Les modalités d'une variable quantitative sont des nombres liés à 1'unité choisie, qui doit toujours être précisée.

Toutes les opérations arithmétiques simples et complexes sont applicables aux variables quantitatives, du dénombrement (fréquences absolues) et autre calcul de pourcentage (fréquences relatives) en passant par la moyenne, la médiane et l'écart-type jusqu'à la modélisation numérique.

Exemples:

L'âge (ans): 0, 1, . , 19, ..., 41, etc...

- La taille

(cm):

120, 121, . . I65, etc..

- La

glycémie (gr/l):

0.90,

1.00, .. 2.10,

etc.

Iexiste deux types de variables quantitatives les variables discrètes et les variables

continues.

Dr S. AMAROUCHE Maître Assistante -Epidémiologie- Université 3 de Constantine Janvier 2021 Page 4

(5)

A- Variable quantitative continue:

Un caractère quantiiatif cst dit continu: orsque ses valeurs sont en nombres infinis dans un intervalle de valeurs.

Evemple:

La

glycémic.

une inlinité de valeurs entre. par

exemple.

10 ans et 11 ans.

Classe:

Le

plus

souvent. pour l'étude de tels caractères. on définit. par regroupement des modalites.

des classes qui constitueront les nouvelles modalités (valeurs) du caractère.

Exemple:

Les ages de 0 an. 1 an. 2 ans, 3 ans, 4 ans seront regroupés dans un intervalle ou classe de [0

an-5 ans (10-4]).

Cette classe (ou tranche

d'åge)

sera considérée c o m m e étant la nouvelle modalité du caractere

age.

Chaque classe est définie par:

son amplitude,

- ses extrémités ou limites: inférieure et supérieure - son centre de classe.

B- Variable quantitative discontinue (ou diserète)

Un caractère quantitatif est dit discontinu, lorsque les valeurs de ses modalités sont exprimées par des nombres isolés, le

plus

souvent des nombres entiers.

*Exemple:

Taille de la famille (nombre de frères et sæurs): la taille ne peut être que 0 enfant. 1 enfant. 2 enfants. 3 enfants., ctc... et non pas 0.5 ou 3,75!

Les modalités de ce type de caractère peuvent, elles aussi, ètre regroupées en classe. selon les mémes principes que pour le caractère quantitatif continu.

8- Effectifs et fréquences:

Une des premières opérations de la statistique consiste à recenser le nombre etou le pourcentage d'individus qui présentent une modalité determinee d'une variable. C'est ainst qu'a chaque modalité est associé un effectif et/ou une fréquence.

A- L'effectif: (aussi appelé fréquenee absolue) de la modalité, désigne le nombre d'individus de la population présentant la modalité

B- La

fréquencerelative

La fréquence relative est le rapport entre deux tréquences absolues: numerateur denuanateu

Ele peut être exprimée par

Page 5 D r S. AMAROUCHE Maître Assistante Epidémiologie- Université 3 de Constantine-Janvier 2021

(6)

Proportion:

lc

numérateur est

une part

du dénominateur.

Elc

s'exprime

sous forme

d'un nombre compris entre 0 et ou bien sous forme d'un pourcentage (ou pour mille. pour dix mille..ctc)

Exemple : 5300 enfants vaccinés 7500 enfants= 0.70- 70

Ratio

le numérateur et le dénominateur sont de même nature mais sont exclusifs l'un de 'autre. Il s'exprime sans unité

Exemple 2000 hommes/1000 femmes. Le ratio H/F (sex ratio)=.

2 hommes pour une femnme

Le taus: il s'agit d'un rapport qui prend en considération le temps: il mesure la probabilité de survenue d' un événement au cours du temps.

L'indice: c'est le rapport de deux effectifs qui sont de nature différente. On l'utilise surtout comme indicateur de fonctionnement

*Exemple dans un hôpital 850 lits, 10 médecins done 85 lits pour un médecin

9-Série ou distribution

Les unités d'observation (U.0.) d'une population, peuvent être étudiées à travers un ou plusieurs caractères.

Pour chaque U.O. nous observeront une modalité du caractère étudié.

Pour l'ensemble des U.0. nous auront un ensemble de modalités observées (de valcurs observées), relatives au caractère étudié.

Cette ensemble de modalités observées s'appelle série ou distribution statistique à un caractère.

La distribution statistique peut, aussi, être à deux. trois ou n caractères (selon le nonmbre de caractères étudiés par unité

d'observation).

V.

PRESENTATION DES DONNEES

Il existe

plusieurs

niveaux de

description statistique :

la

présentation

brute des données, des

présentations par tableaux numériques. des représentations graphiques et des résumes numériques

fournis par un

petit

nombre de

paramètres caractéristiques.

Présentation tabulaire:

Il est

primordial

de définir la

population

et de

préciser

avee

rigueur

la ou les variables relevées sur chacun des individus de la

population

ou de

l'échantillon

la

représentant.

Easuite.

quand

les observations ont élé recueillies, le

premier

travail eonsiste à les

presenter, aus

clairement que

possible,

sous lome de tableu

statistique

Dr S. AMAROUCHE Maitre Assistante Fpidémiologie- Université de Constantine Ja ier 2021 Page 6

(7)

Tableau brut des donnéesS:

Le tableau brut est le tableau élémentaire de travail. T'outes les donnéesy figurent unité par unité et variable par variable.

Les individus ou unités statistiques sont en ligne et les variables en colonnes

Eremple:

Numéro Prénonm sexe Date de

Taille (cm) Poids(Kg) naissance

30/06/1978 24/04/1965 163 12/03/1982 165

23/05/0974 180

Mohamed M 170 70

Souad

75

Lamia karim

F

56

M

69

Tableau de fréquence:

Le tableau de distribution de fréquences est un mode synthétique de présentation des données Chaque tableau est précédé par son titre comprenant les caractéristiques de personnes, de temps et de lieu

Exemple: Population algérienne -Recensement 2008

Effectif (n) Fréquence relative (%) Sexe 72

Masculin 17 232 747

Féminin 16 847 283 69

Total 34 080 030 100

Source: O.N.S. / Exploitation exhaustive du recensement général de la population et de l'habitat - RGPH 2008 -

2- Présentation graphique:

Un graphique - étymologiquement « qui figure par le dessin » - est une représentation visuelle

et simplifiée d'une réalité appréhendée sous une forme essentiellement numérique (série,

tableau).

L'apparition des graphiques statistiques, liée à l'utilisation des coordonnées, doit

essentiellement son origine au philosophe et mathématicien René Descartes (1596-1650). Ces graphiques constituent une synthèse visuelle indispensable de 1'information contenue dans le tableau statistique. Les graphiques utilisés dépendent de la nature de la variable

3- Présentation paramétrique:

C'est un des

objectifs

fondamentaux et LE défis de la

statistique descriptive: résumer de

façon simple de grandes séries statistiques tout en en conservant au mieux le contenu informationnel en limitant au maximum la perte

d'informations

inhérente à ce

processus

réducteur. Afin d'y parvenir. la statistique a développé un certain nombre d'outils pour d'une part caractériser et résumer au mieux des disuributions statistiques et pour d'autre part mettre

en évidence, voire exacerber, le cas écheant, leurs dilférences. Deux groupes complenentares

Dr S. AMAROUCHE Maître Assistante - Epidémiologie- Université 3 de Constantine - Janvier 2021 Page 7

(8)

de param tres permettent d'atteindre ees objectilis: Les paramètres de tendance centrale Les paramétres de dispersion Ces dcus groupes de paramètres sont complémentaires pour la deseription et le résumé de distributions statistiques et on ne saurait faire abstraction de l'un

ou de l'autre pour ces oprations.

Paramètres de tendance centrale (mode, moyenne, médiane.

quantiles,

etc.).

paramètres

de

dispersion

(variance. écart-type. coefficient de variation, standardisation. etc.).

La

présentation

des données. sous la forme de tabulaire,

graphique

et

paramètres

de réduction.

n o u s permet (en première

conclusion)

d'avoir un

portrait

du

phénomène

étudié

Un

portrait signifie

une

réponse,

à travers le recueil

(l'observation)

et le traitement (regroupement et

présentation)

des données, aux

questions

suivantes:

*Qui

sont concernés

par le

phénomène? (caractéristiques

de

personnes)

*Quand

Où le le

phénomène est-il

survenu?

(caractéristiques

de temps)

phénomène

est-il survenu?

(caractéristiques

de lieu)

gadetmaodogue- laiversité 3 de unstantine Javier 2021 Page

Références

Documents relatifs

Voici Une Série statistique quantitative indiquant le nombre d’appels téléphoniques réalisés au moyen d’un GSM au cours d’une journée pour un échantillon de

fin., services domestiques (Pop. Contrairement aux classements utilisés dans les tableaux précédents, les industries intermédiaires comprennent ici, en plus de la sidérurgie,

On regroupe les couples ayant même valeur de x et on les remplace par m couples ayant cette valeur de x et pour valeur de y, la moyenne des valeurs de y du groupe (figure

(k) Si tu devais r´ ealiser le diagramme circulaire de cette s´ erie, quelle serait l’amplitude de l’angle du secteur correspondant aux nombres d’´ etats ont entre 16 et 18

I) Quel est le pourcentage de personnes ayant un salaire inférieur à 375 euros ? II) Quel est le pourcentage de personnes ayant un salaire supérieur à 425 euros ? III) Quel est

Si oui, d´eterminer les coordonn´ees du point moyen et l’´equation de la droite de r´egression de y (les taux de pauvres) en x (les recettes publiques)..

• Utiliser un logiciel ou une calculatrice pour représenter une série statistique à deux variables et en déterminer un ajustement affine selon la méthode des moindres

On appelle mode d’une série statistique à caractère discret la valeur du caractère statistique qui correspond au plus grand effectif. On appelle classe modale d’une