CORSO DI LAUREA IN INFERMIERISTICA
LEZIONI DI STATISTICA Parte II
Elaborazione dei dati
Variabilità
Lezioni di Statistica
VARIABILITA’
Si definisce variabilità la proprietà di alcuni fenomeni di assumere valori o modalità diverse.
I fenomeni che posseggono tale proprietà di definiscono variabili,quelli che non
variano si definiscono costanti.
Tutti i fenomeni biologici sono variabili.
Lezioni di Statistica
La variabilità può essere studiata a livello individuale (es.in una stessa persona) al variare di determinate
condizioni o circostanze oppure nel collettivo (es.in una determinata popolazione)nelle medesime
condizioni o circostanze.
E’ possibile studiare la forma e la misura della variabilità.
Per studiare la forma della variabilità si ricorre alla
rappresentazione grafica dei dati mediante diagrammi cartesiani.
Le caratteristiche delle linee (in genere curve) rappresentano la forma della variabilità.
Lezioni di Statistica
Forma della variabilità a livello individuale Si ricorre ad un diagramma cartesiano indicando sull’asse delle ascisse le
condizioni o circostanze nelle quali si
effettua la misurazione e nell’asse delle
ordinate i diversi valori che la variabile
assume
Lezioni di Statistica
Forma della variabilità nel collettivo
Si ricorre ad un diagramma cartesiano indicando
sull’asse delle ascisse i diversi valori che la variabile assume e sull’asse delle ordinate il numero di
osservazioni (o la frequenza relativa)corrispondente ai singoli valori (in questo caso tutte le misure
devono essere eseguite nelle stesse condizioni e circostanze).
In alcuni casi, e sempre quando si tratta di fenomeni biologici, la forma della variabilità assume un
aspetto caratteristico che si definisce curva normale (o gaussiana).
Curva normale o gaussiana
Così per esempio per studiare la
distribuzione secondo la statura di un collettivo di giovani di 18 anni occorre riportare sull’asse delle ascisse i
diversi valori che la variabile assume (statura m.1,50;1,60;1,70;ecc..) e
sull’asse delle ordinate le frequenze
assolute o percentuali corrispondenti ai
singoli valori (es.numero o percentuale
di giovani alti m.1,50; 1,60;1,70;ecc..)
Principali caratteristiche della curva normale
• La curva di Gauss è simmetrica
• Se un fenomeno si distribuisce secondo una curva normale la media aritmetica,la moda e la mediana coincidono
• La curva di Gauss tende all’infinito (da – infinito a + infinito)
• Ai due lati della moda la curva decresce
rapidamente fino ad un punto in cui la
rapidità di diminuzione è molto minore
(punti di flesso)
segue Principali caratteristiche della curva normale
• L’area compresa tra la curva di Gauss e l’asse delle ascisse (che si definisce area sottesa alla curva di Gauss) corrisponde al 100% delle osservazioni
• La curva di Gauss è definita da una funzione matematica che consente di calcolare le
frequenze(y) corrispondenti ai singoli valori
che la variabile assume(x).
Funzione della curva normale
_
21 x i - x
- -- ---
1 2 σ
y = --- e
σ 2π
segue Funzione della curva normale dove e e π rappresentano due costanti
matematiche
e = 2,71828
π = 3,14159...
Lezioni di Statistica
Misure di variabilità _
2Devianza ∑ ( x
i –x )
_
22
∑ ( x
i –x ) Varianza σ
= ---N
Lezioni di Statistica
segue Misure di variabilità
_
2DEVIAZIONE ∑ ( x i - x ) STANDARD σ = ---
N (o scarto quadratico medio)
La formula serve a calcolare la deviazione
standard di una serie di valori e corrisponde
alla radice quadrata della varianza .
Lezioni di Statistica
Deviazione standard
Molto spesso, negli studi bio-medici, i
dati vengono riassunti attraverso il più comune indice di tendenza centrale: la media. In questo caso, per descrivere compiutamente la popolazione, è
sempre necessario dichiarare anche, come indice di variazione, il valore
della deviazione standard.
Lezioni di Statistica
• La deviazione standard (o scarto quadratico medio) rappresenta la distanza media dei dati dalla loro media.
• La deviazione standard è un ottimo indice di variazione dei dati quando essi sono
distribuiti normalmente e rappresenta la
misura di variabilità più usata nella ricerca
scientifica e in campo clinico.
CALCOLO DELLA DEVIAZIONE STANDARD QUANDO IL NUMERO DELLE OSSERVAZIONI E’ LIMITATO
_
2DEVIAZIONE ∑ ( x i - x ) STANDARD σ = ---
N - 1 (o scarto quadratico medio)
La formula serve a calcolare la deviazione standard quando il numero di osservazioni è limitato(<30).
In questi casi si divide la «devianza» per i «gradi di libertà» che sono ottenuti dal numero di
osservazioni (N) di cui è composto il campione,
meno 1
CALCOLO DELLA DEVIAZIONE STANDARD QUANDO IL NUMERO DELLE OSSERVAZIONI E’ LIMITATO
Quando si studia la variabilità in un campione e si applica tale misura (variabilità osservata)all’intera popolazione dalla
quale il campione è stato estratto(variabilità stimata)si commette un errore più o meno grande a seconda della numerosità del campione.
Lo Student ha dimostrato che per ridurre la differenza tra
variabilità stimata e variabilità reale occorre moltiplicare la varianza per un fattore di correzione
_ 2 _ 2
2 ∑(xi – x) n _ 2 1 n ∑(xi – x)
σ=
---.
--- = ∑ ( xi – x) . --- . --- = --- n n-1 n n-1 n-1Lezioni di Statistica
Calcolo della deviazione standard Esempio
Supponiamo di avere il seguente
campione, di cui vogliamo calcolare l’età media e la deviazione standard:
19, 21, 24, 21, 17
somma dei valori della serie
19 + 21 + 24 + 21 + 17 = 102
media = 102:5 = 20,4
Lezioni di Statistica
Ora calcoliamo la differenza di ogni valore dalla media, cioè il valore
_ x
i– x
detto anche scarto o deviazione, e
quindi eleviamo al quadrato gli scarti e
sommiamo tali quadrati.
Lezioni di Statistica
Differenza tra i valori e la media
2
scarto scarto 19-20,4 = - 1,4 1,96 21-20,4 = 0,6 0,36
24-20,4 = 3,6 12,96 21-20,4 = 0,6 0,36 17-20,4 = - 3,4 11,56
--- 27,20
La devianza è 27,20;i gradi di libertà sono N-1 cioè 4.
Lezioni di Statistica
Dividiamo la devianza per i gradi di libertà 27,2 : 4 = 6,8
ed estraiamo la radice quadrata.
Radice quadrata di 6,8 = 2,61 che è la deviazione standard della serie di valori considerata.
_
Se si applica la formula x σ si ottiene l’intervallo entro il quale è compresa l’età della maggior parte del collettivo da cui proviene il campione esaminato.
20,4 2,61 = 17,79 - 23,01 Questa procedura consente di evitare
l’inconveniente della media aritmetica che non tiene conto della distribuzione dei valori nella serie
considerata.
Lezioni di Statistica
Nell’intervallo _
x σ
è compreso il 68,3% delle osservazioni;
nell’intervallo _
x 2 σ
è compreso il 95,5% delle osservazioni
MISURE DI VARIABILITA’ QUANDO AI SINGOLI
VALORI CORRISPONDE PIU’ DI UNA OSSERVAZIONE (O QUANDO SI TRATTA DI VALORI RAGGRUPPATI IN
CLASSI)
_ 2
Devianza ∑ ( xi – x ) . n i
_ 2 2 ∑ ( xi – x ) . n i Varianza σ = ---
N
_ 2
DEVIAZIONE ∑ ( x i - x ) . n i
STANDARD σ = --- N
MISURE DI VARIABILITA’ QUANDO AI SINGOLI
VALORI CORRISPONDE PIU’ DI UNA OSSERVAZIONE (O QUANDO SI TRATTA DI VALORI RAGGRUPPATI IN
CLASSI)
Statura Valori centr. Numero di
in cm. delle classi osservaz.
X
i .n
ix
in
i____________fino a 150 145 5 725
151 – 160 155 20 3.100 161 – 170 165 50 8.250
171 – 180 175 20 3.500 oltre 180 185 5 925 _______________________________________
Totale - 100 16.500
MISURE DI VARIABILITA’ QUANDO AI SINGOLI VALORI CORRISPONDE PIU’ DI UNA OSSERVAZIONE ( O QUANDO SI
TRATTA DI VALORI RAGGRUPPATI IN CLASSI)
Calcolo della media aritmetica ponderata
_
x p = 16.500 : 100 = 165
segue MISURE DI VARIABILITA’ QUANDO AI SINGOLI VALORI CORRISPONDE PIU’ DI UNA OSSERVAZIONE ( O QUANDO SI
TRATTA DI VALORI RAGGRUPPATI IN CLASSI)
_ _
2_
2___X
ix
i- x (x
i– x) (x
i– x) . n
i145
-
20 400 400 . 5 = 2.000 155-
10 100 100 . 20 = 2.000 165-- -- --
175 10 100 100 . 20 = 2.000 185 20 400 400 . 5 = 2.000 __________________________________________
Totale
-- --
8.000segue MISURE DI VARIABILITA’ QUANDO AI SINGOLI VALORI CORRISPONDE PIU’ DI UNA OSSERVAZIONE ( O QUANDO SI
TRATTA DI VALORI RAGGRUPPATI IN CLASSI)
Devianza=8.000
Varianza=8.000:100=80
Deviazione standard = 80 = 8,94 _
x σ = 165 8,94 = 156
|--|174
segue MISURE DI VARIABILITA’ QUANDO AI SINGOLI VALORI CORRISPONDE PIU’ DI UNA OSSERVAZIONE ( O QUANDO SI
TRATTA DI VALORI RAGGRUPPATI IN CLASSI)
_
x 2 σ = 165 17,88 = 147
|--|183(*)
(*) cifre arrotondate
STATURA DEGLI ISCRITTI DI LEVA NATI NEL 1963 (VISITA DI LEVA 1981)
Statura in cm. X i
n
i X i. n
ifino a 159 155 2,5 387,5 160-169 165 30,5 5.032,5 170-179 175 52,4 9.170,0 180-189 185 13,9 2.571,5 190 e oltre 195 0,7 136,5 Totale
--
100 17.298Xi = Valori centrali delle classi
n i = frequenza % delle osservazioni
_
X p = 17.298 : 100 = 172,98 (media aritmetica ponderata)
segue STATURA DEGLI ISCRITTI DI LEVA NATI NEL 1963 (VISITA DI LEVA 1981)
_ _
X
i- X ( X
i- X ) . n
i- 17,98 - 44,95 - 7,98 - 243,39 + 2,02 +105,848 +12,02 +167,078 +22,02 + 15,414 - 288,34 + 288,34 = 0
segue STATURA DEGLI ISCRITTI DI LEVA NATI NEL 1963 (VISITA DI LEVA 1981)
_ _ _
2_
2X i
-
X(
X i-
X )(
X i-
X )(
X i-
X ). n
i- 17,98 - 18 324 810
- 7,98 - 8 64 1952 + 2,02 + 2 4 209,6 +12,02 + 12 144 2001,6 +22,02 + 22 484 338,8
5.312,0(devianza) N.B. – Nella seconda colonna sono riportati
gli scarti arrotondati eliminando i decimali
segue STATURA DEGLI ISCRITTI DI LEVA NATI NEL 1963 (VISITA DI LEVA 1981)
2 5312
σ = --- =
53,12100
σ =
53,12 = 7,29_
x σ =
173 7 = 166 |-| 180_
x
2σ =
173 14=
159 |-| 187CBM-Indagine sulle condizioni di salute dei bambini di Torbellamonaca
Malattie Tor Bella- Popolazione
(1)
monaca%
(2)italiana(ISTAT)
(3)No 26,4±4,9 49,8
Sì 73,6±4,9 50,2 Totale 100,0 100,0
(1) sofferte negli ultimi tre mesi
(2) Dati standardizzati secondo l’età per renderli confrontabili con la popolazione italiana
(3) Stima su tre mesi del periodo di riferimento per renderlo confrontabile con l’indagine di Tor Bella Monaca