APPUNTI di EPIDEMIOLOGIA e BIOSTATISTICA

(1)

Università degli Studi di Roma "Tor Vergata"

Facoltà di Medicina e Chirurgia

Corso di laurea specialistica in Biotecnologie Mediche A.A. 2010/2011

APPUNTI di

EPIDEMIOLOGIA e BIOSTATISTICA

(2)

EPIDEMIOLOGIA = EPI-DEMOS-LOGOS

STUDIO delle MALATTIE su una POPOLAZIONE

• chi sono sono le persone ammalate?

• quali differenze rispetto ai non ammalati?

• dove la malattia si presenta con maggiore frequenza?

• qual è l’evoluzione temporale della malattia?

(3)

ALCUNE DEFINIZIONI di EPIDEMIOLOGIA

1927 – La scienza che studia gli episodi di infezioni di massa (Frost) 1958 – La scienza che studia la distribuzione di una malattia, o di una particolare condizione, in una popolazione e dei

fattori che la influenzano (Lilienfield)

1970 – La scienza che studia i fattori che determinano la comparsa delle malattie nelle popolazioni umane (Fox)

(4)

Evoluzione dell’epidemiologia

1850-1950: Approccio descrittivo

Malattie infettive (colera, febbre puerperale, ecc.) Malattie non trasmissibili (pellagra, ecc.)

Malattie croniche (malattie cardiovascolari, tumori, ecc.) 1950-2000: Approccio deterministico

“tutti gli esposti diventano casi e tutti i casi sono dovuti a quel fattore”

Approccio probabilistico:

“la causa non è più evento necessario e sufficiente”

2000-oggi: Epidemiologia genetica

studi epidemiologici molecolari mirati a misurare l'esposizione a sostanze specifiche (addotti DNA) e la risposta biologica (mutazioni somatiche), valutazione delle caratteristiche (genotipo e fenotipo) agli agenti esterni, marcatori di un effetto specifico (come espressione genica). Valutazione epidemiologica delle cause ereditarie della malattia,

(5)

Studio epidemiologico del 1854

(John Snow, Londra 1854) Fonte dell’ acqua:

Soutwork Co. (1) Lambeth Co (2).

Others companies (3)

Numero abitanti serviti dalle fonti idriche:

(1): 40.016 (2): 26.107 (3): 256.423

Decessi per colera:

(1): 1.263 (2): 98 (3): 1.422

Morti per 10.000 abitanti (1): 315

(2): 37

(6)

(7)

STRUTTURA di UN’INDAGINE EPIDEMIOLOGICA Parte descrittiva:

a) definizione del fenomeno oggetto di studio b) quantificazione (misure di insorgenza)

c) evoluzione (nel tempo e nello spazio) Parte analitica:

a) formulazione di ipotesi eziologiche su fattori causali e modalità di trasmissione (misure di associazione)

b) impostazione ed esecuzione di studi analitici c) analisi dei dati

d) interpretazione dei risultati Parte operativa:

a) indicazioni d’ intervento e valutazioni delle loro conseguenze b) stime d’ impatto a livello di popolazione generale

(8)

UTILIZZO delle METODOLOGIE STATISTICHE

• popolazione di riferimento e dimensione del campione

• misure di occorrenza e di associazione

• analisi dei risultati (test di significatività e/o intervalli di confidenza)

• individuazione e correzione di possibili

bias

(9)

STUDI EPIDEMIOLOGI

STUDI SPERIMENTALI -Sperimentazioni cliniche -Sperimentazioni di comunità

STUDI OSSERVAZIONALI -Studi trasversali

-Studi prospettici -Studi retrospettivi

(10)

STUDI SPERIMENTALI

SPERIMENTAZIONE CLINICA CONTROLLATA:

A)TERAPEUTICO (su soggetti malati) A)PREVENTIVO (su soggetti sani)

(11)

STUDI OSSERVAZIONALI Studi trasversali (cross-sectional; prevalence study):

misurano la prevalenza di una determinata condizione (malattia) in una determinata popolazione ( o campione di essa)

Studiprospettici:

seguono nel tempo (da T0 a Tn) gruppi di popolazione per verificare se l’

esposizione o meno ad un certo fattore di rischio, si manifesterà o meno una differenza (statisticamente significativa) nell’ incidenza futura di una specifica condizione morbosa (malattia).

Studiretrospettivi:

Analizzano gruppi di popolazione sulla base di osservazioni di eventi e/o correlazioni già avvenute

(12)

ALCUNE MODALITA’ di EFFETTUAZIONE di STUDI EPIDEMIOLOGICI

STUDI DI COORTE:

il punto di partenza è l’ esposizione (causa) e si seguono nel tempo i soggetti per verificare se la frequenza di malattia (effetto) è influenzata dalle differenti modalità di esposizione (gradiente)

STUDI CASO CONTROLLO:

Il punto di partenza è un determinato evento e si confrontano soggetti (caso) esposti a un determinante con soggetti non esposti (controllo) per verificare l’effetto della esposizione sull’evento

(13)

matrice di numeri caratterizzata dal fatto che il valore alla colonna y-esima della riga x-esima è dato da y*x

1 2 3 4 5 6 7 8 9 10

2 4 6 8 10 12 14 16 18 20

3 6 9 12 15 18 21 24 27 30

4 8 12 16 20 24 28 32 36 40

5 10 15 20 25 30 35 40 45 50

6 12 18 24 30 36 42 48 54 60

7 14 21 28 35 42 49 56 63 70

8 16 24 32 40 48 56 64 72 80

9 18 27 36 45 54 63 72 81 90

10 20 30 40 50 60 70 80 90 100

1 2 3 4 5 6 7 8 9 10

(14)

(15)

100

81 90

64 72 80

49 56 63 70

36 42 48 54 60

25 30 35 40 45 50

16 20 24 28 32 36 40

9 12 15 18 21 24 27 30

4 6 8 10 12 14 16 18 20

1 2 3 4 5 6 7 8 9 10

(16)

MISURE di FREQUENZA

PROBABILITÀ:

è il rapporto tra gli eventi osservati nell’intervallo di tempo t⁰a t¹ e il numero di soggetti esposti al tempo t^o.

P(t¹-t⁰) = E (t¹-t⁰)/Nt⁰ N= numero soggetti esposti

E= numero eventi osservati

P= probabilità che i soggetti esposti sviluppino un determinato evento nel tempo

N.B.

La formula della probabilità presuppone che Nt¹–Nt⁰ = E (t¹-t⁰) oppure che E (t⁰-t¹) sia diverso da 0

(17)

(18)

MISURE di POSIZIONE o di TENDENZA CENTRALE

Media

La media di una distribuzione è il suo “centro di gravità” indifferenze della distribuzione delle osservazioni

= x1+x2+…xn/N Mediana

Rappresenta un valore maggiore della metà delle osservazioni e minore della metà o meno delle osservazioni

Moda

Rappresenta il valore che appare con maggiore frequenza nell’insieme dei dati Media>Mediana : assimetria positiva

Media=mediana=moda: simmetria Media<Mediana: assimetria negativa

(19)

MISURE di DISPERSIONE

rappresentano la dispersione dei dati (in + o in -) intorno alla media.

Varianza

È il rapporto tra il valore della somma dei quadrati degli scostamenti dalla media e il numero delle osservazioni

V= ( x¹+x²+…xⁿ/ )º /N-1 Deviazione Standart

è la radice quadrata della varianza, ossia della media dei quadrati degli scostamenti dalla media

√ ( x¹+x²+…xⁿ/ )º /N-1

(20)

MISURE di FREQUENZA

TASSO

è il rapporto tra numero di eventi e popolazione in un periodo di tempo definito

T(t

¹

-t

⁰

)= E(t

¹

-t

⁰

)/ (Nt

⁰

+Nt

¹

)/2 T=tasso

N= numero soggetti esposti

E= numero eventi osservati

(21)

ERRORE di PRIMO e SECONDO tipo

(22)

Errore standard di un tasso

E’ un indice del grado di precisione con cui il tasso determinato su un campione stima il tasso esistente nella popolazione.

Per N > 100 l’errore standard di un tasso è dato da:

Es(T)=√(T/P)*K Es(T)= errore standart di un tasso

P= popolazione

K= costante moltiplicativa Limiti fiduciali di un tasso

Sono i limiti dentro i quali si può affermare, con una data probabilità di errore, che è compreso il tasso “vero” della popolazione.

Limite superiore T+ Es(T) Limiti fiduciali al 95%

Limite inferiore T- Es(T)

(23)

Limiti fiduciali di un tasso

Il valore vero di una popolazione è incluso in un intervallo di confidenza la cui ampiezza dipende dall’errore standard e dal livello di fiducia prescelto. Per costruire intervalli di confidenza al 95% (scelta più comune) ed escludendo il 2,5% nelle aree di coda della distribuzione si ha il valore del limite è uguale a + / – 1,96.

Limite superiore T+ 1.96 E.S (T) Limiti fiduciali al 95%

Limite inferiore T- 1.96 E.S (T)

Sono i limiti dentro i quali si può affermare, con una data probabilità di errore, che è compreso il tasso “vero” della popolazione.

(24)

MISURE di FREQUENZA

Incidenza :

numero di nuovi casi in un dato periodo di tempo in una determinata popolazione

Le popolazioni a cui di riferimento possono essere:

•chiuse

•dinamiche

Le misure di incidenza sono di due tipi:

•incidenza cumulativa (rischio o probabilità)

•densità di incidenza (tasso di incidenza)

(25)

Popolazione chiusa:

è una popolazione i cui soggetti vengono seguiti per tutto il periodo di osservazione e non presenta nè ingressi nè uscite durante il follow-up.

In una popolazione chiusa è valido il calcolo dell’incidenza cumulativa Incidenza cumulativa :

È il rapporto tra il numero dei nuovi casi in un dato periodo di tempo e il numero totale dei soggetti al tempo t¹:

CI (t¹-t⁰) = n(t¹-t⁰)/Nt¹ CI=incidenza cumulativa

N=soggetti al tempo t¹

n=nuovi casi nel tempo da t⁰ a t¹ Il valore di CI varia perciò tra 0 e 1

(26)

Popolazione dinamica:

è una popolazione che varia durante il tempo di osservazione sia perchè nuovi soggetti possono entrare nella popolazione sia perchè dei soggetti possono essere persi durante il follow-up. Per una popolazione dinamica si può calcolare solo la densità di incidenza

Densità di incidenza

È rapporto tra numero di nuovi casi insorti nella popolazione nell’intervallo di tempo e il numero degli individui osservati per la durata del tempo.

DI=(E/(Ni*di) E = eventi nel periodo di osservazione

di = durata del tempo i-esimo

Ni= individui osservati per la durata del tempo i

(27)

MISURE di FREQUENZA

Prevalenza

numero di casi presenti in un dato tempo / totale della popolazione Pr=n/N

La prevalenza dipende dalla comparsa di nuovi casi e/o dalla scomparsa di casi presenti.

Pr I*d

Dove d indica la durata della presenza di un caso

La prevalenza varia direttamente con l’incidenza e la durata media delle malattie. Se I e d sono costanti nel tempo si ha che:

Pr=I*d

(28)

CALCOLO RISCHIO INDIVIDUALE per una DETERMINATA PATOLOGIA CORRELATO alla PRESENZA o MENO di ULTERIORI PATOLOGIE, dalla FAMILIARITÀ, dalla PRESENZA

di MUTAZIONI GENETICHE RILEVATE e da RISCHI INDIVIDUALI

(Clini ed altri 2010)

Ri = [( Pa¹+Pa²+…Paⁿ)] [E/n+( Ip¹+Ip²+…Ipⁿ)]+Rf+Rg+Ri

Ri (Rischio individuale) = 0≥Ri<5

Pa (tipo di patologia correlata) = 0≥Pa<5 E (età) = 0≥E<5 E Pa

N somma delle patologie rilevate

Ip (intereazione tra le patologie rilevate) = Pa^1,2,3+Pan/n Rf (rischio derivato da familiarità) = 0≥Rf<5

Rg rischio derivato da mutazioni genetiche patogene = 0≥Rg<5 Rc (rischio comportamentale, ambientale) = 0≥Rc<5

0≥Ri≤15 = basso rischio 15≥Ri≤30 = medio rischio 30≥Ri = alto rischio

(29)

RICERCA EPIDEMIOLOGICA

OBIETTIVI:

Descrivere frequenza e distribuzione di un evento in una popolazione;

Descrivere la distribuzione, nella stessa popolazione, di fattori predittivi dell’evento in esame;

Valutare l’associazione tra l’evento e i fattori predittivi.

I METODI UTILIZZATI:

Dati già esistenti (certificati di morte, cartelle cliniche etc). Il limite è nell’accuratezza dei dati;

Indagini ad hoc (ad esempio sullo stato di salute di una popolazione).

NB:

L’EVENTO può essere una malattia, una variabile fisiologica, una mutazione genetica, un dato clinico etc.

etc. Deve essere sempre definito in modo accurato, prerequisito essenziale per ogni indagine

(30)

UTILIZZO dei DATI:

Sorveglianza sanitaria di una popolazione;

Descrizione dello stato di salute di una popolazione;

Formulazione di ipotesi (ad esempio sul ruolo svolto da fattori che presentano una distribuzione analoga all’evento osservato). Ipotesi poi verificabili attraverso studi analitici.

Raccolta dati Analisi dei dati

Formulazione ipotesi (costruzione modello) Verifica dell’ipotesi (studi analitici)

(31)

ANALISI dei DATI:

a)Frequenza dell’evento (incidenza, prevalenza, tasso, probabilità)

b)Distribuzione dell’evento (misure di dispersione e di tendenza centrale)

c)Temporalità (orientamento dei dati definendone il trend a lungo o breve termine o secondo fluttuazioni periodiche)

Esempio:

Nell’analisi dei dati riferiti a un evento specifico come lo è una specifica malattia, le principali caratteristiche epidemiologiche che occorre analizzare sono :

•Caratteristiche individuali (età, fattori genetici, ambientali, lavorativi etc.)

•Sesso (differenze nella mortalità e nella frequenza delle malattie, fattori genetici, aspetti comportamentali e sociali etc.)

•Etnia (condivisione di caratteristiche genetiche e/o ambientali)

•Classe sociale (stratificazione della popolazione in sottogruppi definiti dal diverso grado di istruzione e disponibilità economica)

•Lavoro (rapporto tra condizione lavorativa e sviluppo di malattia)

(32)

QUALITÀ dei DATI:

La qualità delle osservazioni e delle misure utilizzate nelle ricerche epidemiologiche è uno dei determinanti principali della validità della ricerca stessa. La qualità dei dati è caratterizzata dalla loro VALIDITÀ (sensibilità e specificità, ovvero grado dell’accordo tra la misura o l’osservazione dell’evento e il valore “vero” dell’evento stesso) e/o RIPRODUCIBILITÀ (grado di concordanza tra misure ripetute dello stesso evento).

La validità è caratterizzata dalla sensibilità e dalla specificità.

La riproducibilità è caratterizzata dalla variabilità individuale (biologica) e dalla variabilità dell’osservatore.

In una ricerca epidemiologica la stima della validità e della riproducibilità delle misure effettuate è necessaria al fine dell’accettabilità o meno delle conclusioni dello studio.

(33)

Esempi:

a)Sensibilità e specificità delle glicosuria nell’individuazione di soggetti diabetici rispetto alla OGTT (curva da carico di glucosio):

La sensibilità è l’individuazione di una proporzione dei casi “veri”. Quindi dalla tabella la sensibilità è data dalla proporzione dei casi classificati come diabetici sul totale dei diabetici: 12/46 = 0,26 (26%);

La specificità descrive la capacità di identificare i casi negativi. Quindi dalla tabella la specificità è data dalla proporzione dei casi negativi nella popolazione classificata come non diabetici sul totale dei non diabetici: 432/479 = 0,90 (90%)

Dalla tabella possiamo ricavare la PREVALENZA OSSERVATA, pari a 59/525 = 0,11. Inoltre possiamo stimare la PREVALENZA VERA data dal rapporto tra la prevalenza osservata-1-specificità e la somma della sensibilità+specificità-1 : 0,11-(1-0,90)/0,26+0,90-1) = 0,37.

Infine è possibile stimare il VALORE PREDITTIVO +/-. Nell’esempio se i 525 soggetto fossero un campione significativo di una popolazione, il VP + è dato da 12/59 = 20,5% (vale adire che un soggetto + al test ha

diabetici non diabetici totale

+12 +47 59

-34 -432 466

46 479 525

(34)

b) Variabilità tra osservatori nella lettura di cartelle cliniche in relazione alla presenza o meno di isterectomia durante uno studio caso-controllo di cancro alla mammella.

Il due osservatori arrivano alle stesse conclusioni sulla presenza (56) e assenza (31) di isterectomia e in disaccordo sulla presenza (6) e assenza (9) di isterectomia.

La CONCORDANZA COMPLESSIVA data dal rapporto tra i casi concordanti e la totalità della popolazione.

Quindi: (56+31)/102 = 0,85 (85%).

LA CONCORDANZA sui POSITIVI è data dal rapporto tra i positivi concordanti e questi + la somma dei discordanti/2. Quindi: 56/56+(6+9/2) = 0,88 (88%)

LA CONCORDANZA sui NEGATIVI è data da rapporto tra i negativi (31) e questi + la somma dei discordanti/2. Quindi: 31/31+(6+9/2) = 0,80 (80%)

1

osservatore

2 osservatore

56 6 62

9 31 40

65 37 102

(35)

DEFINIZIONE dello STUDIO

1.STUDI ANALITICI:

Gli studi analitici hanno lo scopo di indagare cause e fattori di rischio delle malattie, analizzando singoli individui o gruppi ristretti. La progettazione della ricerca attiene la definizione del “modello biologico” che la ricerca intende valutare. E’ necessario scegliere le variabili che si possono osservare e misurare, necessarie alla raccolta di informazioni sufficienti a testare le ipotesi poste nel modello biologico.

2. STUDI di CORRELAZIONE:

In questo tipo di studi si mettono in relazione la distribuzione di uno o più fattori di rischio e una patologia. Non è possibile verificare le relazioni a livello individuale, ma solo di gruppo. In genere sono usati per proporre nuove linee di ricerca e richiedono sempre una verifica da parte di altri studi.

3. STUDI SPERIMENTALI:

Lo studio sperimentale è un’indagine, che può essere condotta sia in campo che in laboratorio, e permette di confrontare 2 o più gruppi di individui riguardo all’esito di trattamenti diversi.

4. STUDI OSSERVAZIONALI

Gli studi osservazionali si pongono l’obiettivo di fotografare in un dato tempo le

(36)

IL CAMPIONAMENTO

• Dimensione del campione

Molte indagini sono di dimensioni minori di quelle necessarie agli scopi prefissati.

Per prevenire ciò è necessario stabilire la dimensione del campione in termini statistici.

• Metodo di campionamento

Il campione può essere scelto casualmente (random). Può accadere che il ricercatore voglia che alcune caratteristiche siano comunque rappresentate nel campione (es.

ambo i sessi, classi di età). In tal caso si campiona stratificando per la caratteristica di interesse.

Tipi di campionamento

Semplice

Sistematico

Stratificato

(37)

(38)

(39)

(40)

(41)

(42)

ERRORI NELLE RICERCHE EPIDEMIOLOGICHE

ERRORI RANDOM:

errori imprevisti, fluttuazioni statistiche della variabile misurata, dovute a imprecisioni implicite nel sistema di misurazione e/o nel sistema di campionamento.

ERRORI SISTEMATICI (BIAS = PREGIUDIZIO): errori dovuti a una causa precisa, che possono in alcuni casi essere previsti e riconosciuti. In senso lato, si definisce bias qualunque fattore che può alterare la validità dei risultati di una ricerca distorsione).

•Sampling bias : sono tutti i tipi di errore sistematico per cui il campione non rappresenta veramente in maniera random la popolazione di origine

•Assignment bias:

•origina nel processo di assegnazione random all’uno o all’altro campione in un studio di tipo RCT.

•Estimator bias: origina da errori sistematici nella misurazione dell’outcome e/o dell’esposizione.

•Cognitive bias: dovuti all’effetto dell’osservatore e dei suoi specifici punti di vista sulla esecuzione della ricerca e sulla valutazione dei risultati

•Confirmation bias: deriva dalla tendenza a cercare o a interpretare le informazioni in modo che confermino i nostri preconcetti. E’ un tipo di bias

(43)

Un fattore estraneo capace di influenzare l’outcome, il cui effetto viene confuso con quello della variabile indipendente (esposizione) viene chiamato FATTORE CONFONDENTE

esposizione malattia

associato

all’esposizione

fattore di rischio per malattia

fattore confondente

(44)

Esempio: Il consumo frequente di birra è associato al fumo di sigaretta.

Vogliamo studiare se il consumo frequente di birra può essere causa di ulcera peptica. Problema: Il fumo di sigaretta è un fattore di confusione nello studio della relazione causale fra consumo di birra e ulcera peptica? I fumatori che non bevono birra hanno un tasso di ulcera peptica maggiore dei non fumatori. Quindi il fumo di sigaretta è un fattore di rischio indipendente per ulcera peptica, e

Consumo di birra Ulcera peptica

Fumo di sigaretta

Fattori confondenti

(45)

Esempio: Il consumo frequente di birra è associato al consumo frequente di pizza. Vogliamo studiare se il consumo frequente di birra può essere causa di cirrosi epatica.

Problema: Il consumo di pizza è un fattore di confusione nello studio della relazione causale fra consumo di birra e cirrosi

Il consumo di pizza sarebbe un fattore confondente se fosse fattore di rischio per cirrosi nei non bevitori di birra, cosa che probabilmente non è vera! Un fattore confondente deve avere un effetto sull’outcome o malattia nel gruppo non esposto per essere considerato tale.

Consumo di birra cirrosi

Consumo di pizza

Fattori confondenti

(46)

Validità dei risultati

• Specificità

• Forza dell’associazione:

• Incremento e decremento del cambiamento

• Coerenza dell’associazione

• Replicabilità dei risultati

Esempi:

• Specificità: una causa specifica della TBC è il bacillus tubercolosis (Attenzione, molte patologie hanno eziologia multifattoriale).

• Forza dell’associazione: i fumatori hanno una probabilità x volte maggiore dei non fumatori di contrarre il tumore al polmone.

• Incremento e decremento del cambiamento: più è alto il numero di sigarette che si fuma e maggiore è la probabilità di soffrire di tumore al polmone

• Coerenza dell’associazione: Associazione tra l’infezione da rosolia nel primo trimestre di gravidanza e disordini congeniti del cristallino (La formazione del cristallino avviene nelle prime settimana di gravidanza, quando il cristallino è vulnerabile al virus della rosolia).

• Replicabilità dei risultati: Se lo studio viene ripetuto in un momento diverso, in un altro posto e su altri soggetti e i risultati sono gli stessi allora la validità dello studio è confermata.

(47)

CRITERI BRADFORD- HILL

Sono i criteri che devono essere soddisfatti quando si vuole affermare che esiste una relazione di causa-effetto tra la variabile E (Esposizione) e la variabile M (Malattia) piuttosto che una semplice associazione:

1. Relazione temporale: E deve avvenire prima di M

2. Forza di associazione: c’è una alta percentuale di associazione tra le due variabili

3. Relazione dose-risposta: all’aumentare di E, deve esserci un aumento confrontabile di M

4. Plausibilità biologica della relazione osservata

(48)

STUDIO CASO-CONTROLLO

Uno studio caso-controllo è caratterizzato dal fatto che le popolazioni oggetto di studio differiscono tra loro dal fatto che i soggetti che le compongono abbiano (casi) o non abbiano (controllo) la malattia, o altra condizione, presa in considerazione dallo studio. Uno studio classico di questo tipo, è stato quello condotto a Boston da ricercatori della Harvard Medical School e pubblicato nel 1972. La ricerca nacque dall’osservazione presso il Massachusetts General Hospital di 8 casi di cancro della vagina diagnosticati a donne di età compresa tra i 15 e i 22 anni. Essendo questo tipo di cancro abbastanza raro (colpisce donne anziane) la ricerca prese in considerazione una serie di agenti e condizioni ritenute come fattori casuali della malattia. La frequenza con cui questi fattori erano presenti nei casi (8) venne confrontata con quella osservata in un numero 4 volte superiore di controlli. Risultò che le madri di 7 delle 8 donne, rispetto a nessuna dei controlli, avevano fatto uso durante fase iniziale delle gravidanze, da cui sarebbero nati i casi, di un farmaco antiabortista (DES=dietlstilbestrolo). Si stabilì così che l’esposizione al DES comportava un rischio altissimo di sviluppare, dopo una latenza di 15-18 anni un adenocarcinoma

(49)

Questa ricerca contribuì a definire le caratteristiche che deve avere uno studio caso-controllo, e cioè, la principale quali i RITERI di INCLUSIONE.

È, infatti, importante definire all’inizio dello studio i criteri di inclusione dei soggetti. Così, se si vuole studiare l’effetto di un farmaco su un gruppo di pazienti affetti da una determina malatttia, occorre una definizione biologica della malattia stessa. Il cancro dell’utero, ad esempio, è una definizione poco adatta in quanto l’adenocarcinoma del corpo dell’utero e il carcinoma acellule squamose della cervice sono entità nosologiche distinte sotto molti aspetti, tra cui i fattori di rischio. Inoltre coccorre procedere ad una definizione operativa, vale a dire includere solo i pazienti che siano portatori di quella determinata patologia.

(50)

DIMENSIONI di un CAMPIONE

La dimensione di un campione è importante perchè ci consente di poter affermare che un incremento numerico dei soggetti oggetto di una ricerca non cambia la stima dei parametri e consente quindi di trarre conclusioni con margini minimi di errore.

Per definire le dimensioni di un campione bisogna scegliere inizialmente il livello di significatività (α), generalmente posto tra 0,05 e 0,01 e può essere a due code o a una sola coda (probabilità di commettere un errore di 1 tipo).

Occorre poi scegliere la potenza statistica dello studio (ß), cioè di considerare vera un’ipotesi falsa (probabilità di evitare un errore del 2 tipo). Considerando, ad esempio, una potenza statistica pari al 90%, cioè 1- ß=10%, si ha una minima possibilità di commettere un errore di tipo 2.

Da tutto ciò si deduce che la probabilità di commettere un errore di tipo 2 dipende dal valore di α (più α è piccolo, più alto sarà il valore di ß).

Una volta definiti questi valori, si stima la frequenza di un evento in una popolazione e la dimensione di un campione (N) dipende sia dalla

(51)

La numerosità di un campione è dunque quella che permette di ottenere gli obiettivi dell’indagine al minimo costo e nel minor tempo. Sarà data, quindi, dal più piccolo numero in base al quale le stime raggiungono il livello di attendibilità desiderato dal ricercatore.

Espresso in termini pratici, e al di là delle formule matematiche utilizzate, la dimensione di un campione deve essere tale da permettere di identificare come "statisticamente significativa" una differenza di effetto che sia spiegabile solo raramente da effetti casuali, ma anche tale da poter essere effettivamente rilevata se esiste, e da poter essere applicabile a tutta la popolazione da cui è stato estratto il campione.

Conviene ricordare che la significatività statistica è solo una stima di quanto sia probabile che la stessa differenza possa essere osservata per puro caso nel caso si ripetessero le stesse osservazioni, da cui la necessità della definizione di uno e uno solo endpoint ben definito o, se più di uno, procedere ad un adeguato incremento della numerosità campionaria.

(52)

Un risultato statisticamente significativo in uno studio di buona potenza può essere privo di valore predittivo per l'applicazione alla popolazione, se il campione non rappresenta – per aspetti demografici, genetici, fisiopatologici – la popolazione cui si intende applicare il risultato o se l'endpoint primario non risponde esattamente alla domanda clinica di interesse per la popolazione considerata in queste linee guida. Questo solo aspetto, indipendentemente dalla significatività del risultato, causa la diversa classificazione della forza di una evidenza esterna considerata in queste linee guida.

Tuttavia, la significatività statistica per sé non è un elemento sufficiente a dare "forza" probante a uno studio.

Anche in questo caso il valore di "P" è elemento necessario ma non sufficiente. Elemento altrettanto rilevante è l'intervallo di confidenza del risultato, la sua natura, il suo peso clinico, il sospetto (o l'evidenza) dibias

(53)

La "potenza" di uno studio clinico è uno degli aspetti forse meno comunemente considerati nelle discussioni ma riveste una rilevanza notevole per la costituzione di linee guida. Tecnicamente, la "potenza" di uno studio è la sua capacità di osservare una differenza di esito fra i due o più gruppi al livello di significatività scelto. Quindi, una volta che lo studio è stato concluso e la differenza è stata osservata al livello di significatività prefissato, la questione della potenza è di minore rilevanza. Tuttavia, la potenza può anche essere definita come la percentuale di studi condotti su campioni indipendenti estratti dalla stessa popolazione che darà una differenza statisticamente significativa se l'effetto del trattamento è vero. Estendendo questa definizione fino a comprendere, negli n campioni estratti indipendentemente dalla popolazione, tutta la popolazione, allora la potenza dello studio è una stima, per quanto grossolana, della proporzione di popolazione che può

"rispondere" al trattamento come si è visto nello studio purché il campione sia davvero rappresentativo della popolazione stessa.