Tests d’autocorréla-on spa-ale

•  Les diﬀérents tests mesurant l’autocorréla@on spa@ale :

ü  Tests pour variables qualita-ves: test de couleur des cartes

ü  Tests globaux d’autocorréla-on spa-ale : les valeurs sont-‐elles globalement (sur l’ensemble du site) posi-vement (néga-vement) corrélées?

Deux indices principaux : I de Moran et C de Geary. I préféré à C, en raison d’une stabilité générale plus grande.

ü  Tests locaux d’associa-on spa-ale (LISA): La valeur observée en i est-‐elle associée posi-vement aux valeurs des localisa-ons voisines (ressemblances) ou

néga-vement (dissemblance)?

Indices LISA : Décomposent l’indice global de façon à iden-ﬁer la contribu-on individuelle de chaque lieu. Perme_ent de détecter les poches locales d’autocorréla-on spa-ale

•  Tests globaux d’autocorréla@on spa@ale : On veut tester :

H0 : independance entre les valeurs de Y prises sur les diﬀérentes localisa-ons (spa-al randomness)

contre H1 : associa-on

ü  associa+on posi+ve : les valeurs de Y proches ont tendance à être regroupées dans l’espace (agréga-on)

ü  associa+on néga+ve : les voisins tendent à être dissemblables (structure en damier)

RQ : Les résultats de ces tests dépendent du choix de la matrice W

Tests d’autocorréla-on spa-ale

v  I de Moran (1950)

ü  Sta-s-que la plus classique d’associa-on spa-ale, analogue au Durbin-‐Watson de séries temporelles

•  I a des valeurs comprises entre -‐1 et 1

 Classic/best measure of spatial autocorrelation

 Depends upon definition of neighboring unit via the spatial weights matrix

 Typically ranges from -1 to 1

 Like regression, it has a few assumptions

 Regional x/y values all come from normal distributions w/same mean and variance for each region

 Randomly rearrange the data on map and compute I many times, would have a normal distribution

 Why? Because we use the normal distribution to calculate the p-value

Moran’s I

 n = number of regions

 w_ij = measure of spatial proximity between region i and j



Product of the deviation from the mean for all pairs of adjacent regions (w_ij=1)

Sum of the weights (count of all adjacent pairs) Essentially a measure of

variance across the regions

2/15/2011

Moran’s I

 Classic/best measure of spatial autocorrelation

 Depends upon definition of neighboring unit via the spatial weights matrix

 Typically ranges from -1 to 1

 Like regression, it has a few assumptions

 Regional x/y values all come from normal distributions w/same mean and variance for each region

 Randomly rearrange the data on map and compute I many times, would have a normal distribution

 Why? Because we use the normal distribution to calculate the p-value

Moran’s I

 n = number of regions

 w_ij = measure of spatial proximity between region i and j



Product of the deviation from the mean for all pairs of adjacent regions (w_ij=1)

Sum of the weights (count of all adjacent pairs) Essentially a measure of

variance across the regions

2/15/2011

Moran’s I

 Classic/best measure of spatial autocorrelation

 Depends upon definition of neighboring unit via the spatial weights matrix

 Typically ranges from -1 to 1

 Like regression, it has a few assumptions

 Regional x/y values all come from normal distributions w/same mean and variance for each region

 Randomly rearrange the data on map and compute I many times, would have a normal distribution

 Why? Because we use the normal distribution to calculate the p-value

Moran’s I

 n = number of regions

 w_ij = measure of spatial proximity between region i and j



Product of the deviation from the mean for all pairs of adjacent regions (w_ij=1)

Sum of the weights (count of all adjacent pairs) Essentially a measure of

variance across the regions

Tests d’autocorréla-on spa-ale

ü  Loi de la sta-s-que de test sous H0 sous l’hypothèse de normalité (N)

q  (N): on suppose que les observa-ons (y1,..yn) sont des réalisa-ons d’un vecteur gaussien à composantes i.i.d sous H0.

avec

Z = I −E_N(I)

V_N(I) → N(0,1) sous H0

E_N(I)=− 1 n−1

V_N(I)= n²S₁−nS₂ +3S₀²

S₀²(n² −1) −E_N²(I)

Tests d’autocorréla-on spa-ale

ü  Loi de la sta-s-que de test sous H0 sous Hypothèse de Randomisa9on (R)

q  (R): Lorsqu’on répar-t plusieurs fois les données au hasard sur la carte

(permuta-on des lieux) et qu’on calcule I à chaque fois, la répar--on des valeurs I obtenues est à peu près gaussienne.

Z = I −E_R(I)

V_R(I) → N(0,1) sous H0

E_R(I)=− 1 n−1

V_N(I)= n

(

(n²−3n+3)S₁−nS₂ +3S₀²

)

⁻^K

(

⁽ⁿ² ⁻^n)S¹⁻^2nS²⁺^6S⁰²

)

S₀²(n−1)(n−2)(n−3) −E_R²(I)

K =

n (y_i − y)⁴

i=1 n

∑

(y_i − y)²

i=1 n

∑

$%% &

'((

Tests d’autocorréla-on spa-ale

ü  Loi de la sta-s-que de test sous H0 en l’absence d’hypothèse sur la distribu@on de I

q  Si on a un doute sur N ou R, on simule la loi de I par Bootstrap pour es-mer la p-‐

value.

Algorithme :

1)  On calcule I.

2)  On exécute B fois la tâche suivante : On permute aléatoirement les observa-ons et on recalcule I : on ob-ent un ensemble de B valeurs de l’indice de Moran

3)  La p-‐value du test est le pourcentage de valeurs générées supérieures à I :

(I₁,...,I_B)

Nombre de b / I_b > I B

Tests d’autocorréla-on spa-ale

ü  Exemples

Test de Moran avec hypothèse N :

moran.test(nc.sids$SID79, listw=sids_nbq_w, alterna-ve="two.sided", randomisa-on=FALSE)

Moran's I test under normality

data: nc.sids$SID79

weights: sids_nbq_w

Moran I sta-s-c standard deviate = 2.5927, p-‐value = 0.009524 alterna-ve hypothesis: two.sided

sample es-mates:

Moran I sta-s-c Expecta-on Variance 0.158977893 -‐0.010101010 0.004252954

Conclusion : on reje_e H0 : il existe une autocorréla-on spa-ale globale, qui est posi-ve (signe de l’indice)

Pour un test à 5%, on reje_e H0 dès que p-‐value<5%

Ecart-‐type de la sta-s-que de moran sous H0 lorsque (N) vraie Valeur de I

E_N(I)

Var_N(I) H0: absence

d’autocorréla-on H1: corréla-on

Tests d’autocorréla-on spa-ale

Test de Moran avec hypothèse R :

moran.test(nc.sids$SID79, listw=sids_nbq_w, alterna-ve="two.sided") Moran's I test under randomisa-on

data: nc.sids$SID79 weights: sids_nbq_w

Moran I sta-s-c standard deviate = 2.6926, p-‐value = 0.00709 alterna-ve hypothesis: two.sided

sample es-mates:

Moran I sta-s-c Expecta-on Variance 0.158977893 -‐0.010101010 0.003943149

Conclusion : on reje_e H0 : il existe une autocorréla-on spa-ale globale, qui est posi-ve (signe de l’indice)

Tests d’autocorréla-on spa-ale

Test de Moran par bootstrap:

bperm=moran.mc(nc.sids$SID79,listw=sids_nbq_w, nsim=999)

Monte-‐Carlo simula-on of Moran's I

data: nc.sids$SID79 weights: sids_nbq_w

number of simula-ons + 1: 1000

sta-s-c = 0.159, observed rank = 990, p-‐value = 0.01 alterna-ve hypothesis: greater

H0 : absence d’autocorréla-on H1 : autocorréla-on posi-ve B

Rang de la valeur de I parmi les valeurs générées

Tests d’autocorréla-on spa-ale

• 

2/15/2011

Dans le document II-‐ Autocorréla-on Spa-ale (Page 37-46)