• Les différents tests mesurant l’autocorréla@on spa@ale :
ü Tests pour variables qualita-ves: test de couleur des cartes
ü Tests globaux d’autocorréla-on spa-ale : les valeurs sont-‐elles globalement (sur l’ensemble du site) posi-vement (néga-vement) corrélées?
Deux indices principaux : I de Moran et C de Geary. I préféré à C, en raison d’une stabilité générale plus grande.
ü Tests locaux d’associa-on spa-ale (LISA): La valeur observée en i est-‐elle associée posi-vement aux valeurs des localisa-ons voisines (ressemblances) ou
néga-vement (dissemblance)?
Indices LISA : Décomposent l’indice global de façon à iden-fier la contribu-on individuelle de chaque lieu. Perme_ent de détecter les poches locales d’autocorréla-on spa-ale
Tests d’autocorréla-on spa-ale
• Tests globaux d’autocorréla@on spa@ale : On veut tester :
H0 : independance entre les valeurs de Y prises sur les différentes localisa-ons (spa-al randomness)
contre H1 : associa-on
ü associa+on posi+ve : les valeurs de Y proches ont tendance à être regroupées dans l’espace (agréga-on)
ü associa+on néga+ve : les voisins tendent à être dissemblables (structure en damier)
RQ : Les résultats de ces tests dépendent du choix de la matrice W
Tests d’autocorréla-on spa-ale
v I de Moran (1950)
ü Sta-s-que la plus classique d’associa-on spa-ale, analogue au Durbin-‐Watson de séries temporelles
• I a des valeurs comprises entre -‐1 et 1
Classic/best measure of spatial autocorrelation
Depends upon definition of neighboring unit via the spatial weights matrix
Typically ranges from -1 to 1
Like regression, it has a few assumptions
Regional x/y values all come from normal distributions w/same mean and variance for each region
Randomly rearrange the data on map and compute I many times, would have a normal distribution
Why? Because we use the normal distribution to calculate the p-value
Moran’s I
n = number of regions
wij = measure of spatial proximity between region i and j
Product of the deviation from the mean for all pairs of adjacent regions (wij=1)
Sum of the weights (count of all adjacent pairs) Essentially a measure of
variance across the regions
2/15/2011
18
Moran’s I
Classic/best measure of spatial autocorrelation
Depends upon definition of neighboring unit via the spatial weights matrix
Typically ranges from -1 to 1
Like regression, it has a few assumptions
Regional x/y values all come from normal distributions w/same mean and variance for each region
Randomly rearrange the data on map and compute I many times, would have a normal distribution
Why? Because we use the normal distribution to calculate the p-value
Moran’s I
n = number of regions
wij = measure of spatial proximity between region i and j
Product of the deviation from the mean for all pairs of adjacent regions (wij=1)
Sum of the weights (count of all adjacent pairs) Essentially a measure of
variance across the regions
2/15/2011
18
Moran’s I
Classic/best measure of spatial autocorrelation
Depends upon definition of neighboring unit via the spatial weights matrix
Typically ranges from -1 to 1
Like regression, it has a few assumptions
Regional x/y values all come from normal distributions w/same mean and variance for each region
Randomly rearrange the data on map and compute I many times, would have a normal distribution
Why? Because we use the normal distribution to calculate the p-value
Moran’s I
n = number of regions
wij = measure of spatial proximity between region i and j
Product of the deviation from the mean for all pairs of adjacent regions (wij=1)
Sum of the weights (count of all adjacent pairs) Essentially a measure of
variance across the regions
Tests d’autocorréla-on spa-ale
ü Loi de la sta-s-que de test sous H0 sous l’hypothèse de normalité (N)
q (N): on suppose que les observa-ons (y1,..yn) sont des réalisa-ons d’un vecteur gaussien à composantes i.i.d sous H0.
avec
Z = I −EN(I)
VN(I) → N(0,1) sous H0
EN(I)=− 1 n−1
VN(I)= n2S1−nS2 +3S02
S02(n2 −1) −EN2(I)
Tests d’autocorréla-on spa-ale
ü Loi de la sta-s-que de test sous H0 sous Hypothèse de Randomisa9on (R)
q (R): Lorsqu’on répar-t plusieurs fois les données au hasard sur la carte
(permuta-on des lieux) et qu’on calcule I à chaque fois, la répar--on des valeurs I obtenues est à peu près gaussienne.
Z = I −ER(I)
VR(I) → N(0,1) sous H0
ER(I)=− 1 n−1
VN(I)= n
(
(n2−3n+3)S1−nS2 +3S02)
−K(
(n2 −n)S1−2nS2+6S02)
S02(n−1)(n−2)(n−3) −ER2(I)
K =
n (yi − y)4
i=1 n
∑
(yi − y)2
i=1 n
#
∑
$%% &
'((
2
Tests d’autocorréla-on spa-ale
ü Loi de la sta-s-que de test sous H0 en l’absence d’hypothèse sur la distribu@on de I
q Si on a un doute sur N ou R, on simule la loi de I par Bootstrap pour es-mer la p-‐
value.
Algorithme :
1) On calcule I.
2) On exécute B fois la tâche suivante : On permute aléatoirement les observa-ons et on recalcule I : on ob-ent un ensemble de B valeurs de l’indice de Moran
3) La p-‐value du test est le pourcentage de valeurs générées supérieures à I :
(I1,...,IB)
Nombre de b / Ib > I B
Tests d’autocorréla-on spa-ale
ü Exemples
Test de Moran avec hypothèse N :
moran.test(nc.sids$SID79, listw=sids_nbq_w, alterna-ve="two.sided", randomisa-on=FALSE)
Moran's I test under normality
data: nc.sids$SID79
weights: sids_nbq_w
Moran I sta-s-c standard deviate = 2.5927, p-‐value = 0.009524 alterna-ve hypothesis: two.sided
sample es-mates:
Moran I sta-s-c Expecta-on Variance 0.158977893 -‐0.010101010 0.004252954
Conclusion : on reje_e H0 : il existe une autocorréla-on spa-ale globale, qui est posi-ve (signe de l’indice)
Pour un test à 5%, on reje_e H0 dès que p-‐value<5%
Ecart-‐type de la sta-s-que de moran sous H0 lorsque (N) vraie Valeur de I
EN(I)
VarN(I) H0: absence
d’autocorréla-on H1: corréla-on
Tests d’autocorréla-on spa-ale
Test de Moran avec hypothèse R :
moran.test(nc.sids$SID79, listw=sids_nbq_w, alterna-ve="two.sided") Moran's I test under randomisa-on
data: nc.sids$SID79 weights: sids_nbq_w
Moran I sta-s-c standard deviate = 2.6926, p-‐value = 0.00709 alterna-ve hypothesis: two.sided
sample es-mates:
Moran I sta-s-c Expecta-on Variance 0.158977893 -‐0.010101010 0.003943149
Conclusion : on reje_e H0 : il existe une autocorréla-on spa-ale globale, qui est posi-ve (signe de l’indice)
Tests d’autocorréla-on spa-ale
Test de Moran par bootstrap:
bperm=moran.mc(nc.sids$SID79,listw=sids_nbq_w, nsim=999)
Monte-‐Carlo simula-on of Moran's I
data: nc.sids$SID79 weights: sids_nbq_w
number of simula-ons + 1: 1000
sta-s-c = 0.159, observed rank = 990, p-‐value = 0.01 alterna-ve hypothesis: greater
H0 : absence d’autocorréla-on H1 : autocorréla-on posi-ve B
Rang de la valeur de I parmi les valeurs générées
Tests d’autocorréla-on spa-ale
•
2/15/2011
21