• Aucun résultat trouvé

La prise en compte de l’autocorrélation spatiale dans les modèles de régression linéaire

LES FACTEURS DE LA PRESSION URBAINE

Encadré 2: Le zonage en aires urbaines

3.3. LE MODELE D’EVALUATION DES FACTEURS DE PRESSION

3.3.3. La prise en compte de l’autocorrélation spatiale dans les modèles de régression linéaire

Initialement suspectée par Student dès 1914, l’autocorrélation spatiale se définit par l’absence d’indépendance entre les observations géographiques. Sa présence est manifeste lorsque, sur un espace donné, les valeurs prises par une variable aléatoire continue ou discrète se répartissent de façon semblables pour deux entités géographiques voisines et non de manière aléatoire.

3.3.3.1. La non indépendance entre les variables géographiques

Deux types d’autocorrélation spatiale peuvent être considérés. D’une part, étant donné que des biens fonciers proches possèdent les mêmes caractéristiques de voisinage, le prix d’un bien foncier dépend également du prix des biens environnants [Can, 1992] ; et ces interactions sont d’autant plus importantes que ces localisations sont proches les unes des autres. Par conséquent, une approche par le modèle spatial autorégressif peut être adoptée. Toutefois, lorsque les résidus ne sont pas corrélés entre eux mais corrélés au prix des biens fonciers, l’adoption d’un modèle spatial avec autocorrélation des résidus est alors préférable.

La dépendance spatiale se définit donc comme résultant d’une relation fonctionnelle entre ce qui se passe en une localisation et ce qui se déroule en d’autres localisations.

Il est donc nécessaire de spécifier les positions relatives des observations les unes par rapport aux autres. Pour modéliser ces interactions entre observations et leur décroissance en fonction de la distance les séparant, nous avons besoin d’un instrument, la matrice de poids ou matrice d’interactions spatiales (notée W et de taille N× N).

Dans la section précédente de notre travail, nous avons avancé les résultats issus de l’estimation du modèle de régression linéaire simple par la méthode des moindres carrés ordinaires. Les variables relatives à la distance sont apparues très significatives dans le modèle de régression de prix hédoniques. Il reste à démontrer que ces facteurs de pression urbaine sont toujours capitalisés dans le prix de vente de la parcelle viticole convertie en usage urbain lorsque la dépendance spatiale est prise en compte.

3.3.3.2. La matrice de poids comme révélateur des interactions spatiales

Il existe plusieurs types de matrices de poids : les matrices de contiguïté simples (fondées sur l’existence/absence de frontière commune), les contiguïtés établies à partir d’un seuil de distance (les centroïdes se situent en dessous d’un seuil de distance critique), de l’inverse de la distance ou de la distance au carré et les matrices des plus proches voisins.

Deux zones géographiques sont contiguës lorsqu’elles partagent une frontière commune. Cependant, lorsque les observations spatiales sont des points dans l’espace, on ne peut plus parler de frontières communes. Dans un zonage irrégulier, il est possible de prendre comme indicateur de l’intensité de l’interaction entre deux unités spatiales, la distance entre deux points (distance euclidienne ou distance temps). On considère alors que deux unités spatiales sont contiguës si la distance qui les sépare est inférieure ou égale au seuil de distance critique spécifié.

W est la matrice de poids représentant la structure spatiale des données. L’absence d’interaction spatiale se traduit par des zéros dans la matrice de poids (par convention, les éléments de la diagonale principale de la matrice de poids sont égaux à zéro :

ii

W =0). Les éléments situés en dehors de la diagonale, Wij, représentent les relations spatiales entre les observations i et j. Sous la méthode des plus proches voisins, Wij est

égale à 1 si i et j sont tels qu’il n’existe pas d’observations plus proche de i ou de j et elle est égale à zéro sinon. On peut étendre cette relation aux n plus proches voisins.

Les matrices de poids sont généralement standardisées afin de rendre l’interprétation des résultats plus aisée, et d’homogénéiser l’intensité des interactions spatiales affectant chacune des unités spatiales. L’opération consiste à diviser chaque élément d’une ligne par la somme de la ligne correspondante de telle sorte que la somme des éléments de chaque ligne soit égale à 1, de sorte que pour chaque ligne i :

1 =

j ij w

L’autocorrélation spatiale est alors modélisée comme une relation fonctionnelle entre une variable y (N× 1) ou un terme d’erreur ε (N× 1) et son décalage spatial associé,

y

W pour une variable endogène décalée ou Wεpour une erreur spatialement décalée [Anselin et Béra, 1998 ; Le Gallo, 2002].

Nous avons construit une matrice de poids en spatialisant les observations sur le plan du cadastre numérisé. Cependant, une telle méthode soulève un problème étant donné que plusieurs observations, situées dans la même commune, partagent les mêmes coordonnées géographiques. Afin de pouvoir exploiter au mieux cette information statistique liée à l’appartenance de plusieurs transactions à une seule commune, nous avons affecté un nombre aléatoire à chaque coordonnée spatiale X et Y des transactions de parcelles autour du centroïde de la commune. Nous sommes donc confrontés à une localisation telle que des points représentent des localisations de parcelle agricole individuelle. Ces points sont mesurés par leur latitude et leur longitude. Et le nombre de ces points est supposé fini.

Carte 2 : Localisation spatiale des parcelles viticoles changeant de destination foncière lors de la transaction

3.3.3.3. Les tests de spécification du modèle spatial et leur détermination

La présence d’autocorrélation spatiale est manifeste lorsque, sur un espace donné, les valeurs prises par une variable ne se répartissent pas de façon aléatoire mais au contraire sont semblables pour deux observations géographiquement voisines. Afin de rendre compte et de quantifier comment une telle concentration se manifeste, se localise dans l’espace, plusieurs statistiques permettent de nous renseigner sur la meilleure spécification du modèle.

Le test I de Moran est le plus communément utilisé pour tester la dépendance spatiale des résidus lorsque les erreurs suivent un processus autorégressif. Cette statistique représente pour chaque variable x le degré d’association linéaire entre sa valeur à une certaine localisation et la moyenne pondérée spatialement de ses voisins.

Un deuxième test est basé sur le principe du multiplicateur de Lagrange. Sa statistique suit un Khi-deux asymptotique d’ordre 1. Dans le cas où les erreurs suivent un processus spatial autorégressif :

u W +

=λ ε

ε ,

où λest le paramètre représentant l’intensité de l’autocorrélation spatiale entre les résidus de la régression

on teste l’hypothèse nulleλ =0. Lorsque celle-ci est rejetée, le test LMerror ne donne pas d’indications quant à la nature du processus générateur des erreurs. LMerror correspond au carré de l’indice de Moran à un facteur d’échelle près. La détection de l’autocorrélation spatiale des erreurs peut s’interpréter comme un problème dans la spécification du modèle comme l’omission de variables explicatives. Ainsi, l’autocorrélation spatiale des erreurs permet de repérer l’existence de variables significatives mais qui ne sont pas prises en compte dans le modèle. S’il n’est pas possible de rajouter d’autres variables explicatives pertinentes alors l’autocorrélation spatiale est un substitut à ces variables omises puisque l’effet non capté par les variables explicatives se retrouve dans les erreurs sous forme d’autocorrélation spatiale.

Le test d’une variable endogène décalée LMlag suppose lui l’hypothèse nulle 0

=

ρ en utilisant la fonction de vraisemblance du modèle spatial autorégressif, cette statistique suivant également un khi-deux asymptotique d’ordre 1.

Le choix de la meilleure spécification du modèle se fait en plusieurs étapes. Une estimation du modèle de régression linéaire simple est d’abord menée par la méthode des moindres carrés ordinaires, auquel on applique le test de Moran. Le rejet de l’hypothèse nulle indique une mauvaise spécification du modèle et une omission de la dépendance spatiale.

Une comparaison des résultats des tests LMerror et LMlag permet de spécifier la forme de l’autocorrélation spatiale : si LMlag n’est pas significatif contrairement au LMerror, ou bien si les deux tests rejettent l’hypothèse nulle mais que le second est plus significatif, alors le modèle avec autocorrélation des erreurs sera choisi (et inversement). L’utilisation des tests de robustesse (RLMlag ou RLMerror) peut compléter les règles de décisions précédentes, le modèle correspondant au RLM le plus significatif étant alors choisit.

Lorsque le modèle spatial est déterminé, les tests LMlag et LMerror permettent de savoir respectivement si une variable endogène décalée ou une autocorrélation spatiale des erreurs est encore nécessaire.

Ces règles de décision sont appliquées au diagnostic de non dépendance spatiale effectué sur le modèle de prix hédoniques précédent. L’analyse est menée sur l’ensemble des 2424 transactions de parcelles viticoles qui, suite à la vente, ont été converties en usage urbain.

3.3.3.4. L’estimation du modèle avec autocorrélation spatiale des erreurs

L’étude de la statistique I de Moran est menée en utilisant les matrices de poids de k-plus proches voisins et de distance, les résultats obtenus étant ensuite comparés afin de choisir la matrice captant au mieux les interactions existant entre les observations, c’est-à-dire celle nous apportant le plus d’information sur l’autocorrélation spatiale globale, en terme de prix des parcelles viticoles converties.

Afin de ne pas alourdir l’analyse, nous avons opéré une sélection sur l’ensemble des matrices créées, en utilisant la statistique I de Moran. En effet, la matrice choisie sera celle ayant la valeur standardisée du I de Moran la plus élevée [Dall’Erba, 2004]. Le tableau suivant (tableau 10) fournit les résultats ayant conduit au choix de la matrice pour l’échantillon de 2424 transactions de parcelles viticoles converties entre 2000 et 2005.

Tableau 10 : Comparaison de la valeur standardisée du I de Moran selon les matrices de poids utilisées

Matrice I standardisé Ecart-type

10 000 m 7,148 0,010 5 000 m 8,398 0,024 2 500 m 9,729 0,052 2 000 m 10,099 0,065 1 000 m 9,576 0,060 Distance 500 m 6,836 0,058 100 4,619 0,009 50 8,009 0,026 25 8,300 0,041 15 8,317 0,053 12 8,324 0,060 10 8,417 0,066 8 7,904 0,070 5 6,029 0,067 4 6,029 0,067 K-plus proches