• Aucun résultat trouvé

Implications méthodologiques des données immobilières : phénomènes

I. Caractéristiques et traitement des données immobi-lières

2. Implications méthodologiques des données immobilières : phénomènes

phénomènes d’autocorrélation et d’hétérogénéité spatiale et processus endogène du choix résidentiel

Dans cette section, nous nous attachons à présenter les biais associés au traitement de données immobilières. Ceux-ci sont de deux types : spatiaux et endogènes. Nous présentons dans un premier temps les processus spatiaux à l’œuvre lors du traitement de données à caractère spatial puis dans un second temps, le caractère endogène du choix de localisation résidentielle.

174

Données immobilières et processus spatiaux : la prise en compte des phénomènes d’autocorrélation et d’hétérogénéité spatiale

L’autocorrélation spatiale peut-être définie comme la relation d’interdépendance qui existe entre deux observations et qui est attribuable à leur localisation relative (Griffith 1992). Bien que claire et concise, cette définition n’est cependant pas suffisante pour expliquer comment la localisation créée une relation d’interdépendance entre des observations distinctes. Pour comprendre ce phénomène, deux processus spatiaux sont généralement avancés. Ceux-ci peuvent être appréhendés en premier lieu par la première loi de géographie énoncée par Tobler (1970) selon laquelle « everything is related to everything else, but near things are more related than distant things ». Sur un espace, tout est relié à tout, mais les objets proches spatialement sont plus liés entre eux qu’aux objets qui leurs sont distants. Le premier processus spatial mis en avant pour expliquer ce phénomène d’interdépendance tient au fait que des observations proches partagent un environnement similaire. Elles présentent alors des caractéristiques semblables. Le second processus spatial est relatif aux externalités qui existent entre des observations (Lesage et Pace 2009). Les caractéristiques de l’une impactent les caractéristiques de ses voisines et vice versa, il existe un phénomène de diffusion spatiale. Suivant la loi de Tobler (1970), cet impact décroit avec la distance qui sépare les observations. Ces deux processus spatiaux conduisent à observer des valeurs similaires en une même localisation, qu’elles soient élevées ou faibles (Anselin 1988; Anselin et Bera 1998). On parle d’autocorrélation spatiale positive lorsque l’on observe un regroupement spatial de valeurs semblables ; d’autocorrélation spatiale négative pour un regroupement de valeurs dissemblables et une absence d’autocorrélation se traduit par un schéma spatial aléatoire.

L’autocorrélation est donc le résultat de processus spatiaux mais elle en devient également un indicateur : elle traduit la multiplicité et l’intensité des structures spatiales au sein d’une ville (des concentrations de valeurs similaires sont autant d’environnement différents) (Dubé, Des Rosiers, et Thériault 2011b; Baudry et Maslianskaïa-Pautrel 2011) mais également l’impact et la portée spatiale des effets de diffusion (ou de débordement, ou de spillovers) (Griffith 1992). L’autocorrélation spatiale peut être abordée à la fois comme ses causes (environnement similaire, externalité spatiale) et ses conséquences (concentration de valeurs semblables en une même localisation).

En plus d’être un indicateur des schémas et processus spatiaux, l’autocorrélation spatiale est devenu un véritable outil dans les domaines de la statistique et de l’économétrie spatiale. La présence d’une forte dépendance spatiale dans les résidus d’une régression permet de rendre compte de la mauvaise spécification d’un modèle et notamment de l’omission de variables explicatives. Son analyse permet également de détecter les biais engendrés par les découpages administratifs ou statistiques (Le Gallo 2002). Ainsi, l’autocorrélation spatiale est à la fois révélatrice des processus spatiaux mais elle s’avère être également un indicateur technique dans les travaux empiriques portant sur des données géoréférencées.

175

Dans le cas du marché immobilier, un ensemble d’auteurs (Baumont 2009; Baumont et Legros 2009; Srikhum 2012) décrivent différentes sources d’autocorrélation spatiale :

- Les logements situés dans le même quartier partagent un environnement commun, leur

conférant des caractéristiques environnementales similaires, qu’elles soient observables ou non ;

- Les habitats voisins ont généralement été construits à la même période, ils partagent donc des caractéristiques intrinsèques semblables ;

- Ils partagent également des environnements socio-économiques communs qui sont source d’externalités de voisinage35 (exemple du cercle de la dégradation dans les quartiers pauvres mentionné au Chapitre 1 point II.2.3) ;

- La fixation du prix d’un bien se fait généralement sur l’appréciation de la valeur des biens voisins, ainsi, des résidences proches présentent un niveau de prix semblable.

Ainsi, l’autocorrélation spatiale entre les biens immobiliers provient du fait que les logements proches partagent des caractéristiques similaires mais également de l’existence d’un phénomène de diffusion spatiale, dans les caractéristiques comme dans la valeur des biens.

L’hétérogénéité spatiale est le second phénomène associé aux données spatiales et se définit comme « l’instabilité dans l’espace des relations économiques » (Le Gallo 2004). Plus précisément, dans le cas des choix résidentiels, cette hétérogénéité se traduit par le fait que, selon l’espace considéré, les individus ne valoriseront pas un même attribut de la même façon. Prenons par exemple le cas d’un jardin ou d’un parking : ces attributs, très courants dans les espaces ruraux, n’y seront que peu valorisés, mais ils seront en revanche très convoités dans les centres-urbains. Inversement, une desserte de transport en commun, accessible partout en ville, s’avère être un atout majeur dans une commune périphérique peu dotée en infrastructures de transport public. Ainsi, la valorisation des attributs d’un logement est modulée selon les caractéristiques de l’espace considéré, le consentement marginal à payer des individus varie selon le contexte spatial dans lequel ils effectuent leurs arbitrages résidentiels. Dans la pratique, cette hétérogénéité se manifeste au travers de la variabilité spatiale des coefficients estimés et d’un phénomène d’hétéroscédasticité des résidus (variabilité spatiale de la variance des résidus). La présence d’hétérogénéité spatiale soulève alors la question de l’existence de sous-marchés ou de différents « régimes spatiaux » (Anselin 1988; Dubé, Des Rosiers, et Thériault 2011b). Prenons l’exemple de quartiers de centre urbain et des quartiers de communes périphériques. Les quartiers issus d’un même espace (centre ou périphérie) présentent généralement les mêmes caractéristiques, les agents font face aux mêmes arbitrages et auront globalement, la même disponibilité à payer pour les différents attributs spatiaux. En revanche, entre ces deux types d’espace, les arbitrages sont tout à fait différents car ils ne se réalisent pas dans le même contexte spatial : nous avons quasiment affaire à deux marchés immobiliers distincts. Ainsi, la prise en compte de l’hétérogénéité spatiale peut se faire via la segmentation du marché immobilier selon les différents contextes spatiaux identifiés.

35 Nous rappelons que Décamps et Gaschet (2013) définissent ces externalités comme « l’interaction entre les comportements individuels des ménages et les caractéristiques (sociales, économiques ou ethniques) de leurs quartiers de résidence » (Cf Chapitre1)

176

Endogénéité du choix résidentiel

Lorsque qu’un individu choisit sa résidence, il propose un prix global pour un vecteur de caractéristiques. Ainsi, le choix résidentiel présente un caractère endogène : l’individu choisit simultanément les attributs du logement et le prix implicite qu’il est disposé à payer pour en acquérir l’usage ainsi que la quantité de ces attributs (Dantas 2010; Travers 2007). Cette simultanéité engendre une dépendance entre les variables explicatives du prix du logement et les résidus de l’estimation, entrainant des coefficients estimés biaisés et non convergents. Ce biais méthodologique est généralement traité par la méthode des variables instrumentales qui consiste à remplacer les variables explicatives endogènes par des variables auxiliaires, corrélées à ces variables explicatives mais pas aux résidus.

Dans leurs travaux, Larue et al. (2013) évaluent le prix implicite attribué aux aménités urbaines dans la ville d’Angers. Pour cela, les auteurs mobilisent des variables capables de retranscrire la valeur accordée aux attributs intrinsèques et extrinsèques du logement. La valorisation des aménités urbaines est approximée par deux types variables : des indicateurs relatifs aux aménités « vertes » urbaines et au mode d’occupation du sol (distance aux espaces verts, superficie des espaces verts) et des indicateurs relatifs à d’autres éléments urbains (distance au centre ou aux voies de circulation). La variable suspectée d’endogénéité est celle du nombre de pièces de l’habitat. Pour corriger le biais potentiel de simultanéité les auteurs utilisent comme variables instrumentales des caractéristiques des acheteurs (CSP, situation familiale et origine géographique). Le test d’Hausman confirme bien la présence d’un biais de simultanéité. En revanche, dans le même type de travaux portant sur la valorisation du littoral, Bonnieux et al. (2008) montrent que ce biais n’est pas vérifié pour la variable relative au nombre de pièces, à la présence d’aménité (littoral) ou au type de maison, et en utilisant comme variables instrumentales les caractéristiques économiques et l’origine géographique des acheteurs. Ainsi, le caractère endogène du choix résidentiel n’est pas confirmé dans tous les travaux.