• Aucun résultat trouvé

Cette carte fait apparaître très nettement la position moyenne du département des Bouches-du-Rhône, où s’étend la majorité de l’aire urbaine de Marseille-Aix-en- Provence. Le département du Var, en revanche, propose un bien meilleur taux de couverture, même si les 14 communes varoises en périphérie de l’aire urbaine de Marseille-Aix-en-Provence pèsent bien peu dans ce taux, comparativement à l’agglomération toulonnaise et au littoral. Cette différence de couverture entre les deux départements est une constante durant les dernières années pour lesquelles on dispose des taux de couvertures. D’une certaine manière, elle s’est même creusée puisque le Var continue à présenter des taux de renseignement nettement supérieurs à la moyenne

143 nationale tandis que les Bouches-du-Rhône voient leur couverture diminuer au fur et à mesure, au point de passer nettement sous la moyenne nationale (cf. tableau 3.3).

Tableau 3.4 : taux de couverture Perval du Var et des Bouches-du-Rhône en comparaison de celui de la France

2003 2004 2005 2006

Bouches-du-Rhône 76 68 64 65

Var 89 79 77 87

France métropolitaine 71 70 70 73

Source : données Perval cédées pour usage par l’INRA-Avignon / Réalisation : G. Boulay, 2011

Il est donc indéniable que la couverture des Bouches-du-Rhône, déjà médiocre, se détériore. La technique employée par Perval pour calculer ces taux ne consistant pas à rapporter un nombre de transactions sur le total des transactions, mais le montant des transactions enregistrées dans la base sur le total des transactions (SCHMITT, 2009), on pourrait penser que certaines transactions à bas prix font artificiellement baisser ces taux. La présence de la plus grande agglomération du méditerranéen dans ce département, dans une période de hausse des prix qui plus est, ramène à peu de valeur cet argument. D’autant que l’étude même sommaire de l’évolution du nombre annuel de transactions enregistrées confirme vite ce phénomène.

3.3.2. L’évolution du nombre de transactions annuelles de l’échantillon : rattrapage et dégradation

L’examen du nombre de transactions pour chacune des années de l’échantillon confirme sans ambages cette situation. La comparaison des courbes correspondant aux divers types de biens montre en outre que la diminution de la couverture est générale, et nullement limitée à tel ou tel segment de marché (cf. figure 3.5).

144

Figure 3.5 : nombre de biens mutés dans l’aire urbaine de Marseille-Aix-en-Provence par type de biens (1991-2006)

Cet état de fait est d’autant plus étonnant que la hausse des prix après 2000 est très soutenue et s’accompagne partout en France d’une hausse du nombre de vente. La baisse du taux de couverture, avérée par Perval même à partir de 2003 a donc manifestement des racines antérieures. On assiste ainsi à une évolution de la base de données qui va à l’encontre des dynamiques macro-économiques. On peut pour cela sur fonder sur des comparaisons à plusieurs échelles (cf. encadré 3.3).

Encadré 3.3

Comment évaluer la baisse du nombre de transactions de l’échantillon ? Eléments de comparaison.

Le principal enjeu pour évaluer l’importance de la baisse du nombre de transactions à partir de 2000 consiste à trouver un ou des élément(s) de comparaison fiable(s). Nous avons décidé d’utiliser deux sources principales. Les travaux de J. Friggit99 constituent la

première. En compilant les données des fichiers MEDOC de la DGFiP et des bases notariales, il a pu estimer le nombre de transactions annuelles depuis 1992. Ces chiffres concernent uniquement les logements anciens. Deuxième source mobilisable : la base de données MIN « France » dont nous disposions. Cette dernière ne porte que sur les années paires de 2000 à 2006, bornes incluses. C’est une période limitée mais qui correspond à la période durant laquelle on observe une réduction anormale du nombre de transactions dans l’aire urbaine de Marseille-Aix-en-Provence.

Une première comparaison consiste à vérifier que la baisse du nombre de transactions à partir de 2000 contrevient aux tendances observables en France (cf. figure 3.6).

99 En libre accès sur une page du CGEDD (section 1.3) : http://www.cgedd.developpement-

145

Figure 3.6 : comparaison des volumes mutés en France et dans l’aire urbaine de Marseille-Aix-en-Provence (1992-2006)

On voit très clairement sur ce graphique, où la courbe « France » représente les mutations de logements anciens comptabilisées par J. Friggit, que c’est effectivement le cas. Les figures 3.7 et 3.8 montrent en outre que ce ne sont pas les données MIN dans leur ensemble qui produisent cette anomalie mais bien les données relevées dans l’aire urbaine de Marseille-Aix-en-Provence.

Figure 3.7 : comparaison des volumes mutés à différentes échelles entre 1992 et 2006

146

Figure 3.8 : comparaison des évolutions annuelles des volumes mutés à différentes échelles entre 1992 et 2006

3.4. La représentativité spatiale de l’échantillon MIN

3.4.1. Comment évaluer la qualité de la distribution spatiale des ventes de l’échantillon ?

Il est nécessaire de vérifier avant tout traitement effectif des données de l’échantillon de travail que ces dernières soient distribuées dans l’espace de manière représentative de la distribution du parc de logement. En effet, pour des raisons de signification des indices, des cartes ou de toute autre production statistique ou graphique, il est impensable qu’une unité spatiale représentant une part infime d’un ensemble territorial plus vaste constitue une part essentielle des résultats statistiques construits à partir d’un échantillon.

Comme toujours dans le cas d’un échantillon, il est donc indispensable d’évaluer la conformité de celui-ci avec une population-mère. L’identification de cette dernière pose cependant un problème. En effet, le but de ce paragraphe est de s’assurer de la similarité de la distribution spatiale des ventes, à l’échelle de la commune, entre le marché réel et le marché tel que représenté par l’échantillon. Or, on ne dispose pas de base de données susceptible de faire office de référence à cette échelle, donc de population-mère, ce qui implique de faire des choix importants (cf. encadré 3.4).

Encadré 3.4

Comment choisir une population-mère de référence pour évaluer la représentativité spatiale d’un échantillon de ventes immobilières ?

147 Les bases de données sur les ventes faisant autorité ne sont disponibles qu’à l’échelle de la France entière (cf. encadré 3.3). De ce fait, elles ne peuvent servir à établir la représentativité d’un échantillon à l’échelle des communes d’une aire urbaine. C’est pour cette raison que nous avons dû choisir comme population-mère les recensements de l’INSEE, et plus précisément le nombre total de logements par commune. Etant donné que notre base de données compte plusieurs années, de 1991 à 2006 principalement, nous nous sommes basés sur les recensements de 1990, 1999 et 2006 puis avons inféré des stocks de logements par commune pour chacune des années intermédiaires. Pour ce faire, on a calculé les taux de croissance moyens annuels pour chaque période intercensitaire. Ces derniers ont ensuite été appliqués à chacune des années à partir de 1990 et de 1999 pour disposer d’indications annuelles sur les parcs de logements communaux. Cette méthode présente les réserves habituelles en matière d’application des TCMA : on reconstitue des stocks fictifs en supposant une croissance régulière (alors que la construction ne l’est pas forcément). Cependant, les biais sur des périodes si courtes sont forcément réduits, comme le prouve d’ailleurs la comparaison entre les valeurs effectivement relevées par l’INSEE en 1999 et celles construites pour la même année via la même technique d’inférence par les TCMA calculés sur la période 1990- 2006.

Ces sources ont pour avantage leur extrême fiabilité en matière de description du parc de logements à l’échelle de la commune. Cependant, il n’existe aucune liaison systématique entre la part d’une commune dans le parc de logements total de l’aire urbaine à laquelle elle appartient et la part de cette même commune dans le total des ventes comptabilisées à l’échelle de cette même aire urbaine. Le nombre de logements par commune indiqué dans les recensements ne peuvent donc être utilisé que comme

proxy pour un tel travail.

Le choix d’une population-mère de référence permet ensuite de vérifier l’existence d’une liaison entre l’échantillon et cette dernière. La majorité des tests sur les échantillons consiste à évaluer le risque que des valeurs centrales de cet échantillon ne soient pas conformes aux valeurs centrales de la population-mère (DODGE, 2007). On ne dispose pas en revanche de tests permettant directement de comparer la distribution spatiale d’un échantillon et de sa population-mère. Pour ce faire, il est plus utile de recourir à des techniques du type régression/résidus (encadré 3.5).

Encadré 3.5

Comment comparer la distribution spatiale de l’échantillon à celle de la population- mère ? Régression et analyse de résidus

Les démarches du type régression puis cartographie des résidus sont courantes et souvent utiles en géographie. Dans notre cas, la variable à expliquer est le nombre de ventes par commune dans l’échantillon qu’est notre base de données, et la variable explicative, le nombre de logements par commune selon les recensements. Les recensements considèrent la ville de Marseille commune une seule commune (Code Officiel Géographique de l’INSEE : 13 055), on ne dispose donc pas du parc à l’échelle des arrondissements (qui disposent pourtant chacun d’un COG, de 13 201 à 13 216). Vu la taille de cette commune et son poids démographique, les diagrammes cartésiens présentent de très nombreux points dans les petites valeurs, et un seul point très éloigné de tous, qui est celui de Marseille. Cette particularité pèse sur les nuages de points (c’est aussi le cas, dans une moindre mesure, pour le cas d’Aix-en-Provence). C’est pourquoi on

148 peut effectuer des régressions soit sur l’ensemble des communes, soit sur l’ensemble moins Marseille, soit sur l’ensemble moins Marseille et Aix-en-Provence.

Il est cependant plus intuitif de faire ce même travail non pas sur les stocks de logements mais sur les parts de chaque commune dans le parc total de l’aire urbaine. En effet, alors que les régressions sur les stocks portaient sur des valeurs très dissemblables, la même démarche portant sur des % permet de saisir plus rapidement les équations. Surtout, elle permet aussi de disposer d’un étalon pour apprécier la conformité des distributions spatiales de l’échantillon et de la population-mère. En effet, une distribution similaire verrait le nuage de points résumé par l’équation y = 1x + 0 (avec un r² de 1).

Le calcul des ces équations pour chacune des années et sur les trois ensembles de communes cités plus haut est intéressant. En effet, les équations résumant les nuages de points tendent à se rapprocher de la forme y = 1x + 0 (le coefficient directeur se rapprochant de 1, et la constante de 0). Cette évolution s’accompagne en outre d’une meilleure qualité de la régression.

C’est pour cette raison que nous avons décidé d’évaluer la représentativité spatiale de notre échantillon à l’aune de cette équation y = 1x + 0. Ainsi, les calculs et la cartographie des résidus se fondent à dessein sur cette équation, et non pas sur les équations résumant les nuages de points pour chacune des années, comme cela est souvent le cas dans les analyses de résidus.

3.4.2. Comment évolue la représentativité spatiale de l’échantillon ?

Sur la base de ces quelques éléments méthodologiques, il est possible d’évaluer plusieurs points. Tout d'abord, il s’agit de s’assurer que les fortes variations du nombre de transactions dont on dispose, parfois en contradiction avec les mouvements réels du marché, ne nuit pas à la qualité de notre échantillon. En d’autres termes, la forte baisse des transactions au sein de notre échantillon à partir de 2000 est-elle le fait de baisses très localisées, ce qui introduirait des biais importants, ou est-elle généralisée à toutes les unités spatiales (communes) ?

Pour ce faire, on a travaillé sur les résidus calculés comme les écarts entre la part de chaque commune dans le parc total de l’AU selon les recensements, et la part dans l’échantillon. Ces écarts ont tous été calculés en valeur absolue100, il s’agit donc d’écarts

en points. On peut additionner ces écarts avant de les diviser par le nombre de communes concernées (puisque nous ne disposons pas du même nombre de communes pour chaque année de notre base de données) comme sur la figure suivante (cf. figure 3.9).

100 Dans le cas contraire, leur somme aurait fait 0. Cette démarche empêche de voir quelles sont les

communes sur ou sous-représentées mais le but ici est surtout de disposer d’un aperçu global de la conformité des deux distributions.

149

Figure 3.9 :moyenne de l’écart en points de % entre la part des communes dans le parc de logements de l’aire urbaine de Marseille-Aix-en-Provence et la part des

communes dans la base de données (1991-2006)

Ce graphique montre clairement l’amélioration progressive de la représentativité spatiale de l’échantillon de transactions. Au départ, l’écart moyen entre la part d’une commune dans les deux distributions est de 0,65 points, pour finir par être inférieure à 0,3. On remarque en outre une forte liaison entre l’augmentation du nombre de transactions enregistrées et l’amélioration de la représentativité spatiale de l’échantillon, y compris en fin de période avec une relative dégradation quand le nombre de ventes disponibles dans les bases MIN baisse.

Concernant la distribution communale de ces résidus, nous avons choisi de les représenter pour des périodes de plusieurs années. Là encore, cela implique de cartographier les résidus en valeur absolue, et donc de se priver de l’information sur la sur ou sous-représentation des communes dans l’échantillon101. Nous disposons de cette

information et serons en mesure de l’exploiter si nécessaire. Il nous semblait seulement ici plus important de se focaliser sur l’évolution de la qualité des données. C’est pourquoi les cartes 3.3, 3.4 et 3.5 correspondent à des périodes choisies en fonction de cette problématique : la période 1991-1996 est celle qui voit les données disponibles dans notre base de données croître plus vite que le nombre de transactions, elle correspond donc à une amélioration de la base. La période 1997-2000 est celle où les ventes disponibles dans notre base de données évoluent conformément au marché. La dernière correspond à une dégradation de l’enregistrement des ventes (cf. supra figures 3.7 et 3.8). Pour chacune de ces années, on dispose du résidu annuel moyen sur la période considérée. La méthode de discrétisation choisie, fondée sur les quantiles102

permet une comparaison rapide.

101 Cette privation ne concernant de toute façon que le mode de représentation puisque les résultats bruts

des traitements sont disponibles et mobilisables par ailleurs.

150