• Aucun résultat trouvé

La loi de Pareto appliquée aux villes chinoises

Dans le document Urbanisation et Croissance des Villes en Chine (Page 193-199)

Evolution de la distribution des tailles des villes en Chine

2. Evolution du système urbain chinois 1990-2000

2.2. Analyses par la loi de Pareto 1. La loi de Pareto et la loi de Zipf

2.2.2. La loi de Pareto appliquée aux villes chinoises

Nous effectuons l’estimation de la loi de Pareto sur les villes chinoises des années 1990, afin d’examiner l’évolution du système urbain durant cette période qui témoigne d’une croissance urbaine rapide. Nous utilisons les données des villes de cinq années sélectionnées, soit 1990, 1993, 1995, 1998 et 2000. Les résultats d’estimation sont présentés dans le Tableau 6.4. La partie supérieure du Tableau 6.4a montre les résultats d’estimation sur l’échantillon complet, où toutes les villes dont le chiffre de la population est disponible sont inclues. La valeur de R2 ne cesse de croître de 0,866 en 1990 à 0,927 en

54 Une série de travaux estiment l’équation de la loi de Zipf en utilisant la même base de donnée de Etats-Unis sur 1900-1990, voir Dobkins et Ioannides (2000), Ioannides et Overman (2001), Black et Henderson (2003), Gabaix et Ioannides (2003), Soo (2005), etc.

2000, suggérant que la régression de la loi de Pareto décrit de mieux en mieux la distribution de la taille des villes chinoises. Cependant, nous notons que récemment, Gan et al (2006) prouvent que la valeur de R2 élevé dans la régression de la Loi de Zipf est un phénomène statistique plutôt que économique ; la signification économique de cet indice est donc à interpréter avec précaution. Les estimations de l’exposant de Pareto révèlent une tendance croissante monotone de 1990 à 2000, avec une valeur estimée non-significativement différente de 1 pour les deux premières années, et non-significativement supérieure à 1 pour les trois dernières années. Ces résultats suggèrent qu’au début des années 1990, la distribution de la taille des villes suit la loi de Zipf, mais qu’elle devient plus égale que le prédit la loi de Zipf dans la seconde moitié de la décennie. Comme le montre la Figure 6.2, la ligne de rang-taille devient plus pentue de 1999 à 2000 (à part le déplacement en haut), impliquant une moindre degré de concentration urbaine, puisque les plus grandes villes dans le système urbain en 2000 ont des tailles relativement plus petites que celles de 1990.

Figure 6.2. Les nuages de points et la prédiction linéaire rang-taille des villes chinoises 1990 et 2000 0 2 4 6 8 L o g ( R a n g ) 8 10 12 14 16 Log (Taille)

1990 Nuage de points Rang-taille 1990 Ligne prédite 2000 Nuage de points Rang-taille 2000 Ligne prédite

Avec un grand nombre de nouvelles villes créées (principalement par la qualification des bourgs), le nombre des villes passe de 467 en 1990 à 663 en 2000. Ce changement de la taille de l’échantillon peut avoir un impact sur l’estimation. Afin de la purger de cet effet, nous réestimons l’équation (6.2) avec un échantillon en panel équilibré, c’est-à-dire incluant seulement les villes existant dans toutes les cinq années. Les résultats sont présentés dans le panneau du milieu du Tableau 6.4a. La valeur de R2 est assez élevée, et reste stable pour les cinq périodes. L’exposant de Pareto montre toujours une tendance croissante, toutefois, sa valeur estimée est en général légèrement plus petite que pour l’échantillon complet : elle est significativement inférieure à 1 pour les trois premières années, et n’est pas significativement différente de 1 pour les deux dernières. Nous pouvons en conclure que les villes dans le panel équilibré deviennent plus égales en termes de distribution de la taille, et que de plus, l’entrée des villes nouvelles contribue plus à la croissance de l’égalité de la distribution pour l’échantillon complet.

Suivant les critères officiels adoptés en 1983 pour définir les « urbains », une agglomération doit normalement avoir au moins 80 000 habitants non-agricoles pour être qualifiée de ville (voir le chapitre 2). Cependant, toutes les villes dans notre échantillon ne remplissent pas ce critère, puisque beaucoup d’agglomérations ayant moins de 80 000 habitants sont classées « villes » par leur importance politique ou administrative. Nous excluons ces petites villes en imposant le seuil minimum de 80 000, ce qui exclut entre 61 (en 2000) et 87 (en 1995) de nos échantillons. Les résultats d’estimation sont présentés dans le panneau inférieur du Tableau 6.4a. Les valeurs de R2 sont très élevées, toutes supérieures à 0,98. L’exposant de Pareto est significativement supérieur à 1 pour toutes les périodes, et la tendance générale reste croissante. Suite à l’exclusion des petites villes, la distribution de la taille des villes paraît plus égale et plus conforme à la loi de Pareto.

Nos résultats suggèrent que l’estimation de l’exposant de Pareto est sensible au seuil de l’échantillon. Pour tester cette sensibilité, nous effectuons les régressions respectivement sur les 100, 200, 300 et 400 plus grandes villes. Les résultats présentés dans le Tableau 6.4b montrent que, comme l’indique la littérature, plus l’échantillon se limite aux grandes villes, plus grand est l’exposant de Pareto estimé, en d’autres termes, la distribution de la taille des plus grandes villes sont plus égale que celle des plus petites. Quant à R2, ses valeurs sont élevées, toutes supérieures à 0,98. La tendance de l’exposant de Pareto reste toujours croissante.

Tableau 6. 4a. Estimation Rang-taille des villes

Equation Rang-taille Equation quadratique Rang-taille Année Obs Constante α R2 Constante Log(Taille) Log2 (Taille) R2

Echantillon complet 1990 467 16,235 0,918 0,886 -9,324 3,28 -0,171 0,992 (0,185) (0,015) (0,333) (0,054) (0,002) 1993 568 17,281 0,987 0,898 -10,139 3,491 -0,182 0,989 (0,169) (0,140) (0,404) (0,066) (0,003) 1995 640 17,869 1,023 0,902 -10,549 3,598 -0,187 0,989 (0,162) (0,013) (0,411) (0,066) (0,003) 1998 666 18,243 1,046 0,913 -10,155 3,539 -0,184 0,989 (0,153) (0,013) (0,426) (0,068) (0,003) 2000 663 18,621 1,071 0,927 -9,605 3,442 -0,179 0,988 (0,144) (0,012) (0,500) (0,080) (0,003) Panel equilibré 1990 441 16,321 0,928 0,901 -9,739 3,326 -0,172 0,992 (0,178) (0,015) (0,363) (0,059) (0,002) 1993 441 16,65 0,946 0,898 -11,45 3,603 -0,183 0,993 (0,187) (0,015) (0,365) (0,059) (0,002) 1995 441 16,813 0,952 0,892 -12,94 3,837 -0,192 0,993 (0,195) (0,016) (0,382) (0,061) (0,002) 1998 441 17,312 0,985 0,903 -13,515 3,923 -0,194 0,992 (0,191) (0,015) (0,441) (0,070) (0,003) 2000 441 17,425 0,989 0,903 -13,514 3,911 -0,193 0,990 (0,193) (0,015) (0,493) (0,078) (0,003)

Echantillon avec un seuil de 80 000 d’habitants

1990 384 19,252 1,157 0,985 1,491 1,618 -0,108 0,997 (0,090) (0,007) (0,421) (0,066) (0,002) 1993 481 20,109 1,212 0,986 3,263 1,427 -0,103 0,997 (0,080) (0,007) (0,417) (0,065) (0,003) 1995 556 20,543 1,235 0,985 2,529 1,587 -0,110 0,997 (0,080) (0,007) (0,424) (0,066) (0,003) 1998 588 20,612 1,233 0,985 2,566 1,588 -0,110 0,997 (0,077) (0,006) (0,391) (0,061) (0,002) 2000 602 20,560 1,224 0,983 2,048 1,664 -0,112 0,996 (0,082) (0,007) (0,447) (0,070) (0,003)

Notes : Les chiffres entre les parenthèses sont les écarts types

Tableau 6. 4b. Estimation Rang-taille des 100 à 400 plus grandes villes

(1) Top 100 villes (2) Top 200 villes (3) Top 300 villes (4) Top 400 villes

Année α R2 α R2 α R2 α R2 1990 1,342 0,989 1,267 0,991 1,229 0,993 1,140 0,983 (0,014) (0,008) (0,006) (0,008) 1993 1,386 0,993 1,347 0,996 1,324 0,997 1,275 0,993 (0,011) (0,006) (0,005) (0,005) 1995 1,415 0,993 1,394 0,996 1,373 0,997 1,342 0,996 (0,012) (0,006) (0,004) (0,004) 1998 1,426 0,993 1,406 0,996 1,380 0,997 1,344 0,996 (0,012) (0,006) (0,004) (0,004) 2000 1,415 0,993 1,401 0,996 1,383 0,997 1,350 0,996 (0,012) (0,006) (0,004) (0,004)

Nous constatons que l’exposant de Pareto est plus grand pour l’échantillon restreint aux plus grandes villes, ceci suggère que la relation entre la taille et le rang des villes peut être non-linéaire. On peut aussi observer cette relation non-linéaire dans la Figure 6.2, qui montre une forme de U inversé. Nous ajoutons donc à l’équation (6.2) un terme quadratique du log de la population en log, soit

it it t it t t it A N N u R =ln − ln + (ln )2 + ln α β (6.3) Les résultats d’estimations à partir de l’équation (6.3) sont présentés dans la partie supérieure droite du Tableau 6.4a pour différentes périodes. La non linéarité dans la régression est confirmée pour tous les échantillons. Le coefficient positif du terme de la population en logarithme et le coefficient négatif de son terme quadratique impliquent une ligne prédite de régression concave, comme le montre la Figure 6.2. Comme le présente ci-dessus, la hausse de l’exposant de Pareto avec la restriction de l’échantillon aux plus grandes villes est un constat courant dans la littérature. Cette relation de forme U inversée entre le rang et la taille en logarithme est confirmée aussi dans Black et Henderson (2003) pour les villes des Etats-Unis, et dans Song et Zhang (2002) pour les villes chinoises.

Tableau 6.4c. Estimation Rang-taille des villes par région

Villes de l’Est Villes du Centre Villes de l’Ouest

Année α R2 Obs α R2 Obs α R2 Obs

1990 0,872 0,932 182 0,951 0,846 192 0,850 0,860 93 (0,018) (0,029) (0,036) 1993 0,953 0,939 248 1,011 0,850 212 0,922 0,883 108 (0,015) (0,006) (0,032) 1995 1,022 0,946 291 1,019 0,857 233 0,938 0,885 116 (0,014) (0,027) (0,032) 1998 1,030 0,945 301 1,089 0,888 243 0,941 0,897 122 (0,014) (0,025) (0,029) 2000 1,022 0,941 296 1,103 0,893 246 1,039 0,949 121 (0,015) (0,024) (0,022)

Notes : Les chiffres entre les parenthèses sont les écarts types. Les termes constants ne sont pas présentés. Nous procédons ensuite aux régressions sur les trois sous-échantillons selon les régions, soient les villes de l’Est, du Centre, et de l’Ouest. Les résultats présentés dans le Tableau 6.4c montrent que, pour toutes les périodes, la taille des villes du Centre est distribuée de manière plus égale que celle des villes de l’Est et de l’Ouest. Ces résultats confirment notre constat préliminaire à partir des écarts types de la taille des villes mentionné dans la section 2.1. Etant donné que la plupart des grandes villes se situent à l’Est, et la plupart des petites à l’Ouest, la plus grande égalité de la distribution des villes

du Centre n’est pas surprenant. De plus, la tendance croissante de l’exposant de Pareto pendant cette décennie se révèle également dans les régressions sur les trois sous-échantillons.

Puisque les analyses descriptives dans la section précédente suggèrent différents schémas d’évolution du système urbain avant et après 1995, nous examinons l’évolution de l’exposant de Pareto. Comme le montre la Figure 6.3, la valeur de α augmente plus vite dans la première moitié de la décennie que dans la seconde, pour toutes les régressions, excepté celle sur le panel équilibré et sur les villes du Centre et de l’Ouest. Pour les régressions sur les villes de plus de 80 000 habitants et sur les villes de l’Est, la valeur de α augmente avant 1995 mais diminue après. Comme il a été exposé dans la section 2.1, la croissance urbaine avant 1995 dépend essentiellement de la création des petites villes, ce qui fait que la distribution de la taille des villes devient plus égale et après 1995, le nombre des villes reste relativement stable, de sorte que l’égalité de la distribution ne peut pas croître au même rythme qu’avant.

Figure 6.3 Exposant de Pareto des villes chinoises en 1990, 1995 et 2000

(a) (b) (c) En appliquant l’estimation de la loi de Pareto aux villes chinoises, nous pouvons tirer les conclusions suivantes : Premièrement, l’exposant de Pareto révèle en général une tendance croissante monotone sur la période 1990-2000, cette tendance est moins manifeste dans la seconde moitié de la décennie. Elle s’observe dans presque toutes les 0,9

1,0 1,1 1,2

1990 1995 2000

Toutes les villes Panel Equilibré Villes au moins 80000 1,1 1,2 1,3 1,4 1990 1995 2000 Top 100 Top 200 Top 300 Top 400 0,84 0,94 1,04 1,14 1990 1995 2000

régressions, quels que soient la taille et le critère de l’échantillon. Nous pouvons accréditer une égalité croissante de la distribution de la taille des villes durant cette décennie, notamment dans sa première moitié. Ce résultat est conforme à ceux de Song et Zhang (2002) et d’Anderson et Ge (2005), qui concluent, par l’estimation de la loi de Pareto, à des tendances similaires dans les distributions récentes de la taille des villes chinoises,. Deuxièmement, nos résultats confirment que l’estimation de l’exposant de Pareto est sensible à la taille et au seuil de l’échantillon, et que sa valeur estimée tend à être plus grande pour les échantillons restreints aux grandes villes. Finalement, si la loi de Pareto décrit bien la distribution de la taille des villes chinoises, il peut également établi une relation non-linéaire entre le rang et la taille des villes.

2.3. Analyse par la matrice de transition

Dans le document Urbanisation et Croissance des Villes en Chine (Page 193-199)