• Aucun résultat trouvé

Trafic aérien de passagers au Canada : analyse exploratoire d'un modèle origine-destination avec interactions spatiales

N/A
N/A
Protected

Academic year: 2021

Partager "Trafic aérien de passagers au Canada : analyse exploratoire d'un modèle origine-destination avec interactions spatiales"

Copied!
40
0
0

Texte intégral

(1)

Trafic aérien de passagers au Canada: analyse

exploratoire d’un modèle origine-destination avec

interactions spatiales

Mémoire

Yahya Ibrahima CISSE

Maîtrise en économique

Maître ès arts (M.A.)

(2)
(3)

Résumé

Ce mémoire revisite à l’aide de méthodes d’économétrie spatiale le modèle gravitaire PODM (Passen-ger Origin-Destination Model) que Transports Canada utilise pour prédire le trafic aérien domestique de passagers. Différents modèles spatiaux de panel sont estimés par maximum de vraisemblance et par la méthode des moments. Les résultats montrent que l’approche traditionnelle ne détecte pas d’effets de la distance entre l’origine et la destination sur le volume du trafic intérieur de passagers. Ce sont les caractéristiques de la région d’origine et de destination (PIB, revenu disponible, population) et les caractéristiques du trajet (prix moyen du billet, nombre de vols offerts) qui sont les déterminants les plus importants des flux de passagers. Dans les modèles spatiaux explorés, les interactions spatiales se révèlent d’importants déterminants aux côtés des caractéristiques locales. La prise en compte de ces effets spatiaux pourrait permettre d’améliorer les prévisions de trafic de passagers au Canada. ——————————

Mots clés : interactions spatiales, données de panel, maximum de vraisemblance, méthodes des mo-ments.

(4)
(5)

Table des matières

Résumé iii

Table des matières v

Liste des tableaux vii

Remerciements ix

Introduction 1

1 Méthodologie 5

1.1 Le modèle standard de gravité . . . 5

1.2 Interactions spatiales : le modèle de base . . . 6

1.3 Modèles spatiaux statiques en panel . . . 9

2 Données 15

2.1 Présentation des données . . . 15

2.2 Statistiques descriptives. . . 15 3 Résultats 19 3.1 Modèles de gravité . . . 19 3.2 Modèles spatiaux . . . 21 3.3 Tests de spécification . . . 24 Conclusion 25 Bibliographie 27

(6)
(7)

Liste des tableaux

2.1 Statistiques descriptives sur les données origine-destination . . . 16

2.2 Matrice des corrélations. . . 17

3.1 Estimation des modèles de gravité . . . 20

3.2 Tests de sélection des modèles de gravité. . . 20

3.3 Estimation des modèles spatiaux empilés et à effets individuels par maximum de vrai-semblance . . . 22

(8)
(9)

Remerciements

La réalisation de ce mémoire a nécessité le concours de nombreuses personnes auxquelles je voudrais adresser ma profonde reconnaissance.

Je remercie particulièrement le Professeur Carlos Ordás Criado, mon encadreur pour son apport sur les méthodes économétriques ainsi que son généreux soutien financier. Ma reconnaissance va égalememt au corps professoral du département d’économique pour la qualité de l’enseignement dispensé ainsi qu’à mes amis et caramades de classe.

À mes parents et à ma famille, pour les efforts consentis à mon éducation, qu’ils trouvent dans ces lignes l’expression de ma profonde gratitude.

(10)
(11)

Introduction

De nombreuses disciplines cherchent à modéliser les échanges entre deux entités (individus, régions ou pays) dans le but d’identifier les principaux déterminants de l’intensité des flux bilatéraux. C’est no-tamment le cas dans les domaines de la géographie urbaine (Engebretsen,2005), la migration (Letouzé et al.,2009), le tourisme (Wang et Song,2010;Grosche et al.,2007), en économie/commerce ( Bald-win et Taglioni,2006;Fischer et Griffith,2008) ou en transport. En matière de transports, les flux de passagers entre deux localisations, aussi appelés "données ou flux origine-destination", constituent de l’information précieuse pour l’analyse empirique. De nombreux organismes publics ou privés utilisent les données origine-destination pour prévoir des flux de trafic à court où long terme et pour évaluer les besoins en matière d’infrastructures de mobilité. À titre d’exemple, Transports Canada agrège les flux de passagers aériens qui embarquent et débarquent dans les aéroports canadiens pour quantifier la demande de transport aérien de personnes des trois grands segments de marché (national, transfronta-lier et international, voir notammentTransports Canada,2011). Cet organisme réalise des prévisions de trafic de court/moyen terme à l’aide du modèle de régression le plus populaire en économie pour traiter ce type de données, le modèle de gravité (voir par exempleBaldwin et Taglioni,2006). Ce mo-dèle permet d’évaluer la sensibilité des flux de passagers aux prix des billets d’avion entre l’origine et la destination, au PIB de l’origine et de la destination et à d’autres caractéristiques spécifiques aux lieux d’origine et de destination des passagers (langue, fréquence des vols, etc). L’exercice économé-trique n’est pas sans difficultés. En effet, le modèle de gravité fait l’hypothèse implicite que l’inclusion de facteurs explicatifs capturant la distance entre les entités analysées (distance géographique) et les caractéristiques spécifiques permet de traiter la dépendance spatiale qui existerait dans les données (LeSage et Fischer, 2010, p. 410). Toutefois, cette hypothèse est rarement vérifiée et de nombreux auteurs proposent de traiter la dépendance spatiale en la formalisant plus explicitement dans le cadre de la régression.

L’économétrie spatiale propose plusieurs manières d’appréhender la dépendance spatiale dans les don-nées, aussi appelée "interactions spatiales". Comme le soulignentLeSage et Fischer(2010), ces inter-actions peuvent être explicitement modélisées en postulant l’existence d’une structure spatiale pour la variable expliquée (appelée modèle d’interactions spatiales de la variable dépendante ou "spatial interaction model") et/ou pour le terme d’erreur stochastique de la régression (composante

(12)

inobser-vée de la variation appelée modèle à erreurs spatiales ou "spatial error model").1 Dans ce type de modèles, la dépendance spatiale est capturée à l’aide de matrices de poids qui précisent la distance (relative) existant entre les individus (personnes physiques, villes, régions). Notons que l’on utilise en général une distance géographique, mais qu’une distance en termes de richesse ou de proximité culturelle pourrait être utilisée. Dans ce contexte, le chercheur qui veut appliquer ces techniques doit posséder de l’information sur la distance séparant les individus. L’analyse spatiale cherche notamment à quantifier l’influence du voisinage sur la variable expliquée. Ces modèles ont été naturellement éten-dus au contexte de l’analyse des données de panel (indiviéten-dus observés sur différentes périodes). Nous renvoyons le lecteur intéressé à l’abondante littérature citée parMillo et Piras(2012). Les modèles de panel permettent notamment de mieux appréhender l’hétérogénéité des comportements individuels, par l’intermédiaire d’effets individuels spécifiques inobservés, qui peuvent être modélisés comme des composantes déterministes ou aléatoires du modèle de régression postulé. Qui plus est, ces estima-teurs spatiaux de panel peuvent être de nature statique ou dynamique (voirBaltagi et al.,2014). Dans le présent travail, nous ne nous intéressons qu’aux modèles statiques.

Ce mémoire applique différentes techniques d’économétrie spatiale pour données de panel aux flux de passagers aériens qui embarquent et débarquent dans un aéroport canadien. Il se concentre donc sur le trafic intérieur de passagers aériens. Notre objectif est de revisiter le modèle de gravité tradition-nellement utilisé par Transports Canada pour prévoir ces flux de passagers avec les nouveaux outils proposés par l’économétrie spatiale pour analyser les données de type origine-destination. Ce modèle, appelé PODM pour "Passengers Origin Destination Model" postule que le volume de passagers entre aéroports dépend du prix moyens des billets d’avion entre l’origine et la destination, des PIB provin-ciaux, de la différence de langue entre les régions d’origine et de destination, de la population de lieu de départ, de la fréquences des vols offerts, de la distance séparant les aéroports. Nous montrons que l’estimation du modèle gravitaire standard n’identifie pas d’effets significatifs de la distance sur les flux de passagers. Ce sont les caractéristiques de l’origine et de la destination et certaines caractéris-tiques des trajets (prix des billets, fréquence des vols offerts) qui se révèlent les variables explicatives les plus pertinentes. Nous construisons ensuite des effets spatiaux (matrice de pondération spatiale) en nous basant sur les distances géographiques qui séparent les aéroports. Nos résultats montrent que les effets spatiaux sont statistiquement significatifs, quels que soient les modèles de panel testés et la modélisation spatiale adoptée (‘spatial interaction model’ vs ‘spatial error model’). Ceci souligne la nécessité de modéliser explicitement les effets spatiaux lorsque l’on effectue de la régression avec des données origine-destination de passagers aériens. Des tests statistiques basés sur le multiplicateur de Lagrange indiquent que l’hétérogénéité de la relation postulée entre aéroports est mieux capturée par le modèle spatial à effets individuels fixes. Finalement, les effets spatiaux mis en lumière indiquent qu’un nombre élevé de passagers entre une origine et une destination favorise le trafic de passagers dans les destinations voisines à l’aéroport de destination. Tous nos résultats demeurent néanmoins

1. À noter queLeSage et Fischer(2010) mentionnent également un traitement des caractéristiques spatiales par effets fixes. Cette approche, proposée parFeenstra(2002) en commerce international, introduit simplement des variables indica-trices qui distinguent les observations d’origine et de destinations dans le modèle gravitaire traditionnel. Elle souffre donc des mêmes biais potentiels que l’estimateur traditionnel.

(13)

exploratoires et il convient de prendre les estimations réalisées avec une certaine prudence.

Le reste du document est organisé comme suit. Après un survol méthodologique des principaux concepts et techniques d’estimation existants au chapitre 1, le chapitre 2 traite de la source des don-nées et de leur description. Les différentes estimations sont présentées avec des tests de spécification au troisième chapitre. Pour conclure, nous fournissons quelques réflexions sur des extensions futures.

(14)
(15)

Chapitre 1

Méthodologie

Ce chapitre développe les aspects méthodologiques fondamentaux liés à l’estimation spatiale de don-nées de type origine-destination (abrégé OD ci-après). Les deux premiers chapitres proposent une introduction au modèle de gravité (chapitre 1.1) et à la régression linéaire avec interactions spatiales (chapitre 1.2). Le chapitre 1.3 présente les extensions réalisées dans ce contexte pour les données de panel, que ce soit dans un cadre de maximum de vraisemblance ou de méthode des moments. No-tons que cette section décrit également les principaux tests de spécification à réaliser pour identifier le meilleur modèle dans le cadre des données OD en panel.

1.1

Le modèle standard de gravité

L’analyse de l’intensité des flux commerciaux ou de voyageurs entre pays/régions a longtemps été dominée par l’utilisation du modèle dit de "gravité". Dans sa formulation la plus simple, ce modèle stipule que les flux de commerce ou de voyageurs entre l’origine i et la destination j sont proportion-nels à la masse (ou taille) des économies et inversement proportionproportion-nels au carré de la distance qui les sépare. L’équation fondamentale est donnée par la fonction :

Yi j= f (Xi, Xj, Di j) = G · Xa i X b j Dc i j (1.1)

où l’indice i = 1, . . . , o se réfère à la ième origine, j = 1, . . . , d est l’indice de la destination, Xiet Xjles

variables explicatives qui capturent les caractéristiques spécifiques aux o origines et aux d destinations respectivement. L’application du logarithme à l’expression (1.1) nous amène à :

ln(Yi j) = g + a ln(Xi) + b ln(Xj) + c ln(Di j) (1.2)

Ainsi, le modèle log-linéaire de gravité consiste essentiellement à ajouter à l’équation (1.2) une erreur aléatoire εi j∼ iid(0, σε2) et à estimer les valeurs des paramètres g, a, b, c par moindres carrés. On notera

que ce modèle stipule un effet négatif de la distance entre une origine et une destination sur les flux. L’estimation de l’équation (1.2) se fonde sur une hypothèse cruciale : la dimension spatiale n’affecte

(16)

pas la distribution des données, c.-à-d. les observations sont réparties dans l’espace géographique de manière indépendante. Cette hypothèse est rarement justifiée. Comme le suggèreTobler(1970) dans l’énoncé de la première loi de la géographie, "Everything is related te everything else, but near things are more related than distant things." Le modèle de gravité a été appliqué pour la première fois en commerce international parTinbergen(1965);Pöyhönen(1963), et depuis, de nombreux auteurs ont estimé une variété de spécifications de cette approche. La forme log-linéaire (1.2) a comme avantage de permettre l’interprétation des paramètres d’intérêt en termes d’élasticités mais elle est également une source de problèmes pour traiter les flux nuls (absence d’échanges ou de voyageurs entre une origine et une destination).1Par la suite, des variantes de cette formulation ont été utilisées à des fins de prévisions et d’estimation des déterminants de flux OD dans divers domaines : la migration, les flux de transport de personnes ou de marchandises, les externalités spatiales d’information dues à la recherche universitaire et au développement (voir Anselin et al.,1997).

La violation de l’hypothèse d’indépendance rend l’estimation de la relation (1.2) par les moindres carrés au mieux inefficace et au pire biaisée (voir essentiellementLeSage et Fischer,2010). Le recours à des techniques d’estimation qui précisent la forme que prend l’interaction spatiale s’avère nécessaire. Nous présentons à la suite les approches et outils nécessaires à une telle démarche. Comme mentionné dans l’introduction, deux approches considérées pour modéliser les interactions spatiales : un modèle avec retard spatial et un modèle avec autocorrélation spatiale de l’erreur. Comme nous le verrons, la matrice qui mesure la géographie (distance) entre les individus joue un rôle essentiel. On présume donc que le chercheur dispose d’information fiable à ce sujet.

1.2

Interactions spatiales : le modèle de base

Cette section présente le modèle de base avec interactions spatiales, qui été ensuite étendu au cadre des données de panel (voir le sous-chapitre 1.3). Nous introduirons dans cette section deux matrices de pondération ou matrices de dépendance spatiale : une pour la dépendance spatiale basée sur l’ori-gine ou la destination des passagers et l’autre pour la spécification de la forme d’autocorrélation de la distribution du terme d’erreur. Une technique d’estimation appropriée pour prendre en compte la dépendance spatiale est également décrite.

1.2.1 Formulation

Les travaux précurseurs dans l’analyse des données spatiales sont l’oeuvre deCliff et Ord(1975). Ces deux auteurs publient une série d’articles à la fin des années soixante et au début des années soixante-dix dans un ouvrage formalisant les premières approches d’économétrie spatiale. La décennie qui a succédé a permis un raffinement de ce cadre d’analyse. Notons que les apports deAnselin(1988) sont également essentiels dans le développement de l’économétrie spatiale. Les modèles qui retiennent notre attention dans ce chapitre découlent tous du modèle deCliff et Ord (1975) et de Ord (1975).

1. VoirLinders(2006) pour les problèmes soulevés par cette transformation.

(17)

Sans perte de généralité, nous considérerons que nous disposons du même nombre de lieux d’origine que de destination, c’est à dire que la taille de notre échantillon est N = n · n. La formulation générale du modèle de base est donnée par le système suivant de deux équations

(

Y = λWY + X β +U

U= ρMU + ε, (1.3)

où Y est le vecteur des observations de la variable dépendante de taille (N × 1) tel que les yi j sont

em-pilés par colonnes (destinations), WY capture la dépendance spatiale de Y , MU capture la corrélation spatiale de l’erreur U , W et M sont des matrices carrées de pondération spatiales et de taille (n2× n2)

qui capturent les distances entre les entités voisines, X est la matrice des k variables explicatives de format (N × k), U est un vecteur de taille (N × 1) d’erreurs supposées corrélées spatialement et ε représente une autre erreur aléatoire indépendante et identiquement distribuée, donc ε ∼ IID(0, σε2I). Notons également que λ et ρ sont des paramètres scalaires qui caractérisent la nature et l’amplitude de la dépendance spatiale dans un certain voisinage de l’origine i ou la destination j de yi j.

1.2.2 Matrice de poids

Concentrons-nous sur les matrices de poids W et M de la spécification (1.3) et développons leur construction pour le cas général. Comme l’indique (LeSage et Pace,2008, p. 952-954), il existe plu-sieurs approches. Dans un premiers temps, on remplit W de poids ωi j> 0 qui mesurent l’intensité de

la dépendance entre l’individu localisé en i et celui localisé en j. Notez que par convention ωii= 0.

Lorsqu’on utilise les distances physiques notées D(i, j), une formule pour le poids pourrait être : ωi j=

1 D(i, j).

Il en résulte une matrice carrée positive W = (wi j) généralement symétrique et de taille (n2× n2). Il

est courant de normaliser les lignes de W en divisant chaque élément par

n

j=1

ωi j, de telle sorte que

Σjωi j = 1. Cette forme de normalisation des lignes de W permet de mesurer la dépendance spatiale

basée sur la destination(l’indice j indiquant la destination) et on la note également Wd= In⊗W , soit

de façon plus explicite :

Wd=        W 0n · · · 0n 0n . .. ... ... .. . . .. ... ... 0n · · · W.       

Lorsqu’une matrice est normalisée pour mesurer la dépendance spatiale basée sur la destination dans le modèle (1.3), un scalaire λ > 0 signifiera que les forces qui favorisent le flux d’une origine vers une destination favoriseront également les flux de cette même origine vers des destinations proches. À titre d’exemple, on dira qu’un grand volume de passagers aériens voyageant de Toronto (aéroport Pearson) vers Montréal (aéroport Trudeau) aura un effet positif sur le volume de passagers voyageant

(18)

de Toronto vers la ville de Québec (aéroport Jean-Lesage), l’aéroport de la ville de Québec (Jean-Lesage) étant proche de celui de Montréal (Trudeau).

De façon alternative, on peut définir la matrice de pondération afin de capturer la dépendance spatiale basée sur l’originenotée (Wo) par une normalisation des colonnes de W . Alors :

Wo= W ⊗ In.

Lorsque cette normalisation est appliquée dans le modèle1.3, un scalaire λ > 0 signifiera que les forces qui favorisent le flux d’une origine vers une destination favoriseront également les flux d’ori-gines proches vers de cette même destination. À titre d’exemple, on dira qu’un volume important de passagers aériens voyageant de Montréal (Trudeau) vers Toronto (Pearson) aura un effet positif sur le volume de passagers voyageant de la ville de Québec (aéroport Jean-Lesage) vers Toronto, l’aéroport de la ville de Québec (Jean-Lesage) étant proche de celui de Montréal (Trudeau).

Une troisième forme de normalisation consiste à combiner Wdet Womais nous n’entrons pas ici dans

plus de détails.

1.2.3 Procédures d’estimation

Nous reprenons ici un développement simple proposé parDrukker (2008) qui illustre le problème d’endogeneité et les non linéairités que affectent l’estimation du modèle (1.3) et qui conduit à privilé-gier une approche par maximum de vraisemblance. La résolution de ce système par rapport à Y et à U requiert d’imposer des conditions d’identification classiques : les matrices M et W doivent être non-singulières, donc inversibles. On a alors les solutions immédiates de Y et U en fonction des données et de l’erreur ε :

U= (I − ρM)−1ε , (1.4)

et avec les hypothèses stochastiques imposées sur ε, la matrice de variance-covariance de U est : ΩU= E(UU

0

) = σ2(I − ρM)−1(I − ρM0)−1. (1.5)

Pour résoudre l’équation linéaire en Y du système (1.3), on y substitue U de l’équation (1.4) et en regroupant à gauche de l’égalité les termes en Y , on a :

(I − λW )Y = X β + (I − ρM)−1ε .

En résolvant l’expression ci-dessus par rapport à Y , on déduit immédiatement : Y = (I − λW )−1 | {z } g(λ ) X β + (I − λW )−1(I − ρM)−1ε | {z } ε∗ . (1.6)

Comme on peut le voir dans l’expression (1.6), le terme ε∗est hétéroscédastique et Y est une fonction non linéaire des paramètres du modèle. L’expression WY dans (1.3) introduit de la simultanéité (en-dogénéité) dans cette équation. En effet, en substituant (1.6) et (1.4) dans l’espérance ci-dessous, on

(19)

obtient : E h (WY )U0 i = W (I − λW )ΩU6= 0

Ainsi, le recours aux moindres carrés ordinaires n’est pas possible dans ce contexte. La vraisemblance du modèle peut se dériver à partir de l’expression (1.6) et on aboutit alors à ce qui est appelé la fonction de vraisemblance concentrée. En reprenant exactementDrukker(2008), cette vraisemblance prend la forme : L∗2(λ , ρ) = −N 2(ln(2π) + 1 + ln ˆσ 2(λ , ρ) + ln(kI − λW k) + ln(kI − ρMk) (1.7) où ˆ σ2(λ , ρ) =N1Y∗∗(λ , ρ) 0h I− X∗(ρ)[X∗(ρ) 0 X∗(ρ)]−1X∗(ρ) 0i Y∗(λ , ρ), Y∗(λ ) = (I − λW )Y, Y∗(λ , ρ) = (I − ρM)Y∗(λ ) = (I − ρM) (I − λW )Y X∗(ρ) = (I − ρM) X

Les paramètres s’obtiennent à l’aide d’une procédure à plusieurs étapes. En substituant les valeurs de ˆλ , ˆρ qui maximisent la log-vraisemblance concentrée dans ˆσ2(λ , ρ), on en déduit l’estimateur par maximum de vraisemblance de σ2. On obtient l’estimateur de β par le même procédé, en introduisant

ˆ λ , ˆρ dans l’équation : ˆ β = h X∗(ρ) 0 X∗(ρ) i−1 X∗(ρ) 0 Y∗(λ , ρ)

Drukker(2008) voit trois difficultés dans cette démarche :

(i) les paramètres du système sont estimés avec des algorithmes d’optimisation numériques (car le système d’équations est non linéaire dans les paramètres) ;

(ii) les lois de distributions (lois limites) des paramètres sont inconnues et doivent par conséquent être simulées pour procéder à des inférences sur les paramètres ;

(iii) et enfin, il est nécessaire de recourir à des artifices techniques en prélude à l’application du quasi-maximum de vraisemblance.

Les procédures d’estimations généralement utilisées sont des algorithmes construits à partir du maxi-mum de vraisemblance concentrée. Nous n’aborderons pas les technicités de l’estimation dans ce mémoire. Le lecteur intéressé pourra se référer aux articles originaux.

1.3

Modèles spatiaux statiques en panel

Jusqu’à maintenant, la dimension temporelle des données a été ignorée. Les modèles spatiaux en panel permettent de saisir et d’évaluer les interactions spatiales en contrôlant à la fois pour les dimensions individuelle et temporelle. Il existe une large littérature sur les modèles spatiaux statiques et dyna-miques pour données de panel. Nous reprenons ici la présentation faite parMillo et Piras(2012) car elle résume l’ensemble des modèles qui sont estimés dans la section empirique. Nous nous concen-trons sur les modèles statiques, l’approche dynamique sortant largement du cadre de ce mémoire.

(20)

1.3.1 Les modèles

Pour présenter les modèles spatiaux statiques pour les données de panel, nous partons d’une version générale identique à celle présentée dans la section précédente, l’équation (1.3), pour aboutir aux versions estimables proposées parBaltagi et al. (2003) et Kapoor et al. (2007). Soit le modèle de régression (1.3) avec une structure de données en panel :

y= λ (IT⊗WN)y + X β + u i = 1, · · · , N; t = 1, · · · , T , (1.8)

où y est un vecteur (NT × 1) des observations de la variable dépendante, X de format (NT × k) est la matrice des observations des régresseurs exogènes et non stochastiques, IT est la matrice d’identité

de taille T , WN est la matrice de pondération de taille (N × N) dont la diagonale principale est nulle,

et enfin λ est un paramètre d’interaction spatiale. L’inclusion d’effets individuels dans (1.8) se fait par l’intermédiaire de la perturbation u, par une structure à trois composantes : les effets individuels, une forme fonctionnelle pour l’autocorrélation spatiale et un terme d’erreur IID. Cette perturbation se différencie de celle du modèle (1.3) de part la structure des données considérées et la présence d’effets individuels. Concentrons nous sur le terme u et explicitons son contenu :

u= λ (ιT⊗ IN)µ + ε, (1.9)

où ιT est un vecteur (T × 1) de un, IN est la matrice d’identité d’ordre N, µ est le vecteur des effets

individuels invariants dans le temps (non autocorrélés spatialement), et ε est le vecteur des innovations spatialement autocorrélées selon un processus identique à celui imposé à y :

ε = ρ (IT⊗WN)ε + υ, (1.10)

avec ρ (|ρ| < 1) un paramètre spatial autorégressif, υit ∼ IID(0, συ2), et εit∼ IID(0, σ 2

ε). Ce modèle

constitue la contrepartie panel à effets fixes individuels du modèle (1.3). Comme le rappellentMillo et Piras(2012), il est naturel de considérer des effets individuels aléatoires dans cette formulation, en faisant l’hypothèse classique que ces effets sont non corrélés avec les variables exogènes. On pose donc µi∼ IID(0, σµ2) et l’on peut réécrire le terme d’erreur :

ε = (IT⊗ B−1N )υ, (1.11)

où BN= (IN− ρWN), et la perturbation u s’écrit sous sa forme complète :

u= λ (ιT⊗ IN) µ + IT⊗ B−1N



υ . (1.12)

On voit alors immédiatement que la matrice de dispersion de u est : Ωu= σµ2(ι 0 Tι T T ⊗ IN) + συ2IT⊗ (BTNBN)−1  (1.13) Comme le signalentMillo et Piras(2012),Baltagi et al.(2003),Elhorst(2003) etElhorst(2009) pro-posent des estimateurs spatiaux de panel à effets individuels qui omettent la dépendance spatiale dans

(21)

la variable dépendante. Ils se concentrent donc sur des modèles pour lesquels seule l’autocorrélation spatiale de l’erreur est modélisée.

Une modélisation alternative de la dynamique autorégressive de l’erreur a été proposée dans le contexte des modèles à effets individuels statiques parKapoor et al. (2007). Ces auteurs ignorent également les interactions spatiale de la variable dépendante y.Kapoor et al.(2007) donnent une forme spatiale autoregressive classique au terme u

u= ρ (IT⊗WN) u + ε. (1.14)

Le terme ε de l’expression (1.14) est également différent de celui que l’on trouve en (1.11). Dans le modèle de Kapoor et al.(2007), ce terme vise à capturer une corrélation des innovations dans la dimension temporelle et il est défini de la manière suivante :

ε = (ιT⊗ IN)µ + υ, (1.15)

où µ est le vecteur des effets individuels et υ est un vecteur d’innovations variant à la fois dans les dimensions transversale et temporelle. Récemment Mutl et Pfaffermayr(2011) ont proposé une extension de Kapoor et al. (2007) qui offre une méthode d’estimation par variables instrumentales des modèles à effets individuels fixes et aléatoires. Sous l’hypothèse d’effets individuels aléatoires indépendants des régresseurs, l’équation (1.14) devient :

u=IT⊗ (IN− ρWN)−1



ε (1.16)

ce qui implique une matrice de variance-covariance de u telle que :

Ωu= [IT⊗ (IN− ρWN)−1]Ωε[IT⊗ (IN− ρWNT)−1], (1.17) où Ωε = συ2Q0+ σ 2 1Q1, avec σ12= συ2+ T σ 2 µ, Q0= Q0= IT− JT T ⊗ IN, Q1= JT T ⊗ IN, JT= ιTι 0 T.

Comme le rappellent Millo et Piras (2012), cette matrice est la matrice de variance-covariance du modèle d’erreur à une seule composante, adaptée à l’ordre dans lequel les données OD sont empilées. Les modèles présentés ci-dessus s’estiment par maximum de vraisemblance ou par des procédures de méthodes de moments. Le détail de ces procédures étant particulièrement lourd à décrire, nous renvoyons le lecteur au document deMillo et Piras(2012) ou aux articles originaux. Toutes les esti-mations qui sont proposées dans la partie empirique de ces différents modèles sont effectuées avec la librairie splm du logiciel R, notamment les fonctions spml et spgm.

1.3.2 Tests de spécification

Dans le but d’identifier le modèle spatial de panel le plus adéquat, comme il est courant en économé-trie des données de panel, une série de tests sont proposés pour identifier le processus de génération de données le plus pertinent. Depuis les travaux précurseurs deBreusch(1978) etPagan(1980), les tests du multiplicateur de Lagrange (LM) ont été largement utilisés pour tester la présence d’effets

(22)

aléatoires et de corrélation sérielle dans les données de panel. Spécifiquement, les tests LM se prêtent mieux à l’estimation des modèles spatiaux à effets aléatoires du fait qu’ils ne nécessitent que l’esti-mation du modèle restreint et à cause des difficultés à estimer le modèle non restreint.

Baltagi et al.(2003) dérivent les tests joint (1), marginaux (2) et (3), et conditionnels (4) et (5) pour différentes combinaisons d’effets individuels aléatoires et d’interaction spatiale liée à l’erreur. Nous gardons ici les notations originales deBaltagi et al.(2003) etMillo et Piras(2012) tout en soulignant le fait que le paramètre λ ci-dessous équivaut au paramètre la corrélation spatiale de l’erreur (le ρ dans notre description précédente). Pour rappel, cette section reprend également le document deMillo et Piras(2012). Les hypothèses de tests examinées dans ce mémoire sont :

1. H0a : λ = σµ2= 0, sous l’hypothèse alternative qu’au moins une des composantes est non nulle. 2. Hb

0 : σµ2= 0 (en supposant que λ = 0), sous l’alternative unilatérale que la composante de la

variance est supérieure à zéro.

3. H0c : λ = 0, en supposant l’absence d’effets aléatoires (σµ2= 0) , sous l’alternative bilatérale que le coefficient d’autocorrélation spatiale est différent de zéro.

4. H0d: λ = 0, en postulant une existence éventuelle d’effets aléatoires (σµ2peut ou ne pas être égal à zéro.), sous l’alternative bilatérale que le coefficient d’autocorrélation spatiale est différent de zéro.

5. H0e: σµ2= 0, en postulant une éventuelle existence d’autocorrélation spatiale ( λ = 0 peut ou ne pas être égal à zéro.), sous l’alternative unilatérale que la composante de la variance est supérieure à zéro.

Comme l’indiqueMillo et Piras(2012), le test joint LM pour la première hypothèse d’absence d’effets individuels aléatoires et d’interaction spatiale dans l’erreur (Ha

0) , a pour statistique de test l’expression

définie par : LMj = NT 2(T − 1)G 2+N2T b H 2 (1.18)

où G = ˜u0(JT⊗IN) ˜u/ ˜u0u−1 , H = ˜˜ u0(IT⊗(W +W0)/2) ˜u/ ˜u0u˜, b = tr(W +W0)2/2 et ˜upour les résidus

de la régression par MCO. L’équation (1.18) est le point de départ pour dériver les tests marginaux de LM utilisés pour vérifier les hypothèses H0bet H0c. La version standardisée du test marginal LM pour l’absence d’effets individuels aléatoires en postulant l’absence d’effets spatiaux est donnée par :

SLM1=

LM1− E(LM1)

p

Var(LM1)

(1.19) où LM1est la racine carrée du premier terme de l’équation (1.18) . De même, par analogie, la version

standardisée de test marginal de LM pour l’absence d’effets d’autocorrélation spatiale en postulant l’absence d’effets aléatoires est donnée par :

SLM2= LM2− E(LM2) p Var(LM2) (1.20) 12

(23)

où LM2est la racine carrée du second terme de l’équation (1.18) . Notons bien qu’à la fois les

équa-tions (1.19) et (1.20) doivent être asymptotiquement normalement distribuées pour N → ∞ (pour T fixé) respectivement sous H0b et H0c2. En se basant sur les équations (1.19) et (1.20), un test statique unilatéral pour H0a : λ = σµ2= 0 peut être dérivé comme suit :

LMH= (LM1+ LM2) /

2 (1.21)

La statistique de test (1.21) est asymptotiquement distribuée selon N(0, 1). Un test joint pour l’hypo-thèse nulle peut être basé sur la règle de décision suivante :

χm2 =            LM12+ LM2 2 , si LM1> 0, LM2> 0 LM12, si LM1> 0, LM2< 0 LM22, si LM1< 0, LM2> 0 0, si LM1< 0, LM2< 0

Sous l’hypothèse nulle, la statistique du test possède une distribution mixte de χm2 donnée par :

χm2 = (1 /4)χ2(0) + (1 /2)χ2(1) + (1 /4)χ2(2) (1.22)

L’inconvénient de l’utilisation de LM2 est qu’une des alternatives suppose que les effets aléatoires

individuels peuvent ne pas exister. De plus, lorsque la variance de cette composante est importante, cela induit des biais d’inférence. C’est ainsi queBaltagi et al.(2003) ont dérivé le test conditionnel LM contre la nullité du coefficient d’autocorrélation spatiale en assumant que la variance de la composante aléatoire peut être ou non égale à zéro. L’expression pour ce test suit la forme :

LMλ= D(λ )ˆ 2 T − 1 + ˆσν4/ ˆσ14 b , (1.23) où ˆ D(λ )2= 1 2uˆ 0 [σˆ 4 ν ˆ σ14( ¯ JT⊗ (W 0 +W )) + 1 + ˆσν4(ET⊗ (W 0 +W ))] ˆu, avec aussi, ˆσ14= ˆu0( ¯JT⊗ IN) ˆu/N et ˆσν4= ˆu

0

(ET⊗ IN) ˆu/N(T − 1). A l’opposé des précédents tests

utilisant les résidus des MCO, les résidus ˆusont ceux du Maximum de Vraisemblance (ML). L’incon-vénient de cette approche réside essentiellement dans les difficultés liées à son implémentation. Un test unilatéral est dérivé simplement en prenant la racine carrée de l’équation (1.23). La statistique de test résultant est asymptotiquement distribuée N(0, 1).

De même, en utilisant LM1, une des alternatives suppose l’absence de corrélation spatiale. Cette

hypo-thèse peut conduire à des inférences erronées quand λ n’est pas suffisamment proche de zéro. Un test conditionnel prenant en compte la potentielle corrélation spatiale de l’erreur peut être dérivé comme :

LMµ= ( ˆDµ)2( 2 ˆσν4 T )(T N ˆσ 4 νec− N ˆσ 4 νd 2− T ˆ σν4g2e+ ˆσν4ghd− ˆσν4h2c)−1× (N ˆσν4c− ˆσν4g2) (1.24)

(24)

où g = tr(W0Bˆ+ ˆB0W)( ˆB0B)ˆ −1, h = tr( ˆB0B), d = tr(Wˆ 0Bˆ+ ˆB0W), c = tr[((W0Bˆ+ ˆB0W)( ˆB0B)ˆ −1)2]

et e = tr[( ˆB0B)]ˆ 2

Un test unilatéral est dérivé en prenant la racine carrée de l’équation (1.24) construite sur les résidus obtenus par ML. La statistique de test qui en résulte est asymptotiquement distribuée selon N(0, 1). Par ailleurs, le test de Hausman (1978) compare les estimateurs à effets individuels aléatoires et fixes en examinant si l’hypothèse d’effets aléatoires peut être ou non supportée par les données.Mutl et Pfaffermayr(2011) ont montré comment étendre cette procédure au cadre d’interactions spatiales. La statistique du test de Hausman prend alors la forme :

H= NT ( ˆθFGLS− ˆθW)T( ˆΣW− ˆΣFGLS)−1( ˆθFGLS− ˆθW) (1.25)

où ˆθFGLSet ˆθW sont respectivement les estimateurs spatiaux MCG et Within, et ˆΣW et ˆΣFGLSles

cor-respondants des estimés des coefficients des matrices de variance covariance. H est asymptotiquement distribuée selon χ2à k degrés de liberté où k désigne le nombre de régresseurs dans le modèle. La procédure pour examiner la validité des différents modèles présentés est la suivante :

(i) estimation du modèle standard (sans interactions spatiales) ;

(ii) estimation des modèles avec interactions spatiales par maximum de vraisemblance et par des méthodes de moments (GMM) ;

(iii) enfin, les tests de spécifications complèteront cette démarche pour déterminer le modèle le plus adéquat pour nos données.

Les estimations se font dans le logiciel R avec les fonctions bsktest et sphtest de la librairie spml.

(25)

Chapitre 2

Données

Ce chapitre présente les données qui serviront aux estimations des modèles décrits dans le précédent chapitre.

2.1

Présentation des données

Les données utilisées dans cette étude proviennent de Transports Canada. Il s’agit d’une base de données sur le trafic de passagers aériens Origine-Destination couvrant la période 1995-2012. Les individus sont les couples Origine-Destination d’aéroports. L’origine fait référence à l’aéroport d’em-barquement et la destination à celui de déd’em-barquement. Transports Canada utilise plusieurs segments de marchés pour analyser le trafic de passagers aériens (domestique, transfrontalier et International). Comme cette étude s’intéresse spécifiquement au transport domestique, les variables utilisées sont celles adaptées à ce segment de marché, autrement dit il s’agit des variables qu’utilise Transports Canada pour effectuer les prévisions de trafic aérien sur ce segment.

Notre échantillon d’étude est un panel de 382 individus observés sur une période de 18 années, soit 6876 observations. Les informations de la base ont trait, entre autres, au nombre de passagers, la distance en kilomètres entre les origines et destinations, le coût du trajet en dollars de constant de 2006, le nombre de vols directs par semaine d’une origine à une destination, et certaines variables macroéconomiques telles que le PIB des provinces d’origine ou de destination, les populations des provinces d’origine ou de destination, le revenu disponible des provinces d’origine ou de destination, etc.

2.2

Statistiques descriptives

Le tableau2.1résume quelques statistiques descriptives des variables utilisées dans la présente étude. Le flux moyen domestique de passagers d’une origine à une destination (Pax.OD) au Canada est de 48 870 passagers. La longueur moyenne d’un trajet (Distance) est de 2828 km et la médiane pour cette variables est d’environs 1800 km.

(26)

TABLE2.1: Statistiques descriptives sur les données origine-destination

Statistiques Min. 1er Qu. Médiane Moyenne 3e Qu. Max.

Pax.OD 53 2433 9791 48870 43272 769881 Distance(km) 243 924.5 1684.5 2828.6 3343.0 28308.0 Time.Car(mn) 180 819.1 1839.9 2025.1 2917.3 6001.4 Fare.2006($CAD) 52.8 355.0 477.9 496.1 619.9 1523.6 POPADO 48777 511131 736893 1202139 1110239 7839642 POPADD 48777 467994 730744 1197697 1110239 7839642 PDIO ($CAD) 15350 21184 23633 24297 26648 45786 GDPO(Million $ CAD) 2116 20302 35621 61382 75647 386563 GDPD (Million $ CAD) 2116 19151 35289 61183 75647 386563 PENG_CAN 0.0198 0.4916 0.8312 0.7077 0.9318 1.0000

La durée moyenne pour un trajet en bus (Time.Car) est de 2025 minutes pour une valeur médiane de 1840. Le bus est pris comme le moyen alternatif à l’avion. Le prix moyen d’un trajet (Fare.2006) est de 496 dollars pour une valeur médiane de 478. La proximité entre la moyenne de la médiane pour le prix du trajet, est un indicateur de la centralité de la distribution de cette variable.

S’agissant des variables macroéconomiques, on note que la moyenne des PIB provinciaux est de 61 300 millions de dollars et la médiane est de 35 600 millions, soit deux fois moins que la moyenne. L’effectif de la population active moyenne d’origine s’élève à 1,2 million contre 24 300 pour la popu-lation inactive. Il en est de même de celui de la popupopu-lation active moyenne de destination. Il ressort de cette description une grande hétérogénéité dans les données.

Le tableau2.2représente la matrice de corrélation entre les variables. Il donne un premier aperçu des interactions existant dans le panel. Ainsi, on remarque que le logarithme de variables comme l’effectif de la population et le niveau de revenus (PIB) est positivement corrélé avec le flux de passagers (en log également). À l’opposé les variables telles que le prix, la distance du trajet et la durée du trajet par un moyen de transport alternatif à l’avion sont négativement corrélées à l’effectif des flux de passagers. Enfin, la variable de langue demeure très peu corrélée aux autres variables du modèle, exception faite de la variable d’intérêt de l’étude. De façon générale, les variables explicatives sont très peu corrélées entre elles, mais fortement corrélées avec l’effectif ou flux de passagers. Ainsi, on peut a priori exclure un problème de multicolinéarité dans la régression linéaire.

(27)

TABLE2.2: Matrice des corrélations

lPax.OD ldistance ltimeCar lfare lPopO lPopD lPDIO lPDID lGDPO lGDPD PENG_CAN lPax.OD 1 -0.303 -0.041 -0.535 0.440 0.456 0.263 0.249 0.472 0.483 0.297 ldistance -0.303 1 0.003 0.587 -0.065 -0.181 0.007 0.000 -0.054 -0.160 0.035 ltimeCar -0.041 0.003 1 0.015 -0.035 0.045 -0.038 0.040 -0.047 0.048 -0.028 lfare -0.535 0.587 0.015 1 -0.156 -0.193 0.048 0.057 -0.146 -0.177 -0.154 lPopO 0.440 -0.065 -0.035 -0.156 1 -0.047 0.226 0.032 0.972 -0.044 -0.109 lPopD 0.456 -0.181 0.045 -0.193 -0.047 1 0.038 0.213 -0.040 0.972 -0.099 lPDIO 0.263 0.007 -0.038 0.048 0.226 0.038 1 0.500 0.391 0.099 0.131 lPDID 0.249 0.000 0.040 0.057 0.032 0.213 0.500 1 0.092 0.378 0.134 lGDPO 0.472 -0.054 -0.047 -0.146 0.972 -0.040 0.391 0.092 1 -0.028 -0.067 lGDPD 0.483 -0.160 0.048 -0.177 -0.044 0.972 0.099 0.378 -0.028 1 -0.057 PENG_CAN 0.297 0.035 -0.028 -0.154 -0.109 -0.099 0.131 0.134 -0.067 -0.057 1

(28)
(29)

Chapitre 3

Résultats

Ce chapitre présente les résultats empiriques obtenus. Son objectif est d’explorer si les effets spa-tiaux inclus dans les modèles de régression du chapitre méthodologique se révèlent statistiquement importants lorsqu’ils sont appliqués à des données OD de trafic aérien de passagers au Canada.

3.1

Modèles de gravité

Ce modèle gravitaire postulé par Transports Canada a la forme suivante :

lPax.OD = l f are + Direct.10 + PENGCAN+ lGDPD + lPDIO + lPopO + ldistance +U. (3.1)

Le tableau 3.1 récapitule les résultats d’estimation de modèles classiques de gravité avec données de panel : les modèles empilé (colonne 1), à effets individuels fixes (colonne 2) et enfin à effets individuels aléatoires (colonne 3).

On remarque que, indépendamment de la spécification estimée, la plupart des coefficients sont hau-tement significatifs au seuil de 5% , sauf celui de la variable explicative ldistance1. Par conséquent, aucun modèle gravitaire ne permet de valider l’existence "d’effets spatiaux" dans ce contexte. En ef-fet, la distance entre aéroports ne semble pas avoir d’impact très significatif sur les flux de passagers lorsque l’on contrôle pour les caractéristiques spécifiques aux origines et aux destinations ainsi que pour les autres variables explicatives retenues. Les différences importantes dans les coefficients esti-més entre modèles indiquent qu’il conviendrait d’identifier le modèle le plus adéquat sur la base d’un critère statistique. Les tests de spécification effectués pour départager les modèles concurrents (consi-gnés dans le tableau 3.2 ) conduisent à privilégier le modèle à effets fixes individuels. Ils montrent que : les tests de restriction de Fisher et du maximum de vraisemblance rejettent tous deux l’absence d’effets fixes individuels et le test de Hausman n’accepte pas l’égalité des coefficients des modèles à effets individuels fixes et aléatoires, ce qui conduit à privilégier le modèle à effets fixes.

(30)

TABLE3.1: Estimation des modèles de gravité

Modèle empilé (1) Effets fixes individuels (2) Effets aléatoires individuels (3)

(Intercept) −12.86∗∗∗ −3.25∗∗∗ (1.74) (0.79) lfare −1.25∗∗∗ −0.36∗∗∗ −0.47∗∗∗ (0.12) (0.05) (0.05) Direct..10 0.83∗∗∗ 0.13∗∗ 0.23∗∗∗ (0.14) (0.05) (0.05) PENG_CAN 1.75∗∗∗ 0.53 1.53∗∗∗ (0.19) (0.62) (0.24) lGDPD 0.73∗∗∗ 0.07∗ 0.21∗∗∗ (0.05) (0.03) (0.03) lPDIO 1.11∗∗∗ 1.03∗∗∗ 0.90∗∗∗ (0.19) (0.07) (0.07) lPopO 0.71∗∗∗ 0.11∗∗∗ 0.23∗∗∗ (0.06) (0.02) (0.03) ldistance 0.00 0.00 −0.02∗ (0.05) (0.01) (0.01) ∗∗∗p< 0.001,∗∗p< 0.01,p< 0.05,·p< 0.1

TABLE3.2: Tests de sélection des modèles de gravité

Test statistique df p-valeur

Fisher 125.45 (381, 6487) 2.2e-16

LM 193.62 - 2.2e-16

Hausman 1649.4 7 2.2e-16

D’autre part, le modèle de gravité (1.2) étant une formulation log-linéaire, les paramètres estimés s’interprètent directement en termes d’élasticités (sauf celui de la variable de langue, qui est une semi-élasticité). Les signes des coefficients du modèle retenu (3) sont ceux prédits par la théorie microéconomique de la demande. En guise d’illustration, les élasticités-prix du trafic domestique de passagers sont négatives et la hausse du prix moyen (de 1% ) du trajet - toutes choses égales par ailleurs - exercerait une influence significative à la baisse sur le flux de passagers domestiques. L’ampleur de cet effet est de -0,36%, ce qui est relativement faible. L’existence de plus de 10 vols directs par jour accroitrait en moyenne le trafic de 13%. De même, le niveau de revenu (PIB global) de la région de destination a un impact significatif et positif (+0.07%) sur les flux de passagers. Le revenu disponible de la région d’origine exerce également un effet positif, avec une élasticité proche de l’unité. Finalement, la taille de la population de la province d’origine influence positivement les flux aériens domestiques entre régions.

(31)

3.2

Modèles spatiaux

Dans cette section, nous estimons le trafic aérien domestique de passagers en utilisant des modèles ex-plicitement conçus pour prendre en compte les interactions spatiales présentes dans les données dans le cadre d’un panel. Rappelons que la matrice des pondérations spatiales est construite à partir des distances physiques entre les aéroports d’origine et de destination. Les matrices de la variable dépen-dante et de l’erreur sont identiques et elle ont été normalisées par rapport aux lignes. Par conséquent, lorsque le paramètre λ sera estimé et qu’il sera statistiquement différent de zéro, il capturera l’effet positif/négatif du volume du flux de passagers d’une origine à une destination sur les destinations voisines. Nous estimerons ces modèles d’abord par maximum de vraisemblance (ML) et ensuite par la des méthodes de moments (GMM et MM).

Le tableau3.3récapitule les résultats des estimations par les procédures ML. La colonne (1) présente les résultats de l’estimation du modèle empilé (c.à.d. sans effets individuels ou temporels fixes ou aléatoires et nommé MEsEA) avec des interactions spatiales sur la variable endogène et avec ρ = 0 (pas d’effets spatiaux dans les erreurs). La colonne (2) montre la version empilée avec autocorrélation spatiale de l’erreur du modèle (1), appelée MEaAE. Les colonnes (3) et (4) contiennent les estimations de la version avec effets individuels fixes des deux modèles précédents (nommés MIFsSE, MIFaEA) et les colonnes (5) et (6) contiennent les estimations de la version avec effets individuels alèatoires (MIAsSE, MIAaEA). À noter que les modèles avec erreurs spatiales sont ceux proposés parKapoor et al.(2007), voir l’équation (1.14) du chapitre 1.

On remarque que, pour une même famille de modèles (empilés, à effets fixes, à effets aléatoires), les effets partiels se révèlent assez similaires, indépendamment des hypothèses sur la perturbation. Les résultats varient beaucoup plus lorsque l’on compare les modèles empilés (1) et (2) aux modèles avec effets individuels (3 à 6). En effet, les paramètres d’interaction spatiale λ ont des influences contraires dans les modèles empilés (exception faite du modèle 4), selon que l’on inclut ou non un effet individuel (aléatoire ou fixe). Cette interaction est négative pour les modèles empilés et le modèle (4) et positive pour les autres modèles. Rappelons que nous avons normalisé les lignes de la matrice des poids spatiaux, par conséquent les effets sur le voisinage s’interprète vis-à-vis de la destination. L’interprétation de λ < 0 (respectivement λ > 0) est que la hausse du trafic entre une origine et une destination pénalise (favorise) les flux de trafics de passagers des aéroports voisins de la destination. Il semblerait donc qu’un trafic intense de passagers de Toronto vers Montréal pénalise/favorise le trafic de Toronto vers Québec, selon que l’on considère un modèle sans ou avec effets individuels (excepté pour le modèle 4). Un paramètre λ > 0 s’interprèterait comme un effet d’entrainement ou de complémentarité entre aéroports de destination et l’inverse dans le cas contraire.

Les autres paramètres estimés pour les variables explicatives sont des effets partiels directs, qui ne prennent pas en compte les effets qui se transmettent par le voisinage. Une décomposition en effets directs, indirects et totaux dépasse le cadre de ce mémoire, nous nous contentons donc d’interpréter les effets partiels directs. On remarque que ces derniers ont tous les signes attendus, et ce que l’on inclut

(32)

TABLE3.3: Estimation des modèles spatiaux empilés et à effets individuels par maximum de vraisem-blance

MEsEA (1) MEaEA (2) MIFsEA (3) MIFaEA(4) MIASE (5) MIAaEA (6)

(Intercept) −12.90∗∗∗ −16.05∗∗∗ 0.22 −0.23 (0.67) (0.93) − − (0.41) (0.30) lambda −0.54∗∗∗ −0.62∗∗∗ 0.57∗∗∗ −1.21∗∗∗ 0.51∗∗∗ 0.85∗∗∗ (0.03) (0.03) (0.04) (0.08) (0.03) (0.02) lfare −0.95∗∗∗ −0.89∗∗∗ −0.42∗∗∗ −0.31∗∗∗ −0.46∗∗∗ −0.32∗∗∗ (0.03) (0.03) (0.03) (0.03) (0.03) (0.02) Direct.10 0.84∗∗∗ 0.81∗∗∗ 0.12∗∗∗ 0.08∗∗ 0.16∗∗∗ 0.16∗∗∗ (0.04) (0.04) (0.03) (0.03) (0.03) (0.03) PENG_CAN 1.80∗∗∗ 1.80∗∗∗ 0.72∗∗ 0.60∗ 1.25∗∗∗ 1.26∗∗∗ (0.04) (0.04) (0.27) (0.26) (0.20) (0.20) lGDPD 0.72∗∗∗ 0.74∗∗∗ 0.08∗∗∗ 0.10∗∗∗ 0.12∗∗∗ 0.07∗∗∗ (0.01) (0.01) (0.02) (0.02) (0.02) (0.02) lPDIO 1.40∗∗∗ 1.73∗∗∗ 0.43∗∗∗ 0.29∗∗∗ 0.45∗∗∗ 0.16∗∗∗ (0.07) (0.09) (0.05) (0.07) (0.04) (0.03) lPopO 0.71∗∗∗ 0.72∗∗∗ 0.02 0.01 0.08∗∗∗ 0.03 (0.01) (0.01) (0.02) (0.02) (0.02) (0.02) ρ − 0.99 − 0.95∗∗∗ − 0.99 − n.d. − (0.01) − n.d. ∗∗∗p< 0.001,∗∗p< 0.01,p< 0.05,·p< 0.1. n.d. = non disponible

ou non des effets spatiaux sur l’erreur des modèles. Les interprétations en termes d’élastictités sont si-milaires à celles effectuées dans le modèle de gravité et nous ne répétons pas ici l’exercice. Nous nous intéressons maintenant aux paramètres ρ estimés dans le tableau3.3. La distribution asymptotique n’étant pas connue, nous n’avons pas cherché à obtenir la variance par simulation car ceci dépasse le cadre de ce mémoire. Des tests sur ce paramètre seront appliqués au chapitre 3.3, dans le cadre de modèles sans interactions spatiales dans la variable dépendante. Nous nous contentons d’interpréter les valeurs obtenues pour ρ comme statistiquement différentes de 0. On remarque donc la présence de corrélations spatiales dans l’erreur avec des valeurs proches de l’unité.

Nous avons ensuite effectué un test pour détecter la présence des effets individuels en vue de nous assurer du bien fondé de les inclure. Pour cela, l’hypothèse H0est : µ1= · · · = µN= α, où α désigne

la constante du modèle empilé. Ce test est effectué au moyen d’un ratio de vraisemblance2Le résultat de ce test conduit au rejet du modèle empilé au profit des modèles à effets individuels. Par conséquent, le lecteur est invité à privilégier les résultats des modèles individuels.

La suite de nos investigations consistera à départager entre les spécifications aléatoires ou fixes des

2. La statistique de ce test est LR = 2(ln(modu) − ln(modr)) est basée sur la différence des log-vraisemblances entre les

modèles non restreint et restreint. Elle est asymptotiquement distribuée selon un χ2à N − 1 degrés de liberté.

(33)

TABLE3.4: Estimation des modèles spatiaux à effets individuels par la méthode des moments

Modèle GMMA (1) Modèle MMA (2) Modèle GMMF (3) Modèle MMF (4)

(Intercept) −1.43∗∗∗ −1.90∗∗∗ (0.36) (0.41) lambda 0.60∗∗∗ 0.39∗∗∗ 0.64∗∗∗ 0.66∗∗∗ (0.03) (0.04) (0.04) (0.04) lfare −0.49∗∗∗ −0.52∗∗∗ −0.43∗∗∗ −0.43∗∗∗ (0.03) (0.03) (0.03) (0.03) Direct..10 0.23∗∗∗ 0.23∗∗∗ 0.12∗∗∗ 0.12∗∗∗ (0.03) (0.03) (0.03) (0.03) PENG_CAN 1.59∗∗∗ 1.57∗∗∗ 0.73∗∗ 0.73∗∗ (0.14) (0.14) (0.27) (0.27) lGDPD 0.18∗∗∗ 0.21∗∗∗ 0.08∗∗∗ 0.08∗∗∗ (0.02) (0.02) (0.02) (0.02) lPDIO 0.31∗∗∗ 0.49∗∗∗ 0.36∗∗∗ 0.36∗∗∗ (0.05) (0.05) (0.06) (0.06) lPopO 0.16∗∗∗ 0.19∗∗∗ 0.01 0.01 (0.02) (0.02) (0.02) (0.02) rho −0.31 −0.01 −0.01 −0.02 n.d. n.d. n.d. n.d. ∗∗∗p< 0.001,∗∗p< 0.01,p< 0.05,·p< 0.1 n.d. = non disponible

effets individuels. Avant de procéder à ces tests, nous proposons également des estimations des mo-dèles à effets individuels effectuées par la méthode des moments. En effet, la méthode du maximum de vraisemblance requiert la normalité des innovations alors que la méthode des moments généralisés ne nécessite aucune spécification a priori du comportement de la perturbation. Les résultats des esti-mations des modèles à effets individuels par l’approche des moments (moments généralisés - GMM-et moments juste identifiés - MM-) sont consignés dans le tableau3.4.

Les colonnes (1) et (2) (respectivement les colonnes (3) et (4)) présentent les résultats de l’estima-tion du modèle à effets aléatoires (respectivement du modèle à effets individuels fixes) d’interacl’estima-tion spatiale avec autocorrélation de la perturbation avec deux méthodes des moments : des moments su-ridentifiés (GMM) et justes identifiés (MM). Comme précédemment, les résultats des estimations des paramètres ne varient pas fondamentalement, hormis ceux des paramètres d’interactions spatiales (λ et ρ). Dans toutes les spécifications estimées avec cette approche, les effets d’interactions liés à la variable dépendante sont significativement différents de 0 et de signe positif, ce qui semble indiquer qu’un flux important de passagers entre une origine et une destination favorise les flux vers des desti-nations voisines.

Jusqu’à maintenant, nous nous sommes contentés de décrire les résultats d’estimation obtenus pour de modèles concurrents et selon différentes approches (ML, GMM, MM). En vue d’examiner la validité

(34)

de ces modèles, nous procéderons à des tests de significativité des effets d’interactions spatiales d’une part, et à des tests de spécification (de Hausman) d’autre part pour sélectionner le modèle le plus adé-quat (effets fixes vs effets aléatoires). Il s’agit d’abord d’appliquer les tests marginaux et conditionnels du maximum de vraisemblance, puis nous présentons le test joint prenant à la fois en compte les deux types d’interactions spatiales, comme décrit dans la section méthodologique.

3.3

Tests de spécification

Des tests LM sont effectués ici pour l’étude de la pertinence statistique d’inclure des effets d’inter-actions spatiales et des effets individuels (ρ et σµ2). Pendant que les tests marginaux conduisent à ne pas rejeter la nullité des interactions spatiales de l’erreur et les effets individuels aléatoires (ρ et µ ), le test conditionnel de l’hypothèse nulle que ρ = 0 | σµ2≥ 0 est largement rejeté. Sa contrepartie σµ2 = 0 | ρ 6= 0 ou ρ = 0 n’a pas pu être calculée par manque de convergence de la procédure de test. En effet, les statistiques des tests marginaux SLM1 et SLM2 sont respectivement 0.0284 (pour

une p-valeur de 0.9773) et 0.0017 ( avec une p-valeur de 0.9986). Quand au test conditionnel dont la procédure converge (test sur λ ), la statistique de test est de 74.19 et la p-valeur est de 0,000. De plus, pour appuyer cette conclusion et completer l’analyse sur les effets individuels aléatoires, nous avons effectué le test joint (LM joint) pour évaluer la nullité simultanée de ρ et σµ2contre l’alternative qu’au moins l’un de ces composants est différent de 0. Le résultat de ce test est le rejet de l’hypothèse nulle (statistique de test 37603 et une p-valeur de 0.000) et donc le rejet de l’absence d’effets individuels et d’interactions spatiales liées à l’erreur.

Finalement, nous avons cherché à préciser la nature des effets individuels (aléatoires ou fixes), le test de spécification de Hausman (en panel spatial) est effectué pour la sélection du modèle le plus en adéquation avec les données. Le résultat de ce test permet de rejeter l’hypothèse nulle d’égalité des coefficients des modèles à effets fixes et à effets aléatoires, comme l’indique la statistique du test 538.85 avec une p-valeur de 0,000. Par conséquent, il conviendrait de retenir les résultats obtenus avec les modèles spatiaux avec effets fixes, avec les deux formes d’interactions spatiales (sur la variable dépendante et sur les erreurs du modèle). Il faut donc privilégier les modèles à effets fixes du tableau

3.4, qui sont estimés avec la procédure d’estimation la plus robuste.

(35)

Conclusion

Ce mémoire examine à la faveur des récents développements de l’économétrie spatiale, l’intérêt de prendre en compte les effets d’interactions spatiales dans le modèle gravitaire PODM qu’utilise Transports Canada pour réaliser ses prévisions sur les volumes de passagers sur le marché intérieur canadien. Il constitue une première tentative d’appliquer un certain nombre d’estimateurs récemment proposés pour mesurer l’impact des interactions spatiales sur des flux origine-destination. Nous nous sommes concentrés sur des modèles statiques en panel, qui incluent des effets individuels. Nous avons estimé une équation adhoc pour le marché intérieur de trafic de passagers au Canada. Nous montrons que les effets spatiaux sont effectivement présents dans les données et que les flux de passagers entre une origine et une destination ont un impact (positif) sur les aéroports voisins de la destination. Nous mettons également en lumière le fait que la structure spatiale des erreurs a également une influence sur les flux de passagers. Par ailleurs, les effets de caractéristiques spécifiques à l’origine et la destination restent significatifs et les relations obtenues ont les signes attendus. Finalement, le test de Hausman spatial nous conduit à privilégier le modèle à effets individuels déterministes pour capturer l’hétéro-généité entre les différentes origines et destinations.

Ces résultats sont donc prometteurs pour les méthodes spatiales testées. Il conviendrait d’étendre l’analyse avec une équation plus complète, et ceci pour différents segments de marché. Rappelons qu’il existe également des modèles dynamiques spatiaux qui peuvent se révéler plus performants que le modèle gravitaire traditionnel pour réaliser des prévisions du trafic de passagers. Ceci devrait être d’un intérêt particulier pour les organismes de prévision du trafic de passagers aériens.

(36)
(37)

Bibliographie

Anderson, T. W. and Hsiao, C. (1980). Estimation of Dynamic Models with Error Components. Working Papers 336, California Institute of Technology, Division of the Humanities and Social Sciences.

Anderson, T. W. and Hsiao, C. (1982). Formulation and estimation of dynamic models using panel data. Journal of Econometrics, 18(1) :47–82.

Anselin, L. (1988). Spatial Econometrics : Methods and Models. Kluwer Acdemic Publishers. Anselin, L., Varga, A., and Acs, Z. (1997). Local Geographic Spillovers between University Research

and High Technology Innovations. Journal of Urban Economics, 42(3) :422–448.

Arellano, M. and Bond, S. (1991). Some Tests of Specification for Panel Data : Monte Carlo Evidence and an Application to Employment Equations. Review of Economic Studies, 58(2) :277–97. Baldwin, R. and Taglioni, D. (2006). Gravity for Dummies and Dummies for Gravity Equations.

CEPR Discussion Papers 5850, C.E.P.R. Discussion Papers.

Baltagi, B. H. (2015). The Oxford Handbook of Panel Data. Number 9780199940042 in OUP Cata-logue. Oxford University Press.

Baltagi, B. H., Fingleton, B., and Pirotte, A. (2014). Estimating and Forecasting with a Dynamic Spatial Panel Data Model. Oxford Bulletin of Economics and Statistics, 76(1) :112–138.

Baltagi, B. H. and Liu, L. (2008). Testing for Random Effects and Spatial Lag Dependence in Panel Data Models. Center for Policy Research Working Papers 102, Center for Policy Research, Maxwell School, Syracuse University.

Baltagi, B. H., Song, S. H., and Koh, W. (2003). Testing panel data regression models with spatial error correlation. Journal of Econometrics, 117(1) :123–150.

Breusch, T. S. (1978). Testing for Autocorrelation in Dynamic Linear Models. Australian Economic Papers, 17(31) :334–55.

Cliff, A. D. and Ord, J. K. (1975). The comparison of means when samples consist of spatially autocorrelated observations. Environment and Planning A, 7(6) :725–734.

(38)

Drukker, D. (2008). Analyzing spatial autoregressive models in Stata. Summer North American Stata Users’ Group Meetings 2008 20, Stata Users Group.

Dubin, M. R. and Bradford, J. C. (2004). Modeling Spatial and Temporal House Price Patterns : A Comparison of Four Models. The Journal of Real Estate Finance and Economics, 29(2) :167–191. Dubin, R. (2003). Robustness of Spatial Autocorrelation Specifications : Some Monte Carlo Evidence.

Journal of Regional Science, 43(2) :221–248.

Elhorst, J. (2009). Spatial Panel Data Models. Handbook of Applied Spatial Analysis. MM Fisher, A Gettis, Springer-Verlag.

Elhorst, J. (2012). Dynamic spatial panels : models, methods, and inferences. Journal of Geographical Systems, 14(1) :5–28.

Elhorst, J. P. (2001). Panel data models extended to spatial error autocorrelation or a spatially lagged dependent variable. Research Report 01C05, University of Groningen, Research Institute SOM (Systems, Organisations and Management).

Elhorst, J. P. (2003). Unconditional maximum likelihood estimation of dynamic models for spatial panels. Research Report 03C27, University of Groningen, Research Institute SOM (Systems, Or-ganisations and Management).

Engebretsen, Ø. (2005). Location and daily mobility. ERSA conference papers ersa05p577, European Regional Science Association.

Feenstra, R. C. (2002). Border Effects and the Gravity Equation : Consistent Methods for Estimation. Scottish Journal of Political Economy, 49(5) :491–506.

Fingleton, B. and Gallo, J. L. (2008). Estimating spatial models with endogenous variables, a spatial lag and spatially dependent disturbances : Finite sample properties. Papers in Regional Science, 87(3) :319–339.

Fischer, M. M. and Griffith, D. A. (2008). Modeling Spatial Autocorrelation In Spatial Interaction Data : An Application To Patent Citation Data In The European Union. Journal of Regional Science, 48(5) :969–989.

Griffith, D. A. (2007). Spatial Structure and Spatial Interaction : 25 Years Later. The Review of Regional Studies, 37(1) :28–38.

Griffith, D. A. and Jones, K. G. (1980). Explorations into the relationship between spatial structure and spatial interaction. Environment and Planning A, 12(2) :187–201.

Grosche, T., Rothlauf, F., and Heinzl, A. (2007). Gravity models for airline passenger volume estima-tion. Journal of Air Transport Management, 13(4) :175–183.

(39)

Kapoor, M., Kelejian, H. H., and Prucha, I. R. (2007). Panel data models with spatially correlated error components. Journal of Econometrics, 140(1) :97–130.

Kelejian, H. H. and Prucha, I. R. (1999). A Generalized Moments Estimator for the Autoregressive Parameter in a Spatial Model. International Economic Review, 40(2) :509–33.

LeSage, J. and Fischer, M. M. (2010). Spatial Econometrics. In Web Book of Regional Science, Book Chapters, chapter Spatial Econometric Methods for Modeling Origin-Destination Flows. Regional Research Institute, West Virginia University.

LeSage, J. and Llano-Verduras, C. (2014). Forecasting spatially dependent origin and destination commodity flows. Empirical Economics, 47(4) :1543–1562.

LeSage, J. P. and Pace, R. K. (2008). Spatial Econometric Modeling Of Origin-Destination Flows. Journal of Regional Science, 48(5) :941–967.

Letouzé, E., Purser, M., Rodríguez, F., and Cummins, M. (2009). Revisiting the Migration-Development Nexus : A Gravity Model Approach. MPRA Paper 19227, University Library of Munich, Germany.

Linders, G. (2006). Estimation of the Gravity Equation of Bilateral Trade in the Presence of Zero Flows. ERSA conference papers ersa06p746, European Regional Science Association.

Millo, G. and Piras, G. (2012). splm : Spatial Panel Data Models in R. Journal of Statistical Software, 47(i01).

Mutl, J. and Pfaffermayr, M. (2011). The Hausman test in a Cliff and Ord panel model. Econometrics Journal, 14(1) :48–76.

Ord, K. (1975). Estimation methods for models of spatial interaction. Journal of the American Statistical Association, 70(349) :pp. 120–126.

Pagan, A. (1980). Some identification and estimation results for regression models with stochastically varying coefficients. Journal of Econometrics, 13(3) :341–363.

Pöyhönen, P. (1963). A tentative model for the volume of trade between countries. Weltwirtschaft-liches Archiv, 90 :pp. 93–100.

Santos Silva, J. and Tenreyro, S. (2005). The Log of Gravity. CEPR Discussion Papers 5311, C.E.P.R. Discussion Papers.

Tinbergen, J. (1965). Tinbergen (Jan) - Shaping the world economy. Suggestions for an international economic policy. Revue Économique, 16(5) :840–840.

Tobler, W. R. (1970). A Computer Movie Simulating Urban Growth in the Detroit Region. Economic Geography, 46 :234–240.

(40)

Transports Canada (2011). Podm report 2009-10. Technical report, Transports Canada.

Transports Canada (2012). Les transports au canada, un survol. Technical report, Transports Canada. U.S. Department of Transportation (2012). Federal highway administration, highway statistics,

sum-mary to 2011, washington (dc). Technical report, U.S. Department of Transportation.

Wang, M. and Song, H. (2010). Air travel demand studies : A review. Journal of China Tourism, 6(1) :29–49.

Références

Documents relatifs

L’idée que nous avons développée est de laisser les avions suivre leur trajectoire optimale quand la complexité du trafic est faible, et de créer à la volée un réseau de route

Près d'un siècle après sa découverte, les clefs de la maladie d' Alzheimer ne sont toujours pas connues. De son origine multifactorielle, à la complexité de son diagnostic,

Conformément aux dispositions de la décision DEA-2016-01 du 25 avril 2016, le GPSA a pour mission d’analyser au niveau national les événements mixtes dans le domaine

Les points 6 à 9 traitent de l’évolution de la desserte des territoires selon différents facteurs : stratégies des compagnies, développement de l’offre low-cost, faillites

dans les régions métropolitaines et centrales, les compagnies classiques sont bien im- plantées, les aéroports souvent saturés et coûteux à l’usage, et les aéroports secondai-

Valérie Saint Dizier de Almeida (2014), suite à l’analyse de neuf discussions à visée philosophique, distingue trois types de styles d’enseignants :

La décomposition du trafic aérien de la Belgique en fonction de la nationalité des appareils précise le rôle de la SABENA pour le trafic (12) Ce fait

Les stratégies de réplication des données dans de tels systèmes doivent alors prendre en compte le compromis entre la satisfaction de la QdS, en termes de temps de réponse, pour