• Aucun résultat trouvé

Données utilisées et problèmes posés

3. Cadre d’étude et aspects méthodologiques

3.2. Données utilisées et problèmes posés

3.2.1. L’offre plutôt que la demande

Nos analyses seront presque toujours menées au travers de l’offre et non de la demande. Ceci paraît logique dès lors que la question posée est celle de la desserte des territoires, mais de toute façon les données portant sur la demande réalisée — c’est-à-dire les passa-gers ou marchandises transportés — ne sont plus disponibles à une échelle géographique-ment fine, s’agissant d’un secteur économique devenu fortegéographique-ment concurrentiel : toute don-née de trafic trop désagrégée, tant géographiquement que selon les opérateurs, peut être utile aux concurrents1. On ne s’étonne donc pas que, comme le signalent Smith et Timber-lake (2001), l’ICAO/OACI fournit des données de demande par route aérienne uniquement pour des liaisons internationales et à condition que celles-ci soient exploitées par plus d’une compagnie.

Les pourvoyeurs nationaux de données, généralement les administrations nationales de l’aviation civile, ne sont guère plus motivés à diffuser des chiffres désagrégés. A titre d’exemple, les rapports statistiques de la Direction Générale [française] de l’Aviation Civile (DGAC) reprennent des données à l’échelle des aéroports français mais « toutes destina-tions confondues » ; lorsque les destinadestina-tions sont envisagées, c’est par pays ou grandes régions mondiales au départ de la France, la Métropole ou l’Outre-Mer, sans autre préci-sion ; et en cas de statistiques par paires d’aéroports, celles-ci sont données uniquement pour les X premières selon le trafic.

1 Il en va de même par exemple avec les données relatives aux flux téléphoniques, et l’on peut parier que J.-P. Grimmeau ne pourrait plus aujourd’hui faire la géographie des flux téléphoniques internationaux depuis les arrondissements belges (Grimmeau et al., 1987).

Autre exemple : l’Association of European Airlines (AEA) fournit gratuitement des données d’offre et de demande (passagers, ASK, taux de remplissage,…) par compagnie membre et par année depuis 1975, mais sans aucune désagrégation géographique.

Signalons enfin Eurostat, qui collecte un éventail de données auprès des pays membres concernant l’offre et la demande réalisées par pays, par aéroport, par type de compagnie, par compagnie,…1. A l’échelle des pays et des aéroports, c’est probablement la base de données la plus complète et en outre elle est gratuitement accessible via Internet. Eurostat descend également à l’échelle des routes aériennes, où elle indique théoriquement le nom-bre de vols, le volume de sièges offerts et le nomnom-bre de passagers réellement transportés. On ne sait cependant rien de la répartition entre compagnies exploitant une même route. Mais surtout, les données sont lacunaires car dépendent du bon vouloir des compagnies et/ou gestionnaires d’aéroports2. Ainsi, en 2004 ou 2005 au départ de la Belgique, aucune statistique par route n’est disponible depuis l’aéroport de Charleroi tandis que diverses rou-tes sont manquanrou-tes depuis Bruxelles-National3. Depuis la France, on dispose du nombre de passagers transportés mais pas du nombre de sièges offerts ; par contre, même des liai-sons exploitées en situation de monopole par des low-cost (par exemple depuis Beauvais) sont renseignées.

3.2.2. Les bases de données OAG

Nous utiliserons donc les données relatives à l’offre régulière telles que contenues dans les bases de données OAG (Official Airline Guide). Contrairement à ce que l’adjectif « Official » pourrait faire croire, OAG est une firme privée dont le core business est la récolte, auprès des compagnies, de leurs horaires détaillés, ainsi que diverses informations connexes (type d’avion, nombre de sièges, partage de code*,…) sur les vols prévus. OAG réunit l’information qu’elle fusionne en bases de données ensuite revendues sous forme de CD ou de produits dérivés (analyses de marché, solutions pour les hommes d’affaires voyageant en avion,…).

Les bases de données sont mises à jour tous les mois et contiennent à chaque fois les pré-visions d’offre pour les 12 mois à venir.

Pour l’édition de janvier 2005 et en ne prenant en compte que les vols réguliers passagers, 770 compagnies ont alimenté OAG avec des informations concernant 99 066 numéros de vols représentant une fréquence cumulée de 20,7 millions de vols (en excluant les vols non-opérés du fait de partages de codes). La base de données correspondante comprend, en comptant cette fois les vols non-opérés, 817 733 lignes.

Des bases de données désagrégées et exhaustives :

Ces bases de données contiennent énormément d’informations totalement désagrégées à l’échelle des vols et de leurs segments éventuels (pour les vols avec escales) (cf. annexe 5). Les plus utiles sont les suivantes :

– aéroport, ville et pays de départ – aéroport, ville et pays de destination – routing complet (départ, escales, arrivée) – fréquence – capacité (sièges) – transporteur et nationalité – période de validité 1 Voir http://europa.eu.int/estatref/info/sdds/fr/aviation/aviation_base.htm.

2 Malgré les obligations communautaires en la matière depuis 2004, suite à un règlement de 2003. 3 Sans que l’on puisse y déceler une quelconque logique. Ce ne sont pas nécessairement les routes

– jours de vol

– partage(s) de code de vol + code(s) de vol du ou des partenaires

– vol réellement opéré ou opéré par un partenaire dans le cadre d’un partage de code – distance de vol (selon l’orthodromie).

Les données OAG correspondent à presque toutes les compagnies opérant des vols régu-liers. Des petites compagnies spécialisées dans des marchés très spécifiques et très limités spatialement sont la plupart du temps intégrées.

Inutile de dire qu’avec de telles informations, connues avec une exhaustivité étonnante, il « suffit » de se poser les bonnes questions. Il y a cependant deux limites à cette facilité apparente : de lourds traitements préalables s’imposent et les requêtes prennent un temps énorme compte tenu de la taille des fichiers.

Sets de données entre nos mains :

Nous disposons des bases de données suivantes :

pour 1991 : le seul mois de janvier ;

pour les années de 1995 puis 1999 à 2005, chaque édition du mois de janvier avec l’offre prévue de janvier à décembre.

Disposant de tous ces CD, libre à nous d’en extraire les données nécessaires. Nous avons à chaque fois procédé à une extraction complète de l’offre régulière passagers1, à l’exclusion des charters réguliers (qui ne représentent qu’une offre infinitésimale par rapport tant aux vols réguliers qu’aux vols charters* non-réguliers) puis à un transfert des données vers le logiciel Access pour traitements ultérieurs.

Traitements préalables :

Les bases de données ne sont pas immédiatement utilisables. Divers traitements s’imposent ; nous les résumons ici brièvement.

Codage des informations :

– établissement d’une base de données des pays avec leur code IATA (bases de données OAG) et FIPS (cartographie dans Arcview) + codes supra-régionaux (découpage du monde en continents, régions, ensembles économiques,…) ;

– gestion de l’évolution des pays et donc de leurs codes (scissions, regroupements, chan-gements de nom et code,…)2 ;

– établissement d’une base de données des aéroports avec code pays et gestion de l’évolution éventuelle (par exemple Oslo où un aéroport en remplace un autre) ;

– attribution d’un code unique à l’aéroport de Bâle-Mulhouse (EAP au lieu de BSL ou MLH selon les compagnies) + modification de toutes les bases de données en conséquence ; – recherche des coordonnées géographiques manquantes pour divers aéroports (en vue

de la cartographie) ;

– établissement d’un code aéroport « bis » pour les aéroports communs d’une même ag-glomération (par exemple Charles de Gaulle + Orly + Le Bourget pour Paris) ;

– établissement d’un code aéroport « ter » pour les aéroports communs d’une même ag-glomération tout en incluant les aéroports « low-cost » éloignés (par exemple prise en compte de Beauvais pour Paris) ;

– établissement d’une base de données des compagnies avec pays d’origine, tout en gé-rant l’attribution successive d’un même code à diverses compagnies au gré des dispari-tions et créadispari-tions de compagnies3 ;

1 Les bases de données contiennent également les vols cargo.

2 En particulier du fait de la décomposition de l’ex-URSS, de la Yougoslavie et de la Tchécoslovaquie. 3 Par exemple le code RK attribué à Air Afrique jusqu’à sa faillite, puis à Royal Khmer Airlines.

– attribution de la typologie économique des régions européennes de Vandermotten et Marissal (2000) au découpage actuel de l’Europe en NUTS, ceci afin de pouvoir croiser la typologie avec les aéroports ; cela implique entre autres de corriger les coordonnées des aéroports mal localisés (par exemple ceux tombant dans la mer donc hors de « leur » région NUTS).

Informations complémentaires :

Pour chaque année, création de nombreux champs complémentaires afin de faciliter les uti-lisations ultérieures :

– question des vols avec escales : cf. infra ;

– calcul des valeurs quantitatives (fréquences, sièges,…) pour le seul mois de janvier ; – champ annonçant les libertés de l’air de chaque vol ou segment de vol ;

– champ annonçant un vol dans l’espace européen libéralisé ; – champ annonçant un vol international ;

– champ annonçant un vol exploité par une compagnie enregistrée dans le pays de départ ou d’arrivée ;

– champs « techniques » requis pour divers traitements dont l’identification des libertés de l’air.

Sélection des vols utiles :

Pour chaque année, création d’un champ indiquant les vols ou segments de vols à ne pas prendre en compte :

– vols opérés par une autre compagnie (partage de code) ; – restrictions s’imposant aux voyageurs ;

– changements d’avion (A-B-C : garder A-B et B-C, rejeter A-C) ; – vols en boucle (A–B–A : garder A-B et B-A, rejeter A-A) ; – problèmes des vols avec escales : cf. infra.

Traitements divers :

– nettoyage du format des champs afin de gagner de l’espace-disque ; – création d’index pour accélérer les requêtes ;

– pour 1991 : en l’absence du champ du nombre de sièges par vol, nous avons estimé celui-ci sur base d’un croisement compagnies / types d’avion / nombre de sièges en 19951 ; lorsque l’information n’était pas disponible en 1995, c’est la capacité standard de l’avion qui a été affectée.

Au total, il faut compter plusieurs jours de travail par base de données annuelle, sans parler des trois mois passés lors de la première utilisation pour comprendre la base de données et élaborer les solutions à tous les problèmes posés.

3.2.3. Limitations des données OAG

Il faut être conscient que les bases de données OAG sont réalisées a priori : elles ne décri-vent pas l’offre réalisée mais l’offre planifiée. On peut imaginer que certains vols seront fi-nalement abandonnés, d’autres ajoutés, que des compagnies feront faillite, que l’avion utili-sé et donc sa capacité seront modifiés,… Cependant, des comparaisons entre le contenu des bases de données et les statistiques par compagnie des vols effectivement opérés (en parti-culier celles issues des sets de données diffusés par l’AEA), de même que des comparaisons

1 Dans la mesure où la capacité des avions est variable selon l’aménagement intérieur décidé par chaque compagnie.

avec les statistiques aéroportuaires, nous permettent d’affirmer que les écarts entre les données d’OAG et la situation réelle diffèrent très peu.

En outre, les compagnies connaissent précisément leur offre pour les mois à venir, mais plus l’échéance est lointaine et plus la planification est sujette à caution, voire n’est pas en-core réalisée. Pour cette raison, l’idéal est de l’utiliser pour une période la plus rapprochée possible de la date d’édition. Dans la mesure où nous disposons des éditions annuelles de janvier et, pour 1991, du seul mois de janvier, la plupart de nos recherches concernent ce mois de l’année. Ceci a aussi pour avantage de se situer juste avant la baisse d’activité aé-rienne due à la première guerre du Golfe.

Par ailleurs, se pose le problème des vols avec escales (Figure 8). Soit un vol A-B-C. Celui-ci sera décrit trois fois : B, B-C et C, puisque ces trois relations existent. En cas de vol A-B-C-D, on trouvera A-B, B-C, C-D, A-C, B-D et A-D. Si cela ne pose pas de problèmes pour certains calculs (nombre de destinations par exemple), cela rend impossible le calcul des sommes au niveau des fréquences et des capacités offertes puisqu’il y aurait immanqua-blement des comptages multiples.

Figure 8 : le problème de la description des vols avec escales

Face à ce problème, nous avons d’abord dû constater que les auteurs ayant publié des re-cherches sur base des mêmes sets de données n’ont pas résolu le problème1 : soit ils utili-sent les vols complets, soit leurs segments.

Nous avons alors tenté, avec l’aide de P. Marissal, réputé notamment pour ses talents de programmeur et que nous remercions ici, d’appliquer une pondération à la capacité des segments et du vol complet, selon deux logiques :

– équirépartition, impliquant, pour un vol A-B-C, 50 % de la capacité pour les segments A-B et B-C et 50 % pour le vol complet A-C ;

– répartition plus subtile tenant compte de l’existence ou non de vols sans escales opérés par d’autres compagnies2.

Aucune de ces deux solutions n’a pu être mise en œuvre de manière satisfaisante pour des raisons techniques que nous ne détaillerons pas ici mais que nous tenons à la disposition du lecteur intéressé.

1 Le passant d’ailleurs sous silence.

2 Dans ce cas, on peut en effet penser que la liaison A-C (d’un vol A-B-C) a son intérêt, et « mérite » plus que 50 % de la capacité. Dans le cas contraire, et en l’absence de contraintes liées à l’autonomie des avions, on peut supposer que la liaison A-C intéresse peu de monde et que le vol A-B-C est plutôt com-posé de deux vols mis bout à bout qui pèsent pour plus de 50% de la capacité par rapport à A-C.

Nous avons imaginé une solution alternative qui nous permettait de répondre aux interroga-tions des bases de données requises. Des champs « use0 », « use0max », « use1 » et « use3 » de type booléen « vrai/faux » ont été créés pour chaque ligne des bases de don-nées, selon la logique de résultat présentée ci-dessous (Figure 9).

Figure 9 : la solution au problème des vols avec escales