• Aucun résultat trouvé

L’approche statistique : la cartographie des probabilités de fréquence des valeurs de flu

des matrices de flux : la matrice ordonnée, le graphe et la carte « Si ton œil était plus aigu tu verrais tout en mouvement : comme le papier

Encart 2-2. Sur la prise en compte du temps en cartographie

3.2 Les approches statistiques et matricielles du traitement des données de flux (Fij) Si la cartographie de flux intéresse plusieurs approches qui peuvent être redondantes ou contradictoires

3.2.1 L’approche statistique : la cartographie des probabilités de fréquence des valeurs de flu

Le raisonnement fondé sur une approche statistique probabiliste a pour objectif de comparer entre elles soit des sous-populations (i,j) de tailles variables, c’est-à-dire différentes matrices portant sur la même

__________________________________________________________________________________________

zone, soit les données d’une même matrice disponibles à plusieurs dates. Le premier cas, qui est celui qui nous intéresse ici, entraîne une transformation des valeurs de la matrice en fonction de la manière dont les probabilités sont interprétées. Comme l’indique D. Courgeau (2002, 2006), plusieurs interprétations des probabilités sont, en effet, envisageables mais toutes ne sont pas utiles à l’analyse des flux.

D. Courgeau défini la probabilité comme « […] une fonction numérique non négative et additive, définie sur une tribu93 (collection de sous-ensembles), dont la masse totale est l’unité » (Courgeau, 2006 : 2). Deux voies d’interprétation des probabilités font sens dans un objectif de cartographie de flux : la première repose sur l’analyse des fréquences simples et des fréquences conditionnelles ; la seconde repose sur la notion de densité conditionnelle. La probabilité de fréquence est interprétée, soit comme la limite de la fréquence d’apparition d’un événement lorsque ce dernier est présent plusieurs fois dans la série observée : c’est la fréquence simple ; soit comme la fréquence d’apparition d’un événement (A), sachant un événement (B), notée : P(A|B) pour la probabilité conditionnelle.

Appliquées à l’analyse d’une matrice de flux à cartographier, ces différentes interprétations des probabilités conduisent à générer de nouvelles matrices qui décrivent, soit des probabilités de fréquence simple, soit des probabilités de fréquence conditionnelles. Dans le cas d’une transformation de la matrice de flux initiale en un tableau de fréquences simples, la valeur résulte du calcul de pourcentages (%) en lignes (ou en colonnes) rapporté au total général des flux (F..). La matrice transformée décrit alors des fréquences de valeurs de flux rapportées au total général, tel qu’illustré par le Tableau 3-1 qui présente une sélection d’indicateurs de fréquences simples.

Tableau 3-1. Indicateurs de fréquence simple des flux

Dans le second cas, la matrice est celle de fréquences conditionnelles [(Fij) | Oi, Dj]. Si les fréquences conditionnelles sont généralement exprimées en proportions du total en ligne (Fi.) et / ou en colonne (F.j), de nombreux auteurs ont suggéré de pondérer ces fréquences en tenant compte des populations des lieux d’origine et de destination (Ravenstein, 1885 ; Dorling, 1991 ; Tobler, 1995 ; Holland, Plane, 2001), c’est-à-dire de critères externes et non endogènes liés à la taille des lieux ou à leur attractivité. Ainsi, pour les flux de population, C. Holland et D. Plane (2001) proposent l’utilisation de plusieurs indicateurs parmi lesquels la « probabilité de transfert » (transfert probability) (Holland, Plane, 2001 : 91-92) qui correspond au rapport du nombre de migrants sur la population de la zone d’origine : (Fij / Pi). Les auteurs introduisent également la notion « d’impact migratoire » (migration impact) calculé pour chaque couple de lieux qui appartiennent à un sous-système des flux (Holland, Plane, 2001 : 52 ; Henrie, Plane, 2008 : 51-52), ce qui suppose de raisonner à l’échelle de la zone d’étude, ainsi qu’à celle de sous-parties94 de la matrice. D. Dorling (1991) suggère de son côté l’utilisation

93

La tribu A d’un ensemble de valeurs (Ω) est un sous-ensemble de parties vides ou composées d’une suite finie d’entités et sur laquelle des opérations combinatoires ensemblistes s’appliquent. Ces possibilités sont l’union ( ) et l’intersection ( ) de sous-parties.

94

L’impact migratoire indique « […] le changement dans la population (positif ou négatif) qui résulte du turnover

migratoire entre Los-Angeles et les autres CBSA [le Core Based Statistical Area, qui correspond au découpage

Indicateur : part (en %) des flux (Oi, Dj) Formulation

- pour les lieux

pour origine i dans le total général des flux

(Fi./F..)*100 pour destination j dans le total général des flux

- pour les flux

(F.j/F..)*100 pour origine i et pour destination j dans le total des flux (Fij/F..)*100 pour destination j et origine i dans le total des flux (Fji/F..)*100

__________________________________________________________________________________________

complémentaire aux (Pi, Pj) du moment de la journée (diurne ou nocturne). Quel que soit le mode de calcul, les valeurs obtenues expriment la probabilité conditionnelle des lieux à émettre (ou à recevoir) des flux, compte tenu de leur capacité d’émission (ou de réception).

Le Tableau 3-2 présente une sélection d’indicateurs de fréquences conditionnelles qui peuvent être élaborés : il décrit des probabilités d’émission (ou de réception) des flux (Fij) par des lieux d’origine (ou de destination) qui sont exprimées en utilisant les marges de la matrice (Figure 3-4, page 116).

Tableau 3-2. Indicateurs de fréquence conditionnelle

La Figure 3-5 présente un exemple de cartographie type d’indicateur de fréquence : elle illustre les probabilités d’émission [(Fij) / Oi]*100 des districts de l’ex-Tchécoslovaquie (1990). Il est possible de substituer les marges à des données exogènes qui sont fonction du type de flux : les populations des lieux d’origine et de destination pour les flux migratoires, par exemple.

Figure 3-5. Cartographie des probabilités d’émission (en %) de l’ex-Tchécoslovaquie (1990)

La transformation des valeurs initiales de la matrice en indicateurs de fréquences présente plusieurs avantages. Tout d’abord, elle intègre les valeurs des flux et leur effet marginal aux lieux : la

territorial américain utilisé pour la collecte de données statistiques] et en dehors des unités spatiales du CBSA avec

lesquelles il existe un flux, pour 1000 personnes qui résident dans les autres (pas à Los-Angeles) CBSA ou en dehors des CBSA du comté. Il convient de noter que, à l’instar des taux de migration nette, il s’agit d’un indicateur de l’impact migratoire et non d’un taux auquel un événement démographique se produit, pour une population définie comme présentant un risque de vivre ces événements » (Holland, Plane, 2001 : 52).

Indicateur : fréquence conditionnelle (en %) des flux ayant Formulation pour origine i et destination j / total des (i) (Fij/Fi.)*100 pour origine i et destination j / total des (j)

pour destination j et origine i / total des (j) pour destination j et origine i / total des (i)

(Fij/F.j)*100 (Fji/F.j)*100 (Fji/Fi.)*100 pour origine i et destination j / somme des marges

pour destination j et origine i / somme des marges

Fij/ (Fi. + F.j)*100 Fji/ (Fi. + F.j)*100 pour origine i et destination j / produit des marges

pour destination j et origine i / produit des marges

Fij/ (Fi. * F.j)*100 Fji/ (Fi. * F.j)*100

__________________________________________________________________________________________

représentation intègre alors l’ensemble de l’information disponible dans la matrice (liens, lieux) sans opérer de sélection des valeurs selon la focale de la matrice : je représente les flux du point de vue des lieux ou je représente les flux entre les lieux.

Le second avantage du recours aux fréquences est issu du premier : ces indicateurs permettent de mettre en évidence les parts d’échanges qui s’éloignent de la distribution marginale, autorisant ainsi l’analyse comparative de différentes séries.

Le troisième intérêt de l’utilisation des fréquences réside dans le calcul du seuil de densité (dk) de la matrice, qui représente le rapport entre la fréquence d’une classe et son amplitude.

Le quatrième avantage du recours à l’analyse des fréquences tient dans la possibilité d’extension du calcul pour l’estimation de sous représentations et de surreprésentations des effectifs dans la distribution totale. Pour cela, il est nécessaire de créer une troisième matrice qui représente l’écart entre les distributions des fréquences conditionnelles et les distributions marginales. Cette troisième matrice sera formée de valeurs respectivement positives (et négatives) qui représentent les surreprésentations (ou les sous représentations).

Se pose alors le problème de la diagonale vide qui fausse ces calculs de fréquences et les rends difficiles à exploiter.

Les quelques indicateurs de fréquences des valeurs de flux qui ont été présentés s’appuient sur la propriété d’additivité en ligne (et en colonne) de la matrice. Ils combinent généralement les valeurs de flux (Fij) avec leurs marges (Oi, Dj) ou avec le total général des flux. Il est possible d’aller plus loin, en combinant les cases de la matrice qui renseignent sur les flux (Fij) pour générer soit des indicateurs qui les décrivent – et non seulement les lieux – (Courgeau, 1980 : 84), soit de simplifier l’information de départ. Pour cela, il convient d’utiliser les méthodes issues du calcul matriciel qui ont été transférées à la cartographie de flux par W. Tobler.