• Aucun résultat trouvé

Le concept de réseau, porteur d’une « polysémie problématique » (Offner, 1996), est aujourd’hui largement utilisé pour appréhender le phénomène de lien social (Lemercier, 2005). Les réseaux complexes permettent quant à eux de « représenter les interactions entre les différents éléments d’un système » (Queyroi, 2013). Leur analyse, leur représentation passent alors par la modélisation des réseaux en graphe, défini comme « une structure permettant l’encodage des données relationnelles » (Queyroi, 2013). L’analyse de réseaux est alors une démarche croissante dans les sciences humaines et sociales (Lemercier, 2005), et particulièrement en géographie (Pumain et Saint-Julien, 2010), où la théorie des graphes illustre « les recherches sur la démultiplication des espaces géographiques, espaces de la logistiques, espaces financiers, espace des pratiques individuelles » (Lévy et Lussault, 2003).

Cette section vise à montrer comment la théorie des graphes, comme théorie mathématique et informatique permet d’étudier la structure du réseau ferroviaire français sur le temps long, parce qu’il s’agit d’un « remarquable outil de modélisation de situations concrètes » (Xuong, 1992). Pour cela, elle participe à la phase de géo-construction de nouveaux indicateurs issus de la seule exploitation des données du réseau contenues de la base de données FRANcE : le graphe participe donc autant à la résolution de problèmes qu’à l’analyse de données. Pour autant, nos échelles d’analyse requièrent de s’extraire du cadre du SIG pour établir des mesures de performance du réseau (Kwan, 2004 ; Mathis, 2003) : l’objet graphe se retrouve ainsi au cœur de la démarche géo- méthodologique dans la GeoComputation, quand « la durée de calcul de certains algorithmes croît très vite avec la taille du graphe, c’est un problème d’efficacité d’algorithme et de complexité de calcul » (Mathis, 2003). Nous voyons ici comment la théorie des graphes donne de premières clés d’entrée pour l’étude de la dynamique d’un réseau pour la suite de notre travail.

4.2.1. Les principes de la modélisation des réseaux de transport

Pour modéliser des relations, le recours au graphe est devenu presque systématique, tant « les graphes constituent l’outil théorique le plus utilisé pour la modélisation et la recherche des propriétés des ensembles structurés. Ils interviennent à chaque fois que l’on veut représenter et étudier un ensemble de liaisons entre les éléments d’un ensemble fini d’objets » (Beauquier, Berstel et Chretienne, 1992). Le graphe est alors défini comme une « figure géométrique formée d’un ensemble de points appelés sommets ou nœuds et de lignes joignants ces sommets arêtes ou liens »22 (Pumain et Saint-Julien, 2010). L’adoption d’un tel objet dans notre question de recherche est justifiée par les proximités entre les propriétés du graphe et les propriétés d’un réseau technique, telles qu’elles ont été définies dans la première partie de ce travail : une structure, une dynamique, une logique (Dupuy et Offner, 2005). Le graphe reprend aussi les concepts de connexité, de connectivité (Pumain et Saint-Julien, 2010) que nous avons évoqués dans la construction du

22 Par convention, dans la suite de ce manuscrit, nous privilégierons l’utilisation des vocables nœuds et liens, ainsi

que leur traduction anglaise employée de manière conventionnelle dans les articles scientifiques anglo-saxons :

« mythe » de l’effet structurant. Pascale Dancoisne a été précurseur en France par l’utilisation de la théorie des graphes pour l’analyse des réseaux ferroviaires (Dancoisne, 1984). Pour autant, la modélisation des réseaux pose les questions de la transformation du réseau en un graphe, de son analyse, ainsi que de la représentation des réseaux par les graphes (L’Hostis, 2003), rejoignant les considérations plus générales de la GeoComputation.

Le statut de la théorie des graphes reste toutefois ambigu tant son utilisation est aujourd’hui pluridisciplinaire (Commenges, 2013) : elle est utilisée par les mathématiques, l’informatique, la physique, la sociologie ou la géographie. La théorie des graphes permet de « résoudre un certain nombre de problèmes classiques comme les chemins les plus rapides entre une ou plusieurs origines et destinations, la capacité d’un réseau » (Mathis, 2003). Ces problèmes paraissent alors aussi concrets que vastes. La théorie des graphes peut être considérée dans notre cas comme un formalisme, toutefois indispensable pour la construction de nouvelles connaissances géohistoriques. Nous reprenons ici deux exemples emblématiques de problèmes récurrents posés à l’objet graphe (Figure 4. 1). On cite volontiers, aux prémices de la théorie des graphes et surtout parce qu’il s’agit d’un problème de transport, le célèbre problème, très opérationnel, des ponts de Königsberg (L’Hostis, 2003), édicté par Leonhard Euler au milieu du XVIIIème siècle. Ce problème mathématique consiste à créer une promenade qui travers une et une seule fois chacun des sept ponts de la ville aujourd’hui nommée Kaliningrad. Le second problème classique est celui de la coloration de la carte de Guthrie en 1852 : l’utilisation du graphe lui permet de colorier la carte des Etats Européens de quatre couleurs différentes sans que deux régions adjacentes aient la même couleur (Queyroi, 2013).

Figure 4. 4. A l’origine de la théorie des graphes …

Le graphe est un objet mathématique. L’étude de leur lien fait alors partie d’une branche des mathématiques appelée topologie. Le cadre théorique des graphes permet ainsi la réalisation d’algorithmes : le plus célèbre d’entre eux est sans doute l’algorithme de Dijkstra, qui résout le problème du plus court chemin (Dijkstra, 1959). Il trouve écho dans notre questionnement parce qu’il permet d’appréhender d’abord l’accessibilité comme un simple indicateur de la distance (Mercier, 2008). Malgré son caractère simple, nous verrons comment sophistiquer cette mesure en ajoutant d’autres variables et caractéristiques des réseaux. La détermination des plus courts chemins

entre chaque nœud (ou lieu) d’un réseau permet d’appréhender la séparation spatiale des activités humaines d’une part (Morris, Dumble et Wigan, 1979), de s’emparer de la loi de Tobler d’autre part. Dans la théorie des graphes, cette distance peut revêtir différentes formes : la valeur des liens traduit la rugosité, c’est-à-dire l’effort consenti pour traverser ces liens. La distance kilométrique paraît naturelle, mais l’information sur les vitesses contenue dans FRANcE permet d’envisager des distances temporelles, où l’algorithme de Dijkstra recherche le temps de parcours le plus rapide sur le réseau ferroviaire pour rejoindre chaque paire de lieu. En termes économiques, cette distance peut enfin être un coût généralisé d’un déplacement, qui allie contraintes monétaires et temporelles. La solution au problème du plus court chemin se concrétise par une matrice associée de distances entre chaque paire de nœud. Dans le domaine de la géographie des transports, elle est souvent appelée matrice origine-destination, à partir de laquelle on peut définir une distance moyenne d’un nœud à tous les autres. On parle alors d’accessibilité relative. Cette mesure peut participer à la construction de matrices d’interaction, nécessaires à la production de connaissances géohistoriques. Le dimensionnement de telles matrices permet de diversifier les indicateurs mais requiert d’autant plus des capacités de calcul.

Derrière ces problèmes très opérationnels, le formalisme des graphes participe aussi à l’analyse des données que l’on y intègre car la « théorie des graphes vise la formalisation des réseaux et la mesure de leurs propriétés » (Lévy et Lussault, 2003). Indépendamment du contexte dans lequel il s’inscrit, s’émancipant ainsi de toute considération géométrique, la théorie des graphes est en capacité de mesurer la structure des relations entre les nœuds qui le composent et donc d’extraire des connaissances à partir d’observations contenues dans le graphe. C’est dans ce cadre que Pascale Dancoisne a revisité la chronologie du réseau ferroviaire français par les indicateurs issus de la théorie des graphes (Dancoisne, 1984). Pour autant, il faut garder à l’esprit quelques limites du formalisme des graphes, qui est « incapables de représenter et de décrire précisément et sans hypothèses implicites un réseau de routes à partir des éléments nécessaires au calcul, par exemple, des chemins ou du flux maximum » (Mathis, 2003). La recherche fondamentale, en mathématique surtout, s’est surtout attachée à la relation entre les sommets plutôt qu’à la description des sommets eux-mêmes (Mathis, 2003). Ainsi, nous verrons comment les sorties du graphe vont davantage venir enrichir les informations des liens entre les objets plutôt que sur les objets eux-mêmes, même si nous nous efforcerons de créer de nouvelles connaissances sur les nœuds du réseau à partir de l’analyse des graphes, parce que désormais, « les systèmes de traitement de l’information autorisent des approches […] prenant en charge le rôle de l’élément, qui lui-même peut être éventuellement décrit en tant que graphe, ce qui ouvre la voie à de nouvelles études de la relation réseau/territoire » (Lévy et Lussault, 2003).

Enfin, le troisième challenge que l’on identifie pour le formalisme des graphes est leur représentation. Dans les domaines de recherche le plus souvent cité, la représentation n’est que secondaire (Queyroi, 2013) : par le formalisme des graphes, « seul importe de savoir comment les sommets sont reliés » (L’Hostis, 2003). Le géographe y voit souvent la perte d’une partie de l’information, par rapport au résultat cartographique. Le graphe se retrouve alors confronté aux « contraintes de la ressemblance » (Mathis, 2003) : parce que la carte Michelin donne l’impression d’un tracé détaillé et exact d’une route, la largeur des voies n’est pourtant qu’une similitude, et n’est pas une représentation à l’échelle de la largeur réelle des routes.

Nous retenons des principaux principes de la modélisation des réseaux de transport la représentation symbolique permise par la théorie des graphes afin de résoudre des problèmes simples au sein desquels nous plaçons l’accessibilité par les temps de parcours. Par ailleurs, la théorie des graphes participe à notre posture épistémologique quand elle permet d’explorer les données contenues dans le SIG-H pour enrichir l’information géohistorique. Elle est aussi au cœur de notre chaîne géo-méthodologique par les enjeux de représentation qu’elle met en exergue. La prochaine étape réside alors dans la transformation de l’information géohistorique en un graphe.

4.2.2. Du SIG-H au graphe : processus de simplification et d’abstraction

D’après Philippe Mathis, la modélisation des réseaux par les graphes est porteuse d’un paradoxe. Outre les nombreux avantages déjà décrits plus hauts, couplés avec le « développement fulgurant des ordinateurs et micro-ordinateurs », la théorie des graphes a beaucoup de difficultés à « satisfaire les deux critères essentiels de tout travail scientifique : la reproductibilité et la comparabilité en ce qui concerne particulièrement la modélisation des réseaux et la production de cartes et/ou d’images de synthèse » (Mathis, 2003). Pour autant, nous retenons dans la perspective de notre travail l’efficacité de ce formalisme dans le domaine du calcul, permettant de répondre aux exigences du dimensionnement de notre question de recherche. La suite de la section montre aussi comment la modélisation du réseau ferroviaire français, puis de l’ensemble du territoire français obéit à une anticipation : « pragmatisme et efficacité sur la théorisation » (Mathis, 2003), laissant tout de même entrevoir des capacités de généralisation de la méthode proposée. Dans cette section, nous reprenons les conclusions du chapitre 3 (Figure 3. 10), qui montrent une mise en connexité du réseau ferroviaire français à partir de 1860. C’est la date à partir de laquelle nous envisageons ici la transformation du SIG-H en graphe : l’objectif est alors d’obtenir un graphe dont les nœuds sont

des gares et dont les liens sont des tronçons ferroviaires. Le graphe obtenu est alors un graphe

planaire, avec la formulation mathématique :

𝐺 = (𝑉, 𝐸, 𝑓) (5)

Le graphe G est composé d’un ensemble V de sommets, d’un ensemble E de liens et où f est une application surjective 𝑓 ∶ 𝐸 → 𝑉 × 𝑉 selon laquelle chaque lien est associé à un couple de sommets. Le graphe obtenu est alors planaire dans la mesure où deux liens « ne se croisent pas en dehors de leurs extrémités, c’est-à-dire un sommet du graphe » (Mathis, 2003), qui peut être représenté sur un plan. C’est aussi un graphe simple dans la mesure où il ne possède pas d’arcs multiples ni de boucle. Ce n’est pas tant la représentation géométrique que la table décrivant f qui est utilisée pour appliquer la théorie des graphes (Figure 4. 5).

Figure 4. 5. Graphe planaire

Cependant, l’information contenue dans la base de données FRANcE ne permet pas une simple transformation des nœuds ferroviaires et des tronçons en un graphe planaire. Nous identifions plusieurs difficultés dans le processus de transformation :

 Notre approche sur la longue durée suppose une évolution de la structure du réseau, donc nécessairement du graphe, à partir de trois complexifications :

 Tous les nœuds sont des intersections sur le réseau ferroviaire mais tous les nœuds ne sont pas des gares ;

 Un nœud peut être créé ou supprimé au cours de la période, matérialisant l’ouverture ou la fermeture d’une gare ;

 Un lien peut être créé ou supprimé au cours de la période, matérialisant l’expansion ou la rétraction du réseau.

Ainsi, les nœuds représentant les gares sont des sommets particuliers du graphe G. Pour l’instant, nous isolons ces nœuds dans une sous-table. De plus, la constitution de la base de données FRANcE, les données relatives aux vitesses et à la population ont été calibrées à la décennie. Nous conservons cette granularité temporelle par décennie en ajoutant une variable binaire par décennie, attestant de la présence ou l’absence du tronçon dans le réseau. On peut donc réécrire l’équation (5) en ajoutant l’information d1860, d1870, …, dn où 𝑑𝑛: 𝐸 → {0; 1} et 𝑑𝑛: 𝑉 → {0; 1} selon laquelle

chaque lien est associé à un codage 1 ou 0 pour chaque décennie :

𝐺 = (𝑉, 𝐸, 𝑓, 𝑑(𝐸, 𝑉)𝑛) (6)

 L’une des principales contributions de la base de données FRANcE dans l’étude du réseau ferroviaire est l’information sur les vitesses de déplacement sur les tronçons ferroviaires. Elle apporte une complexification supplémentaire dans le graphe : un

lien peut être parcouru de manière plus ou moins rapide selon l’évolution de la vitesse moyenne.

Le besoin de généralisation de cette information se concrétise ici par la pondération du graphe, en conservant la granularité temporelle par décennie. La fonction de pondération, dans la recherche du plus court chemin, traduit souvent la distance kilométrique d’un tronçon. Mais dans notre approche par les temps de parcours, cette fonction de pondération doit prendre en compte la distance temporelle : l’effort nécessaire pour traverser le tronçon est alors nommé impédance. Elle est le simple rapport entre la distance métrique et la vitesse moyenne de chaque tronçon. De cette sorte, nous pouvons nous abstenir de l’information d(E)n portant sur les liens et présente dans

l’équation (6), et la retranscrire dans la fonction 𝜔1860, 𝜔1870, … 𝜔𝑛, qui associe à chaque lien 𝑒 ∈ 𝐸 un réel 𝜔𝑛(𝑒) qui représente l’impédance. L’absence du tronçon pour une décennie se traduit donc par une valeur nulle. On obtient désormais un graphe pondéré :

𝐺 = (𝑉, 𝐸, 𝑓, 𝑑(𝑉)𝑛, 𝜔𝑛) (7)

A l’aide de l’équation (7), nous sommes donc en mesure de mobiliser la base de données FRANcE pour construire le graphe G, modélisant le réseau ferroviaire français depuis 1860. La Figure 4. 6 décompose le graphe G en un ensemble de tables qui définissent les deux composantes V et E du graphe, assorties des informations inédites issues de FRANcE. Le passage de la table des intersections à la table des nœuds passe par la définition de 𝑑(𝑉)𝑛. La construction de la table des

liens nécessite d’identifier les sommets qui constituent leur extrémité, pour obtenir f. Le passage des vitesses à l’impédance permet d’obtenir la table des liens avec l’information 𝜔𝑛. Pour cela, un outil est directement implémenté dans l’extension PostGIS : il a l’avantage de s’accommoder directement d’informations géométriques pour générer un graphe à référence géographique (Mathis, 2003 ; Singh et al., 2015). Le module pgRouting permet alors de créer la topologie du réseau à partir d’une table issue de la base de données FRANcE : elle est utilisée pour construire la table relationnelle, en conservant les attributs et la géométrie du réseau, alors que la table reseau_vertices_pgr est créée par la fonction de pgRouting, permettant d’identifier les nœuds et de déterminer les extrémités de chaque lien.

La structure qu’on lui donne permet de définir des sous-graphes, dans deux dimensions : le sous-graphe peut traduire la modélisation du réseau à une décennie donnée, comme il peut traduire la modélisation d’un réseau régional ou départemental. Pour autant, le graphe G répond bien aux exigences de ressemblance (Mathis, 2003), du fait de la digitalisation du réseau dans un SIG-H, dans une perspective géohistorique et en partie patrimoniale. Il reproduit la géométrie exacte du réseau, créant des sommets permettant de dessiner la sinuosité du réseau ferroviaire. Mais par contre, il ne rentre pas directement dans les critères de précision et de pertinence de notre positionnement : « pour la plupart des réseaux et notamment ceux de transport collectif, l’accès au réseau ne peut être que discontinu […]. On ne saute pas, en courant, dans un bus ou dans un train en marche, ni d’un véhicule à l’autre » (Stathopoulos, 1997).

Selon nous, le graphe G construit à partir du SIG-H ne peut construire de connaissances géohistoriques pertinentes à partir du moment où il ne peut faire la distinction entre les points d’entrée sur le réseau et les autres, car « à partir d’une définition matricielle du graphe, toutes les réalisations se valent, sont équivalentes en théorie des graphes » (Mathis, 2003). Ainsi, nous proposons ici une méthode qui permet de passer de la « ressemblance » d’un réseau dans un graphe à une « représentation fonctionnelle » par le graphe (Dupuy et Stransky, 1996 ; Mathis, 2003). L’une des plus anciennes représentations fonctionnelle est la « table de Peutinger », qui date du IIème ou IVème siècle : sans offrir une représentation fidèle de la réalité, la table permet une représentation symbolique qui permet de saisir la structure du réseau ainsi que les distances entre les différentes étapes (Figure 4. 7 a.). La référence géographique est ici conservée pour les nœuds du graphe, mais les liens deviennent abstraits. De manière analogue, nous proposons ici de simplifier le graphe G permettant de poursuivre l’objectif évoqué en début de section : il faut pour cela supprimer les nœuds qui ne sont pas des gares, tout en gardant les propriétés d’un graphe simple et planaire (Figure 4. 7 b.).

Cette généralisation ne se fait toutefois pas sans perte d’informations sémantiques. Pour autant, l’impédance pour parcourir le réseau de gare à gare reste une information indispensable. Elle est obtenue à partir de la construction d’une matrice de gare à gare, pour autant qu’elles soient effectivement contigües : nous supprimons de manière itérative les nœuds qui ne sont pas des gares tout en maintenant la connectivité. On a donc désormais un graphe G’ qui relie les gares deux à deux (Figure 4. 8). Cette hypothèse est acceptable dans la mesure où les intersections entre plusieurs lignes sont dans l’extrême majorité des gares ou alors à proximité immédiate d’une gare (Caron, 1997). Il faut toutefois noter que ce réseau peut contenir parfois des groupes de plusieurs gares toutes connectées deux à deux. C’est notamment le cas dans la périphérie de Paris : dans ces cas-là, nous rejoignons les nécessaires adaptations à faire dans un projet géohistorique, où l’intervention manuelle du géomaticien est requise pour garantir la vraisemblance du réseau, par comparaison avec le réseau géométrique contenue initialement dans FRANcE. Pour autant, l’information sur les temps de parcours reste exacte et ne compromet pas la « vraisemblance » des temps de parcours sur le réseau. Notons par ailleurs que le cas parisien requiert la création de liens ad-hoc, qui permettent de lier les différentes gares parisiennes : cette approximation se justifie dans l’étude du réseau à l’échelle nationale, alors que le centre de l’Etoile de Legrand est précisément Paris (Caron, 1997). La Table 4. 2 montre comment le passage du graphe G ressemblant au graphe G’ fonctionnel permet au graphe de s’insérer dans les critères de pertinence, nécessaires à la construction de nouveaux critères de précision. Le nœud parisien explique la différence de 1 entre le nombre de gares et le nombre de nœuds dans le graphe simplifié. L’opération menée montre que la simplification a