• Aucun résultat trouvé

CHAPITRE 2 REVUE DE LITTÉRATURE

2.2 Modélisation des corridors

2.2.2 Approche de modélisation

La visualisation et le traitement des données spatio-temporelles peuvent être classés en trois catégories (Andrienko, Andrienko, Dykes, Fabrikant, & Wachowicz, 2008) : (a) la représentation directe; (B) l’agrégation; (c) l’identification automatisée des patrons.

2.2.2.1 Représentation directe

L'approche directe consiste à représenter directement, sans traitement préalable ou avec peu de traitement, les éléments de la demande.

La représentation des déplacements par des points d’origine et de destination est une façon simple de présenter les déplacements. La connexion des points OD par des lignes directes (lignes de désir) permet de faciliter la compréhension des mouvements. Ceci est considéré comme étant la représentation la plus simple de la mobilité brute.

Par ailleurs, il est possible d’intégrer des éléments extérieurs à la demande (ex. points de jonction/passage). La Figure 2.7 clarifie l’approche de la représentation directe par un exemple simple de trois paires OD.

D’autres représentations sont possibles, mais cette approche est mieux adaptée pour présenter un nombre limité de données.

Figure 2.7: Illustration d’un exemple simple d’approche de représentation directe 2.2.2.2 Agrégation

L’agrégation consiste à regrouper les données en fonction de leur unité d’affiliation commune (spatiale, temporelle, etc.). Plusieurs chercheurs utilisent cette approche pour représenter le flux de mouvement ou de migration selon plusieurs échelles spatiales (internationale, nationale, urbaine).

L’agrégation zonale est une approche largement utilisée qui représente le flux (ex. origine- destination) entre des unités préalablement délimitées (zones administratives, cellules de la grille, etc.). Bien que le flux entre les différentes unités offre un portrait global du mouvement, il souffre d’une variabilité de précision engendrée par la variance des unités préalablement délimitées (Adrienko & Adrienko, 2011; Nielsen & Hovgesen, 2008).

Certains chercheurs (Bahoken & Olteanu-Raimond, 2013; Mota, Takano, & Taco, 2014; Murray, 2010) proposent de contourner l'inconvénient des unités pré-délimitées en proposant des concepts de délimitation « flexibles » (post-délimités). Ces approches utilisent des variables telles que la densité ou les similitudes entre les composants pour délimiter les unités en premier lieu, puis représenter le flux entre les unités. La technique des polygones de Voronoï en est un exemple. La Figure 2.8 illustre le résultat de l’identification des corridors d’un même ensemble de données en utilisant une approche d’agrégation selon des zones administratives et selon les cellules d’une grille.

Figure 2.8: Exemple d’identification de corridors avec deux approches d’agrégation zonale 2.2.2.3 Identification automatisée des patrons

Cette approche, perçue comme une évolution de l’approche précédente, profite de l’avancement des techniques statistiques et de fouilles de données (Groupement /Clustering) pour identifier des patrons dans un grand ensemble de données.

Plusieurs techniques sont utilisées dans cette approche pour identifier les corridors : elles sont classées soit selon la famille du groupement (hiérarchique, partitionnement, densité, etc.), soit selon la façon de déterminer la similarité entre les déplacements (segmentation puis groupement, groupement intégral).

Le Flow Map (Phan, 2005; Phan, Xiao, Yeh, & Hanrahan, 2005) est un outil permettant d’identifier les corridors intermodaux (mouvement des objets d'un nœud à un autre). Il utilise une approche de groupement hiérarchique afin de produire une représentation simplifiée des flux de mouvements. Rao, Zhang et Guan (2011) utilisent un ensemble de données spatialement agrégées pour identifier les corridors de transport urbain en utilisant un algorithme de regroupement par partitionnement appelé k-moyen. Les mêmes chercheurs soulignent le potentiel des corridors identifiés dans les processus de planification de transport ainsi que pour soutenir la visualisation et contribuer à une meilleure compréhension des déplacements.

En utilisant le concept de similarité, deux visions distinctes sont appliquées pour identifier les corridors :

 La première vision consiste à traiter le déplacement comme un objet dans son intégralité (déplacement en entier), puis à chercher les autres objets qui partagent les mêmes caractéristiques afin de les regrouper et d’identifier les corridors ;

 La deuxième vision consiste à segmenter les déplacements en portions (égales ou non) afin de regrouper les portions jugées similaires pour identifier les corridors.

Dans la première vision, nous pouvons distinguer l’algorithme Longest Common Subsequences (LCSS) proposé par Chen, Özsu et Oria (2005). Celui-ci score la similarité entre deux trajectoires à l’aide d’une équation de distance et d’un seuil de distance prédéfini (mesures de ressemblance /similarité). L’identification des corridors peut être faite a posteriori en rassemblant les trajectoires similaires, autrement dit, ayant un score de similarité acceptable. Cet algorithme est plus adapté pour mesurer la similarité entre les trajectoires incluant plusieurs détours qu’entre des objets de type ligne (ligne de désir).

Dans la deuxième vision, l’algorithme Trajectory Clustering ou TraClus (Lee, J.-G., Han, & Whang, 2007) permet de diviser les trajectoires en segments, puis d’évaluer la similarité entre ceux- ci afin d’identifier les corridors. L’approche de cet algorithme présente l’avantage d’être mieux

adaptée aux lignes de désir que l’algorithme LCSS. Nous allons donc donner plus de détails sur TraClus dans la section suivante.

Chaque méthode de regroupement comporte des avantages et des inconvénients. Selon Ester, Kriegel, Sander et Xu (1996) le regroupement présente des avantages quand une tendance générale doit être déterminée à partir d’un grand nombre des données, mais l'inconvénient majeur est au niveau du paramétrage, de la vérification et de la validation des résultats.

2.2.2.4 Groupement des trajectoires (TraClus)

La méthode de regroupement TraClus est utilisée pour regrouper des mouvements libres et orientés selon des axes (immigration et déplacement des animaux, trajectoires des cyclones). Les caractéristiques de ces mouvements semblent similaires à celles des lignes de désir et c’est pour cette raison que nous choisissons de présenter les grandes étapes de la méthode.

Deux étapes illustrées à la Figure 2.9 sont nécessaires pour identifier les corridors :

 Étape de partitionnement qui consiste à identifier les points où une trajectoire change d’orientation. Cette identification permet par la suite de déterminer les points de segmentation afin de décomposer une trajectoire en petits segments.

 Étape de regroupement qui consiste à mesurer la similarité (ε) entre les segments de différentes trajectoires afin d’identifier les segments similaires, puis d’élaborer les corridors si un nombre minimum de segments (MinLns) est présent.

Figure 2.9: Étapes du regroupement de TraClus (Lee, J.-G. et al., 2007)

TraClus mesure la similarité (ε) entre les segments selon une équation qui regroupe plusieurs distances (illustrées à la Figure 2.10) et qui est calculée selon la formule suivante :

𝑑𝑖𝑠𝑡 (𝐿𝑖, 𝐿𝑗) = 𝑤𝑑+ 𝑤𝑑+ 𝑤𝑑 Où :

o 𝑑 : distance perpendiculaire entre les segments 𝐿𝑖, 𝐿𝑗, calculée selon l’équation : 𝑑 = 𝑙⊥12 + 𝑙⊥22

𝑙⊥1+ 𝑙⊥2 ;

o 𝑑‖ : distance parallèle entre les segments 𝐿𝑖, 𝐿𝑗, calculée selon l’équation :

𝑑‖= 𝑀𝑖𝑛(𝑙‖1 , 𝑙‖𝑠) ;

o 𝑑⍬ : distance angulaire entre les segments 𝐿𝑖, 𝐿𝑗, calculée selon l’équation

𝑑 = ‖𝐿𝑗‖ × sin(⍬)

o 𝑤 : poids associés aux différentes distances

Figure 2.10: Distances de similarité

L’applicabilité, les avantages et les limitations de TraClus pour identifier les corridors à partir des lignes de désir sont présentés en détail dans les Chapitres 4 et 5.

Documents relatifs