• Aucun résultat trouvé

CHAPITRE 4 EXPÉRIMENTATIONS ET RÉSULTATS (STO)

4.2 Application de la méthode classique

4.2.3 Segmentation

Aux vues des sous-parties précédentes, divers paramètres ont été fixés permettant le fonctionnement de l’algorithme de segmentation. Elle s'applique donc sur l’ensemble des vecteurs comportements issus des déplacements effectués par les utilisateurs au long des 3 ans de données, avec K = 6.

Tableau 4-3 : Paramètres algorithme segmentation classique

Dénomination Valeur Paramètre dans R

Taille base de données 3 ans = 159 semaines s = 159

Type d’information Déplacement x = 1

Nombre de groupes 6 K = 6

Nombre d’itération max 100 it_max = 100

Nombre d’initialisation 50 nb_ini = 50

D’autres paramètres, intrinsèques à l’algorithme de segmentation (Tableau 4-3), permettent de jouer sur la qualité et la rapidité d’exécution de la méthode. D’après la méthodologie en 363.3.2, il s’agit de définir une valeur pour le nombre d’itérations maximal et le nombre d’initialisations à effectuer. En effet, il est nécessaire de fixer un nombre d’itérations maximal pour le cas où la convergence vers des groupes fixes après itération serait trop lente à arriver. Le nombre d’initialisations quant à lui, sert à simuler la segmentation à partir de noyaux aléatoires différents. Théoriquement, plus les valeurs de ces paramètres sont importantes, meilleure est la qualité de segmentation en dépit d’un temps de calcul plus long. On privilégie plutôt la qualité que le temps de calcul, c’est pourquoi le nombre d’itérations maximal est fixé à 100 et le nombre d’initialisations à 50.

4.2.4 Analyse des résultats

Cette partie propose une analyse des résultats de segmentations issus de la méthode classique, présentant les différents groupes ainsi que leurs caractéristiques intrinsèques.

Sur la Figure 4-5, le groupe 1 est essentiellement constitué d’usagers se déplaçant en moyenne deux fois les mardis, mercredis et jeudis, et d’une à deux fois le vendredi, mais très peu de déplacements sont à constater en fin de semaine. Concernant la population du groupe, le groupe conserve une taille constante autour de 1000 usagers (en moyenne : 15,0% de la population hebdomadaire étudiée) tout au long de la période d’étude malgré une saisonnalité identifiable par une légère baisse du nombre d’usagers pendant les périodes d’été. Ce groupe s’apparente à un groupe d’usagers dont le patron de déplacement ressemble à celui d’un travailleur à mi-temps où le lundi n’est pas travaillé. En effet, deux déplacements par jour désignent souvent un aller le matin et un retour le soir. Combiné à une population essentiellement constituée d’adultes, on peut deviner qu’il s’agit d’une activité de type travail. L’évolution de la population du groupe rejoint cette théorie, puisqu’en semaine à congé on remarque une forte hausse de la population du groupe. Ce groupe récupère certainement, la population de travailleurs à temps plein (groupe 2) lors des semaines où le lundi est férié.

Le groupe 2 (Figure 4-6) est principalement constitué d’usagers se déplaçant deux fois par jour en semaine et ayant très peu de mobilité en transport en commun en fin de semaine. Il s’agit du groupe le plus fourni puisqu’il varie entre 2000 et 4000 individus (en moyenne : 28,4% de la population hebdomadaire étudiée) en fonction de la période de l’année. L’évolution de la population suit effectivement une saisonnalité facilement identifiable, puisqu’on dénote une perte de plus de 50% des individus entre la deuxième semaine de janvier 2014 et la première semaine d’août 2014. Ces baissent d’activité apparaissent année après année aux périodes d’été. Ce groupe rassemble très certainement les travailleurs à temps plein aux vues du nombre d’usagers, de son évolution périodique et des caractéristiques du groupe. En effet, les travailleurs à temps plein effectuent généralement un aller-retour sur chacun des jours de la semaine, mais très peu de déplacement en fin de semaine. De plus, on remarque une quasi-disparition du groupe lors des semaines à congé; ces individus sont certainement récupérés par le groupe 1 vu précédemment, puisque la plupart des jours fériés sont des lundis au Canada.

Caractéristiquement proche du groupe 2 (Figure 4-6), le groupe 3 (Figure 4-7) est constitué d’usagers qui effectuent deux déplacements sur chacun des jours de la semaine sauf le vendredi. Oscillant également autour de 1000 usagers (en moyenne : 13,5% de la population hebdomadaire étudiée), la saisonnalité est facilement identifiable puisqu’on remarque un écart type plus important. Montrant des périodes de variation similaires, le groupe 3 présente lui aussi une baisse périodique de sa population lors des périodes d’été. Aux vues des fluctuations relatives aux semaines à jours de congé, on peut supposer que le groupe 3 vient récupérer les usagers du groupe 2 dans les semaines où le vendredi est férié, mais vient perdre des usagers au profit du groupe 1, lors des semaines où le lundi est férié. Il y a, ici aussi, quasi disparition du groupe 3 pendant les semaines à lundi férié. À première vue, ce groupe représente les travailleurs à mi-temps effectuant des déplacements vers leurs lieux d’activité du lundi au jeudi compris.

Sur la Figure 4-8, le groupe 4 présente des caractéristiques sensiblement différentes. Ce groupe est constitué d’usagers réalisant peu de déplacements, et ce, uniquement le lundi et le mardi. Sa population reste constante autour de 1000 usagers (en moyenne : 15,0% de la population hebdomadaire étudiée), avec une très faible saisonnalité. La variance est, par contre, très importante. Semblable à un bruit très prononcé, la population peut augmenter ou diminuer de 500 usagers d’une semaine à l’autre. Ce groupe regroupe des usagers occasionnels qui ne nécessitent pas forcément d’utiliser les transports en commun pour aller travailler ou ne travaillant pas. Il est également à prendre en compte qu’un déplacement, suivant les conditions tarifaires d’une ville, peut signifier un aller-retour sur une période réduite, comme un aller-retour pour magasiner, accompagner ses enfants à l’école… On notera une forte hausse de la population pour les semaines de Noël et jours de l’an de chaque année, étant des semaines particulières et très peu achalandées il est logique que le groupe 4 récupère les usagers des autres groupes sur ces périodes.

D’apparence très proche du groupe 2 (Figure 4-6), les usagers du groupe 5 (Figure 4-9) se déplacent deux fois par jour sauf le dimanche où au minimum un déplacement est effectué. Cependant, l’étude de l’évolution de la population dans ce groupe présente une signification bien différente. En effet, on ne retrouve a priori aucune influence des semaines à congé ni de saisonnalité sur l’évolution. Cette population reste constante autour de 900 usagers (en moyenne : 11,1% de la population hebdomadaire étudiée) et disparaît presque lors des semaines de fin d’année. La non- influence des semaines à congé et la faible taille de cette population amènent à la réflexion que les usagers de ce groupe ne travaillent pas, mais effectuent tout de même des activités journalières.

Semblable au groupe 4 (Figure 4-8), le groupe 6 (Figure 4-10) présente les caractéristiques d’un groupe dont les usagers ne se déplacent que faiblement et seulement le mercredi, jeudi et vendredi. Sa population suit une constante autour de 1100 usagers (en moyenne : 17,0% de la population), avec une faible, mais visible saisonnalité. La variance est ici aussi très importante : la population peut augmenter ou diminuer de plus de 1000 usagers d’une semaine à l’autre. Ce groupe regroupe des usagers occasionnels qui ne nécessitent pas de se déplacer en transport en commun pour aller travailler ou ne travaillant pas.

La Figure 4-11 présente un condensé des résultats énoncés précédemment en combinant l’évolution des populations des différents groupes (en pourcentage) et la population totale (courbe noire). On peut voir les transferts de population de groupe à groupe. Par exemple à la semaine 15 (lundi de Pâques), à la semaine 21 (lundi de Pentecôte) ou à la semaine 27 (lundi 1er juillet : fête du Canada), le groupe 1 récupère les usagers du groupe 2 comme l’explique l’analyse précédente. Très pratique pour avoir une idée générale des problèmes engagés dans le réseau, ce graphique présente néanmoins l’inconvénient d’être surchargé et ainsi la moindre information se perd facilement dans la masse de données.

Les définitions de ces groupes ne sont qu’hypothèses. Il se peut que certains comportements, plus rares, se glissent dans les mauvais groupes et biaisent les résultats. On pense notamment aux cartes dont le comportement se situe en bordure de groupe. Généralement, les méthodes classiques prévoient de croiser ces informations à des données sociodémographiques propres à la ville afin d’enrichir la caractérisation des groupes.