• Aucun résultat trouvé

CHAPITRE 5 CONCLUSION ET PERSPECTIVES

5.1 Synthèse des travaux

La revue de littérature a permis de resituer l’objet de ce mémoire dans le contexte actuel des recherches menées à ce jour. On retrouve d’une part des travaux portant sur l’enrichissement des données de cartes à puce (origine et destination des trajets) et d’autre part des travaux portant sur les statistiques et visualisation métier utilisées dans le domaine.

La méthodologie a présenté les raisonnements employés pour répondre aux trois sous-objectifs de ce mémoire. On y retrouve dans un premier temps les travaux menés sur l’algorithme destination : comment l’optimiser et le rendre opérationnel, comment l’adapter au cas du RTL, comment faire pour mesurer sa performance, et comment enrichir un peu plus les transactions (distance et temps d’un trajet, recomposition des séquences de tronçons, etc.). Dans un second temps est présenté le travail d’intégration des résultats de l’algorithme dans le portail « Analytics For Transportation » du CeNTAI de Thales. Suite à cette intégration, une nouvelle structure de données pour les transactions enrichies est proposée afin de faciliter leur visualisation. La technologie de gestion des données Elasticsearch utilisée par le CeNTAI est reconduite. Dans un troisième temps, pour faire suite à la nouvelle intégration des documents des transactions désagrégées et enrichies dans Elasticsearch, une dernière partie présente les possibilités d’utilisation du logiciel Kibana ou encore les suggestions de visualisations utiles pour le développement d’un nouvel outil. L’idée est ici de proposer des outils permettant de visualiser et analyser ces données enrichies par l’algorithme destination tout en répondant aux besoins d’une société telle que le RTL.

Le fruit de ce mémoire a été de proposer une solution opérationnelle efficace et relativement rapide de consolidation et enrichissement de transactions de cartes à puce. Ainsi, à partir d’un jeu de données de transactions, cette solution permet en une seule étape d’estimer les destinations des trajets correspondants, de préparer des statistiques supplémentaires (distance et temps de trajet, séquences de tronçons …) et d’exporter les résultats directement dans un fichier texte ainsi que

vers un outil de gestion de données, Elasticsearch. Le temps de traitement est d’environ 20 minutes pour 3 millions de transactions, temps d’export compris. Pour rappel, le RTL a rendu disponibles 3,1 millions de transactions de bus et métro du mois de mars 2013. 20% des transactions sont effectuées dans 4 stations de métro desservies par le RTL. Ces transactions de métro permettent d’aider un peu l’algorithme dans l’estimation des destinations : lorsqu’elles sont prises en compte, elles n’améliorent que de 1% le nombre total de destinations des trajets de bus, portant à 79% le nombre de trajets OD en bus recomposés pour notre jeu de données de mars 2013. Les séquences de tronçons ou déplacements ont été recomposées au cours de l’algorithme. Il en ressort par exemple que 66% des déplacements de bus, ou séquences de tronçons, effectués par les usagers sont des trajets directs sans correspondance. La part d’usagers effectuant des déplacements d’une seule correspondance est respectivement 12% du bus vers le bus et 20% du bus vers le métro. Dans les 2% de déplacements restants, on retrouve 1% (~20 000) de déplacements de type bus-bus- métro.

Par ailleurs, ce mémoire recherche a proposé des solutions logicielles, au moyen de portails web configurés ou développés pour l’occasion, pour analyser et exploiter ces données enrichies à l’étape précédente, données qui sont directement disponibles après avoir été produites et exportées dans Elasticsearch. On retrouve d’une part les travaux menés dans Kibana avec différents exemples d’utilisation : vue globale des données, possibilité de comparaisons entre différents jeux de données sans avoir à recréer les tableaux de bord et analyses sur des points particuliers tels que l’étude des modes de correspondance, la détection d’erreurs, etc. D’autre part, les résultats du développement d’une nouvelle interface web « Visu Lignes » pour les besoins du RTL sont présentés. Cette interface permet d’avoir une vue globale cartographiée sur l’utilisation du réseau ainsi que la charge sur les différentes lignes du réseau. Ce nouvel outil possède des fonctionnalités de filtres spatiotemporels à l’instar du portail du CeNTAI et de Kibana afin d’étudier les interactions de zones choisies avec le reste du réseau ou encore les flux entre des zones données. La possibilité d’animer heure par heure de la journée la charge globale du réseau en fonction de la sélection spatiotemporelle permet d’aider à visualiser les dynamiques de la mobilité des usagers du réseau. Pour terminer, ce projet de recherche a permis de montrer que l’analyse de gros volumes de données en un temps limité était possible et une solution opérationnelle a été présentée. En effet, il faudrait un temps de traitement de seulement 32 heures pour enrichir les transactions des 8 dernières années du RTL, à raison de 3 millions de données par mois. Ces données de type OD seraient alors

disponibles pour alimenter les analyses des différents départements d’une société de transport en commun tels que la gestion des opérations du réseau, la planification et même le marketing et la finance. Les outils de visualisation développés permettraient alors d’aider le RTL dans la rédaction d’un cahier des charges auprès d’une entreprise offrant des solutions BI pour visualiser leurs données métier, sans compter les avancements possibles pour Thales dans le développement de ses solutions d’affaires.

Documents relatifs