• Aucun résultat trouvé

Le modèle DFM pour une analyse comparative des systèmes de vélos en libre service

N/A
N/A
Protected

Academic year: 2022

Partager "Le modèle DFM pour une analyse comparative des systèmes de vélos en libre service"

Copied!
5
0
0

Texte intégral

(1)

HAL Id: hal-01383938

https://hal.archives-ouvertes.fr/hal-01383938

Submitted on 15 Nov 2016

HAL is a multi-disciplinary open access archive for the deposit and dissemination of sci- entific research documents, whether they are pub- lished or not. The documents may come from teaching and research institutions in France or abroad, or from public or private research centers.

L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau recherche, publiés ou non, émanant des établissements d’enseignement et de recherche français ou étrangers, des laboratoires publics ou privés.

Le modèle DFM pour une analyse comparative des systèmes de vélos en libre service

Charles Bouveyron, Etienne Côme, Julien Jacques

To cite this version:

Charles Bouveyron, Etienne Côme, Julien Jacques. Le modèle DFM pour une analyse comparative des systèmes de vélos en libre service. 48èmes Journées de Statistique organisée par la Société Française de Statistique, 2016, Montpellier, France. �hal-01383938�

(2)

Le mod` ele DFM pour une analyse comparative des syst` emes de v´ elos en libre service

Charles Bouveyron 1 & Etienne Cˆome 2 & Julien Jacques3

1 Laboratoire MAP5, UMR CNRS 8145, Universit´e Paris Descartes & Sorbonne Paris Cit´e

charles.bouveyron@parisdescartes.fr

2 Laboratoire GRETTIA, IFSTTAR etienne.come@ifsttar.fr

3 Laboratoire ERIC, Universit´e Lumi´ere Lyon 2 julien.jacques@univ-lyon2.fr

R´esum´e. Les syst`emes de partage de v´elos (BSS) sont devenus un moyen de transport intermodal durable et sont maintenant propos´es dans de nombreuses villes `a travers le monde. La plupart des BSS offrent ´egalement un libre acc`es `a leurs donn´ees, en particulier les rapports d’´etat en temps r´eel sur leurs stations de v´elos. L’analyse de la masse de donn´ees g´en´er´ees par ces syst`emes est d’un int´erˆet particulier pour les fournisseurs de BSS d´esireux de mettre `a jour les structures et leurs politiques de d´eveloppement. Ce travail a ´et´e motiv´e par l’int´erˆet pour l’analyse et la comparaison de plusieurs BSS europ´eens pour identifier les modes de fonctionnement communs et de proposer des solutions pra- tiques pour ´eviter les probl`emes potentiels. Notre approche repose sur l’identification des patterns communs entre et au sein des syst`emes. A cette fin, une m´ethode de cluster- ing, appel´ee FunFEM, pour les s´eries chronologiques (ou plus g´en´eralement les donn´ees fonctionnelles) est d´evelopp´ee. Elle est bas´ee sur un mod`ele de m´elange fonctionnel qui permet le regroupement des donn´ees dans un sous-espace fonctionnel discriminant. Ce mod`ele pr´esente l’avantage dans ce contexte d’ˆetre parcimonieux et de permettre la visu- alisation des groupes dans un espace quantitatif. Des exp´eriences num´eriques confirment la bonne tenue de FunFEM, en particulier par rapport aux m´ethodes de l’´etat de l’art.

L’application de FunFEM aux donn´ees BSS de JCDecaux et de Transport for London Initiative nous permet d’identifier 10 tendances g´en´erales, y compris quelques patterns

(3)

open access to their data, particularly to real-time status reports on their bike stations.

The analysis of the mass of data generated by such systems is of particular interest to BSS providers to update system structures and policies. This work was motivated by interest in analyzing and comparing several European BSSs to identify common operating patterns in BSSs and to propose practical solutions to avoid potential issues. Our approach relies on the identification of common patterns between and within systems. To this end, a model- based clustering method, called FunFEM, for time series (or more generally functional data) is developed. It is based on a functional mixture model that allows the clustering of the data in a discriminative functional subspace. This model presents the advantage in this context to be parsimonious and to allow the visualization of the clustered systems.

Numerical experiments confirm the good behavior of FunFEM, particularly compared to state-of-the-art methods. The application of FunFEM to BSS data from JCDecaux and the Transport for London Initiative allows us to identify 10 general patterns, including pathological ones, and to propose practical improvement strategies based on the system comparison. The visualization of the clustered data within the discriminative subspace turns out to be particularly informative regarding the system efficiency. The proposed methodology is implemented in a package for the R software, named funFEM, which is available on the CRAN. The package also provides a subset of the data analyzed in this work.

Keywords. Clustering, functional data, mixture model, sub-space

Bibliographie

[1] C. Bouveyron, E. Cˆome and J. Jacques, The discriminative functional mixture model for a comparative analysis of bike sharing systems, The Annals of Applied Statistics, vol.

9 (4), pp. 1726-1760, 2015.

(4)

9 % Afthernoon, WE

16.5 % Afternoon

10.3 % Morning

7.8 % Morning, WE

6.7 % Almost Full

10.7 % Full

11 % Night rebalancing

8.7 % Balanced

7.9 % 0.00

0.25 0.50 0.75 1.00

0.00 0.25 0.50 0.75 1.00

0.00 0.25 0.50 0.75 1.00

0.00 0.25 0.50 0.75 1.00

0.00 0.25 0.50 0.75 1.00

0.00 0.25 0.50 0.75 1.00

0.00 0.25 0.50 0.75 1.00

0.00 0.25 0.50 0.75 1.00

0.75 1.00

Cluster 1Cluster 2Cluster 3Cluster 4Cluster 5Cluster 6Cluster 7Cluster 8Cluster 9

station loading

Clusters Means

(5)

butte Montmarte

butte Chaumont

Père lachaise

Clusters

Afthernoon, WE Afternoon Morning Morning, WE Almost full Full

Night rebalancing Balanced Almost Empty Empty

Figure 2: Repr´esentation spatiale du r´esultat du clustering pour les stations parisiennes.

Références

Documents relatifs

tail pointe vers le dernier ´el´ement de la liste Le dernier ´el´ement poss`ede un pointeur x.next vide (not´e NIL) Doublement li´ee : Le premier ´el´ement poss`ede un pointeur

Pour revenir `a notre ´etude, `a partir de chaque mod`ele propos´e dans le paragraphe pr´ec´edent, nous pouvons rechercher les g`enes diff´erentiellement exprim´es entre les

Pour tester si les observations suivent une loi donn´ ee, pour comparer des moyennes, pour comparer des taux, si les observations sont issues d’une mˆ eme distribution, etc...

a - Calculer pour chaque sou-espace la performance moyenne et enregistrer le r´ esultat dans un data frame (utiliser summaryBy si possible).. b - Rep´ erer les 3 sous-espaces les

c - Comparer de nouveau, ` a l’aide d’un test statistique, les moyennes des 4 s´ eries de donn´ ees ` a partir de sous-´ echantillons al´ eatoires de taille 30. Exercice 4 :

Pour tester si les observations suivent une loi donn´ ee, pour comparer des moyennes, pour comparer des taux, si les observations sont issues d’une mˆ eme distribution, etc...

b - Le fichier ruban-3 initial final.csv contient la longueur de la trajectoire suivie par la pro- cession au d´ ebut (lorsque la tˆ ete atteint le point d’arriv´ e) et ` a la fin de

b - Ecrire une fonction carres qui affiche une ligne de carr´ es dont les intensit´ es de couleurs rouges, bleues et vertes sont contenues dans trois tableaux d’entier de mˆ