• Aucun résultat trouvé

Vers une application en temps-réel du procédé de sélection de variables . 147

4.2 Identification de sections critiques pour la sélection de variables

4.3.4 Vers une application en temps-réel du procédé de sélection de variables . 147

variables

L’évolution des sections critiques est a priori permanente et dépend des conditions expérimen-tées par le réseau. Dans l’idéal, le critère de criticité devrait être en mesure de mettre à jour, à tout moment, l’ordre des sections du réseau. Il s’avère que le modèle LDA, stationnairement construit sur T P périodes temporelles, offre, en réalité, la possibilité de classer tout nouvel ensemble de N distributions sur les configurations (stratégie dynamique).

Cependant, les périodes temporelles doivent évoluer pour s’adapter à une fenêtre glissante, propre à un usage en temps-réel. Une nouvelle définition des périodes temporelles permettant la construction des distributions sur les configurations est requise. Cette étape s’avère particu-lièrement délicate : la fenêtre temporelle doit être suffisamment large pour que la distribution ait du sens, mais suffisamment fine pour caractériser la dynamique à l’instant présent.

La stratégie, envisagée pour définir de telles périodes temporelles et, par extension, les dis-tributions sur les configurations, consiste à construire une fenêtre temporelle artificielle d’évaluation. Pour toute section l et tout instant t de prévision, la distribution artificielle associée Φt,lse scinde en 2 composantes :

une composante stationnaire correspondant à la distribution sur les configurations expérimentées au même instant de journées d’un historique fixé, soit 48 distributions pour un pas de 30 minutes ;

une composante dynamique recueillant les configurations récemment7expérimentées par la section l.

La contribution à la distribution artificielle est de moitié pour chacune des composantes. Le principal avantage de cette stratégie est que la définition du motif critique est possible depuis une stratégie stationnaire appliquée aux T P = 48 périodes constituant les composantes stationnaires. Le nombre de distributions à classer par le LDA est donc restreint. Le modèle de classification est construit rapidement et efficacement pour aboutir à la définition de motifs latents. L’application du cas à 8 configurations sur la zone du Pont de Cheviré parvient au

7. Les configurations les plus proches de l’instant t ne peuvent être intégrées, puisqu’elles font appel aux états de trafic futurs des fils.

même motif critique que ceux identifiés précédemment. Il est alors supposé que les distributions artificielles suivent les mêmes motifs que ceux identifiés par les distributions stationnaires. Cette hypothèse n’est malheureusement pas vérifiée en pratique lors de la mise en oeuvre en temps-réel. En effet, les modifications induites par les distributions artificielles occasionnent une modification des motifs critiques. Après vérification, il s’avère que le2èmemotif n’est plus le plus performant, mais celui correspondant aux configurations intégralement fluides. Une ré-évalution directement portée sur les distributions artificielles des motifs critiques confirme cette observation. L’introduction de périodes et distributions artificielles altère donc en profondeur les motifs latents du système et efface l’effet de la structure spatio-temporelle.La définition de la criticité n’a alors plus de signification physique, au regard de ces périodes artificielles. La caractérisation par fenêtre glissante artificielle n’est donc pas adaptée au problème. Des approches alternatives doivent être envisagées.

4.4 Conclusions et perspectives

I Synthèse

L’objectif poursuivi par ce chapitre est ambitieux car à double enjeux. Il s’agit, d’une part, de procéder à une sélection de variables visant à passer outre le fléau de la dimension pour réduire erreur de prévision globale et complexité temporelle et, d’autre part, de maintenir une bonne robustesse de la prévision face à des événements peu récurrents en saisissant finement la structure spatio-temporelle du réseau. La recherche d’un compromis liant ces deux aspects est requise. Le processus adopté aboutit à deux principales contributions :

– l’identification des sections critiques du réseau, de leur agencement et de leur évolu-tion en foncévolu-tion des périodes de la journée pour caractérisaévolu-tion de la structure spatio-temporelle du réseau ;

– la proposition d’une méthode de sélection de variables de type Variable Ranking apte à s’adapter dynamiquement suivant les périodes de la journée.

La méthodologie introduite consiste à identifier, parmi un ensemble de motifs tirés de configu-rations locales de trafic, celui captant au mieux les caractères de la structure spatio-temporelle du réseau pour répondre aux besoins de prévision. Un unique critère générique triant les sections du réseau suivant leur degré d’appartenance au motif est alors défini, puis seuls les ˆn liens y contribuant le plus sont conservés en entrée du modèle de prévision. Les ˆn sections sélectionnées sont alors qualifiées, pour la période évaluée, de sections critiques du réseau. Les critères de sélection de variables tirés de la méthodologie proposée (type LDA) répondent aux attentes en termes d’amélioration de la robustesse et de réduction (par trois, en moyenne) du temps d’éxécution de la prévision.

Comparés aux critères alternatifs testés, les procédés de type LDA se révèlent souvent bénéfiques suivant l’indicateur de performance choisi. En conditions usuelles de trafic, dès que l’horizon excède 30 minutes, les critères LDA proposent l’erreur de prévision la plus faible. C’est

également le cas en conditions non récurrentes, pour tout horizon de prévision, ce quiconfirme l’hypothèse formulée quant au lien entre comportement critique des sections, structure spatio-temporelle et résilience. Résultant de l’extension d’une méthodologie plus simple (M3), les critères LDA nécessitent de tester moins de critères potentiels et présentent une plus

forte probabilité degarantir l’unicité du critère de sélection de variables.

Enfin, il résulte de l’analyse sur les cas étudiés que ladéfinition de la criticité depuis des motifs latents estpratiquement générique, i.e. inchangée d’un réseau à un autre. Seule la répartition spatiale des sections critiques diverge suivant le réseau considéré, mais les rôles joués par les sections restent les mêmes. En revanche, l’hypothèse de l’évolution dynamique des sections n’est que partiellement vérifiée, puisqu’une grande part des sections restent critiques à tout instant.

I Limites

Le procédé de sélection de variables n’est évalué que sur la seule méthode MKNN. Une confir-mation sur d’autres approches multivariées (MIMO) de type MSVR ou MKernel est à envisager. La transition vers une identification dynamique des sections critiques n’est pas encore attei-gnable. La stratégie à fenêtre glissante proposée annihile le sens physique des motifs latents et donc l’intérêt de la méthode. Une meilleure définition de la période temporelle reste à déterminer pour une application en ligne et dynamique du procédé.

En outre, une hypothèse de stationnarité des liens entre la section d’étude et ses fils/pères est formulée lors de la construction des configurations d’état. Les décalages temporels et pondéra-tions permettant la modélisation de toute configuration sont évalués depuis une méthode de corrélation croisée. Dans une perspective d’évaluation en temps-réel des sections critiques, les configurations pourraient être affinées par l’usage d’un procédé d’évaluation en temps-réel de ces paramètres (usage de l’information mutuelle ou graphical LASSO par exemple).

I Perspectives

L’identification des sections critiques constitue un moyen d’éviter ou de limiter le problème des données manquantes ou aberrantes dans certaines situations. En effet, la prévision ne s’appuyant plus que sur une quantité restreinte de sections, les informations manquantes ou erronnées sur les sections non sélectionnées n’influencent aucunement la prévision. Un procédé de complétion hors-ligne peut ensuite être appliqué pour que le cliché du réseau intégrant la base de données soit exploitable. En revanche, en cas d’informations manquantes sur une section critique, le problème reste entier.

5

Identification et intégration de

phénomènes non récurrents perturbant

le comportement nominal du réseau

Les embouteillages, c’est pratique : ça fait une bonne excuse pour arriver en retard.

Michèle Bernier Le Petit Livre de Michèle Bernier

Abstract :

This chapter deals with the non-recurrent events impacting the nominal behavior of the network.

A first step contributes to the detection of unusual phenomena. A brand new detection method replacing the usual inputs (traffic states) by a clustering indicator (an entropy measurement) is introduced. Such input modification aims to better distinguish the non-recurrent events from the recurrent ones. In comparison to basic methods, its detection accuracy is good.

The second step aims to integrate permanently an incident database to the classic historical database used for learning. This incident database is regularly updated by including the detected incidents strongly impacting the prediction accuracy. The process enables to increase the variability of cases within the learning database without futilely growing the historical size. A long-term improvement of the prediction accuracy is targeted.

Il est usuellement observé que certaines composantes du trafic se répètent avec une régularité prédéterminée (pic de demande en accord avec les déplacements pendulaires, signalisation ...). Ils définissent les motifs récurrents du trafic. Néanmoins, il est reconnu que de tels motifs sont modifiés d’une période de temps à une autre, suivant alors des saisonnalités. Ces phénomènes sont dûs à des variations de comportement des usagers que ce soit lié à des périodes de vacances ou aux jours de la semaine. Il est généralement observé une hausse du volume de trafic les lundis ou vendredis et des chutes de trafic sur les déplacements domicile-travail durant le mois d’août. Néanmoins, ces motifs réguliers ou saisonniers ne sont pas les seuls observables. Le fonctionnement nominal du réseau est régulièrement perturbé par l’apparition de phénomènes récurrents essentiellement dûs à des causes externes [204]. Certains événements non-récurrents sont planifiés de longue date (travaux, manifestations), auquel cas des stratégies de régulation sont applicables en amont, mais, pour la plupart, il s’agit d’événements impromptus. De tels phénomènes inopinés trouvent diverses causes : incidents, accidents, intervention d’urgence ou encore météorologie inclémente. Ne pouvant être anticipés, ces événements conduisent à des pertes de performances de prévision et de fonctionnement du réseau non négligeables, si des congestions en résultent.

Après l’introduction du cadre prédictif propre à la démarche globale (chapitre 2) et son évaluation sur diverses méthodes de prévision (chapitre 3), le chapitre 4 s’est intéressé à l’identification des sections critiques pour délimitation des informations essentielles permettant, entre autres, de mieux faire face à des conditions non récurentes. Poursuivant dans la veine de la robustesse de prévision, ce chapitre vise à identifier et mieux cibler, au sein du procédé de prévision, les périodes de congestion non-récurrentes affectant le fonctionnement nominal du réseau routier. Après une phase de détection de tels phénomènes à partir des seules caractéristiques du trafic disponibles, leur intégration au sein du procédé de prévision est étudiée dans une perspective d’implémentation en ligne.

De même que pour le chapitre 4, le procédé de prévision est considéré comme une boîte indifférenciée (Blackbox), si bien que chacune des méthodes issues de l’approche globale introduite en chapitre 2 pourrait être appliquée. Néanmoins, par souci de concision et de simplicité, seuls les résultats produits à partir de la méthode MKNN sont exposés par la suite.

5.1 Les événements non récurrents dans la littérature du

trafic