• Aucun résultat trouvé

Comparaison de la qualité prédictive du modèle FA à celles des autres modèles

Afin de quantifier l’apport prédictif du modèle des forêts aléatoires par rapport aux trois premiers mo-dèles développés, nous avons fait recours, une fois de plus au coefficient de Theil. Dans chaque rapport effectué, le modèle alternatif est celui des forêts aléatoires tandis que les autres sont considérés comme des modèles de référence. En fonction de l’horizon temporel de prévision, nous avons présenté l’ensemble des

résultats dans la figure FIG.7.7.

Horizon de prévision (secondes)

0,60 0,80 1,00 1,20 1,40 1,60 1,80 2,00 2,20 2,40 2,60 C o e ff ic ie n t d e T h e il CART classique/FA CART modifié/FA MARS/FA

FIG. 7.7 – Indicateur de Theil pour la comparaison du pouvoir prédictif du modèle des forêts aléatoires relativement aux modèles CART

classique, CART modifié et MARS. Par exemple, CART classique/FA signifie rapport du RMSE du modèle CART classique sur le RMSE du modèle des forêts aléatoires.

Pour chaque modèle, nous avons évalué le coefficient moyen de Theil sur l’ensemble des horizons. Les valeurs trouvées se situent autour de 2.18, 1.89 et 1.85 respectivement pour les modèles CART classique, CART modifié et MARS. Ainsi, le modèle ajusté par les forêts aléatoires est le plus prédictif et peut per-mettre d’améliorer la qualité de prévisions du temps de passage des aéronefs en des points de leur trajectoire de près de 118%, 89% et 85% respectivement par rapport aux modèles CART classique, CART modifié et MARS.

Afin de d’affiner l’étude de cette performance d’ajustement du modèle FA, nous observé l’évolution

du coefficient de Theil en fonction de l’horizon temporel. Un examen de la figure FIG.7.7 montre que les

modèles CART classique et CART modifié peuvent fournir de meilleures prévisions au début de l’horizon de prévision inférieur à 300 secondes (5 minutes). En revanche, cette tendance s’inverse très rapidement à partir de l’horizon de prévision supérieur à 600 secondes (10 minutes). Ce modèle semble plus performant

7.5. CONCLUSION 115 lorsque l’horizon de prévision devient très éloigné par rapport à l’origine. Quelque soit l’horizon de prévi-sion, le modèle basé sur les forêts aléatoires fournit sur les données d’apprentissage les prévisions de qualité bien meilleures que celles données par les autres modèles. Toutefois, ce modèle semble souffrir comme les autres de la détérioration de son pouvoir prédictif au fur et à mesure que l’horizon temporel de prévision augmente et s’éloigne de l’origine. Le paragraphe suivant est destiné à la conclusion du chapitre.

7.5 Conclusion

Dans ce chapitre, nous avons developpé un modèle de prévision basé sur les forêts aléatoires. Ce modèle, fondé sur la technique d’agrégation d’arbres de régression construits à partir des échantillons bootstrap est une réponse au problème d’instabilité des arbres de régression produits par la méthode CART. Dans cette étude, nous avons montré qu’en outre, le modèle des forêts aléatoires améliore très significativement la qua-lité des prévisions des modèles CART (classique, modifié) et MARS. A travers le coefficient de Theil, nous avons pu quantifier sur les données d’apprentissage l’apport de cette technique de modélisation par rapport à celle des approches CART et MARS.

L’incertitude de prévision par ce modèle reste fortement dépendante de l’horizon temporel de prévision. La dégradation de ce modèle en fonction de l’horizon de prévision se fait de façon très modérée par rapport à celles observées sur les autres modèles.

Rappelons ici que le pouvoir prédictif réel d’un modèle s’évalue par rapport à son comportement vis-à-vis des nouvelles données. Ainsi, afin de choisir le meilleur modèle pour la prévision de la variable dé-pendante écart temporel, une étape importante de ce travail est désormais nécessaire. Il s’agit d’une phase de validation des modèles sur les données test différentes de celles d’apprentissage qui ont participé à leur ajustement. C’est au terme de cette ultime étape que nous aurons une idée du comportement de chacun de ces modèles lorsqu’il sera utilisé en situation opérationnelle du trafic. Ainsi, le chapitre suivant va porter sur le concept de prédictivité des modèles et sur la validation des quatre modèles proposés dans cette thèse.

Chapitre 8

Prédictivité des modèles et application à la

prévision de la charge secteur

8.1 Introduction

Nous avons proposé quatre modèles non-paramétriques permettant de prévoir en fonction des variables explicatives, les instants de passage des aéronefs en des points de leur trajectoire de vol prévue. A travers ce chapitre, nous visons un objectif double :

• Le premier consiste à évaluer la performance des modèles développés sur leur capacité de prévision en situation réelle du trafic.

• Le deuxième consiste à proposer un horizon temporel de prévision des instants de passage des aéro-nefs sur les points de leur trajectoire de vol prévue et à calculer la charge des secteurs de l’espace aérien par ces modèles.

Ces modèles ne pourront être utiles que s’ils sont dynamiques et peuvent fonctionner en prenant en compte l’évolution du trafic en temps réel. Ainsi, il est important de bien définir un horizon temporel d’utilisation qui soit compatible avec les objectifs visés et atteignables pour une gestion optimale du trafic. Cet horizon de prévision doit prendre en compte les délais de détection des problèmes dans le trafic et du temps néces-saire pour y apporter efficacement des actions correctives appropriées. Rappelons que le but premier de la prévision du trafic est d’anticiper sur les variations futures des flux avec le plus de précision possible. Au final, la question posée est : En utilisant un ou plusieurs des modèles proposés, peut-on prévoir le trafic ? Si oui, sur quel horizon temporel de prévision ? Telle est la question cruciale à laquelle nous voulons, au travers de ce chapitre, proposer une réponse.

Le chapitre est organisé comme suit. Le paragraphe (8.2) est consacré aux indicateurs d’évaluation des modèles. Le paragraphe (8.3) définit la notion de prédictibilité du trafic en en proposant une métrique pour cette étude. Ainsi, le théorème du rapport des vraisemblances monotone est présenté. Nous détaillons les conditions d’application de ce théorème et construisons ensuite les régions de prédictivité des modèles. Dans le paragraphe (8.4) nous proposons une estimation de la distribution de probabilité des résidus des

différents modèles par un mélange de lois gaussiennes. Le paragraphe (8.5) se focalise à la prévision de la charge d’un secteur de l’espace aérien par les différents modèles proposés. Une approximation de l’horizon de prévision est donnée ainsi que celle de la largeur de la fenêtre de prévision. Enfin, le paragraphe (8.6) conclut le chapitre.