• Aucun résultat trouvé

Modélisation du risque d’obsolescence basé sur l’apprentissage supervisé

CHAPITRE 2 DÉMARCHE MÉTHODOLOGIQUE

2.3 Démarche conceptuelle des outils de prévision d’obsolescence

2.3.2 Modélisation du risque d’obsolescence basé sur l’apprentissage supervisé

rédiger les trois articles de journaux. Des articles de conférence sont ajoutés aux annexes I à III, dans le but de supporter davantage le sujet de recherche et le cheminement méthodologique. Ils contribuent aussi à développer les réponses aux objectifs spécifiques pour aider à développer les approches proposées.

2.3.2.1 Étude préliminaire : comparaison des algorithmes

La première phase de la conception consiste à mener une comparaison entre les algorithmes de réseaux de neurones artificiels, Adaboost, machine à vecteurs de support, forêt aléatoire et arbre de décision qui sont capables de prévoir le risque d’obsolescence en se basant sur l’apprentissage supervisé afin d’estimer le meilleur prédicteur. Cette étude a été réalisée et documentée dans un article de conférence présenté dans l’annexe I, intitulé « Obsolescence forecasting strategy of technological components - A comparative study of algorithms » et présenté à la conférence « 7th IESM Conference, October 11 – 13, 2017, Saarbrücken, Germany ». En effet, le choix des algorithmes a été basé sur une analyse de la littérature pour distinguer les meilleurs algorithmes de prévision.

La démarche méthodologique suit les étapes suivantes : 1) la collection des données. Les données sont collectées à partir d’une base de données disponible qui fournit des informations sur les caractéristiques techniques des composants électroniques ainsi que leurs statuts (en production ou obsolète), plus de 700 composants ont été collectés. 2) Par la suite, les données sont divisées en deux groupes aléatoires, soit 2/3 pour l’entraînement et 1/3 pour le test et la validation. L’échantillon est introduit ensuite dans l’algorithme pour construire le modèle de

prévision à partir de l’entraînement de l’échantillon. 3) La sortie du modèle est présentée par une matrice de confusion donnée par le Tableau 2.1.

Tableau 2.1 Matrice de confusion tiré de Grichi et al. (2017)

Algorithmes Actuel Obsolète En production Erreur

BP-NN Obsolète 12 9 21% En production 16 60 SVM Obsolète 9 12 22% En production 9 67 AdaBoost Obsolète 53 26 25% En production 32 110 RF Obsolète 10 11 19% En production 7 69 Decision tree Obsolète 53 26 24% En production 27 115

Les résultats ont montré que RF a surpassé les autres algorithmes avec la meilleure précision. Il est à noter que les algorithmes montrent une amélioration de la précision lorsque la taille de l’échantillon augmente à l’entrainement.

2.3.2.2 Prévision d’obsolescence basée sur l’algorithme forêt aléatoire

La deuxième phase de la conception est consacrée à développer un modèle de régression basé sur la forêt aléatoire pour prévoir la tendance de l’obsolescence. Le modèle réagi sur la corrélation entre la date d’introduction et d’autres caractéristiques techniques. Cette étude a été réalisée et documentée dans un article de conférence, intitulé « A random forest method for obsolescence forecasting » et présenté à la conférence « IEEE International Conference on Industrial Engineering and Engineering Management (IEEM) 2017, Singapore ».

La Figure 2.2 présente le fonctionnement de la forêt aléatoire pour construire le modèle de prévision.

Figure 2.2 Mécanisme de l’algorithme forêt aléatoire Tirée de Grichi et al. (2017)

L’échantillon est divisé en deux sous-ensembles. Le premier comprend généralement 70% des données et il est utilisé pour entrainer les données, c'est ce qu'on appelle l'ensemble d'apprentissages. Le deuxième sous-ensemble comprend 30% des données et il est utilisé pour le test et la validation du modèle. L’ensemble d'apprentissages est introduit dans le RF pour créer le modèle prédictif. Ensuite, les paramètres du modèle sont estimés. Pour chaque nœud

terminal, ces étapes seront répétées jusqu'à ce que le nombre d'arbres soit spécifié et que la taille minimale du nœud soit obtenue. L'étape finale est l'estimation de l'erreur OOB pour le modèle et finalement la sortie est présentée comme un ensemble d'arbres (Tb).

La sélection des paramètres constitue une étape importante dans la conception de l’algorithme. Pour le modèle du forêt aléatoire dans la prévision de l'obsolescence, trois paramètres sont requis. En effet, pour chaque nœud le tirage des variables se fait sans remplacement et uniformément parmi toutes les p variables explicatives (chaque variable a une probabilité 1/p à être choisie). Le nombre m qui représente le nombre de variables tirées aléatoirement à chaque nœud, est fixé au début de la construction du forêt et est identique pour tous les arbres.

2.3.2.3 Optimisation de la prévision de l’obsolescence

À partir des résultats de la comparaison entre les algorithmes de l’apprentissage machine, l’étape suivante de la méthodologie est consacrée à l’amélioration de la performance de l’algorithme forêt aléatoire. En effet, la littérature et l’étude expérimentale ont révélé quelques limites par rapport à la prévision avec l’apprentissage machine, et ce, au niveau de la sélection des variables. La méthode vise à intégrer un algorithme métaheuristique dans le modèle de forêt aléatoire pour optimiser les paramètres et les variables appropriées. Le modèle est donné par la Figure 2.3.

La construction du GA-RF suit plusieurs étapes. Premièrement, les paramètres et le modèle de la forêt aléatoire sont construits. Ensuite l’algorithme génétique et les paramètres associés sont intégrés pour construire le modèle GA-RF. Une étude expérimentale est réalisée basée sur les données collectées auparavant pour la comparaison des algorithmes. Pour examiner la faisabilité de cette approche de même que les résultats, cette partie présente une comparaison entre GA-RF, RF, GBM, ainsi que la régression logistique pas à pas, sous forme d’une matrice de confusion.

Figure 2.3 Architecture du modèle GA-RF tirée de Grichi et al. (2018)

2.3.3 Modélisation du risque d’obsolescence basé sur l’apprentissage non-supervisé

Documents relatifs