• Aucun résultat trouvé

ii Calcul des probabilités et des effets locaux

Dans le document Effets masqués en analyse prédictive (Page 82-88)

F. Applications de la méthode AEL

F.1. ii Calcul des probabilités et des effets locaux

Voici la description des deux étapes suivantes de la méthode AEL : le calcul des probabilités de choix par individu, et celui des effets locaux par critères de choix.

Calcul des probabilités de choix

La deuxième étape de calcul de la fonction de probabilité est immédiate pour l’analyse discriminante qui fournit en sortie une évaluation de la probabilité de choix pour chaque individu.

Concernant les SVMs linéaires, nous appliquons la méthode décrite dans la section E.4. Afin de donner autant de détails que possible sur cette application, nous proposons ci-dessous la figure F.1.1. qui donne la probabilité affectée à chaque individu, en fonction de la distance du point représentant cet individu à la surface de classification issue des SVMs, d’après la méthode de maximisation de la vraisemblance de Platt (2000) présentée précédemment.

Figure F.1.1. Calcul des probabilités de choix pour les SVMs linéaires

Le graphique affiche, en fonction des valeurs de sortie des SVMs linéaires, la courbe de probabilité empirique (en bleu) et la sigmoïde obtenue par la méthode de Platt (en vert) pour estimer la probabilité de choix de chaque individu. Cette sigmoïde servira par la suite, pour les SVMs linéaires, de fonction de probabilité de choix p dans le calcul des effets locaux.

Application de FANOVA

Pour le jeu de données Orange Juice, nous allons noter de la manière suivante les critères de choix afin de rendre les formules aussi lisibles que possible.

x(1) = MM Price x(2) = CH Price x(3) = Loyalty x(4) = MM Disc x(5) = CH Disc

Commençons d’abord par le cas de l’analyse discriminante. L’application de l’ANOVA fonctionnelle permet de décomposer la fonction de probabilité de choix en une somme de fonctions monovariées dépendant des critères de choix ci-dessus. Nous appellerons ces fonctions monovariées les contributions de chaque critère.

La décomposition de la fonction de décision est la suivante :

Dans l’expression de ces contributions, la notation φi correspond au i-ième polynôme de Legendre, comme cela a été précédemment indiqué dans la sous-section E.5.i.

A partir de ces contributions, nous allons pouvoir déterminer les effets relatifs locaux (et leurs écarts-type), suivant la méthode indiquée dans la sous-section E.5.ii., consistant à calculer les moyennes (simples) des contributions ci-dessus par bin.

Ils sont présentés dans le tableau ci-dessous :

Tableau F.1.3. Effets relatifs locaux (Fisher)

Pour nous aider à lire ces résultats de manière pratique, nous avons besoin d’une représentation graphique de l’ensemble des effets sur l’ensemble des bins. Cette représentation ne reportera pas les écarts-type qui devront être consultés dans le tableau ci-dessus.

Spectre AEL

Nous avons mis en place une méthode de représentation des effets relatifs locaux permettant d’avoir une lecture directe des résultats d’une analyse AEL. Les bins sont ordonnés de 1 à 8, et la composition des effets au sein de chaque bin est représentée par une barre verticale. Chaque barre est composée des effets locaux relatifs des critères de choix, donc la somme est toujours égale à 100%. Ainsi chaque barre représente, pour chaque bin, l’influence de chacun des critères dans le choix des individus, ou pour être plus précis une décomposition de la part prévisible du choix des consommateurs suivant les critères de choix étudiés (les variables de prédiction utilisées). Les influences négatives (jouant en défaveur de l’option de choix étudiée) sont représentées en-dessous de l’axe des abscisses, alors que les influences positives (jouant en faveur de l’option de choix étudiée) sont représentées au-dessus.

Dans la partie gauche du graphe (bins 1 à 4) on peut analyser des critères de choix des consommateurs ayant une plus grande probabilité de choisir MM que CH, de ceux dont le choix est le plus prévisible en faveur de MM (bin 1) à ceux dont le choix l’est le moins (bin4). Dans la partie droite du graphe (bins 5 à 8), une analyse des critères de choix des consommateurs ayant une plus grande chance de choisir CH, cette fois de ceux dont le choix est le moins prévisible en faveur de CH (bin 5) à ceux dont le choix l’est le plus (bin 8).

Figure F.1.2. Spectre AEL pour Orange Juice (Fisher)

En faisant de même à partir des résultats issus de SVMs linéaires, on obtient les contributions suivantes :

Ces contributions nous permettent de calculer les effets relatifs locaux par bin. Ils sont donnés dans le tableau F.1.4. ci-dessous :

Tableau F.1.4. Effets relatifs locaux (SVMs)

On peut remarquer que les valeurs des effets sont proches de celles obtenues précédemment dans le tableau F.1.3. ce qui signifie que les fonctions de probabilité issues de l’analyse discriminante et des SVMs linéaires ont des structures sous-jacentes proches et que l’analyse FANOVA met en évidence ces similarités.

En comparant la figure F.1.3. ci-dessous à la précédente, on constate que les principales différences portent sur les bins 4 et 5. Ceci s’explique par le fait que c’est pour les individus à la marge que l’on a observé le plus de différences entre ces méthodes de classification (comme indiqué dans la sous-section F.1.i.).

Figure F.1.3. Spectre AEL Orange Juice (SVMs) Note sur le nombre de bins

Afin de choisir le nombre définitif de bins, nous calculons les effets locaux relatifs des variables de prédiction dans plusieurs cas de figure, de 2 à 10 bins.

Nous avons ainsi recalculé, pour différents nombres de bins, les estimations des effets locaux relatifs et leurs variances respectives, obtenues par bootstrap (suivant les mêmes paramètres qu’Evgeniou et al. 2005). Ces variances nous permettent de connaître le niveau d’incertitude dans la mesure des effets, car il s’agit de la variance des estimations de ces effets. Comme indiqué auparavant, il s’agit de faire un compromis entre le niveau de description que nous voulons obtenir (nombre de bins) et l’incertitude liée à cette description (variance des estimations des effets). Ici, nous décidons de fixer le nombre de bins à 8 pour arbitrer entre la variance moyenne de l’estimation de l’effet local relatif de Loyalty (qui décroît entre 6 et 10 bins) et celle de MM Price (qui augmente entre 6 et 10 bins), qui sont les critères de choix dont les effets sont les plus importants en moyenne.

On pourra confirmer, à partir des analyses qui suivent dans la section F.1.iii. concernant les tests d’égalité entre les effets, que ce choix de 8 bins nous donne une description assez précise des bins. En effet, la plupart des différences entre effets sont significatives, et il n’est donc pas nécessaire de passer de 8 à 6 (ou 4) bins pour avoir des résultats directement interprétables.

Dans le document Effets masqués en analyse prédictive (Page 82-88)