• Aucun résultat trouvé

6.6 Evaluation des différents modèles

6.6.1 Le classeur PrediRec_Resultat

L’onglet « Fiche signalétique »

La Figure 6-7 illustre l’onglet « Fiche signalétique ». Le rôle de cet onglet est de résumer quelles sont les variables qui ont été utilisées pour le test, quel est le nom de celui-ci, à quelle date il a eu lieu et quel a été l’algorithme de prédiction utilisé.

Giotta Mathieu 46 / 77 Imprimé le 19 décembre 2007

HES-SO Valais, décembre 2007

Figure 6-7 : Exemple d’une fiche signalétique L’onglet « Données »

Cet onglet peut être partagé en deux parties (Figure 6-8) :

• La première partie, de la ligne 2 à la ligne 161, contient :

o en vert clair, les valeurs des attributs que nous souhaitons approximer

SIMAV PrediRec ICHV – Sion

En complément des valeurs évaluées par les deux méthodes, nous avons complété l’onglet « Données » avec plusieurs calculs :

pour les deux méthodes de prévision :

o la différence entre l’estimation du « Total Facture » et sa valeur réelle o la différence entre l’estimation du « CW pondéré » et sa valeur réelle

o 11 colonnes pour classer, en tranches de 100 Sfr., la différence en francs entre l’estimation du « Total Facturé » et la recette réelle

o 12 colonnes pour classer, en paliers de 20 % s’étalant de -100 % à + 100 %, les différences en % entre le « Total facture » et sa valeur réelle

o la différence en % du « Total facture » estimé par rapport à celui réel o la différence en % du « CW Pondéré » estimé par rapport à celui réel

• La deuxième partie, de la ligne 165 à 176, contient plusieurs calculs permettant de comparer les méthodes RSV et PrediRec. Les calculs ci-dessous ont été exécutés une fois avec les valeurs relatives des différences et une autre fois avec les valeurs absolues de ces différences :

o les centiles 10 / 25 / 50 / 75 / 90, le minimum, la moyenne et le maximum des différences (« Total Facture » estimées moins « Total Facture » réel) des

« Total Facture » en francs

o les centiles 10 / 25 / 50 / 75 / 90, le minimum, la moyenne et le maximum des différences (« CW Pondéré » estimées moins « CW Pondéré » réel) des

« CW Pondéré »

o les centiles 10 / 25 / 50 / 75 / 90, le minimum, la moyenne et le maximum des différences (« Total Facture » estimées moins « Total Facture » réel) absolues des « Total Facture » en francs

o les centiles 10 / 25 / 50 / 75 / 90, le minimum, la moyenne et le maximum des différences (« CW Pondéré » estimées moins « CW Pondéré » réel) absolues des « CW Pondéré »

o la différence en % de la somme des « Total Facture » estimées par rapport aux « Total Facture » réels

o la différence en % de la somme des « CW Pondéré »estimées par rapport aux

« CW Pondéré » réels

Des filtres automatiques sont affichés au sommet de cet onglet, permettant ainsi de filtrer des cas non codés selon divers critères (Centre hospitalier, cibler les différences inférieures à tant, etc.).

Dans la deuxième partie de la Figure 6-8, nous avons ajouté un bouton permettant d’exécuter une macro VBA qui prépare les données pour le calcul car, en cas d’utilisation de filtres MS Excel, ne sait pas mettre à jour automatiquement les centiles et tous les autres calculs.

Figure 6-8 : Exemple de l’onglet « Données »

Dans un souci de compréhension et d’aide à la navigation, les mêmes couleurs sont reprises dans les graphiques et les tableaux des onglets suivants.

Giotta Mathieu 48 / 77 Imprimé le 19 décembre 2007

HES-SO Valais, décembre 2007

L’onglet « Graphiques_TotalFacture »

Cet onglet réunit différents graphiques permettant de comparer visuellement la différence entre les méthodes RSV et PrediRec.

Au début de la première page, nous affichons, dans un ordre différent, les calculs de la deuxième partie de la Figure 6-8.

Figure 6-9 : Tableau récapitulatif des différences

Figure 6-10 : Tableau récapitulatif des centiles des différences

En dessous des tableaux récapitulatifs (Figure 6-9 et Figure 6-10), nous trouvons deux graphiques représentants les droites de régression des deux méthodes (Figure 6-11).

Ce graphique nous permet d’évaluer la précision des modèles utilisés. Un critère d’évaluation choisis est le R2 de la droite de régression.

Figure 6-11 : Graphique de la droite de régression

A la suite du graphique de la droite de régression, nous affichons un autre graphique (Figure 6-12) comparant les résultats des méthodes RSV et PrediRec par rapport aux résultats attendus. De plus, ce graphique est trié dans l’ordre croissant des différences en % de la méthode PrediRec et la valeur réelle.

SIMAV PrediRec ICHV – Sion

Figure 6-12 : Comparatif des estimations

Sur la page suivante, nous trouvons différents Box Plots représentant la dispersion des différences entre les valeurs estimées par les différentes méthodes par rapport aux valeurs escomptées.

Dans ce graphique, nous y affichons le centile 10 (le point plus à gauche du Box Plot), le centile 25 (la barre de gauche du rectangle) , le centile 50 (la barre rouge dans le rectangle, le centile 75 (la barre de droite du rectangle) et enfin le centile 90 (le point le plus à droite du Box Plot).

Les deux premiers Box Plots (Figure 6-13) représentent les différences relatives entre les valeurs prédites et les valeurs attendues.

Figure 6-13 : Box Plot des différences

Les deux derniers Box Plots (Figure 6-14) représentent les différences absolues entre les valeurs estimées et les valeurs réelles.

Figure 6-14: Box Plot des différences absolues

A la suite des Box Plots, nous trouvons le graphique suivant (Figure 6-15) qui groupe les cas non codés selon leur différence absolue en diverses tranches de 100 Sfr. :

• moins que 100 (<100) ;

• entre 100 et 499 (100 - 499) ;

• entre 500 et 999 (500 - 999) ;

Giotta Mathieu 50 / 77 Imprimé le 19 décembre 2007

HES-SO Valais, décembre 2007

• entre 1000 et 1999 (1000 - 1999) ;

• entre 2000 et 2999 (2000 - 2999) ;

• entre 3000 et 3999 (3000 - 3999) ;

• entre 4000 et 4999 (4000 - 4999) ;

• entre 5000 et 9999 (5000 - 9999) ;

• entre 10000 et 14999 (10000 - 14999) ;

• entre 15000 et 19999 (15000 - 19999) ;

• plus de 20000 (> 20000).

Figure 6-15 :Différence absolue par tranche

Le dernier graphique (Figure 6-16) affiche une courbe représentant les différences relatives groupées en classes de 20 % :

• plus de 100 % de différences sous estimées (-100 %) ;

• entre 100 % et 80 % de différences sous estimées (-100 - 80 %) ;

• entre 80 % et 60 % de différences sous estimées (-80 - 60 %) ;

• entre 60 % et 40 % de différences sous estimées (-60 - 40 %) ;

• entre 40 % et 20 % de différences sous estimées (-40 - 20 %) ;

• entre 20 % et 00 % de différences sous estimées (-20 - 00 %) ;

• entre 00 % et 20 % de différences sur estimées (00 - 20 %) ;

• entre 20 % et 40 % de différences sur estimées (20 - 40 %) ;

• entre 40 % et 60 % de différences sur estimées (40 - 60 %) ;

• entre 60 % et 80 % de différences sur estimées (60 - 80 %) ;

• entre 80 % et 100 % de différences sur estimées (80 - 100 %) ;

• plus de 100 de différences sur estimées (+100 %).

Ce graphique permet de vérifier que les résultats du modèle d’analyse sont bien distribués de manière normale (selon un courbe de Gauss) autour d’un mode se situant le plus proche possible de 0.

SIMAV PrediRec ICHV – Sion

Figure 6-16 : Différence par classe de 20 % L’onglet « Graphiques_CW »

Cet onglet reprend et affiche tous les graphiques de l’onglet « Graphiques_TotalFacture », sauf celui de la Figure 6-15 « Différence ABS par classe ».

Tous les graphiques de l’onglet représentent les « CW pondéré » en lieu et place des « Total Facture ».

L’onglet « FeuilleTravail »

Cet onglet nous sert à trier les cas non codés selon leur clé avant de les reprendre dans l’onglet « Données ».

Un exemple de fichier MS Excel se trouve sur le CD-ROM fourni avec ce rapport de projet.

Il est situé dans le dossier « Documents annexes » et se nomme

« PrediRec_Resultat_Test_024_02_MDT.xls »

Giotta Mathieu 52 / 77 Imprimé le 19 décembre 2007

HES-SO Valais, décembre 2007

Documents relatifs