• Aucun résultat trouvé

Tests sur des donn´ees issues des ´etudes de Syrokko

3.3 Les cas d’utilisation d’HistSyr

3.4.2 Tests sur des donn´ees issues des ´etudes de Syrokko

3.4.2.1 ´Etude de l’influence des conditions environnementales sur les mesures de

corrosion

Cette ´etude entre dans le cadre d’un projet ANR APPLET ”Dur´ee de vie des ouvrages : Approche Pr´edictive PerformantielLE et probabilisTe ” [17,34]. Cette ´etude visait `a apporter une r´eponse aux probl`emes pos´es par la disparit´e des mesures de corrosion r´ealis´ees `a diff´erentes saisons. Les exp´eriences ont ´et´e r´ealis´ees sur diff´erents prismes de b´eton vieillis de fac¸ons diff´erentes (T(T´emoin), G(chlorures au gˆachage), I (chlorures par immersion/s´echage) et C (carbonatation)) afin de prendre en compte les divers modes de corrosion. Chaque prisme de b´eton est d´ecrit par :

• L’agression : T, G, I, C

• La grandeur potentiel libre ou Ecorr qui donne une id´ee qualitative de la probabilit´e de corrosion.

• La grandeur r´esistance de l’enrobage, Re qui indique la chute ohmique du mat´eriau b´eton arm´e. Plus cette valeur est importantes plus le mat´eriau est r´esistant (b´eton plus compact, plus mouill´e, non pollu´e par des esp`eces ioniques, etc...).

• La densit´e de courant de corrosion, Jcorr qui fourni de mani`ere quantitative, la valeur de corrosion instantan´ee de l’armature dans des conditions donn´ees. Plus cette valeur est grande plus la corrosion est active c’est `a dire plus l’armature se corrode.

Dans cette ´etude nous avons utilis´es HistSyr pour transformer les trois variables continues (Ecorr, Jcorr et Re) en histogrammes en prenant l’agression comme classe d’individus. Ces histogrammes ont ´et´e par la suite compar´es aux histogrammes construits `a partir de seuils fix´es par des experts du domaine.

La figure 2.13 repr´esente les diff´erents histogrammes obtenus, o `u Jcorr Hist4, Re Hist5 et Ecorr Hist3 repr´esentent les r´esultats de HistSyr et Jcorr limit4, Re limit5 et Ecorr limit3 repr´esente les histogrammes construits suivant les seuils des experts. Nous constatons que les histogrammes r´esultats de HistSyr sont plus discriminants que les autres. Ces histogrammes ont ´et´e utilis´es dans la suite de cette ´etude pour d´ecrire les agressions.

FIGURE2.13 – Application de HistSyr sur les donn´ees de l’´etude APPLET. Jcorr Hist4,

Re Hist4 et Ecorr Hist3 sont les r´esultats de l’application de la m´ethode HistSyr. Alors que Jcorr limit4, Re limit4 et Ecorr limit3 sont issues du d´ecoupage propos´e par des experts du domaine.

3.4.2.2 ´Etude des trajectoires de prise en charge des cancers dans la r´egion

bourgogne

Cette ´etude entre dans le cadre d’un contrat d’´etude au titre de ”Contrat Projet Etat R´egion (CPER) 2007-2013” du Conseil R´egional de Bourgogne avec plusieurs organismes dont le CHU de Dijon. Il s’agit de l’´etude des trajectoires de prise en charge des patients atteints d’un cancer [88]. Pour chaque type de cancer, 2 tables de donn´ees sont fournies :

• La table des patients o `u chaque ligne correspond `a un patients et contient entre autres la s´equence des ´etablissements fr´equent´es.

• La table des s´ejours o `u chaque ligne correspond `a un s´ejour d’un patient dans un ´etablissement hospitalier.

Afin de r´epondre aux questions concernant l’identification de la relation entre les diff´erents modes de sorties et les trajectoires des patients. Nous avons essay´e de caract´eriser chaque mode de sortie ”mod out” par les variables explicatives existantes dans les deux fichiers de donn´ees. Puisque ces derni`eres contiennent des variables continues num´eriques (age in et sej len tot, pour les fichiers des patients), nous avons utilis´e HistSyr, EWD et EFD pour la construction des histogrammes en prenant la variable ”mod out” comme classe symbolique.

FIGURE2.14 – Application d’HistSyr, d’EWD et d’EFD pour la conversion des variables

”age in” et ”sej len” en histogrammes dans le cadre de l’´etude du mode de sortie des patients atteints d’un cancer colorectal.

colorectal. A partir de cette figure nous remarquons que les histogrammes r´esultats de l’application d’HistSyr sont plus discriminants que les autres histogrammes. Nous constatons aussi que l’ˆage du patient est la variable la plus discriminante pour le mode de sortie.

4

Conclusion

La transformation des donn´ees du classique au symbolique est une ´etape primordiale dans le processus de l’ADS. Cette ´etape se base sur le choix de la classe d’individus et sur l’agr´egation des variables descriptives qualitatives et quantitatives en donn´ees symboliques. G´en´eralement, une variable quantitative est automatiquement transform´ee en intervalles de valeurs. Ceci est d ˆu au fait que l’agr´egation de ce type de variable en histogrammes est une op´eration d´elicate. Afin de simplifier cette agr´egation et de la rendre accessible et automatique, nous avons mis en place la m´ethode ”HistSyr”. Cette m´ethode a pour but de convertir une variable continue en histogrammes les plus discriminants pour les classes. Elle offre `a l’utilisateur la possibilit´e de cr´eer des histogrammes `a partir de variables continues et d’apporter des modifications `a des histogrammes existants. L’efficacit´e de cette m´ethode a ´et´e prouv´ee en comparant ces r´esultats aux histogrammes issus d’autres m´ethodes de discr´etisation.

L’outil ”HistSyr” impl´ementant cette m´ethode ainsi que d’autres m´ethodes de discr´etisation existantes a ´et´e cr´e´e afin d’enrichir le logiciel Syr pour extraire des donn´ees symboliques conservant le maximum d’informations `a partir de bases classiques.

Dans le chapitre suivant nous pr´esentons une nouvelle m´ethode de construction d’arbres de d´ecision symbolique qui entre dans le cadre de la deuxi`eme ´etape d’ADS. Cette m´ethode a donn´e naissance `a un nouveau module dans le logiciel Syr qui est ”SyrTree”.

Arbre de d´ecision symbolique SyrTree

1 Introduction . . . . 83 2 Arbres de d´ecision . . . . 83