• Aucun résultat trouvé

2.5 Les extensions possibles

2.5.1 La r´ egression par morceaux

2.5.1.1 Pr´ esentation

Les mod`eles lin´eaires introduits pr´ec´edemment permettent de repr´esenter des variations quel-conques de tendances des donn´ees observ´ees, aussi bien pour les valeurs modales que pour les impr´ecisions. Cependant, du fait de la structure mˆeme des mod`eles, dont la forme math´ematique est une fonction affine, la variation repr´esent´ee ne peut ˆetre qu’unique sur l’ensemble des donn´ees.

Or, dans une application r´eelle, il est rare que les donn´ees pr´esentent une ´evolution rigoureuse-ment lin´eaire, et identique sur l’ensemble de la plage d’´etude.

Afin de rem´edier `a cela, il est possible de chercher `a identifier non plus un unique mod`ele sur les donn´ees, mais une collection de sous-mod`eles, toujours lin´eaires, chacun d’entre eux permettant de repr´esenter une variation diff´erente des autres [8].

Le mod`ele global est recherch´e sous la forme :

ˆ Y (x) = S X k=1 [Ak0⊕ Ak1 (x − shif tk)] 1[xk min,xk max] (2.59) o`u : • P

repr´esente la somme de plusieurs intervalles flous ;

• Ak0 et Ak1, k = 1, ..., S, sont des intervalles flous trap´ezo¨ıdaux ; • shif tk∈ {xk

min, xkmax} est une valeur r´eelle de d´ecalage appliqu´e sur l’entr´ee x ; • 1[xk

min,xk

max] repr´esente la fonction ´egale `a 1 sur l’intervalle [xkmin, xkmax], et nulle partout ailleurs.

Le mod`ele global est donc compos´e de S sous-mod`eles lin´eaires. Afin que chacun d’entre eux b´en´eficie des avantages pr´esent´es dans les sections pr´ec´edentes, ces sous-mod`eles sont bien en-tendu `a param`etres flous trap´ezo¨ıdaux et `a entr´ee d´ecal´ee, permettant donc d’obtenir l’inclusion totale recherch´ee et de repr´esenter tout type de variation de l’impr´ecision.

Les sous-mod`eles sont ici ind´ependants les uns des autres. Ainsi, chacun d’entre eux a son propre domaine de d´efinition, sa propre valeur de d´ecalage, et ses propres param`etres, totalement ind´ependants de ceux des autres sous-mod`eles. Par cons´equent, ils peuvent ˆetre identifi´es puis utilis´es en pr´ediction ind´ependamment les uns des autres.

La structure g´en´erale du mod`ele ´etant maintenant fix´ee, il reste `a d´efinir une strat´egie d’iden-tification. L’approche propos´ee se d´ecompose en deux phases, la premi`ere d´edi´ee `a la segmenta-tion des donn´ees d’identification, la seconde `a l’identification des param`etres des sous-mod`eles.

L’objectif de la premi`ere phase de segmentation des donn´ees est d’obtenir les jeux d’´echantillons pour chacun des sous-mod`eles. On suppose ici que le nombre S de segments est d´etermin´e a priori. Chacun des sous-mod`eles pouvant repr´esenter une variation quelconque des valeurs modales, ainsi qu’une variation quelconque des impr´ecisions, il est n´ecessaire ici de segmenter les donn´ees selon les changements de tendance de ces deux grandeurs. Le principe est illustr´e sur la figure 2.23.

La premi`ere ´etape de la segmentation va donc concerner les valeurs modales des observations, permettant ainsi de d´egager les principales tendances des donn´ees. Sur chacun des domaines ainsi obtenus, une deuxi`eme segmentation est r´ealis´ee, cette fois sur les variations des impr´ecisions.

segment 2 segment 1 segment 3 segment 1 segment 2 Segmentation des valeurs modales Segmentation des imprécisions

Fig. 2.23: Une vue sch´ematique du principe de segmentation

Il est important de remarquer ici que, si l’on cherche `a segmenter un ensemble d’observations formalis´ees par des intervalles flous, les deux segmentations successives sont r´ealis´ees sur des valeurs r´eelles pr´ecises. En effet, aussi bien les Noyaux kYj que les Radius RSYj sont des nombres pr´ecis. Ainsi, l’algorithme utilis´e dans cette phase n’a pas `a ˆetre d´evelopp´e dans un environne-ment impr´ecis, une approche classique, comme celle propos´ee par Keogh et al. [38] est tout `a fait appropri´ee et utilis´ee dans ces travaux.

Suite `a cette phase de segmentation, l’utilisateur dispose de S jeux d’observations, chacun d’entre eux permettant d’identifier un sous-mod`ele lin´eaire flou. La phase d’identification est alors r´ealis´ee en utilisant la technique r´egressive pr´esent´ee auparavant (cf. synth`ese 5).

Au final, l’utilisateur dispose d’une collection de sous-mod`eles lin´eaires flous, chacun ´etant d’impr´ecision minimale sur son domaine, respectant l’inclusion des observations dans les pr´edictions, et repr´esentant des variations quelconques des valeurs modales et des impr´ecisions. Ces sous-mod`eles optimaux sont regroup´es dans le mod`ele global (2.59).

Il est important ici de souligner que la strat´egie propos´ee de d´ecomposition d’un mod`ele global en sous-mod`eles locaux n’assure en rien l’optimalit´e du mod`ele global. Elle permet n´eanmoins d’aborder simplement le cas o`u un unique mod`ele lin´eaire ne permet pas une repr´esentation utile de l’information. Il est clair que la continuit´e entre sous-mod`eles n’est g´en´eralement pas assur´ee. D’une part, leurs domaines de d´efinition respectifs sont potentiellement disjoints, voire

´

eloign´es, d’autre part il est probable que les sorties estim´ees aux points de jonction entre deux sous-mod`eles soient tr`es diff´erentes dans la mesure o`u c’est justement une diff´erence sur les observations correspondantes qui a dirig´e la segmentation.

continuitéassurée continuité non assurée

Fig. 2.24: Continuit´e du mod`ele global ?

La recherche de continuit´e du mod`ele global n’est pas abord´ee dans ces travaux. Une ap-proche simple, illustr´ee `a la figure 2.24, consisterait `a rajouter, pour l’identification du mod`ele k + 1, une contrainte d’´egalit´e avec la sortie produite par le mod`ele k pr´ealablement identifi´e. Cette fa¸con de faire va cependant `a l’encontre de la philosophie g´en´erale de notre approche, en d´egradant fortement la qualit´e du mod`ele global en terme d’impr´ecision. Une approche plus r´ealiste n´ecessiterait de mettre en place un m´ecanisme d’interpolation entre sous-mod`eles adja-cents.

Pour r´esumer, l’approche de r´egression lin´eaire floue par morceaux pr´esent´ee ici permet d’ob-tenir sur un jeu de donn´ees quelconques un mod`ele global de bonne qualit´e, quoique g´en´eralement non continu. En effet, chacun des sous-mod`eles `a d´ecalage le composant pr´esente une bonne repr´esentativit´e, tout en garantissant l’inclusion recherch´ee et une impr´ecision optimale sur son domaine de d´efinition.

Du point de vue de l’utilisateur, cette approche est ais´ee `a prendre en main. En effet, la tech-nique d’identification s’applique sur chacun des sous-ensembles d’observations, ind´ependamment les uns des autres. De plus, ces sous-ensembles sont obtenus lors d’une phase de segmentation dis-soci´ee de l’identification proprement dite. Par cons´equent, cela ne complexifie pas outre mesure le processus global d’identification. Le dernier point concerne l’ind´ependance des sous-mod`eles qui restent donc utilisables de mani`ere autonome.