• Aucun résultat trouvé

Chapitre 3 Prise en compte de donn´ ees secondaires 61

3.4 Quantification de l’apport d’information

Un probl`eme essentiel de l’approche reste la fiabilit´e de la donn´ee secondaire choisie. En effet, dans le cadre d’une ´etude de cas r´eel, il n’est pas possible de disposer d’une surface de r´eponse de r´ef´erence pour juger de la qualit´e de l’interpolation. Or, comme montr´e sur les exemples pr´ec´edents et sachant que le nombre de points correspondant `a la donn´ee primaire est n´ecessairement petit, l’impact de la variable secondaire est important. Ainsi, une m´ethodologie convaincante et applicable doit permettre de r´epondre aux deux questions suivantes :

– Parmi toutes les simulations alternatives ou donn´ees secondaires possibles, quelle est la plus appropri´ee pour le probl`eme ´etudi´e ?

– Comment d´eterminer si l’information secondaire consid´er´ee am´eliore effectivement la qua-lit´e des pr´edictions ?

3.4.1 Mesure de “Root Mean Square Error ”

Pour r´epondre `a ces questions, nous avons d´evelopp´e une approche bas´ee sur la technique de la validation crois´ee (ou “cross-validation”). Cette m´ethode de validation statistique qui consiste `a partitionner les donn´ees en deux sous-ensembles : le premier sert dans la construction de la surface de r´eponse, tandis que le second est pr´eserv´e afin de confirmer et valider la qualit´e de l’interpolation. Les deux ensembles sont, de fa¸con g´en´erale, appel´es respectivement ensemble d’entraˆınement (ou “training set”) et ensemble de test (ou “testing set”). Diff´erentes variantes de la validation crois´ee existent suivant la taille de l’ensemble de test, que la validation soit r´ep´et´ee avec diff´erentes partitions et qu’il y ait remise ou non des points lors du calcul d’une nouvelle partition. La validation permet alors d’obtenir une mesure de l’erreur de pr´ediction pour chacun des points de donn´ee. Ces erreurs sont exprim´ees ensuite sous la forme d’une mesure globale comme, par exemple, la racine carr´e de la moyenne des erreurs de pr´ediction au carr´e (ou RMSE, “Root Mean Square Error ”) afin de juger de la qualit´e de la surface de r´eponse.

L’analyse propos´ee consiste `a effectuer une validation crois´ee des surfaces de r´eponse construites avec et sans la ou les donn´ee(s) secondaire(s) et de comparer les valeurs de pr´edictivit´ee. Ainsi, il est attendu que :

– si une donn´ee secondaire n’apporte pas d’information, la RMSE ne devrait pas changer ; – si l’information apport´ee est contradictoire, cette valeur devrait augmenter ;

– si la donn´ee est informative, cette valeur devrait diminuer.

Dans notre cas, la m´ethode de validation crois´ee est de type “jackkniffe”, dans laquelle `a chaque it´eration seul un point du jeu de donn´ee est retir´e. Tandis que la mesure de pr´edictivit´e du mod`ele est bas´ee sur le RMSE.

3.4.2 Validation

Afin de tester cette technique d’analyse, la fonction F(x,y), (´equation (3.9)) est de nouveau choisie. Ici :

– les donn´ees primaires sont reparties suivant un hypercube latin comprenant 20 points o`u la fonction F(x,y) est ´evalu´ee ;

– la donn´ee secondaire est toujours une surface de r´eponse ´egale `a la fonction F(x,y) elle-mˆeme.

Ensuite, deux cas d’´etude sont successivement consid´er´es :

– le premier suit une approche classique et ne prend pas en compte la donn´ee secondaire ; – l’autre suit la m´ethode propos´ee. En outre, afin de simuler diff´erentes sources de donn´ees

alternatives de qualit´e diverses, un bruit al´eatoire est ajout´e `a la surface de r´eponse cor-respondant aux donn´ees secondaires. Ce bruit est g´en´er´e suivant une loi uniforme dont l’amplitude varie de± 0. (i.e. aucun bruit) `a ± 1.5 (figure (3.6)).

La m´ethode de construction est l’interpolation lisse discr`ete avec contrainte de gradient constant comme rugosit´e et une contrainte de d´eriv´ee seconde. L’´evolution de la mesure RMSE de la validation crois´ee en fonction de l’amplitude du bruit est rapport´ee table (3.7). Ces r´esultats montrent que cette technique permet de quantifier l’apport des donn´ees secondaires dans la

Fig.3.5 – R´esultat de l’interpolation lisse discr`ete dans le cas o`u aucune donn´ee secondaire n’est consid´er´ee, la mesure de RMSE vaut alors 0,625.

(a) Amplitude du bruit : 0 (b) Amplitude du bruit : 0.5 (c) Amplitude du bruit : 1

Fig. 3.6 – Exemples de donn´ees secondaires plus ou moins bruit´ees. Les surfaces de r´eponse construites avec ces donn´ees ont pour valeur de RMSE : 0.492, 0.582 et 0.692, respectivement.

Coeff. Bruit 0. 0.25 0.5 0.75 1.0 1.25 1.5

RMSE 0.492 0.527 0.582 0.639 0.692 0.741 0.785

Fig.3.7 – ´Evolution de la mesure RMSE en fonction de l’amplitude du bruit ajout´e `a la variable secondaire.

construction des surfaces de r´eponse : la pr´edictivit´e du mod`ele (c’est-`a-dire l’inverse de la mesure RSME) augmente avec leur prise en compte (la RMSE passe de 0.625 `a 0.492). Cette technique de mesure de pr´edictivit´e semble en outre ˆetre capable de distinguer si les donn´ees secondaires sont bruit´ees ou non : la RMSE augmente de 0.492, s’il n’y a pas de bruit, `a 0.785 dans le cas contraire.

Cette technique semble donc bien efficace pour mesurer la pr´edictivit´e d’une surface de r´eponse ainsi que l’apport des donn´ees secondaires. Cependant, deux probl`emes se posent : (1) le nombre de points o`u est connue la donn´ee primaire est limit´e, ce qui nuit `a la robustesse de la mesure RSME et, (2) cette approche n’inclut, pour le moment, aucun test statistique pour comparer les mesures de RMSE obtenues et permettre de d´eterminer les valeurs significativement diff´erentes.

Fig.3.8 – Version modifi´ee du mod`ele de r´eservoir SPE 10.