• Aucun résultat trouvé

Chapitre 4 : Prise en compte du relief dans l’estimation de la ressource solaire 101

4.2 Modélisation de l’influence du relief

4.2.3 Modélisation de l’horizon

4.2.3.3 Distance caractéristique et optimisation de la procédure

La plupart des outils numériques permettant le calcul de l’horizon, qu’ils soient spécialisés comme le logiciel français Carnaval, ou qu’ils soient intégrés à un logiciel SIG, comme le modèle r.horizon (Hofierka et al., 2007) inclus dans le module r.sun (Šúri et Hofierka, 2004) du logiciel GRASS GIS, laisse le choix de la distance maximale de recherche autour du point d’observation à l’utilisateur. Cependant, il apparaît de prime abord que la rotondité de la Terre délimite intrinsèquement l’altitude minimale d’un point du relief, de sorte qu’au-delà d’une distance donnée entre celui-ci et le point d’observation, celui-ci soit nécessairement au dessous du plan horizontal P. Ce phénomène est parti-culièrement visible sur la FIGURE4.5, où l’on constate qu’au-delà d’un certain angle entre la normale −

nA et la normale −→nB, l’élévation angulaire αAB devient négative et n’appartient donc plus à l’horizon observé depuis A.

Distance caractéristique

On peut donc, pour faire suite à cette constatation, introduire la notion de distance caractéristique, ou autrement dit la distance maximale utile de recherche de points du MNT, appartenant potentiel-lement à la ligne d’horizon maximale. Dans notre modèle, la zone de recherche de l’horizon est une matrice MNT rectangulaire de largeur ∆λ et de hauteur ∆ϕ, centrée sur le point d’observation défini

Chapitre 4 : Prise en compte du relief dans l’estimation de la ressource solaire

dans le système (λ ,ϕ). L’objectif est donc ici de retrouver la zone caractéristique de calcul d’un ho-rizon, c.-à-d. la zone maximale utile de recherche de largeur ∆λmax et de hauteur ∆ϕmax, au-delà de laquelle l’élévation angulaire d’un point du MNT est nécessairement négative ou nulle.

Pour ce faire, on peut, dans un premier temps, exprimer les relations qui permettent de retrouver l’angle ϕ − ϕA sur un méridien (longitude constante), et l’angle λ − λA sur un parallèle (latitude constante), entre un point M quelconque, de coordonnées (λ ,ϕ,h) et de grande normale N, et le point d’observation A, tels que αAM = 0. L’élévation angulaire devenant nulle lorsque l’angle entre la normale −→nA et le vecteur −→AMest égal à π

2, cela revient à résoudre les deux équations suivantes : −→nA·−→AM

λ =λA

= 0 et −→nA·−→AM ϕ=ϕA

= 0 (4.18)

De la symétrie de révolution de l’ellipsoïde découle une solution explicite à l’équation selon le parallèle :

|λ − λA|ϕ=ϕA = δ λ (h)|ϕ = arccos (NA+ hA) cos2ϕA− (h − hA) sin2ϕA (NA+ h) cos2ϕA



(4.19)

En revanche, l’asymétrie de l’ellipse méridienne ne permet pas de retrouver une équation explicite de l’arc ϕ − ϕA; on trouve une relation implicite reliant les latitudes ϕ et ϕA:

(N + h) cos(ϕ− ϕA) + (NAsinϕA− N sinϕ)e2sinϕA− (NA+ hA) = 0 (4.20) Si cette équation peut être résolue numériquement (processus itératif, dichotomie), il est toutefois plus intéressant d’utiliser une approximation locale pour obtenir une solution explicite ; celle-ci est réalisée en assimilant l’ellipse méridienne à un cercle, dont le rayon est le rayon de courbure principale de l’ellipsoïde dans la direction du méridien (Bosser, 2012). Le terme central de l’équation précédente disparait alors (excentricité nulle) et les grandes normales en A et en M sont remplacées par le rayon ρ de l’approximation sphérique locale calculé en A :

|ϕ − ϕA|λ =λA = δ ϕ(h)|λ = arccos ρ + hA ρ + h



(4.21)

Où le rayon de courbure principale ρ, dans la direction du méridien, est donné par la relation suivante :

ρ = a 1 − e2 1 − e2sin2A)32

(4.22)

Dans ce cas particulier, M est un point quelconque situé soit sur le méridien, soit sur le parallèle passant par A ; mais on peut aisément généraliser ces deux relations à n’importe quel point de coor-données (λ + δ λ (h)|ϕ, ϕ + δ ϕ(h)|λ, h), sachant que l’on aura donc toujours αAM 60. On peut alors utiliser cette méthodologie pour retrouver la largeur ∆λmax et la hauteur ∆ϕmax de la zone maximale utile de recherche. Pour ce faire, on retrouve les points matérialisant les frontières dans les quatre directions cardinales, MN(λMN, ϕMN, hMN) au nord, ME(λME, ϕME, hME) à l’est, MS(λMS, ϕMS, hMS) au sud et MO(λMO, ϕMO, hMO) à l’ouest, visibles sur la FIGURE4.7, pour lesquels les conditions suivantes sont encore respectées :

4.2 Modélisation de l’influence du relief          0 6 ϕMN− ϕA6δ ϕ(hMN)|λ & λMOMNME 0 6 ϕA− ϕMS 6δ ϕ(hMS)|λ & λMOMSME 0 6 λA− λMO6δ λ (hMO)|ϕ & ϕMS 6ϕMO6ϕMN 0 6 λME− λA6δ λ (hME)|ϕ & ϕMSMEMN (4.23)

Ces conditions étant couplées entre elles, on détermine les coordonnées des points de chaque frontière par itération. Finalement, on en déduit les dimensions de la zone :

∆ϕmax = ϕMN− ϕMS et ∆λmax= λME− λMO (4.24) Quel que soit l’horizon recherché, il sera alors parfaitement défini par cette zone rectangulaire, de hauteur ∆ϕmax et de largeur ∆λmax, centrée sur le point d’observation considéré. Subséquemment, on peut alors, de la même façon, déterminer le MNT utile de la République de Djibouti, présenté dans la FIGURE 4.2, c.-à-d. le relief au-delà duquel il n’est plus nécessaire de regarder pour obtenir tous les horizons du pays avec une précision maximale.

Réduction du temps de calcul

Si l’on connait désormais, pour chaque point du MNT considéré, la taille maximale de la zone de recherche associée au calcul de l’horizon, une autre problématique apparait cependant de facto : plus cette zone est grande et plus le temps de calcul d’un horizon est élevé. Dès lors, si l’on veut que le processus total de désagrégation reste efficient, il est essentiel de réduire le temps de compilation des horizons de l’entièreté du MNT, tout en gardant une précision acceptable. Cette optimisation requiert donc de réduire la surface des zones de recherche utilisées dans le calcul des horizons, puis d’évaluer, d’une part, le temps d’exécution correspondant et, d’autre part, l’erreur engendrée par rapport au modèle idéal, sachant que l’on cherche à minimiser les deux.

Pour ce faire, il nous faudrait compiler les horizons du pays pour une zone de taille (∆ϕmax, ∆λmax) et n zones de différentes tailles (∆ϕi, ∆λi)i=1,2,...,n plus faibles, puis déterminer l’erreur spécifique correspondante (RMSE). Évidemment, dans l’optique de minimiser le temps de calcul du processus complet, il serait particulièrement peu pertinent que la méthode destinée à retrouver un paramètre du modèle soit plus coûteuse que l’exécution du modèle lui-même. Aussi, afin d’éluder cet écueil, on peut faire appel aux inférences statistiques, ou autrement dit retrouver les caractéristiques les plus significatives de la distribution totale de cette erreur à travers le territoire, telles que la moyenne ou l’écart-type, en nous basant sur un ou des échantillons plus restreints tirés de celle-ci.

En matière d’inférence statistique, estimer le paramètre θ d’une population F, constituant un en-semble d’observations, revient à déterminer la statistique ˆΘ, ou estimateur, variable aléatoire prenant la valeur ˆθ pour chaque échantillon construit aléatoirement à partir de F (Walpole et al., 2011). Dans le cas de la moyenne µ d’une population F de distribution inconnue, il résulte du théorème central limite (TCL) que la distribution des valeurs ¯x de la statistique ¯X, moyenne d’un échantillon aléatoire x = {x1, x2, . . . , xn} de taille n issu de F, suit une loi approximativement normale centrée sur µ. Ce-pendant, la précision de l’erreur standard et des intervalles de confiance d’une estimation ¯x de µ est fortement dépendante de la forme de la distribution de la population originelle ; de même pour l’es-timateur S2 de la variance σ2, qui suit une loi du χ2 si et seulement si l’échantillon est issu d’une population suivant une loi approximativement normale (Walpole et al., 2011).

Chapitre 4 : Prise en compte du relief dans l’estimation de la ressource solaire

indépendante de la forme de la distribution, ou non paramétrique, et conservant une précision im-portante malgré des échantillons de taille réduite. Une démarche bien adaptée aux caractéristiques de notre problème est celle du bootstrap (Efron et Tibshirani, 1993), qui repose sur le principe sta-tistique du plug-in : approcher le paramètre θ d’une distribution quelconque F, tel que θ = t(F), à partir de l’estimation ˆθ d’une distribution empirique ˆF, échantillon de n observations choisies aléa-toirement parmi F, telle que ˆθ = t( ˆF). Néanmoins, si l’on peut apprécier θ à partir d’un échantillon de la population, il nous faut également connaitre l’erreur commise sur cette estimation : c’est là l’idée centrale du concept du bootstrap. Ce dernier consiste dans le ré-échantillonnage de ˆF, c.-à-d. le tirage avec remise, au sein de la population empirique, de B échantillons aléatoires ˆF∗(b) de taille n, avec b = 1,2,...,B, appelés échantillons bootstrap. On utilise alors la distribution des B valeurs ˆθ∗(1), ˆθ∗(2), . . . , ˆθ∗(B), estimations de chaque échantillon bootstrap telles que ˆθ∗(b)= t( ˆF∗(b)), autour de ˆθ, pour estimer l’erreur standard ou l’intervalle de confiance de l’estimation ˆθ (Efron et Tibshirani, 1993 ; Singh et Xie, 2010).

Afin d’évaluer, en première instance, la diminution de l’erreur avec le temps de calcul de l’hori-zon, nous avons d’abord considéré des zones de recherche carrées pour 10 largeurs différentes, de 10 à 100 km par pas de 10 km. Le choix arbitraire d’une zone carrée traduit la volonté d’éluder au maxi-mum les écueils d’un paramétrage trop excessif, qui pèserait sur le temps de compilation ; par ailleurs, les distances sont données en kilomètres pour faciliter la compréhension, et le pas de 10 km évite le traitement d’un trop grand nombre d’horizons. Par la suite, la première étape de la procédure consiste dans la sélection d’un échantillon aléatoire de n = 50 points au sein du pays, sur lesquels chaque hori-zon est déterminé pour les différentes tailles de hori-zone précitées ainsi que pour la hori-zone caractéristique. En évaluant la RMSE de chacun de ces horizons vis-à-vis de l’optimum, on obtient un échantillon de 50 erreurs indépendantes ˆE = {e1, e2, . . . , e50} pour chaque distance d = 10 · k où k = 1,2,...,10, qui représente une estimation plug-in de la distribution totale E des erreurs. Le diagramme en boîte de la FIGURE 4.8 nous donne alors une indication sur la distribution de l’erreur commise, fortement asymétrique, ainsi que sur son évolution en fonction de la taille de zone considérée et donc du temps consommé.

On peut ainsi utiliser ce diagramme afin d’évaluer la distance de recherche d’un horizon corres-pondant au meilleur compromis entre précision et temps de calcul. Bien évidemment, selon le degré de fidélité désiré et les moyens informatiques à disposition, ce compromis ne sera pas nécessairement le même d’une étude à l’autre. Dans notre cas, le temps de calcul est exprimé pour un seul processeur et peut être approximativement divisé par le nombre de cœurs disponibles sur la machine considé-rée en utilisant un processus parallélisé. Si les valeurs limites peuvent être de fait exclues (erreur ou temps trop élevés), on constate graphiquement qu’un saut existe dans l’étalement de l’erreur entre 60 et 70 km, et c’est donc cette dernière qui a été employée dans cette thèse.

Une fois la zone définie, on recherche alors l’erreur probablement commise sur le calcul d’un horizon quelconque du pays, ce qui revient à estimer la moyenne µE et l’écart-type σE de la distribu-tion associée E. Pour cela, on construit un nouvel échantillon aléatoire empirique de n = 200 erreurs

ˆ

E = {e1, e2, . . . , e200}, correspondant à d = 70 km, à partir duquel on tire aléatoirement avec remise, et comme préconisé par Singh et Xie (2010), B = n2échantillons bootstrap ˆE∗(b)= {e1, e2, . . . , e200} où b = 1,2,...,B. On détermine ensuite la moyenne ¯e∗(b)et l’écart-type s∗(b)e de chacun de ces échan-tillons, leur distribution permettant de retrouver la précision de ¯e et se, statistiques construites sur la population empirique et qui infèrent les paramètres µE et σE de la population globale. Une mé-thode simple pour appréhender les intervalles de confiance est celle des percentiles, mais l’asymétrie et le biais qui existent au sein de la distribution d’un écart-type (Walpole et al., 2011) désignent la procédure BCa (bias-corrected and accelerated) développée par Efron (1987) comme la meilleure

4.2 Modélisation de l’influence du relief 0 0.5 1 1.5 0.013 0.028 0.052 0.094 0.14 0.19 0.26 0.33 0.4 0.5

Temps de calcul moyen (s)

Erreur (°)

10 20 30 40 50 60 70 80 90 100

Largeur de la zone de recherche (km)

Médiane

Écart interquartile Valeurs adjacentes Valeurs extrêmes

FIGURE 4.8 – Diagramme en boîte de l’erreur commise vis-à-vis de l’horizon idéal, en fonction de l’étendue de la zone de recherche utilisée et du temps de calcul moyen associé.

alternative. L’utilisation classique des percentiles approche, pour un niveau de signification α, l’inter-valle de confiance de l’estimation ˆθ considérée à (1 −2α)%, sous la forme [ ˆθ∗(α), ˆθ∗(1−α)], où ˆθ∗(α) indique le 100αième percentile des B estimations bootstrap ˆθ∗(1), ˆθ∗(2), . . . , ˆθ∗(B). La méthode BCa est une amélioration de cette première approximation, où les bornes de l’intervalle sont cette fois de la forme [ ˆθ∗(α1), ˆθ∗(α2)], où α1et α2 sont ajustées par rapport à α et 1 − α à l’aide de la fonction de répartition de la loi normale, afin de corriger le biais et l’asymétrie de l’estimateur considéré (pour le calcul de α1et α2, voir Efron et Tibshirani (1993) et Efron (1987)).

On peut donc finalement estimer que la distribution E de l’erreur de modélisation e commise sur un horizon quelconque calculé au sein de Djibouti, pour une zone de recherche de côté d = 70 km, suit une loi e ∼ µE, σE2 avec :

 µE ∈ [0,024°, 0,039°]

σE ∈ [0,043°, 0,067°] (4.25) Où l’intervalle de confiance de µE et de σE correspond à un niveau de signification α = 5%.

4.2.3.4 Comparaison et validation