• Aucun résultat trouvé

Modélisation de la température de l’eau en rivière à l’aide du modèle additif généralisé et comparaison avec d’autres approches statistiques.

N/A
N/A
Protected

Academic year: 2021

Partager "Modélisation de la température de l’eau en rivière à l’aide du modèle additif généralisé et comparaison avec d’autres approches statistiques."

Copied!
92
0
0

Texte intégral

(1)

Université du Québec

Institut National de la Recherche Scientifique Centre Eau Terre Environnement

MODÉLISATION DE LA TEMPÉRATURE DE L’EAU EN

RIVIÈRE À L’AIDE DU MODÈLE ADDITIF GÉNÉRALISÉ ET

COMPARAISON AVEC D’AUTRES APPROCHES

STATISTIQUES

Par Fatima Laanaya

Mémoire présenté pour l’obtention du grade de Maître ès sciences (M.Sc.)

en Sciences de la Terre

Jury d’évaluation

Examinateur externe Khader Khadraoui

Université Laval

Examinateur interne Normand Bergeron

INRS-Eau-Terre-Environnement

Directeur de recherche André St-Hilaire

INRS-Eau-Terre-Environnement

Codirecteur de recherche Erwan Gloaguen

INRS-Eau-Terre-Environnement

(2)
(3)

REMERCIEMENTS

La réalisation de ce mémoire a été possible grâce au concours de plusieurs personnes à qui je voudrais témoigner toute ma reconnaissance.

Je voudrais tout d’abord adresser toute ma gratitude à mon directeur de recherche Monsieur André St-Hilaire, professeur à l’INRS-ETE, de m’avoir accueillie dans son équipe et d’avoir accepté de diriger ce travail. Sa rigueur scientifique, sa disponibilité et ses qualités humaines m’ont profondément touchée.

Mes remerciements s’adressent également à mon codirecteur Monsieur Erwan Gloaguen, professeur à l’INRS-ETE, pour avoir accepté de co-superviser ce travail.

Je tiens à remercier également le directeur de programme Monsieur Pierre-Simon Ross, professeur à l’INRS-ETE, pour l’honneur qu’il m’a fait en acceptant de m’intégrer au programme de maîtrise en sciences de la terre dans un moment difficile de ma carrière de recherche.

Qu’ils puissent trouver dans ce travail le témoignage de ma sincère gratitude et de mon profond respect.

Mes remerciements les plus chaleureux vont à tous mes camarades à l’INRS pour leurs encouragements, soutiens et pour l’ambiance agréable tout au long de cette maîtrise.

Finalement, mes remerciements les plus sincères vont aussi à mon mari et à mes enfants, qui ont toujours su m’encourager et me soutenir le long de cette belle expérience de recherche.

(4)
(5)

RÉSUMÉ

La prévision du processus thermique en rivière implique le développement et l’application des approches appropriées aptes à produire des prédictions précises et stables. Cette prévision peut se faire à base de deux catégories de modèles, déterministes et statistiques. La modélisation statistique est un outil qui nécessite moins d’intrants. Elle permet de quantifier les effets des conditions hydrométéorologiques (ex. température de l’air, débit, …) sur la température d’un cours d’eau et d’évaluer l’impact de cette dernière sur la qualité et la quantité des ressources aquatiques. Le but de cette étude est de tester l’applicabilité du modèle additif généralisé (MAG) à simuler la température de l’eau et de mettre en valeur son intérêt en le comparant à deux approches statistiques paramétriques déjà existantes, soit le modèle logistique et le modèle de régression des résidus1. La revue de littérature a montré que le modèle MAG, un modèle non paramétrique, n’a pas été exploré par des études antérieures de la température de l’eau. Il a l’avantage d’être très flexible pour capter la tendance présentée par les données. C’est un outil de modélisation très populaire dans les études environnementales et épidémiques. Le modèle a été évalué sur des données d’un site de la rivière Ste-Marguerite (Canada), une rivière ayant une population de saumon Atlantique, qui préfère les eaux relativement froides. Les moyennes journalières enregistrées sur ce site de la température de l’eau, de l’air et le débit couvrent la période de 2007 à 2013. La comparaison des trois modèles MAG, logistique et régression des résidus est effectuée selon trois indices d’évaluation, l’erreur de prévision (the root mean square

1 Ce modèle de régression de résidus a souvent été appelé stochastique, bien qu’il ne le soit pas statistiquement

parlant. Cette nomination inappropriée est une confusion en modélisation thermique entre le modèle autorégressif d’ordre 2 et le modèle de régression linéaire des résidus de la température de l’eau et les effets retardés d’ordre 1 et 2 des résidus de la température de l’air.

(6)

vi

error : RMSE), le biais (B) et le coefficient de Nash-Sutcliff (Nash-Sutcliffe coefficient of effeciency : NSC). En utilisant la technique de validation croisée, ces indices ont été calculés pour chaque année et pour toute la période d’étude. Les résultats de cette procédure ont montré que le modèle MAG performe mieux, suivi par la régression des résidus suivie par le modèle logistique.

(7)

TABLE DES MATIÈRES

1 INTRODUCTION ... 1 1.1 MISE EN CONTEXTE ...3 1.2 LES IMPACTS ANTHROPIQUES ...4 1.2.1 Changements climatiques (CC) ... 4 1.2.2 Les barrages... 5 1.2.3 La coupe forestière ... 7

1.3 VARIABLES INFLUENÇANT LA TEMPÉRATURE DE L’EAU ...8

1.4 MODÉLISATION DE LA TEMPÉRATURE DE L’EAU ...9

1.5 OBJECTIFS DE L’ÉTUDE ...12

2 SYNTHÈSE DES RÉSULTATS ... 15

2.1 INTRODUCTION ...17

2.2 MÉTHODOLOGIE ...18

2.1 DONNÉES ET SITE D’ÉTUDE ...21

2.2 RÉSULTATS ...22 2.3 DISCUSSION ...26 3 ARTICLE ... 29 ABSTRACT ...33 RÉSUMÉ ...34 3.1 INTRODUCTION ...35

3.2 WATER TEMPERATURE MODELS ...37

(8)

viii

3.4.1 Generalized additive model ... 42

3.4.2 Comparison with other models ... 45

3.4.3 Model evaluation and validation ... 47

3.5 RESULTS ...48

3.5.1 GAM model ... 49

3.5.2 Logistic model ... 55

3.5.3 Residual regression model ... 56

3.5.4 Comparative study ... 57

3.6 DISCUSSION AND CONCLUSIONS ...61

REFERENCES ...65

4 CONCLUSIONS ET RECOMMANDATIONS ... 71

(9)

LISTE DES TABLEAUX

Table 3.1 : Number of non-missing data by year and period for the three variables water and air temperatures and flow ... 41 Table 3.2 : Significance of effects ... 50 Table 3.3 : Results of the cross validation water temperature (°C) modeling expressed by RMSE,

(10)
(11)

LISTE DES FIGURES

Figure 3.1 : Watershed Sainte-Marguerite River with location of hydrometric station, weather

station and thermographs (s1, s2, s3, respectively) ... 40

Figure 3.2 : Average daily water and air temperatures from 2007 to 2013 ... 49

Figure 3.3 : Average daily flows from 2007 to 2013 ... 49

Figure 3.4 : Estimated smoothing function, the x-axis shows the values of Air temperature and the y-axis represents the contribution of the fitted values ... 51

Figure 3.5 : Estimated smoothing function, the x-axis shows the values of flow and the y-axis represents the contribution of the fitted values ... 51

Figure 3.6 : Estimated smoothing function the x-axis shows the values of day of year and the y-axis represents the contribution of the fitted values ... 52

Figure 3.7 : Normal Q-Q plot of GAM residuals... 54

Figure 3.8 : Normal distribution of GAM residuals ... 54

Figure 3.9 : Residuals versus estimated water temperature ... 55

Figure 3.10 : Relation between daily mean water temperature and mean air temperature and a fitted logistic function ... 56

Figure 3.11 : Mean daily water temperature, annual component estimated by sinusoidal function and the residual component ... 57

Figure 3.12 : Scatterplot of observed versus predicted values from the GAM for the season of May to October (2007 to 2013) ... 60

Figure 3.13 : Scatterplot of observed versus predicted values from the logistic for the season of May to October (2007 to 2013) ... 60

(12)

xii

Figure 3.14 : Scatterplots of observed versus predicted values from residuals regression for the season of May to October ... 61

(13)
(14)
(15)

1.1 Mise en contexte

Le régime thermique des cours d’eau est un facteur important pour les écosystèmes aquatiques (Acuña & Tockner, 2009; Cairns et al., 1978). En effet, les températures élevées diminuent les concentrations en oxygène (Ozaki et al., 2003; Secondat, 1952) et augmente celles des polluants (Ficke et al., 2007). En particulier, Whitehead et al., (2009) rapporte que la température de l’eau a un impact sur la qualité de l’habitat du poisson. Plusieurs études se sont intéressées aux impacts et conséquences du changement thermique des cours d’eau sur les poissons préférant les eaux froides du fait que leur niche d’habitat thermique est plus restreinte que les poissons plus tolérants aux variations thermiques (Brett, 1979; Britton et al., 2010; Eaton & Scheller, 1996). Ainsi, il a été prouvé que la variation de la température de l’eau a des impacts sur la répartition des espèces en milieu fluvial (Ebersole et al., 2003; Edwards & Cunjak, 2007; Magnuson et al., 1979; Vannote et al., 1980). De plus, les périodes les plus chaudes de l’année provoquent un stress thermique chez plusieurs espèces de poissons (Isaak et al., 2012). La réponse à ce stress chez les salmonidés ne dépend pas uniquement de la température absolue de l’eau, mais aussi de la rapidité avec laquelle la température de l’eau augmente (Quigley & Hinch, 2006). Par conséquent, lors d’une hausse importante de celle-ci, ces espèces vont chercher, lorsqu’ils sont disponibles, des refuges thermiques pour se protéger (Baird & Krueger, 2003; Dugdale et al., 2013). En revanche, les organismes aquatiques ont des limites de tolérance aux variations thermiques. Dans le cas de l’exposition à des températures dépassant ce seuil de tolérance les poissons sont soumis à un stress physiologique voire même une mortalité. Même en deçà du seuil létal, une exposition à des températures élevées peut générer des conséquences sur leurs croissance, reproduction et résistances aux maladies (Crozier et al., 2008; Martins et al., 2012).

(16)

4

En outre, un taux important de mortalité des poissons, dû à la hausse des températures, peut avoir un impact négatif sur la pêche (Macdonald et al., 2010) et sur le reste de la chaîne alimentaire.

1.2 Les impacts anthropiques

De nombreuses études portent sur l’identification des impacts anthropiques modifiant le régime thermique des cours d’eau. Certains impacts ont une influence considérable comme l’urbanisation, l’agriculture, les effluents thermiques. Nelson et Palmer (2007) ont montré un accroissement de 7 °C de la température des cours d’eau urbains suite à un ruissellement de surfaces imperméables, avec une augmentation moyenne de 3.5 °C. Peu d’études ont traité l’impact de l’agriculture au Canada. Cependant, l’effet de l’aménagement agricole se traduit souvent par la coupe de la végétation ligneuse en bordure des cours d’eau ce qui les rend plus exposés à la radiation solaire incidente, ainsi qu’au ruissellement ce qui occasionne un réchauffement (Grégoire & Trencia, 2007). Concernant les effluents thermiques des stations énergétiques ou nucléaires, leur impact se résume à une augmentation de la température de l’eau causée par le rejet de l’eau ayant servi aux refroidissements (Prats et al., 2012), comme dans le cas de certains tronçons de la Loire en France (Moatar & Gailhard, 2006). Nonobstant, les principaux impacts anthropiques étudiés jusqu’à présent sont ceux associés aux changements climatiques, à la présence de barrages et à la coupe forestière.

1.2.1 Changements climatiques (CC)

Selon le Groupe d’experts intergouvernemental sur l’évolution du climat (GIEC), le climat change, tant au Canada que partout ailleurs dans le monde. Ce fait est accepté par tous les spécialistes, ainsi que par la plupart des décideurs. L’impact de l’Homme sur ces changements est encore sujet à des controverses politiques, mais, encore une fois, l’ensemble des spécialistes

(17)

est unanime sur la causalité entre l’activité anthropique et les changements. Les dernières évaluations internationales confirment le changement de nombreux paramètres, par exemple l’augmentation des températures de l’air et des océans (GIEC, 2013). Plusieurs autres études mettent en évidence l'augmentation de la température des eaux des rivières (Arismendi et al., 2012; Ducharne, 2008; Ficklin et al., 2013; Kaushal et al., 2010; Morrill et al., 2005). L’impact écologique le plus notable du réchauffement climatique est la migration d’espèces intolérantes aux températures chaudes vers des altitudes et latitudes plus élevées, répondant à leurs préférences thermiques (Parmesan & Yohe, 2003; Walther et al., 2002). Une autre conséquence de ces CC est l’augmentation de la température des eaux douces à l’échelle planétaire. Ainsi, l’étude de Van Vliet et al., (2011) prévoit une hausse moyenne globale de la température de l’eau de 2.6 °C pour une augmentation de 4 °C de celle de l’air. Ce changement thermique de l’eau a une incidence directe sur les conditions de l’habitat des organismes poïkilothermes (Hari et al., 2006). En effet l’étude de Daufresne et al., (2009) démontre l’existence d’une relation directe entre l’augmentation de la température et la réduction de la taille de ces organismes. De même, l’étude de Caldwell et al., (2015), menée sur 61 sites au sud-est des É -U., a estimé une augmentation de 0.11 °C/décennie de la moyenne annuelle de la température de l’eau historique (1961-2010). Ceci semble peu, alors que les projections entre 2011 et 2060 ont suggéré une augmentation de 0.41 °C/décennie.

1.2.2 Les barrages

Des changements dans les signaux thermiques dus à la présence des réservoirs hydrauliques peuvent perturber le cycle de vie des organismes aquatiques (Lowney, 2000). En effet, certains barrages modifient le régime thermique des cours d’eau en aval de la structure de retenue (Olden & Naiman, 2010; Webb, 1996). Leurs effets dépendent du type d’ouvrage, du mode de gestion et

(18)

6

de la position de la prise d’eau, du volume du réservoir (Bartholow et al., 2004) et de la stratification de la colonne d’eau dans les réservoirs (Webb & Walling, 1997). Le mode de gestion notamment le moment du relâchement et le volume d’eau relâché influencent également le régime thermique (Toffolon et al., 2010). Ainsi, la position des prises d’eau modifie la température de l’eau en relâchant de l’eau chaude (épilimnique) ou froide (hypolimnique) issue, de la surface ou de la profondeur respectivement, des réservoirs stratifiés (Olden & Naiman, 2010). L’étude de Webb et Walling (1997) en Angleterre, a exploré les données de la température de l’eau d’une rivière régulée et a détecté une hausse de la moyenne de la température, une diminution des valeurs estivales maximales et une réduction des fluctuations journalières.

L’influence des retenues sur la température de l’eau des rivières est présentée par un effet de lissage des cycles journaliers et/ou annuels de la température de l’eau en aval (Liu et al., 2005). En Australie, Preece et Jones (2002) ont noté que la température maximale annuelle a diminué de 5°C et se produisait trois semaines plus tard par rapport à celle observée avant la construction du barrage. Par contre Singer et Gangloff (2011) ont remarqué un réchauffement de la température moyenne mensuelle tout au long de l’année suit à l’installation d’un petit barrage sur une rivière en Alabama. Aussi, l’étude de Maheu et al., (2015) à l’est du Canada a démontré le même constat concernant l’impact des barrages de stockage sur la température de l’eau à l’été et à l’automne.

Enfin, la simulation de l’étude de Poirel et al., (2010), qui porte sur l’influence des barrages-réservoirs sur la température de l’eau en aval des ouvrages, confirme une hausse de la température de l’eau estivale liée à la hausse des températures de l’air et d’une baisse marquée des débits.

(19)

1.2.3 La coupe forestière

De nombreuses études ont examiné l’impact de la coupe forestière sur la thermie des cours d’eau (St-Hilaire et al., 2015). Hannah et al., (2008) ont démontré que la coupe forestière riveraine influence la température de l’eau. La récolte de la bande riveraine mène à une augmentation de la radiation solaire incidente et par conséquent une hausse de 6 °C à 7 °C de la température de l’eau aura lieu (Moore et al., 2005). Généralement, le retour à une densité de végétation semblable à celle qui existait avant la coupe prend en moyenne 15 à 20 ans (Moore et al., 2005). Une comparaison, des cours d’eau exposés à la radiation solaire et ceux qui sont ombragés au Minnesota, révèle une différence de 2.5 °C de la température moyenne hebdomadaire (Blann et al., 2002). Aussi, une augmentation entre 1.4 °C et 4.4 °C de la moyenne hebdomadaire de la température maximale a été observée dans les cours d’eau du Maine où l’exploitation forestière a eu comme résultat l’élimination de la bande riveraine protectrice (Wilkerson et al., 2006). St-Hilaire et al., (2000) rapportent que dans le cas des évènements météorologiques extrêmes, la coupe forestière peut faire accroître la température journalière moyenne de 1°C. Cependant, Jones et al., (2006) ont noté qu’une bande de 30 m aide à conserver une température adéquate pour les salmonidés dans 63% des cours d’eau de Géorgie (É.-U.). Par contre une bande de 15 m a permis de maintenir une température adéquate dans seulement 9% des cours d’eau, alors qu’une coupe à blanc a conduit à une augmentation de 2 °C à 8 °C des fluctuations de la température diurne en été (Johnson & Jones, 2000). La coupe forestière peut indirectement augmenter la thermie des cours d’eau en raison de l’érosion qui élargit son lit et réduit sa profondeur (Beschta, 1997). D’autres paramètres de végétation, à savoir l’indice de surface foliaire, la hauteur moyenne des arbres et la largeur de la bande riveraine, sont fortement corrélés avec la température maximale du cours d’eau (Sridhar et al., 2004).

(20)

8

1.3 Variables influençant la température de l’eau

Les variations spatiales de la température de l’eau de rivière sont influencées par les composantes locales du climat (Mohseni et al., 1998; Sinokrot & Stefan, 1993), la structure géomorphologique (Caissie, 2006; Mosley, 1983), la topographie (Chen et al., 1998), le débit (Caissie, 2006), les interactions entre l’eau souterraine et l’eau de surface (Ward, 1985; Webb et al., 2008), et le couvert végétal du bassin versant et riverain (St-Hilaire et al., 2000). À titre d’exemple, la régression linéaire multiple de Segura et al., (2014) a démontré que la surface de drainage exerce un fort contrôle durant toutes les saisons, alors que l’effet des eaux souterraines n’était apparent que pour le printemps et l’automne. Toutefois, les eaux souterraines influencent négativement la température des cours d’eau, sauf durant l’hiver. Ils constatent également que l’élévation et la pente moyenne du bassin versant ont des effets négatifs pour l’ensemble des saisons, ce qui signifie que les bassins plus pentus ont tendance à avoir un régime thermique plus frais en raison de la réduction des temps d’exposition à la chaleur solaire sur l’eau de ruissellement sur les versants.

En revanche, les tendances temporelles dans la température de l’eau sont liées aux changements climatiques ainsi qu’aux activités humaines. En effet, la sensibilité de la rivière en réponse à ces facteurs est difficilement prévisible puisque les changements de la température peuvent être influencés par d’autres facteurs confondants (Garner et al., 2014). Cole et al. (2014) ont en effet introduit la température de l’air, la vitesse du vent, la pression atmosphérique, la radiation solaire, le point de rosée ainsi que l’humidité, et le couvert nuageux pour modéliser la température de l’eau. Néanmoins, la température de l’air demeure la variable la plus utilisée dans la modélisation de la température de l’eau en raison de la covariation spatiale et temporelle entre les deux températures (Guillemette et al., 2009; Li et al., 2014; Ouellet, 2011; Wehrly et al.,

(21)

2009). La relation température de l’eau – température de l’air n’est pas forcément linéaire, mais dépend aussi des conditions locales. Par exemple, la température de l’eau est influencée par le débit de la rivière (Caissie, 2006; Moatar & Gailhard, 2006; Webb et al., 2003). A contrario, les cours d’eau ayant de faibles débits sont plus affectés par les conditions atmosphériques (Van Vliet et al., 2011).

1.4 Modélisation de la température de l’eau

La modélisation et la prévision de la température de l’eau à l’échelle spatiale ou temporelle ont été explorées selon deux types de modèles. Les modèles physiques et les modèles statistiques (Benyahya et al., 2007; Caissie, 2006; Cole et al., 2014; Marceau et al., 1986). Les modèles physiques sont basés sur les processus physiques des échanges thermiques entre la rivière et son milieu naturel (Caissie et al., 2007; Cox & Bolte, 2007; Edinger et al., 1968; St-Hilaire et al., 2000). Ils sont typiquement développés pour des tronçons de cours d’eau, bien que certains l’aient été à l’échelle du bassin versant. Ils peuvent être utilisés pour prévoir les conséquences de modifications anthropiques sur les cours d’eau ou leur bassin versant, tels que la construction d’un barrage ou la coupe forestière. Cependant, ces modèles exigent un grand nombre d’intrants et la connaissance de plusieurs paramètres pour sa calibration (ex. la température de l’air, le point de rosée, la vitesse du vent, la radiation solaire, la géométrie du cours d’eau, …). Malgré le fait que les modèles déterministes puissent fournir des estimations précises de la température de l’eau, l’acquisition des données nécessaires n’est pas toujours évidente à l’échelle régionale (Mohseni et al., 1998; Risley et al., 2003).

De plus, les relations physiques entre les différentes parties du modèle peuvent être difficiles à modéliser en raison de l’hétérogénéité spatiale. Les modèles statistiques ou empiriques

(22)

10

fournissent une alternative intéressante si l’échantillonnage est exhaustif et sans biais. Ces derniers ne prennent pas en considération directement les sources et les puits des flux de chaleur, mais ils représentent le concept physique implicitement en se basant sur les corrélations sur un grand nombre de mesures entre un nombre relativement restreint de variables environnementales d’entrée et la température de l’eau (Caissie, 2006; Webb et al., 2008). Ils ont l’avantage de nécessiter moins de paramètres, peu de covariables, une durée du développement moins importante et des coûts réduits des données et d’exploitation (Eaton & Scheller, 1996; Mohseni et al., 1999). Par contre ils nécessitent de longues séries d’observations (Marceau et al., 1986). De multiples travaux de modélisation statistique de la température de l’eau ont déjà été effectués avec chacun ses forces et ses faiblesses. Parmi les méthodes statistiques, on peut citer :

1) Les modèles de régression paramétriques pour lesquels la relation est spécifiée de manière paramétrique a priori, comme les modèles de régression linéaires, stochastiques2 et le modèle non linéaire. Les modèles de régression linéaire basés sur l’hypothèse forte de linéarité, utilisent une seule variable explicative (souvent température de l’air) (Caissie et al., 2001; Erickson & Stefan, 2000; Segura et al., 2014; Smith, 1981; Webb et al., 2003) ou plusieurs variables explicatives (température de l’air, son effet retardé, débit, … ) (Ahmadi-Nedushan et al., 2007; Stefan & Preud'Homme, 1993b; Webb et al., 2003; Webb & Nobilis, 2007) pour prédire la température de l’eau. Ces derniers sont plus efficaces à l’échelle hebdomadaire et mensuelle qu’à l’échelle journalière du fait que les températures quotidiennes de l’eau sont susceptibles d’avoir une autocorrélation dans le temps (Caissie, 2006; Erickson & Stefan, 2000; Morrill et al., 2005; Pilgrim et al., 1998). Les modèles dits « stochastiques » décomposent les séries chronologiques

2

Bien que ce terme ait été souvent utilisé de manière inappropriée en modélisation thermique car il s’agit d’une régression linéaire multiple.

(23)

en une composante saisonnière et une résiduelle afin de produire les prévisions journalières de la température de l’eau (Ahmadi-Nedushan et al., 2007; Caissie et al., 2001; Caissie et al., 1998; Cluis, 1972; Kothandaraman, 1971). Le modèle de régression paramétrique non linéaire le plus utilisé, reliant la température de l’eau et celle de l’air, est le modèle logistique (nommé aussi sigmoïde) (Benyahya et al., 2007; Caissie, 2006; Caissie et al., 2001; Mohseni & Stefan, 1999; Mohseni et al., 1998; Segura et al., 2014). Ce modèle est adéquat sur des données hebdomadaires par contre il n’a pas donné un bon ajustement pour des données quotidiennes (Caissie et al., 2001; Mohseni & Stefan, 1999; Mohseni et al., 2003). Le modèle logistique fournit une bonne explication de l’effet d’hystérèse des températures de l’eau et de l’air. La relation non linéaire est convenable puisque la température de l’eau est moins sensible que la température de l’air pendant les saisons froides (température de l’air est inférieur à 0°C) due à l’altération du débit et au gel du cours d’eau. En revanche, pour les saisons chaudes, quand la température de l’air augmente, la température de l’eau augmente du même ordre à cause du taux élevé de l’évaporation (Li et al., 2014). Afin de remédier aux limitations de ces derniers, on utilise : 2) les modèles de régression non paramétriques pour lesquels la relation n’est pas spécifiée à priori. On peut citer l’approche des analogues ou K voisins les plus proches (K-Nearest Neighbours) comme exemple de modèles non paramétriques utilisés pour la prévision de la température de l’eau (Benyahya et al., 2008; St‐Hilaire et al., 2012). Ainsi, l’approche par réseaux de neurones artificiels (ANNs), qui sont des modèles non paramétriques, non additifs et assimilés à des modèles de régression non linéaires généralisés, ils apportent une nette amélioration des prévisions fournies par des modèles paramétriques (Bélanger et al., 2005; Chenard & Caissie, 2008; Daigle et al., 2014; Nohair et al., 2008; Sharma et al., 2008). Enfin, les modèles linéaires généralisés (GLM) combinés à la méthode non paramétrique des polynômes

(24)

12

locaux ont été utilisés pour modéliser la température de l’eau à la rivière Sacramento en Californie (Caldwell et al., 2014). Ils ont donné de bons résultats pour prédire le maximum journalier de la température de l’eau (É.-U.) (Caldwell et al., 2014).

1.5 Objectifs de l’étude

En général, les modèles de la température de l’eau sont prédictifs et non pas explicatifs. Cependant l’objectif visé par les études de la modélisation de la température est de trouver un modèle capable d’apprendre des données disponibles qu’on lui propose et d’offrir une bonne prédiction de la température de l’eau. Notre étude partage aussi cet objectif commun avec les études antérieures. Son objectif principal consiste à évaluer la performance du modèle MAG afin de maximiser la qualité de l’estimation de la température de l’eau en fonction de la température de l’air, tout en prenant en considération l’impact du débit sur la relation température de l’eau – température de l’air. Cette évaluation est basée sur la détermination de sa précision, son biais et son adéquation à travers sa comparaison à deux modèles populaires, le modèle logistique et le modèle de régression des résidus. Elle va permettre aussi de juger si le MAG peut être utilisé pour la gestion des ressources aquatiques et par les scientifiques qui s’intéressent à développer leur propre modèle.

Les travaux réalisés dans le cadre de cette maîtrise sont présentés sous forme d’un mémoire par article. Le second chapitre présente un résumé en français des travaux complétés et le contenu de l’article intitulé « Modeling the water temperature: comparison of the generalized additive model, logistic and residuals regression models ». le chapitre 3 présente l’article en anglais le chapitre 4 présente les conclusions et les recommandations du projet.

(25)

Cette étude a été réalisée sous la direction du professeur André St-Hilaire et la codirection du professeur Erwan Gloaguen. Le rôle de l’étudiante pendant la réalisation de ce projet a été de préparer les données (agrégation journalière, présentation graphique des données,…), procéder aux traitements statistiques, analyser et synthétiser les résultats et en dernier lieu rédiger l’article en tant que première auteure. Ces travaux ont été effectués sous l’encadrement du directeur et codirecteur de recherche, qui ont assuré un excellent suivi et orientation de la méthodologie utilisée. Ils ont évalué la précision et la fiabilité des résultats et des analyses statistiques en émettant des corrections, suggestions et commentaires.

(26)
(27)
(28)
(29)

2.1 Introduction

Comme il a déjà été mentionné, de nombreuses études ont montré l’existence d’un lien significatif entre les variations de la température de l’eau et celles de la température de l’air (Erickson & Stefan, 2000; Smith, 1981) et/ou débit (Moatar & Gailhard, 2006; Webb et al., 2003). Dans la présente étude, nous proposons d’utiliser le modèle MAG avec, comme variables d’entrée, la température de l’air et le débit. Ce dernier a un impact sur la relation entre la température de l’eau et celle de l’air (Caissie, 2006; Moatar & Gailhard, 2006; Webb et al., 2003). De plus, la prise en compte du débit a permis d’améliorer le pouvoir prédictif des modèles de régression et les gains qui lui ont été associés n’étaient pas négligeables (Bélanger et al., 2005; Moatar & Gailhard, 2006; Van Vliet et al., 2011; Webb et al., 2003). En outre, des séries temporelles pour ces deux variables sont souvent disponibles. À notre connaissance, le modèle MAG a été utilisé seulement pour modéliser les variations spatiales dans le cadre de la modélisation de la température de l’eau, tel que rapporté par la revue de Wehrly et al., (2009) qui a comparé la précision du modèle de régression linéaire multiple (MLR), de MAG, du krigeage ordinaire (OK) et du modèle linéaire mixte (LMM) pour prédire spatialement la température moyenne au mois de juillet des cours d’eau situés à Michigan et Wisconsin (É.-U.). Cette revue a montré que le LMM a donné les meilleures prévisions, suivi par le MAG, le LMR et le OK. Les variations spatiales de la température de l’eau sont importantes, mais en général elles sont inférieures aux variations temporelles (Gras, 1969; Webb et al., 2003). La présente étude vise à vérifier l’efficacité et la limite du modèle MAG à prédire la température moyenne journalière à une station de suivi de la rivière Sainte-Marguerite. Cette vérification est faite en comparant sa performance à celle de l’approche logistique proposée par Mohseni et al. (1998) et l’approche de

(30)

18

la régression des résidus de la température de l’eau et de l’air décrite par Caissie et al. (1998). Il est à noter que ces deux derniers modèles n’ont pas les mêmes intrants que le modèle MAG utilisé. Le but de l’exercice est vraiment de tester le modèle MAG avec des méthodes conventionnelles utilisées par les praticiens.

2.2 Méthodologie

Notre approche de modélisation non paramétrique utilise le MAG introduit par Hastie et Tibshirani (1986). Le MAG (équation 3.2) dispose de nombreux avantages par rapport au modèle GLM (McCullagh & Nelder, 1989), dont il est une extension. Contrairement au GLM (équation 3.1) qui se base sur l’hypothèse forte de linéarité entre les paramètres, le MAG ne suppose aucune forme de dépendance et la relation n’est pas obligatoirement linéaire. Il permet de tenir compte des relations non linéaires complexes entre les variables étant donné que la forme des relations est déterminée par les données. Il est aussi intéressant, car l’effet additif des variables explicatives est conservé et aucune hypothèse d’indépendance de ces variables n’est nécessaire. Son principe repose sur la modélisation de la réponse au moyen d’une somme de fonctions non linéaires, ce qui permet de détecter plus précisément l’influence de chaque variable explicative. Ce modèle permet une très grande flexibilité au niveau des fonctions de lissage (équation 3.4) qui relient la variable dépendante – température de l’eau – aux variables explicatives – température de l’air et débit. Les relations qui unissent la température de l’air et le débit respectivement à la température de l’eau ne sont pas nécessairement linéaires, ni nécessairement aussi simples que le modèle logistique. C’est pourquoi le MAG pénalisé a été

(31)

considéré dans cette étude (Wood, 2006), où les fonctions de lissage3 sont des splines4 cubiques (nommées aussi splines pénalisées).

L’objectif principal de la régression des séries chronologiques est d’étudier si une partie de la variation à court terme dans la variable réponse peut être expliquée par des changements dans les variables explicatives. Ces séries présentent souvent des variations de tendance à long terme comme des variations saisonnières. Par exemple, l’étude d’Orr et al., (2014) a utilisé le MAG pour détecter les tendances présentes dans des données irrégulières de la température de l’eau sur des sites en Angleterre et au pays de Galles sur une période de 17 ans. Pendant les 17 ans, en moyenne, la température de l’eau moyenne a augmenté de 0.03°C (0.002 C ) par année. Un changement positif dans la température de l’eau a été observé sur 86% des sites. Ces variations de tendances et saisonnières sont susceptibles de dominer les données ce qui peut confondre les associations à court terme cherchées entre variable réponse – variables explicatives et influencer l’interprétation des liaisons à court terme entre séries (Peng & Dominici, 2008). Comme notre intérêt est dans les associations à court terme, l’objectif est de contrôler ces variations à long terme en incluant dans le modèle un terme qui dépend du temps et qui permet de reproduire la quasi-périodicité saisonnière des séries (Bhaskaran et al., 2013). Dans la modélisation de la température de l’eau, le contrôle de la saisonnalité du signal permet de prendre en compte l’effet d’hystérésis qui lui est associé.

La mise en œuvre du modèle MAG a été effectuée avec le logiciel R (R Development Core Team, 2012) muni du progiciel « mgcv5 » (Wood, 2012) version 1.7-22. Ce progiciel utilise une

3 Un lissage est un outil non paramétrique qui contrôle la régularité d’une fonction (de régression ou de densité). La régularité est contrôlée par le degré de différentiabilité de la fonction.

4 Une spline cubique est une fonction polynômiale par morceaux de degré 3 (ou d’ordre 4) et de points de rupture appelés nœuds. Elle est de classe C4-2 à chaque nœud.

(32)

20

version modifiée par Wood (2006) de la méthode de GCV (generalized cross-validation) pour déterminer automatiquement le degré de lissage optimal associé à chaque variable explicative. Le modèle MAG ci-dessus a été comparé au modèle logistique et au modèle de régression des résidus.

Le modèle logistique (équation 3.6) a quatre paramètres qui ont une signification physique (Mohseni et al., 1998). Il permet de modéliser la température de l’eau en fonction de la température de l’air. Ce modèle a été abondamment utilisé avec les données hebdomadaires, mais rarement utilisé avec des données mensuelles. Malgré cela, il n’a pas donné de bons résultats pour l’estimation de la température maximale journalière de l’eau (Caissie et al., 2001). L’approche de la régression des résidus consiste à séparer les séries de température de l’eau et de l’air en deux composantes: la composante annuelle ou saisonnière à long terme et la composante à court terme constituée des résidus (après soustraction de la composante à long terme) en utilisant les équations (3.7) et (3.8) respectivement. La composante saisonnière est modélisée par une fonction sinusoïdale pour les deux séries de températures (eau et air) (Cluis, 1972) par les équations (3.9) et (3.10) respectivement. La composante résiduelle de la température de l’eau est modélisée à l’aide d’une régression multiple (équation 3.11) en fonction des délais (lag1 et lag2) de la composante résiduelle de la température de l’air (Kothandaraman, 1971).

L’ensemble des trois modèles a été validé par la technique de la validation croisée (Jackknife) (Quenouille, 1949). Cette procédure consiste à enlever temporairement les données d’une année de la température de l’eau du jeu de données et d’utiliser le reste comme données de calibration, pour ensuite estimer les valeurs de température de l’année enlevée. On répète cette opération pour toutes les années pour trouver une estimation de toutes les valeurs de la température de

(33)

l’eau permettant une comparaison entre les valeurs estimées et les valeurs observées via trois critères de comparaison : la racine de l’erreur quadratique moyenne (RMSE) (Janssen & Heuberger, 1995), le biais et le coefficient NSC (Nash & Sutcliffe, 1970) dont les formules sont représentées par les équations (3.12) (3.13) et (3.14) respectivement.

Le critère NSC mesure l’adéquation du modèle aux données. L’adéquation entre le modèle et les observations est parfaite pour un NSC=1 et le modèle commence à être satisfaisant à partir d’un NSC supérieur ou égal 0.80. Cependant, pour un NSC négatif, il serait préférable de prendre la moyenne des valeurs mesurées comme estimateur au lieu de celle estimée par le modèle.

2.1 Données et site d’étude

La rivière Sainte-Marguerite est une rivière à saumon Atlantique de la région du Saguenay, au Québec (Canada) (Guay et al., 2000). Elle est un affluant de la rivière Saguenay constituée de deux branches principales de 90 km et 85 km dans un bassin versant ayant une superficie totale de 2100 km2, qui se joignent 2.5 km avant de se jeter dans la rivière Saguenay (voir Figure 3.1). Le site de l’étude se situe sur la branche nord-est de la rivière Sainte-Marguerite. La figure 3.1 montre l’emplacement de la station météorologique, la station hydrométrique gérée par le Ministère du Développement durable, de l’Environnement et de la Lutte contre les changements climatiques (MDDELCC) et la sonde S3 (thermographe S3) utilisée pour la température de l’eau. Les données enregistrées sur ce site de la température de l’eau, de l’air et le débit couvrent la période de 2007 à 2013 (6 années de données), cependant, aucune donnée n’est disponible pour l’année 2008. Les données horaires relevées des deux premières variables sont agrégées en moyennes journalières. Pour chaque année on ne garde que les mesures des mois de mai à octobre (184 jours). Le choix de ces mois se justifie par le climat (climat continental) de la zone

(34)

22

étudiée caractérisée par un régime hivernal où les variations thermiques des cours d’eau sont négligeables pendant l’hiver à cause du couvert de glace qui limite les échanges thermiques entre la rivière et son environnement (Marsh, 1990). Ces variations deviennent importantes suite à la fonte des neiges pour les saisons de printemps, d’été et d’automne ce qui correspond à notre période d’étude. Il faut noter que les données dont on dispose ne sont pas complètes pour certaines années à cause de pannes d’enregistrement du thermographe ou l’occurrence de périodes sèches durant lesquelles il a été exondé, ce qui rend les données enregistrées invalides (Table 3.1).

2.2 Résultats

Les séries de données sont présentées graphiquement (Figure 3.2 : température de l’eau et de l’air en haut, débit en bas). Cette figure montre que les amplitudes des variations de la température de l’air sont plus prononcées que celles de la température de l’eau qui sont naturellement lissées. En effet, l’inertie thermique de l’eau empêche les variations rapides de sa température. Il faut noter que la température de l’eau a atteint des moyennes journalières relativement élevées au cours des étés des années 2010, 2012 et 2013. Des températures de l’eau élevées telles qu’enregistrées pendant ces trois années sont souvent observées dans les cours d’eau larges et peu profonds (Caissie, 2006). La Figure 3.2 suggère une relation non linéaire entre la température de l’eau et les variables explicatives température de l’air et débit.

Une modélisation MAG a été effectuée en incorporant la température de l’air et le débit comme variables expliquant le régime thermique. L’introduction de la variable jour de l’année dans cette modélisation a permis de reproduire la saisonnalité des données.

(35)

Le MAG permet d’estimer l’influence d’une seule variable explicative, après avoir enlevé celle des autres variables explicatives, sur la variable réponse. les résultats de ce modèle peuvent être représentés graphiquement par la relation de la température de l’eau avec la température de l’air et le débit. Les résultats analytiques de ce modèle montrent que les effets de la température de l’air, du débit et la saison sont significativement non linéaires avec une probabilité critique (P-value) < 0.00001 (voir Tableau 3.2). Cela veut dire que la part non linéaire n’est pas négligeable et tenir compte que de la composante linéaire de ces effets n’est pas suffisant. La déviance expliquée (voir Tableau 3.2) par le modèle a la même signification que le R2 dans le cas linéaire. Le calcul de la déviance expliquée pour un modèle est effectué par rapport à la déviance du modèle nul. Le pourcentage de la variance totale expliquée par ce modèle est de 93% (voir Tableau 3.2). Les effets nets non linéaires de la température de l’air, du débit et l’effet saisonnier sont représentés par les Figures 3.3, 3.4 et 3.5. Le tracé des effets nous permet d’appréhender la nature de la relation entre la température de l’air et le débit avec la température de l’eau. On peut remarquer que le nuage de la courbe lisse de la température de l’air (voir Figure 3.3) dessine légèrement une forme en S. Le débit représente un effet plutôt décroissant (voir Figure 3.4). L’effet du débit est plus marqué par la présence des crues printanières. Cet effet est plus présent pendant le printemps à cause du gros volume d’eau issu de la fonte des neiges. L’effet de la température de l’air est plus marqué pendant l’été où la rivière présente un faible débit, ce qui signifie que la température de l’air est étroitement associée à la température de l’eau au cours de cette saison. L’inclusion du débit a permis de tenir compte implicitement des spécificités de chaque saison, tandis que l’inclusion de terme qui dépend du temps minimise le risque d’erreur associée à l’effet d’hystérèse.

(36)

24

La contribution à la déviance expliquée du modèle par une variable explicative est égale à la déviance du modèle complet moins la déviance du modèle réduit de cette variable explicative divisée par la déviance du modèle nul (où il n’y a aucune variable explicative) (Turgeon, 2012). En termes de pourcentage, la contribution associée à chaque variable explicative est rapportée à la somme des contributions de l’ensemble des variables explicatives incluses dans le modèle. Pour le modèle MAG proposé, la contribution à la déviance expliquée du modèle de la température de l’air, de débit et de la saison est de 44,6 %, 30.2 % et 24.1 % respectivement. Pour ce cas d’étude, le modèle MAG a donné un bon ajustement de la température de l’eau en fonction de la température de l’air et le débit avec un RMSE (équation 3.12) pour toute la période de l’étude de 1.79°C. L’analyse résiduelle a été menée afin de déterminer si le modèle MAG peut être accepté. Cette analyse a été effectuée sur les résidus de validation croisée pour éviter le problème de surajustement des données. Elle porte sur le test de la normalité des résidus et le diagnostic de la persistance des structures dans ces derniers. Elle a confirmé l’acceptation du modèle MAG (voir Figure 3.6 et 3.7).

Le modèle logistique (Mohseni et al., 1998) qui relie la température de l’eau à la température de l’air en utilisant l’équation 3.6 a été appliqué sur les moyennes journalières de la température de l’eau et de l’air. L’estimation de cette fonction logistique est donnée par l’équation 3.15. Les données journalières de la température de l’eau et de l’air montrent une forte dispersion (Figure 3.7). Cette fonction ne représente pas bien les données journalières. Elle est plus adaptée aux données hebdomadaires où la dispersion est réduite. La variabilité totale expliquée par ce modèle est de 78 %. Le RMSE pour toute la période de l’étude est de 2.75°C.

La régression des résidus commence par l’optimisation de la composante annuelle de la température de l’eau et de l’air en appliquant l’équation 3.8 et 3.9 respectivement. La

(37)

composante annuelle de la température de l’eau explique 80.3 % de la variabilité totale de la température de l’eau. La figure 3.8 représente l’estimation de cette composante pour l’année 2013 en utilisant l’équation 3.16. Une fois que la composante annuelle a été retirée des séries de la température de l’eau et de l’air, les résidus de la température de l’eau ont été estimés par un modèle de régression en fonction des délais (lag1 et lag2) des résidus de la température de l’air (équation 3.17). Les coefficients de lag1 et lag2 pour les résidus de température de l’air étaient significatifs et l’ordonnée à l’origine n’était pas significative. Ce modèle est meilleur que le modèle logistique pour représenter les données quotidiennes. Les lag 1 et lag2 des résidus de la température de l’air expliquent 44% de la variabilité totale des résidus de température de l’eau. Cependant, la variabilité totale expliquée par ce modèle lorsque la composante annuelle a été ajoutée est de 89% et le RMSE pour toute la période de l’étude est de 2.09 °C

La comparaison des trois modèles MAG, logistique et régression des résidus est effectuée et les résultats des indices d’évaluation, RMSE (équation 3.12), biais (équation 3.13) et NSC (équation 3.14) pour chaque année et pour toute la période sont présentés dans le Tableau 3.3. Dans le cadre de cette étude, le MAG donne de meilleurs résultats avec un RMSE pour toute la période de l’étude de 1.79 °C qui varie entre 1.28 °C et 2.18 °C, selon les années. Le biais est centré à zéro, avec une valeur annuelle entre -1.35 et 1.32°C. Le critère NSC indique une bonne adéquation du modèle MAG à ces données avec une valeur de 0.90. Ce résultat est confirmé par la présentation graphique des valeurs estimées versus valeurs observées (voir Figure 3.10). Cette figure montre un alignement compact autour de la première bissectrice, indiquant que l’écart entre les valeurs observées et les valeurs prédites par le modèle MAG est minime et sans biais. Pour la validation du modèle logistique et du modèle de régression des résidus, les RMSE pour toute la période d’étude étaient de 2.75 °C et 2.09 °C respectivement. Ces deux modèles sont

(38)

26

moins performants que le modèle MAG, mais la performance du modèle de régression est entre celle du MAG et du modèle logistique. Les valeurs annuelles du RMSE varient entre 1.83 °C et 3.40 °C pour le modèle logistique puis entre 1.04 °C et 2.64 °C pour le modèle de régression des résidus. Le biais pour toute la période de l’étude est très faible et centré en zéro pour ces deux derniers modèles, mais l’étendue est très large (i.e. entre -1.08 et 1.99°C pour le modèle logistique et entre -1.15 °C et 1.85 °C pour le modèle de régression des résidus). Le NSC est de 0.76 pour le modèle logistique et 0.86 pour le modèle de régression des résidus. La figure 3.11 présente les valeurs estimées par le modèle logistique versus les valeurs observées. Elle montre que ce modèle surestime les faibles valeurs de la température de l’eau. Cependant, la figure 3.12 démontre que le modèle de régression des résidus sous-estime les valeurs les plus élevées et surestime les faibles valeurs de la température de l’eau. Il est important de noter que ces deux derniers modèles ne tiennent pas compte de l’effet du débit. Cette omission est peut-être la cause des surestimations de la température de l’eau qui ont été observées généralement au printemps à des niveaux d’eau plus élevés et des sous-estimations qui ont été observées au cours de l’été, quand les niveaux d’eau sont plus faibles.

2.3 Discussion

L’objectif de cette évaluation est de déterminer si le MAG est un outil prometteur qui peut aider à la gestion des ressources aquatiques en fournissant des simulations et des prédictions précises de température de l’eau. La performance du modèle MAG a été comparée à celle d’approches existantes, soient le modèle logistique et le modèle de régression des résidus. Le modèle logistique a donné des résultats moins précis que les deux autres modèles pour les données quotidiennes (RMSE = 2,75 °C), ce qui concorde avec les résultats de Caissie et al., (2001) pour

(39)

la température maximale journalière de l’eau. Selon la revue de Benyahya et al. (2007), ce modèle est plus adapté aux données hebdomadaires pour lesquelles il a été largement utilisé. Le modèle de régression des résidus présente une performance relativement acceptable (RMSE = 2,09 °C). De meilleures performances ont été obtenues avec ce type de modèle dans des études antérieures telles que celle de Caissie et al., (1998). Ce dernier modèle ne prend pas en compte la structure de l’autocorrélation de la série de température de l’eau (mais prend en compte celle de l’air), qui est généralement importante (Caissie et al., 1998). L’effet du débit sur la température de l’eau est également omit dans ce modèle, comme dans le cas du modèle logistique. Il faut noter que la période de l’étude contient trois années avec des températures de l’eau relativement chaudes, ce qui est atypique pour la rivière Ste-Marguerite (voir Guillemette et al., (2009) pour maxima mensuels). Ces limitations ont une incidence sur la performance du modèle de régression des résidus pour cette rivière. En outre, la forte corrélation entre le lag 1 et lag2 des résidus de la température de l’air pose un problème de multicolinéarité, ainsi les résultats peuvent donc être moins précis. Les résultats du modèle MAG ont montré qu’il était très flexible pour ajuster les relations non linéaires entre la température de l’eau et les variables explicatives (température de l’air et le débit). Ces résultats n’étaient pas influencés par les valeurs atypiques présentent dans les données de cette étude. L’inclusion du débit a permis une amélioration du modèle, probablement due au fait que la crue printanière et les étiages estivaux modulent les extrêmes thermiques. L’analyse résiduelle du modèle MAG donne confiance dans son potentiel d’utilisation. En somme, le modèle MAG a établi des relations non linéaires très flexibles entre la température de l’eau et les variables explicatives, température de l’air et le débit. Il a donné un meilleur ajustement pour la température de l’eau de la rivière Sainte-Marguerite et surtout, il était plus robuste dans le cas de données atypiques. Pour valider ces résultats préliminaires de

(40)

28

cette étude, des applications sur d’autres sites sans valeurs atypiques seraient utiles. Sa validation sur d’autres sites permettra de juger s’il peut être utilisé comme un outil potentiel pour une gestion efficace des systèmes aquatiques.

(41)
(42)
(43)

Modeling the water temperature: comparison of the generalized additive

model, logistic and residuals regression models

By Fatima Laanaya1a André St-Hilaire1 Erwan Gloaguen1

1

INRS-ETE, Université de recherche 490 da la couronne, Québec, G1K 9A9, Canada

Manuscript submitted to: Hydrological Sciences Journal 31 July 2015

a

(44)
(45)

Abstract

Water temperature plays a fundamental role in the control of dissolved oxygen concentrations and it has a significant influence on the life cycle of aquatic organisms, including stenotherm fish such as salmonids. It is thus of prime importance to build reliable tools to forecast water temperature in order to preserve river fishes to water warming. This study proposes to evaluate a statistical scheme to model the average water temperature based on daily average air temperature and average flow rate at the Sainte-Marguerite River, North Canada. The aim of this work is to test a non-parametric water temperature regression model and to compare its performance to two previously developed approaches: the logistic and residuals regression models. The non-parametric generalized additive model (GAM) model allows to test whether the relationship between the response variable (water temperature) and the explanatory variables (air temperature, flow rate) is significantly different from a linear relation, and graphically illustrates the form of this relationship. Due to its flexibility, the GAM was able to capture some of the non-linear response between water temperature and the two explanatory variables. The shape of these effects is determined by the trends shown in the collected data. The three models were evaluated annually using a cross-validation technique. Three comparison criteria were calculated: the root mean square error (RMSE), the bias error and the Nash-Sutcliffe coefficient of efficiency (NSC). The goodness of fit of the three models was also compared graphically. The GAM is the best of among the three models with a RMSE = 1.79 °C, bias = 0.006 and NSC = 0.90 compared to the logistic model RMSE = 2.75 °C, bias = 0.01, and NSC = 0.76. Whereas the residuals regression model gave RMSE = 2.09 °C, bias = -0.03 and NSC = 0.86.

(46)

34

Résumé

La température de l’eau exerce un contrôle fondamental de la quantité d’oxygène dissout. Elle a une influence significative sur le cycle de vie des systèmes aquatiques, tels que les salmonidés. Ce travail propose une modélisation statistique de la moyenne journalière de la température de l’eau en fonction des moyennes journalières de la température de l’air et le débit à la rivière St-Marguerite située à la région du Saguenay-Lac-Saint-Jean-Côte-Nord au Québec (Canada). Elle porte sur l’élaboration d’un modèle de régression non paramétrique de température de l’eau et sur la comparaison de sa performance avec le modèle logistique et le modèle de régression des résidus. Le modèle non paramétrique GAM permet de tester si la relation entre la variable réponse (température de l’eau) et les variables explicatives (température de l’air, débit) est significativement différente d’une relation linéaire et de visualiser graphiquement la forme de cette relation. Grâce à sa flexibilité, le modèle additif généralisé (GAM) a montré que les effets des deux variables explicatives sont non linéaires. La forme de ces effets est déterminée par les tendances présentées dans les données récoltées. Les trois modèles ont été évalués en utilisant la technique de validation croisée par année. Trois critères de comparaison ont été calculés, l’erreur quadratique moyenne (RMSE), le biais et le NSC. La qualité de l’ajustement des trois modèles a également été comparée graphiquement. Le modèle GAM est le meilleur des trois modèles avec un RMSE = 1.79, biais = 0.006 et NSC = 0.90 comparativement au modèle logistique avec RMSE = 2.75, biais = 0.01 et NSC = 0.76 et le modèle de régression des résidus avec RMSE=2.09, biais = -0.03 et NSC = 0.86.

Mots-clés : Moyenne journalière de la température de l’eau, modèle logistique, GAM, régression des résidus.

(47)

3.1 Introduction

Water temperature is one of the physical factors controlling water quality. For instance, it affects oxygen concentration that is inversely proportional to water temperature (Ozaki et al., 2003; Secondat, 1952), as well as the concentration of some pollutants (Ficke et al., 2007). Water temperature has direct or indirect effect on many other physical (e.g. density, viscosity, ... ), chemical (e.g. conductivity, oxygen solubility, …) or biological (Stevens et al., 1975) variables in lotic ecosystems.

The thermal regime of rivers is important for aquatic ecosystems (Acuña & Tockner, 2009; Cairns et al., 1978; Caissie, 2006). Aquatic species require suitable habitats in order to complete their full life cycle. Several studies have examined the impacts and consequences of changes in the thermal regime of streams on cold-water fish and they found out that these fish have less opportunity for a possible migration from their thermal habitat (Brett, 1979; Britton et al., 2010; Eaton & Scheller, 1996). Water temperature is also a determining ecological factor for many biological parameters such as metabolic activity (Demars et al., 2011), reproduction, survival (Connor et al., 2003; Eaton et al., 1995) and growth rate (Elliott & Hurley, 1997; Neuheimer & Taggart, 2007). Also, it has been proven that water temperature has an impact on the distribution of species in rivers (Ebersole et al., 2003; Edwards & Cunjak, 2007; Magnuson et al., 1979; Vannote et al., 1980). Higher than average water temperature may generate thermal stress for certain species of fish (Isaak et al., 2012). Indeed, the response to this stress for salmonids depends on the rate at which the water temperature increases (Quigley & Hinch, 2006). In some cases, these species will seek, when available, thermal refuges in order to avoid being exposed to high temperature conditions (Baird & Krueger, 2003; Dugdale et al., 2013).

(48)

36

Many studies focus on the identification of human impacts altering thermal regimes of rivers. Some activities may have significant influence on water temperature, such as urbanization (e.g. Nelson & Palmer, 2007) , agriculture (e.g. Grégoire & Trencia, 2007) and thermal effluents (e.g. Moatar & Gailhard, 2006; Prats et al., 2012). Other important anthropogenic impacts include climate change, dams and logging.

Worldwide, international assessments confirm the change in air and ocean temperatures (IPCC, 2013). Climate change (CC) represents a significant threat to the life of aquatic species (Crozier & Zabel, 2006; Eaton & Scheller, 1996; Ferrari et al., 2007; Mohseni et al., 2003; Webb et al., 2004). Several studies have highlighted the fact that water temperature of rivers has significantly increased (Arismendi et al., 2012; Ducharne, 2008; Ficklin et al., 2013; Kaushal et al., 2010; Morrill et al., 2005). Such a shift in the thermal regime of rivers would have a direct impact on the habitat conditions of poikilothermic organisms (Hari et al., 2006). The most notable ecological impact of climate change remains the migration of different species to higher altitudes and latitudes, as a response to their thermal preferences (Parmesan & Yohe, 2003; Walther et al., 2002). Indeed, the study of Daufresne et al., (2009) demonstrated the presence of a direct relationship between temperature increase and the size reduction of ectothermic aquatic organisms (bacteria, phyto- and zooplankton, and fish). Changes in thermal signals due to the presence of reservoirs disrupt the life cycle of aquatic organisms (Lowney, 2000). Indeed, dams alter the river thermal regime downstream of the impoundment (Olden & Naiman, 2010; Webb, 1996). Their effects depend on the type of the structure, the management mode and the position of the water intake. The influence of impoundment on river water temperature is presented by a smoothing of daily cycles downstream of the dam (Liu et al., 2005).

(49)

3.2 Water Temperature Models

The modeling and forecasting of the water temperature under different spatial or temporal scales has been conventionally tackled using two models: deterministic and statistic. (Benyahya et al., 2007; Caissie, 2006; Cole et al., 2014; Marceau et al., 1986). Deterministic or physical models are based on the mathematical representation of the physical processes of heat exchange between the river and its natural environment (Caissie et al., 2007; Cox & Bolte, 2007; Edinger et al., 1968; St-Hilaire et al., 2000). They are typically developed at the river reach scale. Although deterministic models can provide accurate estimates of water temperature, acquiring the necessary data is not always possible, especially at the regional level (Mohseni et al., 1998; Risley et al., 2003).

Statistical or empirical models remain an alternative that requires less parameters than deterministic models (DeWeber & Wagner, 2014; Mohseni et al., 2003; Moore, 2006; Morrill et al., 2005; Smith, 1981). In addition to requiring less input data statistical approaches often require a shorter period of development and reduced costs of data and operation (Eaton & Scheller, 1996; Mohseni et al., 1999). However, they require long series of observations (Marceau et al., 1986). Statistical models do not take into account direct sources of heat flow. Instead, they represent implicitly the physical concept by taking into consideration the correlations between a relatively small number of environmental variables input and the water temperature (Caissie, 2006; Webb et al., 2008). Multiple statistical works of water temperature modeling have already been presented with their strengths and weaknesses (Benyahya et al., 2007). Among these statistical methods are the following:

(50)

38

1) The parametric regression models, for which the relationship is parametrically specified a priori. This category includes the single or multiple linear regression, stochastic and nonlinear models (Ahmadi-Nedushan et al., 2007; Erickson & Stefan, 2000; Smith, 1981; Stefan & Preud'homme, 1993a; Webb et al., 2003) to predict water temperature. They are more effective at weekly and monthly scales than at daily scales, given that the daily water temperatures have greater autocorrelation (Caissie, 2006; Erickson & Stefan, 2000; Morrill et al., 2005; Pilgrim et al., 1998). The term “stochastic model” has been used to describe water temperature models that decompose time series into a seasonal and a residual component so as to produce daily forecasts of water temperature (Ahmadi-Nedushan et al., 2007; Caissie et al., 2001; Caissie et al., 1998; Cluis, 1972; Kothandaraman, 1971). The most often used non-linear parametric regression model that links the water temperature to air temperature, remains the logistic model (also called sigmoid model) (Benyahya et al., 2007; Caissie, 2006; Caissie et al., 2001; Mohseni & Stefan, 1999; Mohseni et al., 1998; Segura et al., 2014). This model is suitable for weekly data whereas its application on daily data did not produce a good fit (Caissie et al., 2001; Mohseni & Stefan, 1999; Mohseni et al., 2003).

To overcome the limitations of parametric models, other models are used:

2) Non-parametric regression models for which the relationship is not specified a priori. The K-nearest neighbor approach is an example of non-parametric models that were previously used for predicting water temperature (Benyahya et al., 2008; St‐Hilaire et al., 2012). Artificial Neural Networks (ANNs) often show improvement in forecasts when compared to parametric models (Bélanger et al., 2005; Chenard & Caissie, 2008; Daigle et al., 2014; Nohair et al., 2008; Sharma et al., 2008). And finally, the generalized linear model (GLM) combined with the non-parametric

(51)

method of local polynomial was used to model water temperature in the Sacramento River in California which gave a good results to predict daily maximum water temperature (USA) (Caldwell et al., 2014).

In this study, we propose to apply a generalized additive model (GAM), with air temperature and flow as the input variables. The flow represents an important factor influencing the actual relationship between water and air temperature (Caissie, 2006; Moatar & Gailhard, 2006; Webb et al., 2003). ). Also, including the flow has improved the predictive power of some water temperature regression models (Bélanger et al., 2005; Moatar & Gailhard, 2006; Van Vliet et al., 2011; Webb et al., 2003).

The GAM offers the option to take into account the complex nonlinear relationships between parameters because the shape of the relationship is determined by the data. In fact, the relationship between air temperature, flow and the water temperature is known to be non-linear at the daily time step. This model allows great flexibility for functions that link the dependent variable-water temperature-to independent variables-air temperature and flow. For these reasons, the GAM model offers some potential for water temperature modelling. The GAM model was only used previously to model the spatial variations of water temperature, as reported by the review of Wehrly et al., (2009). This review compared the model precision and accuracy of multiple linear regression (MLR), generalized additive model (GAM), ordinary kriging and of linear mixed modeling (LMM) so as to spatially predict the average watercourses temperature in July in the states of Michigan and Wisconsin (USA). Their results showed that the LMM gave the best predictions followed by the GAM, LMR and krig. The spatial variations in water temperature are important, but in general they are inferior to the temporal variations (Gras, 1969; Webb et al., 2003).

Figure

Figure 3.1 :  Watershed  Sainte-Marguerite  River  with  location  of  hydrometric  station,  weather  station  and  thermographs (s1, s2, s3, respectively)
Figure 3.1 shows the location of the weather station (latitude 48° 16' 37.2'' N, longitude 69° 56'  2.399''  O),  the  hydrometric  station  (latitude  48°  16'  5.016''  N,  longitude  69°  54'  33.012''  O)  managed  by  Ministry  of  Sustainable  Develo
Figure 3.2 and Figure 3.3, suggests a nonlinear relationship between water temperature and the  explanatory variables air temperature and flow rate
Figure 3.2 : Average daily water and air temperatures from 2007 to 2013
+7

Références

Documents relatifs

Modèle d’évolution de la protéolyse dans des échantillons de viande de porc en fonction de la température et des teneurs en eau et en sel : Intégration dans un modèle simulant

La répartition de potentiel ainsi créée entraîne des conditions de température très strictes pour les cathodes d’où les relations que nous avons vues entre la

pouvons conclure que notre équation donne de meil- _ leurs résultats que celle de Van derWaals, et que les valeurs des températures tirées de l’équation de Van

Mesure de la température des neutrons dans le réflecteur d’une pile à eau

mètre à résistance de platine, soit d’un thermomètre à contact, soit d’un système de régulation par thermo-. couple et potentiomètre commandant un

Construction et validation d’un modèle de prédiction des besoins en eau des vaches laitières incluant l’effet de la température ambiante. Rencontres Recherche Ruminants, Dec

Nous obtenons une repr´ esentation asymptotique de notre statistique de test se rap- prochant de celle obtenue sous des hypothses plus restrictives par Lopez et Patilea (2009)