Geomorphologie fluviale et Machine Learning : Quelques éléments de réflexion

(1)

HAL Id: hal-03023334

https://hal.inrae.fr/hal-03023334

Submitted on 25 Nov 2020

HAL is a multi-disciplinary open access

archive for the deposit and dissemination of sci-entific research documents, whether they are pub-lished or not. The documents may come from teaching and research institutions in France or abroad, or from public or private research centers.

L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau recherche, publiés ou non, émanant des établissements d’enseignement et de recherche français ou étrangers, des laboratoires publics ou privés.

éléments de réflexion

Théo Recking

To cite this version:

Théo Recking. Geomorphologie fluviale et Machine Learning : Quelques éléments de réflexion. Géo-morphologie. 2020. �hal-03023334�

(2)

(3)

Geomorphologie fluviale et Machine Learning

Quelques éléments de réfexion

Théo RECKING1

1_{Univ. Grenoble Alpes, ENSIMAG, 3800, Grenoble, France}

Table des matières

1 Introduction 3

2 Le Machine Learning 4

2.1 Introduction . . . 4

2.2 Support Vector Machine . . . 5

2.3 Artificial Neural Network (ANN) . . . 6

2.3.1 Principe . . . 6

2.3.2 Différents Modèles ANN : . . . 7

2.4 Model Tree . . . 8

3 La Morphodynamique fluviale 9 4 Utilisation du Machine Learning en Morphodynamique fluviale 10 4.1 Utilisation de modèles SVM . . . 10

4.2 Utilisation de modèles ANN . . . 12

4.3 Utilisation d’un model tree . . . 13

4.4 Utilisation de Réseaux de Neurones Complexes . . . 14

4.5 Comparaison des différents modèles . . . 15

5 Quelques tests exploratoires 21 5.1 Introduction . . . 21

5.2 Traitement des données . . . 21

5.3 Résultats . . . 22

6 Conclusion 24

(4)

1 Introduction

À l’heure où le Machine Learning s’implante dans tous les domaines, il jouit d’une popularité grandissante auprès de la communauté scientifique. Et pour cause ce domaine de l’informatique, où tout ou presque reste encore à faire, apporte un nouvel axe d’approche aux chercheurs, un axe proba-biliste, permettant de résoudre des problèmes complexes. Le Machine Learning possède des avantages notables sur des approches plus traditionnelles telle que sa rapidité d’exécution ou sa grande flexibilité qui en fait un outil redoutable lorsque les équations deviennent trop complexes et ne suffisent plus pour construire un modèle raisonnable.

La multiplicité des données récoltées par des capteurs couplé a une puissance de calcul démultipliée en seulement quelques années donne aux instituts de recherche toutes les clés pour utiliser des algo-rithmes d’intelligence artificielle. Ainsi on trouve aujourd’hui de nombreuses études tentant d’adapter des algoritmes de Machine Learning à de nombreux domaines scientifiques (médecine, météo, etc). L’objectif de cette étude documentaire est de compiler et comparer les résultats des différentes études et travaux existants liant IA et Morphodynamique fluviale.

Nous verrons donc que de nombreux travaux tendent à montrer que l’utilisation du Machine Lear-ning peut être viable, notamment pour prédire la charge sédimentaire dans une rivière (sédiments charriés et/ou en suspension) et offre des prédictions de qualité similaire voire meilleure que celle des modèles déjà existants.

Cependant, le machine learning possède lui aussi ses limites. En effet, le nombre de données né-cessaires pour la phase d’apprentissage, le traitement des données en amont ou l’identification d’un modèle optimal sont autant de nouvelles problématiques intrinsèquement liées à l’utilisation de mo-dèles statistiques. Ces nouvelles limites ne semblent pourtant pas être totalement traitées par une partie non négligeable des études sur le sujet. Nous verrons qu’elles sont pourtant capitales et per-mettent d’améliorer sensiblement le résultat de la prédiction.

Enfin, une dernière partie sera consacrée à une petite expérimentation sur un jeu de données colletée sur l’Idaho. En effet, l’objectif de cette partie sera de prédire qs (le flux solide) grâce à trois modèles différents : un réseau de neurones (ANN), une régression linéaire (MLR) et une support vector regression (SVR), et de voir quelle efficacité ont ces différents modèles en pratique par comparaison avec des données mesurées.

(5)

2 Le Machine Learning

2.1 Introduction

On appelle algorithme de Machine Learning tout algorithme d’aide à la décision comprenant une

phase d’apprentissage basée sur des données plus ou moins nombreuses, de dimension n. La plupart

du temps ces algorithmes ont un but régressif ou discriminant.

— Les algorithmes discriminants ont pour but de classer une donnée selon ses attributs, on parle alors de classification. La majeure partie des algorithmes de Machine Learning sont à vocation discriminante, elle est très facile à mettre en place et est très utile en pratique. En médecine par exemple, savoir si un patient est susceptible de développer une maladie (2 classes : OUI-NON), en reconnaissance d’image (savoir de quel espèce appartient tel animal), etc...

Par exemple, l’algorithme du ”plus proche voisin” qui consiste à classer une donnée selon la classe de ses voisins les plus proches trouvés avec une mesure bien choisie est l’un des algorithmes les plus simples pour réaliser une classification.

— Les algorithmes régressifs sont des algorithmes permettant de conjecturer une nouvelle valeur d’une variable réponse associée à une nouvelle donnée d’entrée. Ainsi si l’on suppose que toutes les données d’apprentissage ytrain suivent une même fonction h(y) inconnue, un algorithme régressif doit renvoyer une approximation de h(x) plus ou moins précise. L’algorithme régressif le plus connue est sans doute la régression linéaire.

Le point fort de ces algorithmes est leur rapidité d’exécution. En effet une fois un modèle entraîné, le calcul d’une prédiction peut s’effectuer en quelques secondes, voire en quelques millisecondes. Ils ont cependant deux points faibles :

— La prédiction est purement probabiliste. En pratique, pour s’assurer de la fiabilité d’un modèle, il est d’usage de diviser l’ensemble d’apprentissage en 2 ensembles : un ”training set” pour l’apprentissage et un ”test set” qui permet de tester l′accuracy et le log−loss de notre modèle.

Il est important de ne pas utiliser le même ensemble car cela pourrait donner un modèle beaucoup trop spécialisé qui ne marche que dans le cas de notre ensemble et plus dans le cas général. On parlerait alors de sur-apprentissage.

— Les algorithmes de Machine Learning nécessitent généralement de larges bases données d’ap-prentissage pour donner des résultats satisfaisants, or nous ne disposons pas toujours d’une telle base.

Dans la suite de cette section nous trouverons une rapide description des différentes méthodes de Machine Learning utilisées dans les différents articles présentés à la Section 4.

(6)

2.2 Support Vector Machine

Les Support Vector Machine (noté SVM) est un modèle d’apprentissage proposé par Vapnik and Lerner [1963], cet algorithme, à vocation discriminante mais aussi régressive, repose sur deux principes fondamentaux : les hyperplans à marge maximale et les fonctions noyaux.

— Hyperplans a Marge Maximale : Lorsqu’un ensemble de données est réparti linéairement dans un espace de dimension n, on dit que l’on utilise le principe de Marge Maximale lorsque l’on sépare les données par un hyperplan (donc de dimension n-1) respectant le principe sui-vant : lors de l’apprentissage, on place la frontière entre 2 classes à équidistance des 2. La distance entre les classes d’apprentissage et la frontière hyperplane est appelée Marge (Fig. 1).

Figure 1 – Schéma du principe de marge maximum en dimension 2. Source : fr.qwe.wiki Lors de la phase de prédiction de h(X) le modèle compare la position de X par rapport à l’hy-perplan. Mathématiquement trouver l’hyperplan(w, w0)revient à calculer :

argmaxw,w0(

1

||w||mink(lk[w

T_l

k+w0])) (1)

Avec {(x1, l1), ..,(xp, lp)} ∈RNx{−1, 1}l’ensemble d’apprentissage.

En normalisant la formule cela revient à minimiser avec la condition : lk[wTlk+w0] >0 :

1

2||w||2 (2)

L’hyperplan trouvé est alors appelé hyperplan canonique.

(7)

Figure 2 – Analyse en dimension 1 ne permettant pas la discrimination (panneau supérieur) et en dimension 2 avec la fonction noyau polynomiale permettant la discrimination (panneau inférieur)

2.3 Artificial Neural Network (ANN)

2.3.1 Principe

Inspirés du fonctionnement du cerveau humain, les réseaux de neurones multicouches sont un des outils les plus puissants du Machine Learning. Conceptualisés pour la première fois par Werbos [1974], les réseaux de neurones multicouches apparaissent en 1986 suite aux travaux de Rumelhart et al. [1986]. Ils sont constitués d’un nombre arbitraire de couches constituées d’un ou plusieurs neurones reliés entre eux par des synapses (Fig. 3).

Figure 3 – Vue simplifié d’un réseau de neurone source : wikipedia.org Chaque neurone est composé de deux fonctions :

— une fonction de combinaison qui prend les valeurs en entrée du neurone et qui renvoie une valeur en dimension 1, dans les modèles les plus simples cette fonction est simplement une

(8)

combinaison linéaire.

— une fonction d’activation qui a pour but d’activer ou non le neurone.

Lors de la phase d’entraînement les paramètres de chaque neurone sont ajustés pour s’approcher au mieux de la sortie recherchée.

Le théorème de Cybenko [1989] nous apprend que n’importe quelle fonction peut être approximée avec une précision arbitraire grâce à un réseau à trois couches (1988), ce qui rend les réseaux de neurones particulièrement efficaces. Mais en plus de demander un nombre important de données, la phase d’apprentissage est de plus particulièrement sensible au surapprentissage, ce qui les rend parfois moins efficaces que d’autres méthodes plus simples.

2.3.2 Différents Modèles ANN :

Il existe de nombreux modèles ANNs plus ou moins complexes. Sans les expliquer en détail (pour cela voir les références), on peut par exemple citer :

— Feed forward neural networks (FFNN) :

Il s’agit du modèle ANN le plus simple ainsi que le premier du genre créé [Werbos, 1974, Rumelhart et al., 1986]. Dans ce modèle l’information circule toujours vers l’avant, d’où son nom : réseau de neurones à propagation avant. Il se distingue ainsi des réseaux de neurones récurrents qui ont une structure interne plus complexe.

— Adaptive neuro-fuzzy inference system (ANFIS) :

Jang [1997] a introduit en 1993 un nouvel algorithme d’apprentissage neuronal de 5 couches permettant de construire un ensemble de règles IF-THEN de FUZZY qui ont la particularité de pouvoir approximer des fonctions non linéaires. Ainsi un réseau ANFIS intègre à la fois les principes de réseaux neuronaux et de logique floue, ce qui permet de rassembler les avantages des deux dans un cadre unique.

— Radial basis neural networks (RBNN) :

Broomhead [1988] explique ce qu’il appelle un réseau de neurones à base radiale. Il s’agit d’un réseau de neurones de 2 couches dont les noeuds de sortie forment une combinaison de fonctions de base. Il a pour avantage d’avoir un temps de convergence très rapide sans minima locaux, puisque son erreur est toujours une fonction convexe.

— Generalized regression neural networks (GRNN) :

Il s’agit d’une version améliorée des réseaux de neurones à base radiale [Specht, 1991], l’idée est que chaque ensemble d’apprentissage va représenter la moyenne d’un des neurones à base radiale. Il présente tous les avantages du RBNN tout en demandant moins de données mais peut demander une grande puissance de calcul. À ce jour, il n’existe pas de méthodes efficaces capables de l’optimiser.

(9)

2.4 Model Tree

Les arbres de décision, ou Model Tree [L. Breiman, 1984] est une technique très simple d’apprentis-sage supervisé. Le but de l’apprentisd’apprentis-sage est de construire un arbre couvrant l’ensemble des données grâce à un algorithme récursif. Ainsi l’espace totale du jeu de donnée est divisé en plusieurs sous-espaces distincts. Lorsqu’une nouvelle variable entre dans l’arbre elle est dirigée vers un sous-espace qui lui est associé (Fig. 4). Si le but est de classifier les données alors on associe une étiquette a chaque espace et on parle de Classification Tree. Si le but est de trouver une valeur numérique alors on associe un modèle de régression simple à chaque espace de manière à ce que le modèle s’adapte de manière optimale au problème. On parle alors de Regression Tree.

Figure 4 – Fonctionnement d’un Model Tree. Source : Machine Learning Approach to Modeling

(10)

3 La Morphodynamique fluviale

On appel morphodynamique fluviale l’étude de la morphologie des rivières (l’étude de leur forme) ainsi que l’étude de la charge sédimentaire tel que présenté par Church [2006]. Ainsi, il s’agit d’un sujet de recherche aux enjeux réels et aux applications directs et variés (aménagement des rives, création de barrages, etc... ).

Dans cette étude, nous nous focaliserons sur la prédiction sédimentaire, c’est à dire comment prédire et avec quelle précision, la quantité de sédiment présente en un point de la rivière. En effet, cet aspect de la morphodynamique fluviale semble bien adaptée à des techniques de Machine Learning.

Les sédiments emportés par le courant peuvent être divisés en deux catégories : les sédiments charriés qui sont les plus lourds et qui se trouvent au fond de la rivière, ainsi que les sédiments en suspension qui sont plus légers (Fig 5).

Figure 5 – Sédiment Charriés/en suspension Source : Enseeiht

C’est ce transport de sédiment qui est à l’origine de la morphologie d’une rivière, ainsi il est important de pouvoir prédire la charge sédimentaire présente dans celle-ci. Il existe pour cela différents modèles physique (modèle d’Einstein, modèle de Parker, model de Yang, etc...) permettant de prédire la charge charriée ou en suspension grâce à différents paramètres comme le débit de l’eau, la taille des sédiments ou la profondeur de la rivière . Dans cette étude nous allons étudier si les approches utilisant une intelligence artificielle donnent de meilleurs résultats que les modèles traditionnels largement utilisés et le cas échéant, dans quelles conditions.

(11)

4 Utilisation du Machine Learning en Morphodynamique

flu-viale

4.1 Utilisation de modèles SVM

Dans l’article Machine Learning approach to predict sediment load-a case study, Aza-mathulla et al. [2010] ont tenté d’analyser la charge sédimentaire de trois rivières de Malaisie, la rivière Muda, Langat et Kurau grâce à un modèle SVM. La phase d’apprentissage s’est réalisée avec des données de dimension 12. Chaque donnée regroupe : le débit Q, le transport en suspension Tj, le transport par charriage Tb, la pente de la surface de l’eau So, la hauteur du lit R, la largeur du lit B, la section mouillée A, le coefficient de Manning n, la quantité totale de sediments Tt, la taille médiane des sédiments d50 et la vitesse moyenne de l’eau V (Tab. 1).

Table 1 – Données récoltées pour la rivière Kurau. Source : Azamathulla et al. [2010]

L’étude cherche à associer la base de données à une machine SVM pour trouver une relation du type : Tj = f(Q, V, B, Y0, A, P, S0), c’est-à-dire prédire la charge sédimentaire totale (charriée et en

suspension) grâce aux autres données connues de la rivière sur un tronçon donné du lit. Pour cela ils ont utilisé 150 données d’apprentissage, et 64 de test. Sur les 64 données de test, ils ont calculé la charge sédimentaire de 3 manières différentes : de manière classique en passant par les équations de (i) Yang et (ii) Engelund-Hansen et (iii) en utilisant la machine SVM préalablement entraînée. Il s’est avéré que la machine SVM avait des résultats au moins équivalent et souvent meilleur que ceux obtenu avec les équations (Fig. 6).

(12)

(13)

4.2 Utilisation de modèles ANN

La possibilité d’utiliser des réseaux de neurones pour étudier le transport sédimentaire fut évoquée par Bhattacharya et al. [2004] et par Cigizoglu [2004], leurs résultats étant finalement publiés dans Bhattacharya et al. [2007]. Dans cette étude les 3 chercheurs ont tenté de prédire la charge sédimen-taire charriée en utilisant les données (normalisées) de Gomez and Church [1988], ainsi que la charge sédimentaire totale en utilisant la base de données de Brownlie [1981]. Après avoir testé 3 scénarios différents il a été admis que la manière la plus précise de prédire la charge sédimentaire charriée est de donner en entrée du réseau de neurones le ”particule parameter” D= D50

(

(s−1)g v2

)1/3

et le ”trans-port stage parameter” T = θ′−θcr

θcr , avec D50 la taille médiane des sédiments, s =

ρs

ρ, ρs la densité des sédiments, ρ la densité de l’eau, g la constante gravitationnelle, v la viscosité cinématique de l’eau, θ′ est un paramètre de mobilité lié à la rugosité du grain et_θ_cr la contrainte au cisaillement critique. La RSNE et le percentage error du résultat obtenu par ANN ont ensuite été comparés à ceux des modèles classiquement utilisés sur cette même base de données : le modèle de Bagnold, le modèle d’Einstein, le modèle de Parker et le modèle de Rijn. Il s’avère que le modèle de Machine Learning obtient les meilleurs résultats (Tab. 2).

Table 2 – Performance du modèle ANN prédiction du charriage [Bhattacharya et al., 2007]

L’étude de la charge sédimentaire totale en prenant comme entrée D, la vitesse des ondes u, ainsi que la profondeur h, mène à des résultats similaires (Tab. 3).

Table 3 – Performance du modèle ANN prédiction de la charge sedimentaire totale [Bhattacharya et al., 2007]

Ce bon résultat n’est pas isolé. Kisi [2004] cherche a obtenir la concentration sédimentaire dans l’eau grâce à un réseau de neurone multicouches et obtient lui aussi un résultat satisfaisant (R2_{de 0.8).}

Melesse et al. [2011] utilisent un modèle ANN sur le Mississipi, le Missouri et le Rio Grande et trouvent un R2 _{de 0.87, Nourani [2009] cherche a prédire la charge sédimentaire présente à l’embouchure de la}

rivière Talkherood et réussi lui aussi à trouver de meilleurs résultats en utilisant un réseau de neurones ANN. Zhu et al. [2007] utilisent la même méthode sur la rivière chinoise de Longchuanjiang et démontre qu’elle a de meilleurs performances qu’un modèle plus simple, une Multiple Linear Regression (MLR) (Fig. 7).

(14)

Figure 7 – Comparaison des données observées avec les données prédites par un modèle ANN/MLR-PR [Zhu et al., 2007]

4.3 Utilisation d'un model tree

Bhattacharya et al. [2007] ont essayé de comparer une approche utilisant des réseaux de neurones (cf. 4.2) de Deep Learning, avec une approche de Machine Learning plus orientée statistique : un Regression Tree. Les résultats montrent que cette approche, bien que plus simple, est plus performante qu’une approche classique ou par modèles ANN (Tab. 4 et 5). Les résultats obtenus par le réseau de neurones étant déjà meilleurs que ceux obtenus par des modèles ”classiques”, ce résultat montre qu’il est toujours possible d’affiner encore davantage ceux obtenus par Machine Learning en faisant varier les modèles et les paramètres. Ainsi on peut citer Partal and Cigizoglu [2008], Rajaee [2011] ou Rajaee et al. [2011] qui associent un réseau ANN Classique avec en entrée une transformée en ondelette pour prédire la charge sédimentaire et qui obtiennent des résultats encore meilleurs (R2 _{de 0.92 pour leur}

(15)

Table 4 – Comparaison Modèle ANN et Model Tree, prédiction des sédiments charriés [Bhattacharya et al., 2007]

Table 5 – Comparaison Modèle ANN et Model Tree, prédiction des sédiments charriés et en suspension [Bhattacharya et al., 2007]

4.4 Utilisation de Réseaux de Neurones Complexes

Kisi [2005], Kisi et al. [2008] approfondissent le sujet et cherchent à trouver le meilleur modèle de Machine Learning en comparant différents types de réseaux de neurones ANN plus complexes. Un réseau ANFIS, un réseau RBNN, un réseau GRNN et un réseau FFNN pour prédire les sédiments suspendus dans l’eau des rivières turques (Tab. 6).

Table 6 – Performance respectives des différents modèles [Kisi et al., 2008]

Ainsi d’après la conclusion de cette étude le meilleur modèle ANN pour prédire la charge sédi-mentaire présente dans une rivière est le modèle ANFIS (Bien que tous les modèles sont efficaces, notamment le modèle FFNN). Le modèle ANFIS a donc été réutilisé pour d’autres études comme celle de Rajaee et al. [2009] qui tendent à démontrer elles aussi que ce modèle est particulièrement efficace pour prédire la charge sédimentaire dans l’eau.

(16)

4.5 Comparaison des différents modèles

Il existe donc de nombreuses méthodes de Machine Learning permettant de prédire la charge sédimentaire d’une rivière. Kumar et al. [2016] se proposent de comparer les performances d’un modèle ANN, de deux Model Tree, d’une machine SVM, d’un modèle RBNN et d’un modèle MLR (Multiple Linear Régression) sur une même base de donnée (Figures 8 et 9).

(17)

Figure 9 – Performance respectives des différents modèles (suite) [Kumar et al., 2016] Comme attendu, si il y a une différence notable entre le ”trainSet” et le ”testSet”, les modèles de Machine Learning sont tous plus efficaces que les modèles plus traditionnels. Le résultat de l’étude montre aussi que les modèles SVM/SVR sont plus efficaces que les réseaux de neurones ou que les arbres de décisions qui sont eux les moins efficaces. En effet, si les réseaux de neurones peuvent être sensiblement plus efficaces que les autres modèles, ils sont en revanche très sensibles lors de la phase d’apprentissage. Il est donc d’usage d’utiliser un modèle dit pré-entraîné, c’est à dire un modèle qui à été entraîné en amont avec une large base de donnée sur un problème plus simple. Il semble donc que la charge sédimentaire est un phénomène trop complexe pour pouvoir utiliser des réseaux de neurones sans les avoir pré-entraînés. Les réseaux de neurones ont tendance a ne pas comprendre le phénomène global mais seulement local. Ceci dit, les résultats d’un algorithme de Machine Learning sont très dépendants du traitement des données effectué en amont. Ainsi il est possible qu’avec un ”trainSet” différent les modèles ANN surpassent les autres.

(18)

veut faire du Machine Learning. On peut donc regretter que la plupart des études ne s’attardent pas sur la phase d’analyse des données. Par exemple les données utilisées par Azamathulla et al. [2010] (Tab. 1) sont corrélées entre elles, on pourrait donc vraisemblablement améliorer le résultat en traitant davantage la phase d’analyse des données.

Ce constat a été démontré par Afan et al. [2015]. En effet, ils tentent de montrer l’importance des données en entrée dans la prédiction de la charge sédimentaire présente dans une rivière. Pour cela, ils utilisent deux scénarios. Le premier ne prend en compte que des paramètres sur les sédiments. Le deuxième scénario s’attarde aussi sur sur le débit de la rivière. Comme attendu, c’est le deuxième scénario qui obtient les meilleurs résultats (Fig. 7).

(19)

Tayfur et al. [2013] tentent de trouver la manière optimale de traiter les données grâce à une Principal Component Analysis ou PCA [Hotelling, 1933]. Pour cela ils s’appuient sur les travaux de Yalin [1977] et de Dogan et al. [2009] qui montrent que le transport sédimentaire est avant tout une fonction de : u∗ la vitesse de frottement, q le débit unitaire, d50 la taille médiane des sédiments,ρ la

densité de l’eau, _ρ_s la densité des sédiments, h la profondeur de l’eau, B la largeur de la rivière, um la vitesse de l’eau,ν la viscosité cinétique, σ_g, S la pente, et g la constante gravitationnelle. En utilisant le théorème de Buckingham’s Pi, Dogan [2008] trouve 10 paramètres sans dimension auxquels Tayfur et al. [2013] ajoutent 8 autres paramètres issus de la littérature :

C= f( h d50 , ρ ρs ,umh ν , u∗d50 ν , hS (Gs−1)d50 ,um u∗, B h, q √ ghh, q u∗d50 , B d50 , νu∗ g(Gs−1)d250 , ν2 g(Gs−1)d3₅₀ , q 2 g(Gs−1)d3₅₀ ,ρsu∗ 2 γsd50 ,√ um g(Gs−1)d50 , S,σg, R d50 ) (3)

Les variables adimensionnelles sont définies dans le Tableau 7.

(20)

Après application d’une PCA, le nombre de paramètres peut être réduit à moins de 6 composantes tout en gardant une quantité d’information maximale en supprimant les données corrélées entre elles (Tab. 8).

Table 8 – Résultat des PCAs. Source : Tayfur et al. [2013]

Ainsi, en prenant ces données en entrée d’un réseau de neurones, on peut voir que le modèle performe logiquement mieux que les modèles ANN de Bhattacharya et al. [2007] par exemple (Tab. 9).

Table 9 – Résultat ANN après PCA. Source : Tayfur et al. [2013]

D’autres méthodes existent pour sélectionner les variables en entrée. Lafdani et al. [2013] utilisent un test Gamma [Stefánsson et al., 1997] pour traiter leurs variables en amont de leur modèle. Ils obtiennent ainsi de très bon résultats (Fig. 11 et Tab. 10).

(21)

Table 10 – Résultat de a) SVR et b) ANN après test Gamma. Source : Lafdani et al. [2013]

On peut voir encore une fois que sélectionner correctement les variables en entrée du réseau permet d’améliorer sensiblement les performances du modèle ANN.

Pour conclure cette partie, on peut remarquer que la prédiction de la charge sédimentaire nécessite généralement des réseaux de neurones complexes, mais comptant peu de neurones. Rajaee [2011] trouve un résultat optimal pour 6/7 neurones par couche (Figure 11), ce qui montre qu’il s’agit d’un phénomène moyennement complexe. En effet plus un réseau nécessite de neurones et plus il est difficile de reconnaître des patterns identifiables dans les jeux de données. De même, il ne semble pas qu’un grand nombre de couches cachées soit nécessaire. Par exemple Rajaee [2011] et Bhattacharya et al. [2007] ont utilisé des réseaux à 3 couches (donc une couche cachée seulement) et ont obtenu des résultats satisfaisants. Cela nous montre qu’il s’agit d’un phénomène relativement stable vis-à-vis des petites variations de données. En effet plus un modèle nécessite de couches cachées, plus le phénomène qu’il essaye de comprendre va être sensible aux sous transformations internes au jeu de données. Table 11 – Comparaison des performances en fonction du nombre de neurones. Source : Rajaee [2011]

(22)

5 Quelques tests exploratoires

5.1 Introduction

Pour terminer cette étude bibliographique, nous nous proposons d’effectuer quelques tests grâce à la base de donnée de l’Idaho [King, 2004], une base de données bien connue et utilisée dans diverses études [entre autre King, 2004, Barry et al., 2004, Mueller et al., 2005, Barry et al., 2008, Muskatiro-vic, 2008, Pitlick et al., 2008]. Cette base donnée contient des données de dimension 12 avec comme information : Q le débit, U la vitesse moyenne verticale, H la hauteur de l’eau, R le rayon hydraulique,

W la largeur de la rivière, S la pente de la rivière, D16, D50, D84 et D90 avec Dα le diamètre d’un

sédiment tel que_{α% des sédiments aient un diamètre supérieur à ce sédiment ainsi que qs le transport} solide que nous essayerons de prédire grâce a 3 méthodes : un modèle ANN, un modèle MLR et un modèle SVR.

5.2 Traitement des données

(23)

une erreur trop grande dans la prédiction des valeurs plus petites constituant la majorité des cas.

5.3 Résultats

Les figures 14, 15, 13 comparent les valeurs prédites par les modèles avec les données observées. Leurs performances respectives étant comparées dans le Tableau 12. Chaque modèle a été entraîné grâce à un jeu de données trainSet de 1226 observations et testé grâce à un jeu testSet de 304 obser-vations

Figure 13 – Résultat avec un modèle ANN

(24)

Figure 15 – Résultat avec un modèle SVR

Table 12 – Comparaison des modèles

Dans notre cas on peut voir que le modèle ANN performe un peu mieux que les autres mais peu importe le modèle, l’erreur reste proche de 0,2. Cependant comme on peut le voir sur les Figures 13, 14, 15, utiliser des modèles de Machine Learning pour prédire qs = f(U, S, H, Q, D50) montre un intérêt

limité. Pour améliorer ce résultat un travail plus approfondi sur le jeu de donnée et sur les modèles peut être effectué. En effet il pourrait par exemple être intéressant de voir si les paramètres trouvés par Tayfur et al. [2013] (cf. Figure 8) permettent de prédire qs de manière beaucoup plus précise sur les données de l’Idaho. De plus le modèle ANN utilisé ici est un modèle feed-forward à 3 couches (10, 5 et 5 neurones) issu de la library Keras [Chollet et al., 2015]. Il est fortement possible que ce modèle ne soit pas le modèle optimum pour ce problème, une piste d’amélioration consisterait à tester des modèles à plus de couches et/ou de neurones, voire à tester des modèles différents.

(25)

6 Conclusion

Finalement, Nagy et al. [2002] liste les avantages d’un modèle de Machine Learning sur un modèle classique :

— les modèles probabilistes sont capables d’adapter la nature stochastique du mouvement des sédiments plus que les formules empiriques classiques ;

— On peut toujours améliorer le modèle en rajoutant de l’information aux données en entrée ; — Contrairement aux formules physiques élaborées la plupart du temps grâce à des études

labo-ratoire, un modèle de Machine Learning peut être uniquement construit à partir des données récoltées sur le terrain tel que réalisé dans la Section 5.3 ;

— Les modèles de Machine Learning peuvent être utilisés par des ingénieurs sensibilisés aux li-mites d’une approche statistique (notamment dans l’interprétation des résultats) mais sans aucunes connaissances préalables en morphodynamique fluviale directement après avoir récolté les données sur le terrain ;

De plus, nous avons pu constater que les différentes études menées sur le sujet démontrent qu’un mo-dèle de Machine Learning était tout à fait capable d’égaler les momo-dèles classiques usuellement utilisés (Partie 4). Cela dit, nous avons aussi pu constater que le choix et le traitement des données en entrée du modèle est essentiel. Ainsi, nous avons pu voir à la Section 4.2 que les modèles de Deep Learning, pourtant plus puissant, pouvaient se montrer moins efficaces que des modèles statistiques sans une étude complète du jeu de données (Section 4.5). Enfin, nous avons vu dans la Section 5.3 que les modèles de Machine Learning ne sont pas toujours plus performant que les modèles physiques. Ainsi le Machine Learning est un nouvel outil viable pour prédire la charge sédimentaire en un point d’une rivière. Un outil qui s’ajoute, sans les remplacer, à la liste des différents modèles physiques existant actuellement.

Pour aller plus loin, on pourrait approfondir l’étude des données, une partie peu explorée dans les différentes études, on pourrait également essayer d’appliquer d’autres modèles que ceux testés. Enfin on pourrait s’intéresser à des domaines de la géomorphologie fluviale encore pas ou peu associés au Machine Learning comme par exemple la prédiction du tracé d’une rivière.

(26)

Bibliographie

H. A. Afan, A. El-Shafie, Z. M. Yaseen, M. M. Hameed, W. H. M. W. Mohtar, and A. Hussain. Ann based sediment prediction model utilizing different input scenarios. Water resources management, 29(4) :1231–1245, 2015.

H. M. Azamathulla, A. A. Ghani, C. K. Chang, Z. A. Hasan, and N. A. Zakaria. Machine learning approach to predict sediment load-a case study. CLEAN - Soil Air Water, oct 2010.

J. J. Barry, J. M. Buffington, and J. G. King. A general power equation for predicting bed load transport rates in gravel bed rivers. Water Resources Research, 40(10), 2004.

J. J. Barry, J. M. Buffington, P. Goodwin, J. G. King, and W. W. Emmett. Performance of bed-load transport equations relative to geomorphic significance : Predicting effective discharge and its transport rate. Journal of Hydraulic Engineering, 134(5) :601–615, 2008.

B. Bhattacharya, R. Price, and D. Solomatine. A data mining approach to modelling sediment

trans-port. World Scientific, 2004.

B. Bhattacharya, R. Price, and D. Solomatine. Machine learning approach to modeling sediment transport. Journal of Hydraulic Engineering, 133(4) :440–450, 2007.

D. Broomhead, D. S. ; Lowe. ”Radial basis functions, multi-variable functional interpolation and

adaptive networks”. RSRE, 1988.

W. R. K. Brownlie. ”Compilation of alluvial channel data : Laboratory and field”. Laboratory of Hydraulics and Water Resources, Division of Engineering and Applied Science, California Institute of Technology, Pasadena, Calif, 1981.

F. Chollet et al. Keras. https://keras.io, 2015.

M. Church. Bed material transport and the morphology of alluvial river channels. Annu. Rev. Earth

Planet. Sci., 34 :325–354, 2006.

H. K. Cigizoglu. Estimation and forecasting of daily suspended sediment data by multi-layer percep-trons. Advances in Water Resources, 27(2) :185–195, 2004.

G. Cybenko. Approximations by superpositions of a sigmoidal function. Mathematics of Control,

Signals and Systems, 2 :183–192, 1989.

E. Dogan. “Prediction of total sediment load in open channel with ANN (in turkish). PhD thesis, Dept. of Civil Eng., Sakarya Uinv., Turkey, 2008.

E. Dogan, S. Tripathi, D. A. Lyn, and R. S. Govindaraju. From flumes to rivers : Can sediment transport in natural alluvial channels be predicted from observations at the laboratory scale ? Water

(27)

J. G. King. Sediment transport data and related information for selected coarse-bed streams and rivers

in Idaho. Number 131. US Department of Agriculture, Forest Service, Rocky Mountain Research

Station, 2004.

O. Kisi. ”multi-layer perceptrons with levenberg–marquardt training algorithm for suspended sediment concentration prediction and estimation”. Hydrol. Sci. J, pages 1025–1040, 2004.

O. Kisi. ”suspended sediment estimation using neuro-fuzzy and neural network approaches”. Hydrol.

Sci. J, pages 683–696, 2005.

O. Kisi, I. Yuksel, and E. Dogan. Modelling daily suspended sediment of rivers in turkey using several data-driven techniques/modélisation de la charge journalière en matières en suspension dans des rivières turques à l’aide de plusieurs techniques empiriques. Hydrological Sciences Journal, 53(6) : 1270–1285, 2008.

D. Kumar, A. Pandey, N. Sharma, and W.-A. Flügel. Daily suspended sediment simulation using machine learning approach. Catena, 138 :77–90, 2016.

R. O. C. S. L. Breiman, J. Friedman. ”cart : Classification and regression trees”. Wadsworth

Interna-tional, 1984.

E. K. Lafdani, A. M. Nia, and A. Ahmadi. Daily suspended sediment load prediction using artificial neural networks and support vector machines. Journal of Hydrology, 478 :50–62, 2013.

A. Melesse, S. Ahmad, M. McClain, X. Wang, and Y. Lim. Suspended sediment load prediction of river systems : An artificial neural network approach. Agricultural Water Management, 98(5) :855–866, 2011.

J. Mercer. ”functions of positive and negative type, and their connection with the theory of integral equations”. Philos. Trans. Roy. Soc. London, A, pages 415–446, 1909.

E. R. Mueller, J. Pitlick, and J. M. Nelson. Variation in the reference shields stress for bed load transport in gravel-bed streams and rivers. Water Resources Research, 41(4), 2005.

J. Muskatirovic. Analysis of bedload transport characteristics of idaho streams and rivers. Earth

Surface Processes and Landforms : The Journal of the British Geomorphological Research Group,

33(11) :1757–1768, 2008.

H. Nagy, K. Watanabe, and M. Hirano. Prediction of sediment load concentration in rivers using artificial neural network model. Journal of Hydraulic Engineering, 128(6) :588–595, 2002.

V. Nourani. ”using artificial neural networks (anns) for sediment load forecasting of talkherood river mouth”. J. Urban Environ. Eng., 3, pages 1–6, 2009.

T. Partal and H. Cigizoglu. ”estimation and forecasting of daily suspended sediment data using wavelet-neural networks”. J. Hydrol, pages 317–331, 2008.

J. Pitlick, E. R. Mueller, C. Segura, R. Cress, and M. Torizzo. Relation between flow, surface-layer armoring and sediment transport in gravel-bed rivers. Earth Surface Processes and Landforms :

The Journal of the British Geomorphological Research Group, 33(8) :1192–1209, 2008.

T. Rajaee. Wavelet and ann combination model for prediction of daily suspended sediment load in rivers. Science of the total environment, 409(15) :2917–2928, 2011.

(28)

T. Rajaee, S. A. Mirbagheri, M. Zounemat-Kermani, and V. Nourani. Daily suspended sediment concentration simulation using ann and neuro-fuzzy models. Science of the total environment, 407 (17) :4916–4927, 2009.

T. Rajaee, V. Nourani, M. Zounemat-Kermani, and O. Kisi. River suspended sediment load prediction : application of ann and wavelet conjunction model. Journal of Hydrologic Engineering, 16(8) :613– 627, 2011.

D. E. Rumelhart, G. E. Hinton, and R. J. Williams. Learning representations by back-propagating errors. Nature, 323(6088) :533–536, 1986.

D. F. Specht. ”a general regression neural network”. IEEE Transactions on Neural Networks, page 568–576, 1991.

A. Stefánsson, N. Končar, and A. J. Jones. A note on the gamma test. Neural Computing &

Appli-cations, 5(3) :131–133, 1997.

G. Tayfur, Y. Karimi, and V. P. Singh. Principle component analysis in conjuction with data driven methods for sediment load prediction. Water resources management, 27(7) :2541–2554, 2013. V. Vapnik and A. Lerner. ”pattern recognition using generalized portrait method”. Automation and

Remote Control, 1963.

P. Werbos. Beyond regression : New tools for prediction and analysis in the behavioral sciences. PhD thesis, Harvard University, 1974.

M. Yalin. ”Mechanics of sediment transport”. Pergamon, Oxford, 1977.

Y. Zhu, X. Lu, and Y. Zhou. ”suspended sediment flux modeling with artificial neural network : an example of the longchuanjiang river in the upper yangtze catchment, china”. Geomorphology, 84 : 111–125, 2007.

(29)

Centre Center Lyon-Grenoble - Auvergne-Rhône-Alpes 2 rue de la Papeterie BP 76,

38 402 St-Martin-d’Hères - France

Rejoignez-nous sur :