Conclusion - Système informatique d'aide à la modélisation mathématique basé sur un langage de

Figure 1.18 – visualisation des concepts rencontrés dans le domaine de l’agronomie quantitative et sujets explorés au sein de l’équipe Digiplante.

1.4 Conclusion

Dans ce chapitre, nous avons posé les bases de la modélisation mathématique des systèmes complexes. Nous avons vu que l’on peut approcher la chose soit par une modélisation purement statistique, soit par une modélisation mécaniste. Nous avons restreint notre champ d’étude à la modélisation mécaniste étant donné que c’est le seul type de modélisation qui permet de formuler des hypothèses vis à vis du fonctionnement interne des systèmes.

Nous avons aussi vu que dans le cadre de la modélisation des plantes, nous pouvons avoir affaire à différents types de modélisation selon la nature du système considéré. Toutefois, dans le cadre de nos travaux de recherche nous ne sommes pas encore penchés sur les notions telles que la modélisation multi-échelle ou multi-formalisme aﬁn de nous concentrer sur les bonnes pratiques de modélisation. Nous considèrerons uniquement les systèmes dynamiques discrets à espaces d’état continus, stochastiques ou déterministes aﬁn de pouvoir formuler un cadre de travail permettant d’apporter une solution à la problématique de recherche que nous avons précisée. Toutefois, ce sont des questions à garder en mémoire pour formuler des hypothèses quant aux perspectives de ces travaux.

Les travaux concernant notre cadre de recherche sont multiples car nous touchons à la fois à des no-tions telles que la modélisation et simulation des systèmes, l’analyse des modèles mécanistes et la stochasticité.

Nous avons présenté des approches qui ont alimenté notre cadre de réﬂexion quant à la modélisation et simulation, ainsi que l’analyse et nous verrons par la suite l’état de l’art concernant la stochasticité lorsque nous mettrons en place le cadre conceptuel concernant les simulations.

Chapitre 2

Modèles, noyau, simulation et langage

Dans ce chapitre nous décrirons les modèles utilisés d’un point de vue mathématique et informatique aﬁn d’introduire le vocabulaire et la sémantique nécessaires au développement d’un langage de modéli-sation. Puis nous effectuerons quelques rappels sur la notion de stochasticité et ce que cela implique en termes de générateur aléatoire, pourﬁnalement voir comment est implémenté le noyau et l’algorithme principal de simulation au sein de la bibliothèque C++.

2.1 Modèle mathématique

Dans cette section nous discutons du niveau de modélisation choisi pour nos systèmes biologiques ainsi que du cadre mathématique propice au développement des algorithmes d’analyse. Nousﬁnirons par présenter le cadre informatique qui découle de toutes ces considérations enﬁn de section.

2.1.1 Différentes approches

La modélisation des systèmes biologiques peut se faire selon différentes approches en fonction de la nature des données et des processus mis en jeu mais aussi en fonction des objectifs de la modélisation. L’approche mécaniste permet de mettre en avant certaines hypothèses de fonctionnement et d’organi-sation dans les plantes. La communauté de la modélid’organi-sation de la croissance des plantes développe des modèles à dfférentes échelles (Prusinkiewicz2004) :

— échelle cellulaire (Bessonov, Crauste et Volpert2011) — échelle de la plante individuelle (Reffye et al.2008)

— échelle de la population, vue comme un ensemble d’individu interagissant entre eux (Fournier et Andrieu1999), (Cournède et al.2008) ou comme population statistique (Baey et al.2012) — échelle du champ (Brisson2008)

Nous restreignons notre étude aux 3 derniers niveaux en considérant le cadre des modèles de Markov cachés. Ce cadre nous permet de développer un ensemble de méthodes statistiques. Il faut noter que les variables entrant en compte dans les différentes interactions ne sont pas toutes de nature observable et nous aurons l’occasion par la suite d’introduire le concept de variables d’états cachés pour rendre compte de ce phénomène. Par exemple, nous pouvons avoir accès à la masse totale d’une plante (et encore, seulement par mesures destructives) mais par contre la production journalière de biomasse est plus délicate à observer.

2.1.2 Représentation d’état

Soient (tn)0≤n≤N, la suite des temps de discrétisation du système étudié (par exemple une discrétisation journalière), une première formulation des modèles peut être faite grâce à sa représentation d’état qui

est donnée en (2.1) :      X₀donné Xn+1= Fn(Xn, Un, P,εn) Y_n= Gn(Xn, P,ε′ n) (2.1) où :

— Xnest l’ensemble des variables d’états du système au temps tn, Xn∈ Rq

— U_nest l’ensemble des variables de contrôle du système au temps t_n, U_n∈ Rm

— P est l’ensemble des paramètres du système, P ∈ Rp

— εn est une variable stochastique correspondant au bruit de modélisation ε = {ϵn}1≤n≤N avec ϵ∈ Rd

— F_nest la fonction de transition du système au temps t_n — ε′

nest une variable stochastique correspondant au bruit d’observation ε′= {ϵ′

n}_1≤n≤Navec ϵ′ ∈ Rd^′

— G_nest la fonction d’observation du système au temps t_n — Y_nle vecteur des observations du système à valeurs dans Ry.

Comme évoqué dans la problématique en 1.3.2, les systèmes biologiques que nous étudions ont la particularité que leurs observations sont :

— hétérogènes puisque nous pouvons observer autant le rendement que la surface foliaire, — non-périodiques car nous n’avons pas des données de façon régulière,

— rares car en plus du manque de régularité le volume est faible.

La fonction globale d’observation du système G est composée de k fonction d’observations gidont les exécutions sont contraintes par la fonction Λτ_i. τireprésente une timeline (ligne de temps) qui spéciﬁe à quel temps nous devons activer gi.

Nous réécrivons dés lors la fonction d’observation de la forme :        Gn(Xn, P,ε′ n) = (gi(Xn, P,ε′ n)Λτi(n))1≤i≤k Λτi(n) =    1, si n ∈ τi 0, sinon (2.2)

Cette représentation d’état est utile pour transmettre aux nouveaux modélisateurs le cadre dans lequel ils vont travailler et ainsi à la fois découpler et relier les différents compartiments du modèle.

2.1.3 Modèle de Markov caché

La description du modèle de Markov caché peut se retrouver dans (Trevezas et Cournède 2013) et (Cournède et al.2013) et est reproduite ci-dessous en (2.3) :

     X0 ∼ µp(.) Xn+1|(Xn= x) ∼ fn,P,Un(.|x) Yn|(Xn= x) ∼ gn,P(.|x) (2.3) avec :

— (Xn)_nle vecteur des variables d’états au temps n (biomasse, surface foliaire, ...) considéré comme une variable aléatoire à valeur dans Rq

— P ∈ Rple vecteur des paramètres du système qui peuvent être d’origine génétique ((Tardieu2003), (Letort2008))

— (Un)_n, les variables de contrôle dans Ru, qui reprèsentent l’environnement comme la température, le niveau d’irrigation

— Ynle vecteur des observations du système, variable aléatoire à valeurs dans Ry.

Cette formulation a été montrée comme équivalente à la formulation en représentation d’état pour Green-Lab dans (Trevezas et Cournède2013), ou pour LNAS (Chen2014).

La fonction d’observation et la transition principale du système sont stochastiques aﬁn de représenter les différentes pertubations qui ne peuvent pas être approchées par des processus déterministes comme les bruits de modélisation ou d’observation.

Cette formulation est pratique pour la mise au point d’algorithmes statistiques. Cependant, dans le cadre de l’élaboration d’un modèle et de son évaluation par un ordinateur, on lui préferera sa représentation d’état.

Dans la prochaine section, nous montrerons les différentes étapes qui ont mené du modèle mathéma-tique général à la création de la formulation informamathéma-tique et de l’ensemble du langage qui en découle.

Dans le document Système informatique d'aide à la modélisation mathématique basé sur un langage de programmation dédié pour les systèmes dynamiques discrets stochastiques.Application aux modèles de croissance de plantes. (Page 35-38)