Discussion - Modélisation de la variabilité inter-individuelle dans les modèles de croissance d

500 1000 1500 2000 2500 3000

010203040506070

F. 3.4 – Prédictions du modèle en fonction de la dose dazote reçue. La ligne continue représente la médiane et les lignes pointillées les quantiles dordre 5 et 95.

Cet eﬀet négatif a pu être contrebalancé par un rythme dapparition des feuilles plus rapide chez les plantes fertilisées lors de la première phase de développement, même si lutilisation dune forte dose na pas permis daugmenter signiicativement ce rythme p= 0.62.

Le temps de rupture et donc le changement de phase se fait plus tôt chez les plantes ayant reçu un apport azoté p < 0.001 pour les deux doses, mais, comme pour les autres paramètres, cette diﬀérence nest pas signiicative entre les deux doses dazote.

Aucune différence signiicative na été observée sur la différence de rythme entre les deux phases de développement. Le rythme dapparition des feuilles lors de la première phase étant plus élevé pour les plantes fertilisées, cela signiie donc que le rythme dapparition des feuilles reste plus élevé pour ces plantes au cours de la deuxième phase de développement. Cela signiie également que ce changement de rythme, qui se traduit par un ralentissement de la vitesse dapparition des feuilles, et donc un allongement du phyllochrone, a le même effet quel que soit la dose dazote reçue.

En utilisant les valeurs moyennes de chaque paramètre, le nombre de feuilles émises au moment du changement de phase est estimé à 37 pour les plantes sans azote, à 34 pour celles ayant reçu une dose normale et à 36 pour celles ayant reçu une forte dose. On remarque donc quen plus dêtre indépendant des autres paramètres, le temps de rupture semble également associé à un nombre de feuilles relativement stable dune dose à lautre, et situé autour de 35–36 feuilles.

La dose normale dazote était probablement suffisante pour permettre aux plantes de ne pas subir de stress azoté, puisquaucune différence signiicative na été relevée entre les deux différentes doses.

1.5 Discussion

Le modèle hiérarchique présenté ci-dessus nous a permis de prendre en compte à la fois les variabilités intra et inter-individuelles impliquées dans le phénomène dorganogenèse. Contrairement aux approches classiques basées sur des modèles à eﬀets ixes, nous avons également pu tenir compte de la structure de corrélation des observations. La variabilité inter-individuelle étant signiicativement non nulle pour chaque

standard, et dautre part sur la diﬀérence entre la dose élevée et la dose standard dazote. Les résultats ne sont pas présentés dans le tableau pour des raisons de clarté.

paramètre du modèle, cela signiie quaucun de ces paramètres ne peut être traité comme un eﬀet ixe, et quil est donc réellement nécessaire de prendre en compte sa variabilité dans la population comme nous lavons fait. Il est alors possible destimer cette variabilité, et de comparer diﬀérentes populations en tenant compte de cette variabilité.

Nous avons montré que le temps de rupture était non corrélé aux autres paramètres du modèle, et que le changement de phase associé pouvait être relié à un nombre de feuilles relativement stable denviron 35 feuilles. Lors de la comparaison des diﬀérentes doses, nous avons également montré quun même ra-lentissement sopérait au cours de la deuxième phase, quelle que soit la dose dazote reçue. Des résultats similaires ont été observés parLemaire et al.2009 sur la comparaison de trois densités de plantation. Ils ont montré que le rapport de rythme, cest-à-dire le ratio entre les rythmes dapparition des deux phases, étaient identiques pour chaque densité comparée, mais que le temps de rupture variait. Ces diﬀérents phénomènes peuvent sexpliquer par la forte compétition pour la lumière qui prévaut avant la couverture du sol par le feuillage. Avant cette date, les plantes cherchent à pousser plus vite et plus haut que leurs voisines et ont donc intérêt à avoir un phyllochrone qui soit le plus faible possible. Par contre, une fois ce point atteint, elles nont plus autant dintérêt à développer plus de feuilles, et pourraient donc adopter un comportement identique, qui pourrait correspondre en quelque sorte au comportement«minimal» requis.

Le même comportement a été observé sur dautres plantes, comme le navet, le colza, le chou frisé ou le rutabaga Fletcher et al., 2012. Sibma 1977 a également montré quil était possible daugmenter le rendement dune culture en lui faisant atteindre le point de couverture plus tôt, à un moment où lensoleillement et la production potentielle sont à leurs maximums.Dürr et Boiﬃn1995 ont également montré limportance datteindre la couverture foliaire du sol au moment le plus approprié, cest-à-dire lorsque la radiation est optimale.

Le premier intérêt de notre approche est de mieux comprendre ce phénomène clé de lorganogenèse, et sa variabilité au sein dune population de plantes, et dans diﬀérentes conditions environnementales. Une bonne description de lorganogenèse est également primordiale pour lapplication de modèles individus-centrés de type structure-fonction. En eﬀet, une fois que les sources de variabilité du modèle ont été identiiées et quantiiées, il est possible détudier leurs propagations dans le système dynamique de crois-sance de la plante. Ces méthodes, dites danalyse dincertitudes, ont été étudiées dans le cadre des modèles de plantes parMonod et al.2006 : étant donnée une densité de probabilité pour les facteurs dentrée du modèle, on utilise des méthodes de type Monte Carlo pour évaluer lincertitude dans les facteurs de sortie.

Si les objectifs sont diﬀérents, les méthodes employées sont proches de celles utilisées lors dune analyse de sensibilité voir Chapitre1, section2.3. Lavantage de cette approche est quelle permet dobtenir en sortie du modèle, non pas une valeur unique, mais une distribution de probabilité, ce qui peut notamment savérer utile en analyse de risque. Cependant il est nécessaire, comme pour une analyse de sensibilité, de déinir au préalable la densité de probabilité des facteurs dentrée. Une autre approche consiste alors à développer un modèle de croissance de plante à eﬀets mixtes.

Cest ce que nous proposons dans la section suivante, avec une adaptation du modèle structure-fonction Greenlab. Dans le cadre de ce modèle, nous pourrons également utiliser comme paramètres dorganoge-nèse, ceux estimés individuellement à laide du modèle présenté ici.

2 Le modèle Greenlab de population

Dans cette section, nous proposons une extension du modèle individu-centré Greenlab, présenté au Chapitre1, Section1.1dans le cas de la betterave voirJullien et al.2011 pour ladaptation du modèle Greenlab au colza, à léchelle de la population. Pour cela, nous utilisons la structure hiérarchique des modèles mixtes : dans un premier temps nous caractérisons la variabilité intra-individuelle, cest-à-dire la façon dont varient les observations dune même plante, en fonction de paramètres spéciiques à cette plante, puis dans un second temps nous étudions la variabilité de ces paramètres individuels dans la population.

Si le modèle dorganogenèse présenté dans la section précédente avait été entièrement implémenté dans le logiciel Monolix, nous avons adopté la démarche inverse dans le cas du modèle Greenlab : au lieu dimplémenter le modèle sous Monolix, nous avons choisi dimplémenter les algorithmes MCMC-EM et SAEM dans la plateforme de modélisation de léquipe, PyGMAlion.

Ce choix a été motivé par plusieurs raisons. Premièrement, le modèle Greenlab était déjà implémen-té sous la plateforme, qui est spéciiquement dédiée à la gestion de modèles dynamiques. Les ichiers dobservations, denvironnement, et de paramètres associés au modèle Greenlab étaient également déjà au format requis par PyGMAlion. Deuxièmement, lun de nos objectifs étant de comparer les deux al-gorithmes MCMC-EM et SAEM, il nous fallait choisir un environnement permettant dimplémenter les deux méthodes, ain dassurer une comparaison la plus objective possible. Enin, dans loptique de rendre cette méthode accessible aux autres modèles développés dans léquipe, il nous a paru indispensable de commencer par la mettre en œuvre sous PyGMAlion.

Le modèle dorganogenèse et le modèle Greenlab de population ont été codés séparément, principale-ment pour des raisons pratiques. En eﬀet, les paramètres dorganogenèse déterminent le nombre dobser-vations et donc la taille des vecteurs individuels dobservation du modèle Greenlab de population : estimer ces paramètres avec lalgorithme EM impliquerait donc que pour chaque planteiobservée possédant un nombre ixenide feuilles, on obtiendrait à chaque itérationkde lalgorithme EM et à chaque étape de la procédure MCMC un vecteur de simulations de taillen^k,(m)_i , oùn^k,(m)_i na aucune raison dêtre égal àni. On chercherait donc à comparer des vecteurs de tailles diﬀérentes, ce qui poserait des problèmes numé-riques. Une solution pourrait être daugmenter artiiciellement la taille du plus petit vecteur en ajoutant des zéros, mais cela peut poser des problèmes lorsque lon utilise un modèle logarithmique, ou augmenter artiiciellement lécart entre simulations et observations. Une autre solution pourrait être de tronquer les vecteurs simulés dont la taille serait supérieure à celle du vecteur dobservation, mais cela ne règle pas le cas où le vecteur de simulations est plus petit.

Nous présentons dans cette section la formulation générale du modèle Greenlab à léchelle de la po-pulation, en considérant deux modèles derreurs, additif ou log-additif. Nous proposons également une formulation du modèle permettant la prise en compte de bruits de modélisation au niveau du processus de production de biomasse. Les deux algorithmes MCMC-EM et SAEM sont ensuite comparés sur plusieurs jeux de données virtuels, puis sur des données réelles provenant de la betterave sucrière et du colza.

2.1 Formulation du modèle

Comme les observations dont nous disposons pour chaque plante sont issues de mesures destructives, nous ne disposons pas du suivi au cours du temps de la croissance de la plante. Cependant, en utilisant la structure récursive de formation des biomasses de chaque organe, il est possible daccéder à lhistorique du développement de la plante à partir des observations faites, à un temps donné ixé, sur lensemble des

organes de la plante. Plus spéciiquement, la biomasse de lorgane de rangnobservé à un temps donné peut également être vue comme la biomasse de lorgane initié au tempstn. Ceci nous permettra en particulier décrire le modèle comme un modèle de Markov caché lorsque lon introduira des bruits de modélisation.

À un temps dobservation tobs ixé, nous notons yi = (yi(t1), . . . , yi(tni))le vecteur dobservation des biomasses initiées aux temps t1, . . . , tni pour la plante i, etO lensemble des organes de la plante.

Le nombre dobservations par plante, ni, correspond donc au nombre dorganes initiés, cest-à-dire au nombre dorganes présents sur la plante au moment où elle a été observée.

Or nous avons vu dans le premier chapitre, lors de la description du modèle Greenlab, mais également dans la première partie de ce chapitre, que ce processus dorganogenèse dépendait lui-même de plusieurs paramètres. Dans le cas de la betterave, on observe deux phases de développement, auxquelles sont associés quatre paramètres dorganogenèse : le temps thermique dinitiation, lephyllochronede la première phase, le temps thermique de rupture qui correspond à la mise en place de la deuxième phase de développement, et le phyllochrone de cette deuxième phase. Dans le cas du colza, une seule phase de développement est observée au cours du stade rosette, et seulement deux paramètres sont nécessaires : le temps dinitiation et le phyllochrone.

2.1.1 Variabilité intra-individuelle

On suppose ensuite que ces mesures correspondent à lobservation du système dynamique de croissance de la plante, que lon suppose ici déini par le modèle Greenlab, assortie dun bruit dobservation. Deux approches peuvent être utilisées pour prendre en compte ce bruit dobservation, par lintermédiaire dun modèle additif ou dun modèle log-additif. Lutilisation dun modèle additif peut cependant poser quelques soucis au niveau de la variance du bruit dobservation, car à la date à laquelle sont faites les mesures, certains organes sont encore en expansion, et nont pas encore atteint leur taille maximale. Ainsi, leurs masses pourront être largement inférieures à celles des organes matures, et lutilisation dun modèle additif peut conduire à une variance du bruit dobservation trop forte pour ces organes. Au contraire, le modèle multiplicatif tient compte naturellement de cette diﬀérence potentielle déchelle. De plus, lutilisation dun modèle additif avec bruit Gaussien possède également linconvénient théorique de fournir des observations à support dansR, alors que nous travaillons avec des quantités strictement positives.

Nous considérons dans la suite les deux modèles suivants, log-additif M1 ou additif M2 :

yi(tn) = Gn(ϕi)◦e^ε^i,n, M1 εi,n∼ N^dn(0,Σn)

yi(tn) = Gn(ϕi) +εi,n, M2 εi,n∼ N^dⁿ(0,Σn)

où ◦ représente le produit de Hadamard multiplication terme à terme de deux matrices,dn est le nombre dorganes de rangn,ϵi,nest un vecteur de tailledn,Gn(ϕi)est le vecteur des biomasses théoriques des organes de rang n pour la plantei, et ϕi est un vecteur de paramètres spéciiques à la plante i. En reprenant les notations du Chapitre 1, les biomasses des organes sécrivent en fonction de la séquence de biomasses produites depuis linitiation de chaque organe jusquau tempstobs auquel ont été faites les

observations :

Gn(ϕi) =

(_t^e_n_∧t_obs

∑

u=tn

so,n(u, p^al_i ) d(u, p^al_i ) qi(u)

)

o∈O

, 3.8

où nous rappelons que :

– tobs est le temps auquel les observations sont faites, – tnest le jour auquel sont initiés les organes de rangn,

– t^e_nest le temps de in dexpansion en jours des organes de rangn,

– so,n(u, p^al_i )est la fonction puits de lorgane de typeoet de rangnde la planteiau tempsu, – d(u, p^al_i )est la demande totale de la planteiau tempsu,

– qi(u)est la production de biomasse de la planteiau tempsu.

Nous adoptons la conventionqi(t₀) :=q₀(i), oùq₀(i)est la masse de la graine de la plantei. Betterave

Dans le cas de la betterave, trois types dorganes sont considérés : les limbes, les pétioles et la racine.

Lensemble des organes est doncO = {l, p, r}. La racine étant initiée en même temps que la feuille de rang 1 = les cotylédons, elle est incluse dans lobservation yi,1, et napparaît plus dans les observations ultérieures. On a donc les modèles suivants :

yi(tn) = Gn(ϕi)◦e^ε^i,n, M^′1

ou yi(tn) = Gn(ϕi) +εi,n, M^′2

avec

εi,n∼







N3(0,Σl,p,r) si n= 1, N2(0,Σl,p) si n >1, Σl,p,r =

(Σl,p 0 0 σ_r²

) ,

Σl,p=

( σ²_l ρσlσp

ρσlσp σ_p² )

Colza

Dans le cas du colza, au stade rosette seules les feuilles sont prises en compte dans le modèle, on a donc O = {l}. Il ny a donc quune seule fonction puits, celle correspond aux feuilles. Le modèle sécrit alors simplement sous la forme suivante :

yi(tn) =Gn(ϕi)e^ε^i,n, M^′′1 ou yi(tn) =Gn(ϕi) +εi,n, M^′′2

εi,n∼ N(0, σ_l²).

2.1.2 Variabilité inter-individuelle

On noteϕi = (ϕi,1, . . . , ϕi,P)^tle vecteur contenant les paramètres du modèle spéciiques à la plante i. En supposant que la matrice de covarianceΓest diagonale, on a :

ϕi =β+ξi, 3.9

ξi ∼ N^P(0,Γ).

Pour sassurer que les paramètres considérés ont bien pour supportR, on pourra considérer si nécessaire une transformation de la forme ϕi,j = hj(ψi,j), j = 1, . . . , P, où les ψi := (ψ_i,1, . . . , ψi,P) sont les paramètres individuels initiaux du modèle.

Dans le document Modélisation de la variabilité inter-individuelle dans les modèles de croissance de plantes et sélection de modèles pour la prévision (Page 103-108)