500 1000 1500 2000 2500 3000
010203040506070
F. 3.4 – Prédictions du modèle en fonction de la dose dazote reçue. La ligne continue représente la médiane et les lignes pointillées les quantiles dordre 5 et 95.
Cet effet négatif a pu être contrebalancé par un rythme dapparition des feuilles plus rapide chez les plantes fertilisées lors de la première phase de développement, même si lutilisation dune forte dose na pas permis daugmenter signiicativement ce rythme p= 0.62.
Le temps de rupture et donc le changement de phase se fait plus tôt chez les plantes ayant reçu un apport azoté p < 0.001 pour les deux doses, mais, comme pour les autres paramètres, cette différence nest pas signiicative entre les deux doses dazote.
Aucune différence signiicative na été observée sur la différence de rythme entre les deux phases de développement. Le rythme dapparition des feuilles lors de la première phase étant plus élevé pour les plantes fertilisées, cela signiie donc que le rythme dapparition des feuilles reste plus élevé pour ces plantes au cours de la deuxième phase de développement. Cela signiie également que ce changement de rythme, qui se traduit par un ralentissement de la vitesse dapparition des feuilles, et donc un allongement du phyllochrone, a le même effet quel que soit la dose dazote reçue.
En utilisant les valeurs moyennes de chaque paramètre, le nombre de feuilles émises au moment du changement de phase est estimé à 37 pour les plantes sans azote, à 34 pour celles ayant reçu une dose normale et à 36 pour celles ayant reçu une forte dose. On remarque donc quen plus dêtre indépendant des autres paramètres, le temps de rupture semble également associé à un nombre de feuilles relativement stable dune dose à lautre, et situé autour de 35–36 feuilles.
La dose normale dazote était probablement suffisante pour permettre aux plantes de ne pas subir de stress azoté, puisquaucune différence signiicative na été relevée entre les deux différentes doses.
1.5 Discussion
Le modèle hiérarchique présenté ci-dessus nous a permis de prendre en compte à la fois les variabilités intra et inter-individuelles impliquées dans le phénomène dorganogenèse. Contrairement aux approches classiques basées sur des modèles à effets ixes, nous avons également pu tenir compte de la structure de corrélation des observations. La variabilité inter-individuelle étant signiicativement non nulle pour chaque
standard, et dautre part sur la différence entre la dose élevée et la dose standard dazote. Les résultats ne sont pas présentés dans le tableau pour des raisons de clarté.
paramètre du modèle, cela signiie quaucun de ces paramètres ne peut être traité comme un effet ixe, et quil est donc réellement nécessaire de prendre en compte sa variabilité dans la population comme nous lavons fait. Il est alors possible destimer cette variabilité, et de comparer différentes populations en tenant compte de cette variabilité.
Nous avons montré que le temps de rupture était non corrélé aux autres paramètres du modèle, et que le changement de phase associé pouvait être relié à un nombre de feuilles relativement stable denviron 35 feuilles. Lors de la comparaison des différentes doses, nous avons également montré quun même ra-lentissement sopérait au cours de la deuxième phase, quelle que soit la dose dazote reçue. Des résultats similaires ont été observés parLemaire et al.2009 sur la comparaison de trois densités de plantation. Ils ont montré que le rapport de rythme, cest-à-dire le ratio entre les rythmes dapparition des deux phases, étaient identiques pour chaque densité comparée, mais que le temps de rupture variait. Ces différents phénomènes peuvent sexpliquer par la forte compétition pour la lumière qui prévaut avant la couverture du sol par le feuillage. Avant cette date, les plantes cherchent à pousser plus vite et plus haut que leurs voisines et ont donc intérêt à avoir un phyllochrone qui soit le plus faible possible. Par contre, une fois ce point atteint, elles nont plus autant dintérêt à développer plus de feuilles, et pourraient donc adopter un comportement identique, qui pourrait correspondre en quelque sorte au comportement«minimal» requis.
Le même comportement a été observé sur dautres plantes, comme le navet, le colza, le chou frisé ou le rutabaga Fletcher et al., 2012. Sibma 1977 a également montré quil était possible daugmenter le rendement dune culture en lui faisant atteindre le point de couverture plus tôt, à un moment où lensoleillement et la production potentielle sont à leurs maximums.Dürr et Boiffin1995 ont également montré limportance datteindre la couverture foliaire du sol au moment le plus approprié, cest-à-dire lorsque la radiation est optimale.
Le premier intérêt de notre approche est de mieux comprendre ce phénomène clé de lorganogenèse, et sa variabilité au sein dune population de plantes, et dans différentes conditions environnementales. Une bonne description de lorganogenèse est également primordiale pour lapplication de modèles individus-centrés de type structure-fonction. En effet, une fois que les sources de variabilité du modèle ont été identiiées et quantiiées, il est possible détudier leurs propagations dans le système dynamique de crois-sance de la plante. Ces méthodes, dites danalyse dincertitudes, ont été étudiées dans le cadre des modèles de plantes parMonod et al.2006 : étant donnée une densité de probabilité pour les facteurs dentrée du modèle, on utilise des méthodes de type Monte Carlo pour évaluer lincertitude dans les facteurs de sortie.
Si les objectifs sont différents, les méthodes employées sont proches de celles utilisées lors dune analyse de sensibilité voir Chapitre1, section2.3. Lavantage de cette approche est quelle permet dobtenir en sortie du modèle, non pas une valeur unique, mais une distribution de probabilité, ce qui peut notamment savérer utile en analyse de risque. Cependant il est nécessaire, comme pour une analyse de sensibilité, de déinir au préalable la densité de probabilité des facteurs dentrée. Une autre approche consiste alors à développer un modèle de croissance de plante à effets mixtes.
Cest ce que nous proposons dans la section suivante, avec une adaptation du modèle structure-fonction Greenlab. Dans le cadre de ce modèle, nous pourrons également utiliser comme paramètres dorganoge-nèse, ceux estimés individuellement à laide du modèle présenté ici.
2 Le modèle Greenlab de population
Dans cette section, nous proposons une extension du modèle individu-centré Greenlab, présenté au Chapitre1, Section1.1dans le cas de la betterave voirJullien et al.2011 pour ladaptation du modèle Greenlab au colza, à léchelle de la population. Pour cela, nous utilisons la structure hiérarchique des modèles mixtes : dans un premier temps nous caractérisons la variabilité intra-individuelle, cest-à-dire la façon dont varient les observations dune même plante, en fonction de paramètres spéciiques à cette plante, puis dans un second temps nous étudions la variabilité de ces paramètres individuels dans la population.
Si le modèle dorganogenèse présenté dans la section précédente avait été entièrement implémenté dans le logiciel Monolix, nous avons adopté la démarche inverse dans le cas du modèle Greenlab : au lieu dimplémenter le modèle sous Monolix, nous avons choisi dimplémenter les algorithmes MCMC-EM et SAEM dans la plateforme de modélisation de léquipe, PyGMAlion.
Ce choix a été motivé par plusieurs raisons. Premièrement, le modèle Greenlab était déjà implémen-té sous la plateforme, qui est spéciiquement dédiée à la gestion de modèles dynamiques. Les ichiers dobservations, denvironnement, et de paramètres associés au modèle Greenlab étaient également déjà au format requis par PyGMAlion. Deuxièmement, lun de nos objectifs étant de comparer les deux al-gorithmes MCMC-EM et SAEM, il nous fallait choisir un environnement permettant dimplémenter les deux méthodes, ain dassurer une comparaison la plus objective possible. Enin, dans loptique de rendre cette méthode accessible aux autres modèles développés dans léquipe, il nous a paru indispensable de commencer par la mettre en œuvre sous PyGMAlion.
Le modèle dorganogenèse et le modèle Greenlab de population ont été codés séparément, principale-ment pour des raisons pratiques. En effet, les paramètres dorganogenèse déterminent le nombre dobser-vations et donc la taille des vecteurs individuels dobservation du modèle Greenlab de population : estimer ces paramètres avec lalgorithme EM impliquerait donc que pour chaque planteiobservée possédant un nombre ixenide feuilles, on obtiendrait à chaque itérationkde lalgorithme EM et à chaque étape de la procédure MCMC un vecteur de simulations de taillenk,(m)i , oùnk,(m)i na aucune raison dêtre égal àni. On chercherait donc à comparer des vecteurs de tailles différentes, ce qui poserait des problèmes numé-riques. Une solution pourrait être daugmenter artiiciellement la taille du plus petit vecteur en ajoutant des zéros, mais cela peut poser des problèmes lorsque lon utilise un modèle logarithmique, ou augmenter artiiciellement lécart entre simulations et observations. Une autre solution pourrait être de tronquer les vecteurs simulés dont la taille serait supérieure à celle du vecteur dobservation, mais cela ne règle pas le cas où le vecteur de simulations est plus petit.
Nous présentons dans cette section la formulation générale du modèle Greenlab à léchelle de la po-pulation, en considérant deux modèles derreurs, additif ou log-additif. Nous proposons également une formulation du modèle permettant la prise en compte de bruits de modélisation au niveau du processus de production de biomasse. Les deux algorithmes MCMC-EM et SAEM sont ensuite comparés sur plusieurs jeux de données virtuels, puis sur des données réelles provenant de la betterave sucrière et du colza.
2.1 Formulation du modèle
Comme les observations dont nous disposons pour chaque plante sont issues de mesures destructives, nous ne disposons pas du suivi au cours du temps de la croissance de la plante. Cependant, en utilisant la structure récursive de formation des biomasses de chaque organe, il est possible daccéder à lhistorique du développement de la plante à partir des observations faites, à un temps donné ixé, sur lensemble des
organes de la plante. Plus spéciiquement, la biomasse de lorgane de rangnobservé à un temps donné peut également être vue comme la biomasse de lorgane initié au tempstn. Ceci nous permettra en particulier décrire le modèle comme un modèle de Markov caché lorsque lon introduira des bruits de modélisation.
À un temps dobservation tobs ixé, nous notons yi = (yi(t1), . . . , yi(tni))le vecteur dobservation des biomasses initiées aux temps t1, . . . , tni pour la plante i, etO lensemble des organes de la plante.
Le nombre dobservations par plante, ni, correspond donc au nombre dorganes initiés, cest-à-dire au nombre dorganes présents sur la plante au moment où elle a été observée.
Or nous avons vu dans le premier chapitre, lors de la description du modèle Greenlab, mais également dans la première partie de ce chapitre, que ce processus dorganogenèse dépendait lui-même de plusieurs paramètres. Dans le cas de la betterave, on observe deux phases de développement, auxquelles sont associés quatre paramètres dorganogenèse : le temps thermique dinitiation, lephyllochronede la première phase, le temps thermique de rupture qui correspond à la mise en place de la deuxième phase de développement, et le phyllochrone de cette deuxième phase. Dans le cas du colza, une seule phase de développement est observée au cours du stade rosette, et seulement deux paramètres sont nécessaires : le temps dinitiation et le phyllochrone.
2.1.1 Variabilité intra-individuelle
On suppose ensuite que ces mesures correspondent à lobservation du système dynamique de croissance de la plante, que lon suppose ici déini par le modèle Greenlab, assortie dun bruit dobservation. Deux approches peuvent être utilisées pour prendre en compte ce bruit dobservation, par lintermédiaire dun modèle additif ou dun modèle log-additif. Lutilisation dun modèle additif peut cependant poser quelques soucis au niveau de la variance du bruit dobservation, car à la date à laquelle sont faites les mesures, certains organes sont encore en expansion, et nont pas encore atteint leur taille maximale. Ainsi, leurs masses pourront être largement inférieures à celles des organes matures, et lutilisation dun modèle additif peut conduire à une variance du bruit dobservation trop forte pour ces organes. Au contraire, le modèle multiplicatif tient compte naturellement de cette différence potentielle déchelle. De plus, lutilisation dun modèle additif avec bruit Gaussien possède également linconvénient théorique de fournir des observations à support dansR, alors que nous travaillons avec des quantités strictement positives.
Nous considérons dans la suite les deux modèles suivants, log-additif M1 ou additif M2 :
yi(tn) = Gn(ϕi)◦eεi,n, M1 εi,n∼ Ndn(0,Σn)
yi(tn) = Gn(ϕi) +εi,n, M2 εi,n∼ Ndn(0,Σn)
où ◦ représente le produit de Hadamard multiplication terme à terme de deux matrices,dn est le nombre dorganes de rangn,ϵi,nest un vecteur de tailledn,Gn(ϕi)est le vecteur des biomasses théoriques des organes de rang n pour la plantei, et ϕi est un vecteur de paramètres spéciiques à la plante i. En reprenant les notations du Chapitre 1, les biomasses des organes sécrivent en fonction de la séquence de biomasses produites depuis linitiation de chaque organe jusquau tempstobs auquel ont été faites les
observations :
Gn(ϕi) =
(ten∧tobs
∑
u=tn
so,n(u, pali ) d(u, pali ) qi(u)
)
o∈O
, 3.8
où nous rappelons que :
– tobs est le temps auquel les observations sont faites, – tnest le jour auquel sont initiés les organes de rangn,
– tenest le temps de in dexpansion en jours des organes de rangn,
– so,n(u, pali )est la fonction puits de lorgane de typeoet de rangnde la planteiau tempsu, – d(u, pali )est la demande totale de la planteiau tempsu,
– qi(u)est la production de biomasse de la planteiau tempsu.
Nous adoptons la conventionqi(t0) :=q0(i), oùq0(i)est la masse de la graine de la plantei. Betterave
Dans le cas de la betterave, trois types dorganes sont considérés : les limbes, les pétioles et la racine.
Lensemble des organes est doncO = {l, p, r}. La racine étant initiée en même temps que la feuille de rang 1 = les cotylédons, elle est incluse dans lobservation yi,1, et napparaît plus dans les observations ultérieures. On a donc les modèles suivants :
yi(tn) = Gn(ϕi)◦eεi,n, M′1
ou yi(tn) = Gn(ϕi) +εi,n, M′2
avec
εi,n∼
N3(0,Σl,p,r) si n= 1, N2(0,Σl,p) si n >1, Σl,p,r =
(Σl,p 0 0 σr2
) ,
Σl,p=
( σ2l ρσlσp
ρσlσp σp2 )
.
Colza
Dans le cas du colza, au stade rosette seules les feuilles sont prises en compte dans le modèle, on a donc O = {l}. Il ny a donc quune seule fonction puits, celle correspond aux feuilles. Le modèle sécrit alors simplement sous la forme suivante :
yi(tn) =Gn(ϕi)eεi,n, M′′1 ou yi(tn) =Gn(ϕi) +εi,n, M′′2
εi,n∼ N(0, σl2).
2.1.2 Variabilité inter-individuelle
On noteϕi = (ϕi,1, . . . , ϕi,P)tle vecteur contenant les paramètres du modèle spéciiques à la plante i. En supposant que la matrice de covarianceΓest diagonale, on a :
ϕi =β+ξi, 3.9
ξi ∼ NP(0,Γ).
Pour sassurer que les paramètres considérés ont bien pour supportR, on pourra considérer si nécessaire une transformation de la forme ϕi,j = hj(ψi,j), j = 1, . . . , P, où les ψi := (ψi,1, . . . , ψi,P) sont les paramètres individuels initiaux du modèle.