Lune des étapes essentielles lors de la construction dun modèle est celle de sa validation. Limportance de cette étape de validation a notamment été discutée dans le chapitre précédent, où nous précisions en particulier que le choix des critères dévaluation dépendait de lobjectif pour lequel le modèle avait été construit initialement. Par exemple, lorsque le but est dobtenir un outil prédictif, les critères présentés au chapitre précédent savèrent particulièrement adaptés, alors que si lobjectif est de construire un modèle purement descriptif, dautres critères seront utilisés. Il convient donc, comme précisé au chapitre précédent, de bien déinir en amont lobjectif du modèle.
Dans le cadre des applications de ce chapitre, notre principal objectif sera essentiellement descriptif. Le but est de décrire le mieux possible la population étudiée. Pour cela,Mentré et Escolano2006 proposent, dans le cadre des modèles non linéaires mixtes, dutiliser un critère basé sur les écarts de prédiction du modèle. À partir des estimations obtenues grâce aux algorithmes décrits précédemment, il est possible destimer la distribution des prédictions à laide de méthodes de Monte-Carlo. On déinit ensuite lécart de prédiction pour lindividuisous la conditiontij,eij, comme la valeur de la fonction de répartition des prédictions au pointyij.
Plus précisément, en notantYij, i= 1, . . . , s, j = 1, . . . , ni la prédiction du modèle pour lindividu iet la conditiontij, on a :
eij =P(Yij ≤yij), 2.62
oùyij est lobservation pour lindividuisous la conditiontij voir section1. La loi desYij est incon-nue, mais la fonction de répartition peut être approchée par des méthodes de Monte Carlo. Pour cela, on simuleM jeux de données(Yijm), m= 1, . . . , M selon le modèle 2.1 - 2.2, à partir de lestimateurθˆ. On approche ensuiteeij par le quantile empirique correspondant, cest-à-dire par
ˆ eij = 1
M
∑M
m=1
1Yijm≤yij. 2.63
Sous lhypothèse nulle {H0 : le modèle décrit bien les données}, ces écarts de prédiction suivent une loi uniforme sur [0,1]. Cependant, les erreurs de prédictions dun même individu sont corrélées, et les tests usuels du type Kolmogorov-Smirnov, qui requièrent lindépendance des données, ne peuvent pas être utilisés. Comets et al. 2008 ont alors proposé dutiliser une version décorrélée de ces erreurs de prédiction. Pour chaque individu, on note Yim le vecteur de prédictions du jeu de données simulé m. On calcule ensuite sa moyenne et sa variance empiriques sur lesM échantillons de Monte-Carlo, puis on déinit la prédiction décorréléeYim,∗ :
Yim,∗ = (VarYi)−1/2(Yim−E(Yi)). 2.64
Leserreurs de prédictioneˆ∗ij sont ensuite obtenues de la même façon que les écarts de prédiction, mais en utilisantYim,∗au lieu deYim. Pour inir, on déinit alors leserreurs normalisées de prédictioncomme :
npdeij = Φ−1(ˆe∗ij). 2.65
Ainsi normalisées, les erreurs de prédiction suivent, sous lhypothèse nulle, une loi normale centrée réduite.
Chapitre 3
Modélisation de la variabilité inter-plantes
“La plupart des hommes ont, comme les plantes, des propriétés cachées que le hasard fait découvrir.”
François de la Rochefoucauld,Maximes.
D
précédent, nous avons présenté une approche basée sur les modèles à effets mixtes, permettant de prendre en compte à la fois la variabilité intra- et inter-individuelle dans une popu-lation. La variabilité intra-individuelle est représentée par une fonction non linéaire décrivant lévolution des observations dun même individu, et la variabilité inter-individuelle, celle qui nous intéresse plus spé-ciiquement, est prise en compte en introduisant des effets aléatoires dans le modèle.Dans ce chapitre, nous présentons deux applications de cette méthodologie à la modélisation de la variabilité inter-plantes. Nous nous sommes intéressés tout dabord à la variabilité de lorganogenèse chez la betterave sucrière section1, à laide dun modèle mixte linéaire par morceaux, permettant de prendre en compte les deux phases de développement observées voir Chapitre1, section1.1.1. Ce modèle a été implémenté sous Monolix e Monolix Team,2011, logiciel dédié à lestimation dans les modèles non linéaires mixtes et basé sur lalgorithme SAEM présenté au chapitre précédent.
Puis, nous proposons en section2une extension du modèle Greenlab à léchelle de la population. Les performances des deux algorithmes destimation présentés dans le chapitre précédent ont été comparés sur des jeux de données simulées, puis sur des jeux de données réelles provenant de la betterave et du colza, en supposant un modèle de bruit portant uniquement sur les observations.
1 L’organogenèse chez la betterave
Nous présentons dans cette section une application des méthodes précédentes au modèle dorganoge-nèse chez la betterave dont la variabilité génétique est assez forte, ne sagissant pas dune lignée pure.
Cette variabilité sobserve en particulier sur le nombre de feuilles, qui peut être très différent dune plante à lautre, même dans des conditions environnementales identiques. Or, les plantes étant en com-pétition constante pour la lumière, la capacité pour certaines dentre elles de produire plus de feuilles, ou plus rapidement que leurs voisines, peut leur garantir un meilleur accès à la lumière et leur permettre de produire plus de biomasse.Liu et al.2004 ont par exemple observé dimportantes variations de rende-ment lorsque le rythme démission des feuilles ou la vitesse démergence différaient dune plante à lautre.
Linterception lumineuse étant directement reliée à la production de biomasse voir chapitre1, chaque
F. 3.1 – Croissance de la betterave sucrière simulée par le logiciel DigiPlant Cournède et al.,2006, aux cycles de croissance 15, 17, 20, 26, 30, 34, 39 et 43.
facteur ayant une inluence sur la vitesse dexpansion de la surface foliaire et donc sur la surface foliaire totale, pourra avoir un impact sur le rendement.
Le rythme dapparition des feuilles est donc un paramètre crucial dans le développement de la plante.
Il est en général déini à laide de son inverse, le phyllochrone voir aussi chapitre 1, section 1.1.1. La variabilité du phyllochrone a été étudiée pour plusieurs espèces, et plusieurs facteurs environnementaux ayant une inluence sur ce paramètre ont été identiiés. Dans leur étude du sorgho,Clerget et al. 2008
montrent par exemple quil existe une corrélation positive entre la température du sol et le phyllochrone, et une corrélation négative entre la photopériode et la longueur du jour dune part, et le phyllochrone dautre part. Des résultats similaires ont été observés parCao et Moss1989 pour le blé et lorge, et une courte revue des facteurs ayant une inluence sur le phyllochrone a été proposée parWilhelm et McMaster1995.
Parmi les facteurs pouvant provoquer une hausse du phyllochrone et donc un ralentissement du rythme dapparition des feuilles, on retrouve la température, un stress hydrique très important, ou même de fortes concentrations en sel. À linverse, le phyllochrone décroît lorsque la concentration en CO2augmente, ou lorsque la quantité et la qualité de la lumière diminuent.
Dans le cas de la betterave, Milford et al. 1985a,b ont observé deux phases distinctes dans le dé-veloppement de la plante, ce qui les conduit à déinir deux phyllochrones, un pour chaque phase. Ils ont observé, en comparant plusieurs années dexpérimentations et plusieurs traitements agricoles avec ou sans irrigation, avec ou sans engrais, en faisant varier la densité de plantation et la date de semis, que le phyllochrone de la première phase restait stable, mais que la durée de cette première phase, ainsi que le phyllochrone de la deuxième phase, étaient plus variables. Lemaire et al.2008 ont également observé ces deux phases successives dans le développement de la betterave, avec une première phase qui sétend de lémergence jusquà lapparition de la vingtième feuille environ, puis une seconde phase de ralentissement du développement foliaire correspondant à un plus grand phyllochrone. Plusieurs hypothèses peuvent être avancées pour expliquer ce phénomène :Milford et al.1985a suggèrent par exemple un changement dans la température de base servant au calcul du temps thermique voir équation1.6, et une augmentation de la compétition pour les ressources entre les feuilles et la racine. De leur côté,Lemaire et al.2008,2009 ont montré que ce changement intervenait au début de la phase linéaire de croissance racinaire, et au moment de la couverture du sol par le feuillage, lorsque la compétition pour la lumière augmente. Cette cassure se retrouve également chez certaines autres plantes, notamment chez le colza, mais dans ce dernier cas on assiste plutôt à une accélération quà un ralentissement du rythme démission des feuilles.
Néanmoins, si le phyllochrone moyen reste stable, il est fortement variable dune plante à lautre Frank et Bauer,1995, ce qui, associé à la variabilité du temps de germination ou démergence Dürr et Boiffin, 1995, implique une forte variabilité du nombre total de feuilles voir igure3.2.
Malgré cette forte variabilité inter-individus, peu détudes portant sur le phyllochrone la prennent en compte. La plupart dentre elles sont basées sur des modèles à effets ixes, soit basés sur toute la population
500 1000 1500 2000 2500 3000
10203040506070
Temps thermique
Nombre de feuilles
F. 3.2 – Nombre de feuilles en fonction du temps thermique pour 20 plantes poussant dans des conditions standard de densité 10.89 pl/m2 et dapport en fertilisants 136 kg/ha.
de plantes, et reposant donc sur lhypothèse irréaliste selon laquelle les données provenant dun même individu sont indépendantes voir par exemple Xue et al. 2004 ; Frank et Bauer 1995 ; Bauer et al.
1985 ;Streck et al.2005 ;Juskiw et al.2005, soit basés sur des valeurs moyennes, ce qui permet de contourner le problème des corrélations entre mesures, mais implique également une perte importante dinformation Lemaire et al.,2009. En prenant lexemple de lengrais, même si la littérature est relati-vement abondante concernant linluence que peut avoir ladministration dazote sur la croissance et le développement de la betterave, son effet sur chacun des paramètres dorganogenèse a rarement été étudié.
Lee et Schmehl1988 ont observé un effet non signiicatif de lazote sur le phyllochrone, mais un effet signiicatif de linteraction azote-date de récolte, et azote-date de récolte-date de semis. A contrario,Stout
1961 a montré quun niveau élevé dazote pouvait stimuler la croissance de nouvelles feuilles. Quoiquil en soit, les résultats de ces études reposent sur des hypothèses dindépendance entre mesures dune même plante, ou sur des valeurs moyennes, et doivent donc être interprétés avec précaution. En effet, il nest pas possible avec ce type dapproches de distinguer la variance imputable à la variabibilité inter-individuelle de la variance résiduelle, toutes les sources de variabilité étant alors réunies sous un même terme derreur, ce qui peut conduire à sous-estimer ou à sur-estimer la signiicativité des tests statistiques.
Nous proposons dans cette section un modèle dorganogenèse non linéaire mixte, permettant de mo-déliser lévolution du nombre de feuilles en fonction du temps thermique. Le modèle sera appliqué dans un premier temps sur une population standard, puis adapté pour tester leffet des facteurs environnemen-taux, en prenant pour exemple leffet de lazote. Le modèle a été entièrement implémenté sous le logiciel Monolix e Monolix Team,2011, dans lequel lestimation se fait par lalgorithme SAEM présenté en section2.4.