R EVUE DE STATISTIQUE APPLIQUÉE
F RANÇOIS H USSON
Construire un modèle stochastique à partir d’un modèle déterministe
Revue de statistique appliquée, tome 49, n
o4 (2001), p. 5-27
<http://www.numdam.org/item?id=RSA_2001__49_4_5_0>
© Société française de statistique, 2001, tous droits réservés.
L’accès aux archives de la revue « Revue de statistique appliquée » (http://www.sfds.asso.fr/publicat/rsa.htm) implique l’accord avec les condi- tions générales d’utilisation (http://www.numdam.org/conditions). Toute uti- lisation commerciale ou impression systématique est constitutive d’une in- fraction pénale. Toute copie ou impression de ce fichier doit contenir la présente mention de copyright.
Article numérisé dans le cadre du programme Numérisation de documents anciens mathématiques
http://www.numdam.org/
CONSTRUIRE UN MODÈLE STOCHASTIQUE
À PARTIR D’UN MODÈLE DÉTERMINISTE
François
HussonLaboratoire de
Mathématiques appliquées,
ENSA de Rennes,65 rue de Saint Brieuc, 35042 Rennes Cedex
RÉSUMÉ
Très souvent en modélisation, les modèles construits sont déterministes dans le sens où ils
prédisent toujours
les mêmes résultats (i.e. les mêmes valeurs pour les variables de sortie)pour
un jeu
de variablesexplicatives
donné. Pourtant, il est intéressant de connaître la variabilité des variables de sortie. Dans de nombreux cassimples,
uneméthodologie
estdisponible
pour construire un modèlestochastique,
mais ce n’est pas le caslorsque
le modèle déterministe estcomplexe
(cequi
estfréquent
enagronomie
ouécologie
parexemple).
Dans cet article,on décrit
plusieurs
méthodes permettant de construire un modèlestochastique
àpartir
d’unmodèle déterministe et on choisit une méthode
qui
peuts’appliquer
à un modèle déterministecomplexe.
Onapplique
alors cette méthode à unexemple
issu del’agronomie.
Mots-clés : Modèle non linéaire à
effets
mixtes, variabilité, modèlestochastique
ABSTRACTVery often in
modeling,
the built models are deterministic becausethey always predict
the same values for the output variables when the
input
variables aregiven.
However, it isinteresting
to know thevariability
of the outputs. In manysimple
cases, amethodology
isavailable to build a stochastic model, but it is not the case when the deterministic model is
complex
(which isfrequent
in agronomy orecology
forexample).
In this article, one describes several methodsallowing
to build a stochastic model from a deterministic model and onechooses a method which can be
applied
to acomplex
deterministic model. One thenapplies
this method to an
example resulting
from agronomy.Keywords :
Non linear mixed model,variability,
stochastic model0. Introduction
-.
La
plupart
des modèlesagronomiques
donnent des résultatsdéterministes :
ilsprédisent toujours
les mêmes résultats pour unjeu
de variablesexplicatives
donné. Laconnaissance des distributions des
prédictions
du modèle estpourtant précieuse
pour connaître la variabilité de ces résultats et pour calculer parexemple
des intervalles de confiance desprédictions.
Un modèle déterministe n’est pas suffisant et l’introduction d’aléatoire dans le modèle estnécessaire,
d’où la construction de modèle que l’onappelle
modèlestochastique.
Un tel modèle donne à la fois laprédiction
et la variabilité de ses variables de sortie.Si nous
appliquons
notre définition des modèles déterministes et des modèlesstochastiques
au modèlelinéaire,
le modèle déterministe est Y =X (3
et le modèlestochastique
est Y =X03B2
+ E avec E une variable aléatoirequi suit,
parexemple,
uneloi normale. Donc lors de la construction de modèle
linéaire,
on construit directementun modèle
stochastique.
Par contre,lorsqu’on
construit un modèleagronomique,
le modèle est déterministe. En
effet,
les modèlesagronomiques
sont souvent des modèles trèscomplexes qui
sont itératifs(une
itération parjour)
etqui
utilisentde très nombreuses
équations.
Des variablesprédictrices,
telles que des variablesmétéorologiques,
des variables décrivant l’état du sol ou encore lavariété,
sont utilisées en entrée par le modèle. Le modèlepermet
ensuite deprédire plusieurs
variables telles que le
rendement,
laquantité
de matièresèche,
la date derécolte,
etc.Ces modèles
agronomiques
étantcomplexes,
les calculs(et
donc lesprédictions)
nepeuvent être effectués que par des ordinateurs. On
parle
alors de simulations(une
simulation étant l’ensemble descalculs,
dequelques jours
avant le semis à larécolte, qui
permet deprédire
l’ensemble des variables desortie).
Notons deplus
que les modèlesagronomiques
utilisentgénéralement
énormément deparamètres,
et doncqu’il
estimpossible
d’estimer tous lesparamètres
du modèle. Lesparamètres
sontestimés par des
expériences
antérieures lors de la construction de sous-modèlesqui
sont utilisés dans le modèle
(par exemple,
un sous-modèlepermettant
de simulerl’absorption
d’eau par laplante
a étéparamétré, puis
est inclus dans le modèle de croissance de laplante). Ainsi, lorsque
le modèle déterministe estconstruit,
lesparamètres
du modèle ont été déterminés(nous
noterons cesparamètres (3)
et sontconsidérés comme fixes
(et
non comme des variablesaléatoires).
Dans cet
article,
on considère queplusieurs
mesures sont effectuées sur unmême
individu,
que ces mesurespeuvent
être effectuées surplusieurs
variables etqu’elles
peuvent être effectuées à des intervalles de tempsirréguliers
d’un individuà l’autre. Par
exemple,
si on modélise la croissance d’uneplante,
onpeut
avoir5 mesures de
poids puis
une mesure du rendement sur un même individu. On définit le modèle déterministe paroù y
est un vecteurcorrespondant
à toutes lesprédictions disponibles
dans le modèle(par exemple : plusieurs quantités
de matièresèche,
la date derécolte,
lerendement,...)
et
X dtj 1est
le vecteur desprédicteurs
duième
individu(ou traitement) correspondant
à l’ensemble des variables
explicatives
utilisées par le modèlejusqu’à
la datedl il
du
prélèvement
de la mesurej, f
est une fonction(linéaire
ou nonlinéaire)
desparamètres 0
et du vecteur desprédicteurs X;{.7}.
. On considère que le modèle deterministe a été construit etparamétré
et donc que desexpériences
antérieuresont permis d’estimer les
paramètres
J (par/)).
Les résidus du modèle déterministesont donc calculables :
où ?/"
estla j ème
mesure(observations)
sur leième individu,
ete"
le résidu dumodèle déterministe
correspondant
à cette mesure.C’est la distribution
de y qui
nous intéresse mais pour connaître cette distri-bution,
il suffit de connaître la distribution des résidus. Notrestratégie
consiste àconsidérer que le modèle déterministe
explique déjà
unepart importante
de la va-riabilité des observations. On s’intéresse alors à la variabilité des résidus du modèle
sans
distinguer
si cette incertitudeprovient
d’une mauvaise connaissance des varia- blesd’entrée,
d’une mauvaise estimation desparamètres,
de certaineséquations
dumodèle
qui
ne sont pas tout àfait justes,
d’erreursd’échantillonnage
ou d’erreurs demesures.
Si les résidus du modèle déterministe sont
indépendants
etidentiquement distribués,
lesprédictions
du modèlestochastique
se calculentsimplement
enajoutant
une variable aléatoire
fi
au modèle déterministe :avec
u 2
la variance des résidus(la
loi des12
est très souventNormale).
Cependant,
si les résidus du modèle déterministe ne sont pasindépendants,
cette modélisation ne convient pas.
Or,
siplusieurs
mesures sont effectuées sur un mêmeindividu,
les résidusrisquent
d’être autocorrélés. Ils sont même presquesystématiquement
autocorréléslorsqu’une
même variable est mesurée à différentsinstants.
Pour montrer
l’importance
de l’étudeprésentée
dans cet article, on peutsouligner
quel’analyse
de données à mesuresrépétées
est unproblème
trèsfréquent
en
statistique
et trouve de nombreusesapplications
dans desdisciplines
très variéescomme la
pharmacologie
oul’agronomie (des
concentrations de médicament ou despoids
deplante
sont des mesuresrépétées
dans letemps).
Des modélisations
stochastiques (que
nous détaillerons par lasuite)
sontdispo-
nibles dans de nombreux cas
simples (résidus
du modèle déterministeindépendants,
modèle
linéaire,
modèle non linéairesimple)
mais si le modèle déterministe est unmodèle non linéaire
complexe,
comme les modèlesdynamiques
que l’on rencontrefréquemment
enagronomie
ouécologie
parexemple,
alors on ne sait pas comment rendrestochastique
le modèle.L’objectif
de cet article est deprésenter puis
de com-parer différentes méthodes permettant de construire un modèle
stochastique
àpartir
de modèles déterministes
linéaires,
nonlinéaires, statiques, dynamiques,
etc. Pourcela, nous évaluerons différentes modélisations
disponibles
pour les cassimples
etnous verrons si elles peuvent être
adaptées
à des modèlescomplexes.
Le choix de la modélisation
dépend
essentiellement du modèle déterministe lui-même et de ses résidus. Dans unpremier temps,
nous verrons comment testerl’indépendance,
le nonbiais,
la multinormalité des résidus. Nous décrirons ensuitequelques
modèlesstochastiques
et nous verrons sousquelles
conditions ilspeuvent
être utilisés. Enparticulier,
on s’intéressera aux modèles non linéaires à effets mixtes et on décrira alors deux méthodesqui permettent
d’estimer lesparamètres
de tels modèles.
Enfin,
on construira enguise d’exemple
un modèlestochastique
decroissance du colza.
1.
Étude
des résidus du modèle déterministeAfin de choisir la méthode la
plus adaptée
pour construire un modèle stochas-tique,
on étudie lecomportement
du modèle déterministe et celui de ses résidus : le modèle est-ilbiaisé,
les résidus pour un même individu sont-ilsindépendants
ou au-tocorrélés,
les résidus suivent-ils une loimultinormale,
les erreursd’échantillonnage
sont-elles relativement
importantes
etexpliquent-elles,
à ellesseules,
les résidus dumodèle déterministe?
1.1.
Étude
du biais du modèleL’étude du biais d’un modèle est
simple :
il suffit de tester, variable parvariable,
si la moyenne des résidus estégale
à 0. Pour cela on utilise des tests de conformité(test t).
Pour des variables continues(telle
que laquantité
de matièresèche),
on estamené à réaliser autant de tests
qu’il
y a de dates de mesure. Si toutes les variables sont sansbiais,
alors le modèle sera dit sans biais. Notonsqu’il
esttoujours possible
de se ramener à un modèle sans biais par translation.
1.2.
Étude
del’indépendance
des résidusL’indépendance
des résidus est unehypothèse plus
intéressante car c’est unecondition
indispensable
dans de nombreux tests.Or,
siplusieurs
mesures sontréalisées sur un même
individu,
les résidus du modèle déterministe forment unesérie
chronologique
et il est intéressant de tester si c’est un bruit blanc ou non. Lastatistique
de Durbin-Watson ou le test de portemanteau(Seber
etWild, 1989, p.322) permettent
de testerl’ hypothèse
que les coefficients de corrélation entre observations successives sont nuls si les observations sont réalisées à intervalles de tempsréguliers.
Cependant,
bien souvent, il est difficile de fairebeaucoup
de mesures et desmesures à intervalles de
temps réguliers (en
raison de contraintesclimatiques,
deprélèvements destructifs, ... ).
Les testsclassiques
d’autocorrélations ne peuvent pas être utilisés et on doit recourir à des tests nonparamétriques.
On va construire un test, certes moinspuissant
que les tests d’ autocorrélationsclassiques,
maisqui
permet detester
l’indépendance
d’observationsquelle
que soit lafréquence
des mesures.Pour que les résidus soient
indépendants,
il est nécessaire que lessignes
desrésidus,
classés par ordrechronologique,
soientindépendants (cette
condition n’est passuffisante).
On va alors testerl’hypothèse
«H : les occurrences dessignes
desrésidus sont
indépendantes (à
l’ordre1 )» .
Pourcela,
il est nécessaire que les résidus soient centrés. On se base alors sur le test de Wald-Wolfowitzqui permet
de tester que, dans un échantillon de «A» et«B »,
les lettres sont distribuées au hasard(Tomassone
et
al., 1993, p.220). Cependant,
ce testpermet uniquement
de testerl’hypothèse
individu par
individu,
donc on est amené à le modifier pour avoir un testglobal
entrois
étapes :
1. on
calcule,
individu parindividu,
le nombre dechangements
designes
observéet le nombre de
changements
designes
maximalqui
aurait pu être observé(=le
nombre d’observations moins1);
2. on somme sur tous les individus pour obtenir le nombre de
changements
designes global (nobs)
et le nombre dechangements
designes
maximalglobal (nmax) ;
3. on calcule alors la
probabilité
d’observer un nombre dechangements
designes
inférieur ou
égal
à nobs sil’hypothèse
H est vraie et de cetteprobabilité,
onconclut.
Soit t la variable aléatoire
correspondant
au nombre total dechangements
designe;
on notePH(t nobs)
laprobabilité
d’observer un nombre dechangements
de
signes
inférieur ouégal
à nobs sousl’hypothèse
H :PH (t
=r)
est laprobabilité
d’avoir exactement rchangements
designes.
Les résidusétant
indépendants
d’un individu àl’autre, PH (t
=r)
nedépend
que de nmax et pasdu nombre d’individus. Par
conséquent,
pour calculerPH (t
=r),
onpeut
considérerqu’on
a un seul individu avec 1 + nmax résidus(et
donc nmaxchangements
designes
auplus),
d’où :De cette
probabilité,
on déduitl’indépendance
ou non dessignes
desrésidus,
et par suite des résidus du modèle déterministe.Comparé
aux testsclassiques
d’autocorréla-tions,
ce test est moinspuissant
car il ne tient pascompte
del’amplitude
des écartsentre deux valeurs successives et donc n’utilise
qu’une partie
de l’informationprésente
dans les observations.
Cependant,
enpratique,
ce test est très souvent suffisant pourmettre en évidence les corrélations entre résidus successifs.
Notons que si
PH (t -- nobs)
estfaible,
alors les résidus pour un même individu ont tendance à être du mêmesigne.
Celasignifie
que le modèle déterministe à tendance à surestimer(ou sous-estimer) systématiquement
les observations d’un même individu.1. 3.
Étude
de la multinormalité des résidusPour déterminer si la distribution des résidus du modèle déterministe est
multinormale,
onpeut
utiliser le test de multinormalitéproposé
par Mardia(1974).
Ce test est fondé sur les
statistiques
du coefficientd’asymétrie
et du coefficientd’aplatissement
multivarié. Ce test de multinormalité estdisponible
dans lelogiciel
SAS
(version 6.12).
1.4. Distinction des erreurs
d’échantillonnage
et des erreurs de
prédiction
du modèleSi des
répétitions
sontdisponibles
pour un mêmetraitement,
il est intéressant dedistinguer
les erreurs deprédiction
du modèle des erreursd’échantillonnage
dansle calcul des résidus du modèle. En
effet,
la variabilité des résiduspeut
sedécomposer
en deux termes : la variance des erreurs
d’échantillonnage
et la variance des erreursde
prédiction
du modèle. Si la variance des erreurs deprédiction
du modèle est faiblecomparée
à la variance des erreursd’échantillonnage,
alors le modèle déterministe est bon et le modèlestochastique peut
être construit avecl’équation (2).
La
présence
derépétitions
permetégalement
de tester si une combinaison des variablesexplicatives (ce qu’on appelle traitement)
a un effetsignificatif
sur lesrésidus. Des résultats de ce test
dépend
la modélisationstochastique
que l’on choisira de mettre enplace.
2. Modèles
stochastiques
On va
présenter quelques
modèlesstochastiques après
les avoirséparés
en deuxclasses :
1. Les modèles avec une variabilité additive sur les variables de sortie
2. Les modèles
dynamiques stochastiques
Lors de la
présentation
de chacun desmodèles,
onprécisera
sousquelles
conditions ils sont utilisables et
quelles
sont les difficultés rencontrées pour estimer lesparamètres
d’un tel modèlelorsque
le modèle déterministe(i. e.
la fonctioncjJ)
estcomplexe.
2.1. Modèles
stochastiques additifs
Les modèles
stochastiques
additifs se construisent enajoutant
auxprédictions
du modèle déterministe un terme d’erreur. C’est ce terme d’erreur
qui
rend le modèlestochastique.
Plusieurs modélisations de la variabilité et des corrélations des résidus des variables de sortie du modèle sontenvisageables.
2.1.1. Modèle de
base, 03BE
et 03A3quelconques
Avant d’étudier des modèles
stochastiques complexes,
onpeut adapter
le modèlestandard
(2)
à notre étude. On note :où y,
est le n2-vecteur desobservations, f(, Xi )
est le n2-vecteur desprédictions
du modèle
(ce
ni-vecteur desprédictions peut
aussi se noteri),
est le vecteurestimé des
paramètres
dumodèle, Xi
est la matrice des variablesprédictrices
etêi
est le ni-vecteur des résidus du modèle pour le traitement i. On a
ici /3
et noncar
comme cela a été
souligné
enintroduction,
le modèle utilise lesestimations /3
desparamètres j3
obtenues par desexpériences
antérieures. Le biais du modèle s’écritÇi == E( êi) = E(yi - f(, Xi ) ) .
Si les vecteursêi
sontindépendants
et suivent uneloi
multinormale,
on aêi
i f"’VN (Çi, 03A3i) où Çi et S. dépendent
de iuniquement
par leur dimension. Celasignifie qu’on peut écrire 03BEi = D’i03BE
etE = D’i03A3Di où 03BE
est unvecteur
(N
x1)
et E est une matrice(N
xN)
de variances-covariancesquelconque (N
étant le nombre de mesurespossible) qui
n’estdiagonale
que dans le casparticulier
où les
composantes
du vecteurêi
sontindépendantes (i. e.
si les résidus du modèle déterministe sontindépendants
d’une mesure àl’autre)
etDi
est une matrice(N
xni ) composée
de 1 et de 0. Les matricesDi
sontparticulières
car on trouve une et uneseule
composante qui
vaut 1 par colonne et toutes les autrescomposantes
valent 0.Les ni
composantes qui
valent 1 ont pour numéro deligne
les numéros des mesuresqui
sont effectuées sur l’individu i. Parexemple si,
lors d’uneexpérience,
N = 5mesures peuvent être effectuées sur des individus et que sur l’individu
io,
les mesures1,
3 et 5 sontmanquantes,
on écrira :et
Chaque composante de 03BE
et Epeut
êtreestimée, respectivement,
par la moyenneempirique
et par les variances ou covariancesempiriques
des résidus du modèle.Cependant,
les estimations de toutes les composantesde 03BE
et E sont souvent difficilesà obtenir car il est très
fréquent
que des données soientmanquantes
et que l’on effectueun nombre ni de mesures sur le traitement i
qui
est très inférieur à N. Parexemple,
pour des mesures de
poids journalières,
Ncorrespond
au nombre dejours pendant
la culture et comme ces mesures sont coûteuses et
destructrices,
elles sont effectuéesbeaucoup
moins souvent.Cette modélisation convient aux
problèmes ayant
peu de variables de sortie et où les sorties sont des variables à tempsfixe,
i. e. mesurée une seule fois(par exemple,
le
rendement,
la date delevée).
Eneffet,
si des variables sont àtemps
discret(i. e.
mesurées
plusieurs
fois dans l’étude comme parexemple
lepoids),
alors le nombrede sortie du modèle est
important,
cequi augmente
la taillede 03BE
et 03A3. Parexemple,
si une variable est observée à 200
instants,
levecteur 03BE
sera de taille 200 x 1 et lamatrice S de taille 200 x 200 d’où l’estimation de 20300
paramètres indépendants.
Lemodèle
stochastique
utilise alorsbeaucoup
deparamètres
cequi
rend les estimations peu stables et la modélisation mauvaise d’unpoint
de vueprédictif.
2.1.2. Modélisation
de ç
et 03A3Si on veut décrire des variables à
temps discret,
les estimationsempiriques
descomposantes
de 03BE
et E sont très difficiles à obtenir. Onpeut
alors modéliser le vecteur desespérances
et la matrice de covariances des résidus afin de diminuer le nombre deparamètres
à estimer. Faivre et al.(1991)
proposent des formes fonctionnelles pour lesespérances,
variances et covariances des résidus. Parexemple,
si lesespérances
sont linéaires en fonction du temps
(de j )
et si les covariances sont linéairesen j’,
on peut proposer les formes suivantes :
03B84
est unparamètre
commun à la variance et à la covariance etreprésente (en pratique)
la variance associée à l’erreur de mesure. Le nombre de
paramètres
à estimer estconsidérablement réduit par
rapport
à la méthodeprécédemment décrite,
mais ce nombre reste tout de même trèsimportant
si on veut modéliserplusieurs
variables àtemps
discret. Onpeut
noter que l’estimation desparamètres
9 n’est passimple
carelle doit être effectuée sous la contrainte de
positivité
de la matrice de covariancesV(êi).
Onpeut
noter que des modèles detype
ARMA ou ARIMApermettent
de modéliser des variables continues etpeuvent
être utilisés ici sur les résidus.Cette méthode convient aux
problèmes
danslesquels
les observations serésument à une seule variable à
temps
discret et éventuellementquelques
variables àtemps
fixe.Cette modélisation a un défaut
majeur qui
est commun à toutes les modélisations de cette classe : les modèlesstochastiques
ainsi construitsgénèrent
de la variabilitésur les
prédictions
des variables pourlesquelles
des observations sontdisponibles
et àpartir desquelles 03BE
et E ont été estimés. Par contre, pour les autres variables de sortie dumodèle,
aucune variabilité n’est modélisée.2.2. Modèle
autorégressif
d’ordre 1Afin de rendre aléatoires toutes les variables
(intermédiaires
et desortie)
dumodèle,
le terme de variabilitépeut
être inséré directement dans leséquations
dumodèle
plutôt qu’ajouté
aux résultats déterministes de celui-ci.2.2.1. Modèle
autorégressif additif
Un modèle
dynamique stochastique
se définit par :où d
est le vecteur des accroissements de y dans l’intervalle detemps dj, 0(y, (3, X, j )
le vecteur des
prédictions
de l’accroissement du modèle déterministe ete 13 1
l’erreurau
temps j.
Ce modèle peut s’écrire comme un modèleautorégressif
fonctionnel d’ordre 1. Si on écrit ce modèle pour letraitement i,
on a :ou bien en faisant
apparaître
un terme d’accroissement :où
03A3i{j}
est le p-vecteur des accroissements(p correspond
au nombre de variables observées et donc au nombred’équations
renduesaléatoires)
entrel’instant j -
1 etl’instant j (fonction
non linéaire deyi{j - 1})
calculé par le modèle déterministe etei fil
le p-vecteur des aléas à
l’ instant j
sur le traitement i de loiN(03BE, 03A3).
Cette méthode
permet
de modéliser des variables continues pourlesquelles
lavariabilité du résidu est du même ordre de
grandeur
àchaque
instant de lasimulation,
et donc pour
lesquelles
la variabilité estindépendante
de l’accroissement. Dans lecas
contraire,
les aléasrisquent
d’être le moteur du modèle en début de culture(dans
le sens où les aléas auront leplus
d’influence sur les sorties dumodèle)
et les aléasn’auront pas d’effet sur les résultats du modèle et la variabilité du modèle
stochastique
sera
proche
de 0 en fin de culture.Typiquement,
un modèle detype exponentiel (très
utilisé pour modéliser la croissance des
plantes :
parexemple,
lepoids
d’uneplante
endébut de culture est une fonction
exponentielle
du nombre dejours depuis
lesemis)
ne pourra pas être rendu
stochastique
par cette méthode.Dans la définition d’un modèle
autorégressif
d’ordre1,
les aléas sont des bruitsblancs,
mais onpeut généraliser
ces modèles en utilisant une des troishypothèses
suivantes :
- les
ei{j}
sont des p-vecteurs aléatoiresindépendants (cas
des bruitsblancs),
- e tj 1
= ai où ci est un p-vecteuraléatoire,
-
etii
= aik pourik-1 j jk
où les aik sont desp-vecteurs
aléatoiresindépendants
deux à deux(Vz, k).
La
première hypothèse signifie qu’une
valeur différente de l’aléa estajoutée
àchaque
instant. La deuxièmehypothèse qu’un
même aléa est calculé etajouté
àchaque
instant de la simulation. Ces deux
hypothèses
étant trèsradicales,
Seber et Wild( 1989)
ont
proposé
la troisièmehypothèse qui
est intermédiaire. La simulation estdécoupée
en
plusieurs phases (m).
Au début dechaque phase,
une valeur de l’aléa est choisiepuis ajoutée chaque
instant à laprédiction
déterministe.L’hypothèse
de Seber et Wild( 1989)
est trèsgénérale puisque
lapremière hypothèse proposée correspond
à m = lenombre
de fois
oùl’équation
est utilisée tandis que la secondecorrespond
à m 1.La distribution des Qik est normale de
moyenne 03BE
et de matrice decovariance 03A3; 03BE
etE peuvent être
estimés,
àpartir
desdonnées,
par moindres carrés.White et Brisbin
( 1980)
ont montré que, même si les Q2k sontindépendants
etchangent
àchaque instant,
les sorties d’un modèlestochastique
ainsi construit sontautocorrélées.
2.2.2. Modèle
autorégressif multiplicatif
Plutôt que
d’ajouter
un aléa auxéquations
dumodèle,
onpeut multiplier
l’accroissement par un aléa.
Ainsi, l’équation
aléatoire du modèle s’écrira àl’instant j :
Y. z yi{j-1}
eteij}
sont des p-vecteurs etA’ t *1
est une matricediagonale
p x p(p
étant le nombre de variables
observées).
Lesespérances
et variances deei, 03BE
et E dedimension p x 1 et p x p, sont à nouveau les
paramètres
à estimer àpartir
des données.Cette modélisation revient à
ajouter,
àchaque équation,
des aléasayant
des variancesqui
varient dans letemps
etqui dépendent
de l’accroissement :avec
Ainsi,
la variabilité créée àl’instant j dépend
de laprédiction
du modèle et le rapport del’écart-type
dechaque
composante de l’aléa sur l’accroissement reste constant pourtout j.
De tels modèlesstochastiques
créent une variabilitéproportionnelle
auxrésultats du modèle déterministe. C’est une situation
particulièrement fréquente
pour les modèles de croissance deplante.
Comme pour le modèle
additif,
on utilise le modèle de Seber et Wild avece!j} ==
aik, pourjk-1 j jk,
les p-vecteurs O-ik étantindépendants
demoyenne 03BE
et de variance E. Les estimationsde 03BE
et Epeuvent
être calculées comme pour le modèle additif.Ces deux modélisations
autorégressives (additive
etmultiplicative)
posentcependant
desproblèmes
d’ordre calculatoire : si le nombre d’observations n’est pas le même d’un traitement à l’autre et si les observations ne sont pas réalisées aux mêmes instants d’un traitement àl’autre,
comment déterminer le nombre dephases
m et les différentes
phases?
Par contre, si lesphases peuvent
être facilementdéfinies,
les deux méthodes décrites dans cette sectionpermettent
de modéliser la variabilité de variables continues. Deplus,
la variabilité étantajoutée
directement dans leséquations
du
modèle,
toutes les sorties du modèle deviennentaléatoires, qu’elles
soient àtemps
discret ou àtemps
fixe.3. Modèle à
paramètres
aléatoires - Modèle mixtePlutôt que
d’ajouter
un aléa aux résultats de certaineséquations
dumodèle,
ilest
toujours possible
de considérer que ce sont lesparamètres
du modèlequi
sont desvariables aléatoires. Tous les
paramètres
d’un modèle déterministe sont constants, mais onpeut
considérer que certainsparamètres
suivent une loi deprobabilité
etqu’avant
toute simulation(i. e.
toute exécution du modèle surordinateur),
une valeurdu
paramètre
est choisie au hasard dans sa loi deprobabilité.
Leparamètre
restefixe
pendant
toute une simulation mais sa valeur est différente d’une simulation à l’autre. Ces modèles sontfréquemment
utilisés en économétrie et sontappelés
« modèles à
paramètres
aléatoires ». Cela revient à considérer que l’effet d’un traitement n’est pas totalementpris
en compte dans lemodèle,
soit à cause de variablesexplicatives qui
ne sont pas utilisées par lemodèle,
soitplutôt
parce que dans certaineséquations
il y a un effet individuel nonpris
en compte : un individu sedéveloppe plus (ou moins) rapidement qu’attendu
à un certain stade de croissance à caused’aptitudes
individuelles de laplante
ou d’un micro-environnement favorable(zone plus fertile, micro-climat, ... ).
Cesparticularités
individuellespeuvent
se traduire parun
changement
deparamètre
de croissancespécifique
àchaque individu;
leparamètre (3i
propre à l’individu i s’écritoù (3
est un effet commun à tous les traitementset bi
est un effet individuel avecbi rv N(0, D).
Ceci nous amène à introduire les modèles mixtes que nouspourrions appeler
modèles à effets individuels.Chaque paramètre
individuel ne nous intéresse pas en tant que tel mais c’est son existence et sa distributionqui
nous intéresse.Définition d’un modèle non linéaire mixte
Le vecteur des
paramètres {3i peut
varier d’un individu à l’autre(notons
que la dimension de ce vecteur estindépendante
de ipuisqu’il
fauttoujours
connaître les valeurs de tous lesparamètres
du modèle pourpouvoir
utiliser lemodèle) :
où
/3
est un p-vecteur desparamètres
à effetsfixes, bi
est un q-vecteur des effets aléatoires associés au traitementi,
les matricesAi
etBi
de taillesrespectives
r x p etr x q
(avec
r p et rq)
sont des matrices d’effets fixes et d’effetsaléatoires,
et Dest une matrice de covariances de
dimension q
x q. Les modèles mixtespermettent
àla fois des corrélations non nulles et des variances différentes mais
supposent toujours
la normalité des
paramètres.
Davidian et Giltinan
( 1995) indiquent
que deuxgrandes
classes deprocédures
ont été
proposées
pour estimer lesparamètres
de tels modèlesqu’ils
nomment« modèles non linéaires
hiérarchiques
». Si le nombre de mesures par individu est trop faible et nepermet
pas d’estimer lesparamètres
de larégression spécifique
àchaque individu,
les méthodesproposées
sont toutes basées sur la linéarisation dumodèle,
etla méthode
proposée
par Lindstrom et Bates( 1990)
est tout à faitadéquate. Si,
parcontre, suffisamment de données sont
disponibles,
cequi
est souvent le cas pour les études decroissance,
il estpréférable
de travailler individu par individu. Davidian et Giltinan( 1993
et1995)
proposent une méthode pour estimer lesparamètres
dumodèle
stochastique
dans ce cas.3.1. Méthode
proposée
par Lindstrom et BatesEntre 1980 et
1985,
de nombreux auteurs(Sheiner
etBeal, 1980; Berkey, 1982;
Racine-Poon, 1985 ;
Steimer etal., 1985)
ont étudié les modèles non linéaires à effets aléatoires pour décrire la fonction deréponse
moyenne ainsi que la variabilité intra et inter-individus. En1990,
Lindstrom et Bates proposent un modèlegénéral
nonlinéaire mixte pour des données à mesures
répétées :
avec
et où
ei 1 bi rv N(0, Ri)
avecR2
une matricequi dépend
de iuniquement
par sa dimension.Pour des modèles non
linéaires,
il est très souvent difficile de calculer la vraisemblance de la distributionmarginale de yi
car la fonctionf
n’est pas linéaireen
bi.
Lindstrom et Bates(1990) indiquent
quel’approximation
de(4) qui
consiste àsupposer que les
espérances
des effetsaléatoires
sont nullespeut
être mauvaise. Ilspréfèrent
linéariser le modèle(4) puis
maximiser la vraisemblance du modèle linéaireapproché.
Pourcela,
ilsapprochent yi - fi (Ai(3
+Bibi)
auvoisinage
depar
où
Zi
est une fonction de 8(où 0
est un vecteur contenant les éléments des matricesR2
et de la matrice
D) car /3 et bi dépendent
de e. Alors :et
l’approximation
de la distribution conditionnellede yi
s’écritAinsi,
la distributionmarginale de y2 peut
êtreapprochée
paroù
La distribution
de yi
estapprochée
par une distributionmultinormale,
il est doncpossible
de calculer la vraisemblance de cette distributionapprochée
etd’estimer (3
et 8 par maximum de vraisemblance ou par maximum de vraisemblance restreint.
Lindstrom et Bates
proposent
unalgorithme
itératif en deuxétapes
pour trouverces estimateurs du maximum de vraisemblance :
1.
étape
despseudo-données :
àpartir
desestimations 8 de (),
minimiser en/3
etb2,
i =1,...,
I(où
I est le nombre detraitements),
Les résultats de ces estimations sont
notés b2
et0;
2.
étape
des effets linéaires mixtes : calculer lesestimations /3 et 8
de/3
et 8qui
minimisent
où 1%
etZi dépendent
de/30
etles
estimations del’étape
1.L’algorithme
consiste à itérer ces deuxétapes jusqu’à
convergence.La méthode de Lindstrom et Bâtes est très séduisante d’un
point
de vuethéorique puisque
l’estimation est effectuée de manièreglobale
et maximise directement unevraisemblance
approchée
sur tous les individus. Des critères(comme
celuid’Akaike)
fondés sur la vraisemblanceapprochée peuvent
être utilisés pour choisir entreplusieurs
modèles. Eneffet,
il suffit de calculer la vraisemblanceapprochée
desmodèles en
compétition,
évaluée aux valeurs de convergence desparamètres.
SousSAS,
un programme construit et estime lesparamètres
de tels modèles non linéairesmixtes. En