R EVUE DE STATISTIQUE APPLIQUÉE
Y. A RAGON
Sur l’estimation des probabilités de transition d’une chaîne de Markov à partir des données marginales
Revue de statistique appliquée, tome 20, n
o2 (1972), p. 79-94
<
http://www.numdam.org/item?id=RSA_1972__20_2_79_0>
© Société française de statistique, 1972, tous droits réservés.
L’accès aux archives de la revue « Revue de statistique appliquée » (
http://www.sfds.asso.fr/publicat/rsa.htm
) implique l’accord avec les conditions générales d’uti-
lisation (
http://www.numdam.org/conditions). Toute utilisation commerciale ou im-
pression systématique est constitutive d’une infraction pénale. Toute copie ou im-
pression de ce fichier doit contenir la présente mention de copyright.
SUR L’ESTIMATION DES PROBABILITÉS DE TRANSITION
D’UNE CHAINE DE MARKOV
A PARTIR DES DONNÉES MARGINALES
Y. ARAGON
Laboratoire de Statistique (Université de Toulouse)
I - INTRODUCTION
L’estimation des
probabilités
de transition dans une chaîne deMarkov,
à
partir
d’observationsportant
sur les transitions(micro-observations)
aété traitée par Anderson et Goodman
[1]. Cependant
l’estimation de ces pro- babilités àpartir
des donnéesmarginales (macro-observations)
n’a pas reçu de solution satisfaisante.C’est ce
problème qui
est étudié ici. Le but de cet article est essen- tiellementpratique.
Aussin’y figurent
que peud’éléments
dejustification.
Pour une étude
plus complète
on pourra sereporter
à[2].
Parcontre,
la solutionnumérique
duproblème
a été détaillée pourpermettre
à toutprati-
cien d’utiliser facilement les
techniques proposées.
II - POSITION DU PROBLEME
Pour un
utilisateur,
une chaîne de Markov est un modèledynamique
discret
permettant d’analyser
des sérieschronologiques (voir
Telser[12]
pour un
exposé
desapplications économiques classiques).
Ce modèle reposesur
l’hypothèse
suivante :"La
probabilité
pour un individu d’être dans unétat j
donné à un ins-tant
t,
est entièrement déterminée par saposition
à l’instantprécédent
oud’une manière
générale
aux n instants consécutifsprécédents ;
n est l’ordrede la chaîne".
Les
paramètres
d’une chaîne de Markov sont lesprobabilités
de tran-sition
pij,
formant la matrice P.p
est laprobabilité
pour un individuquelconque
de se trouver dansl’état j
à un instant sachantqu’il occupait
l’état i à l’instantprécédent.
Ily a r états
(i,j = 1,..., r).
Lesprobabilités marginales q(t) qu’un
individuOn
dispose,
pour estimer lespij,
d’échantillons extraits de cette po-pulation.
Dans la situationclassique,
on observe lesnij (t),
nombre d’indivi- duspassés
de l’état i à l’instant t-1 àl’état j
en t et pour destemps
d’ob-servations consécutifs en nombre
T+1,
et notés de 0 à T.La
présente
étude est centrée sur le cas où lesnij(t)
sont inconnuset où seules sont
disponibles
les margesnj (t),
c’est-à-dire les nombres d’in- dividusprésents
dans un état à un instant. On a évidemment :r
La taille de l’échantillon observé au
temps
t estN(t) = Uj(t) ;
dansles cas où cette taille est
indépendante
de t on la note N. Remarque : onparlera
indifféremment de marges, de donnéesmarginales,
de macro-obser-vations,
de donnéesagrégées.
III - DIFFICULTES DANS L’APPLICATION DE LA METHODE DU MAXIMUM DE
VRAISEMBLANCE,
TELLEQU’ELLE
EST UTILISEE EN[1] :
Dans la situation
classique,
le même échantillon est observé àchaque instant,
et on connaît les transitions.Quand
larépartition
initiale des indi- vidus est certaine la densitéconjointe
desobservations,
se note :Quand
les micro-observationsnij(t)
sont connues, on obtient àpartir
de cetteexpression,
les estimateurs M. L. despij.
Si les
nij (t)
sont inconnus et que seuls lesnj (t),
donnéesmarginales
sont
disponibles,
on peut formuler la densitéconjointe
des observationsUj(t).
a)
Probabilitéconjointe
den(t) = (n1(t), ...,nr(t))
conditionnée par la connaissance den(t-1).
Il faut dénombrer toutes les
façons possibles
de passer de l’état i ent-1,
àl’état j
ent,
et les affecter de leurprobabilité
de réalisation. Or il y a autant defaçons
de passer de i en t-1à j
ent, qu’il
y a denij(t),
vérifiant les 3 conditions :
D’autre
part nij (t)
est distribuée multinomialement deparamètres :
(ni(t-1);pi1,...,pir).
Laprobabilité
d’observer le vecteurn(t)
conditionnée par la connaissance den(t-1)
s’écrit donc :avec nij
(t)
vérifiant les conditions(3) .
C’est le
produit
de convolution de r densités multinomiales.b)
Onpeut
maintenant écrire la densitéconjointe
desobservations,
larépartition
initialen(O)
étantsupposée
connue.les
ni j (t)
vérifiant(3).
Cette
expression
estimpraticable
pour rechercher des estimateurs M. L. despj.
C’estpourquoi
d’autres méthodes d’estimations convenablessous certaines
hypothèses
ont étéproposées.
IV - AUTRE APPROCHE DU PROBLEME
Plusieurs
types d’hypothèses
sur le modèle sontpossibles parmi
les-quelles
les deux suivantes s’introduisentsimplement.
Pour chacune d’ellesnous donnons les estimateurs obtenus sans tenir
compte
des contraintes d’iné-galités.
Ces estimateurs
n’appartiennent
pas nécessairement àl’espace
para-métrique
Q*C’est
pourquoi
onindiquera
à la sectionV,
uneprocédure simple
etrapide permettant
d’obtenir des estimateursappartenant
àQ..
A - Situation où les marges sont directement obtenues
(en abrégé -
situationM).
1 - Etant données que seules les marges sont
utilisées,
onpeut
envi-sager des échantillons où elles sont directement
obtenus,
sans l’intermédiai-re des transitions. Ce sera notamment le cas, si on
prélève
à tous les ins-tants d’observation
consécutifs,
dans lapopulation
markovienne d’ordre1 ,
un nouvel échantillon tiré
indépendamment
duprécédent
au moment du son-dage.
En effet chacun de ces échantillons estcomposé
d’individusprésents
dans l’état i à l’instant t. Il est distribué suivant une loi multinomiale
(N(t) ;
q1(t),
... ,qr(t) .
On a bien obtenu ainsi des marges ni(t) (i=l, ... , r),
distri- buées multinomialement. La densitéconjointe
de ces observations s’écrit :Les
paramètres
à estimerp - apparaissent
dans cetteexpression
par l’intermédiaire des relationsou
p(t)ij
est l’élémentij
dePt.
Siq.(0)
est inconnue onpeut
l’estimer parni(0)N(0) , et l’expression (5)
estremplacée
parLa recherche des estimateurs M. L. des
pij
à l’aide des relations(5)
et
(7)
ou(8)
et(7)
est encore tropcompliquée.
Lee et Collaborateurs[6]
ont donc utilisé au lieu des relations exactes
(8),
des estimations de ces rexpressions,
obtenues enremplaçant qj(t) = p q (t-1)
parQuand N(t) -
+~ pour toutt, p (t)
converge enprobabilité
versq (t) .
Au lieu de
(8)
on a :où
pi (t)
est défini par(9).
Cette
expression
n’est pas la vraisemblance de l’échantillon dont on vient de décrire l’obtention.(cf. [2]
pour uneinterprétation
de(10)
commevraisemblance).
2 - Estimateurs sans contraintes dans cette situation
On montre
[6]
que les estimateurs obtenus en maximisantl’expression (10)
sont solutions del’équation :
où
03A3*
étantinconnue,
on laremplace
par un estimateurf..
p* solution de
(11)
est aussi l’estimateur G.L.S.qu’on
aurait obtenuen minimisant :
finale,
par les états de la chaîne de Markov. Pour trouver les estimateurs desPli,
ils doivent connaître les transitions entre deux instants consécutifs(au moins).
L’échantillon suivant le processus évolue exactement comme lesuggère
la définition d’une chaîne de Markov et c’est ainsiqu’habituellement
on
engendre
artificiellement un échantillon de cettepopulation.
2 - Estimateurs par les moindres-carrés sans contraintes
d’inégalités
dans cette situation
(situation T) :
On
peut
essayer d’estimer lespj
par une méthode de moindres carrés(L.S.)
sur unsystème d’équations
linéaires. Onpeut remplacer
les relations(6)
par les relationsUj(t)
est un aléa centré dont la distribution reste àpréciser.
Le mo-dèle de
régression
introduit par les relations(14) peut
être considéré commeune
régression
conditionnelle deWj(t)
surWi (t-l).
On posera alors :E(ui(s)|W(s)
pour st) =
0C’est une convention cohérente avec le mode d’obtention des marges, à
partir
du même échantillon à tous les instants. Les moments centrés d’ordre 2 d’unproduit
de convolution étant la somme desmomentscorrespondants
deslois
convoluées,
la matrice des covariances duproduit
de convolution(4)
est donc :On cherche en fait les moments d’ordre 2 des
Uj(t)
définis par(12).
Sous
l’hypothèse précédemment
introduitequ’à chaque instant,
lesWi (s)
pours t sont
certains,
on passe deWi (t)
àui(t)
par une translationcertaine,
on montre que
cov(uj(s), Uk(t) |Wi (s), i=1,...,
r,s=O, ... , t-1) =
0.De
(15)
et deWj(t-1) = nj(t-1) N,
ondéduit [ 2]
Pour un échantillon de taille assez
grande,
onpeut
doncapprocher
ladistribution des
ui(t) (i=l,...,r)
par une distribution multinormalecentrée,
de matrice des covariances
On
peut exprimer
leséquations (14)
comme unsystème d’équations
li-néaires
(11).
ui =
[ui(1),...,ui(T)]’
Dans ce
système,
les covariances des éléments de u. sont les cova- riances conditionnellesprécédemment
introduites. La matriceA.
de ces co-variances n’est donc pas la matrice des covariances des éléments de u. au
sens habituel du terme. Mais comme on a convenu d’effectuer des
régres-
sions conditionnelles de
W(t)
surW(t-1),
onpeut
montrer que :p. étant déduite de P en éliminant la dernière colonne
w. (t-l)
étantdéduit de
W(t-1)
en éliminant son dernier élément.Cette
égalité
incite à choisir larégression
linéaire :W. = X* p*
+u*
où u. est une v. a. centrée pour
laquelle
onprend
comme matrice des co-variances
A..
La minimisation de
(W. - X*p*)’ 4-’(W. - X*p*),
donnerait les estima- teurs G. L. S.(moindres-carrés généralisés), si A*
était connue, mais*
dé-pend
desparamètres
à estimer. C’estpourquoi A*
estremplacée
par une estimation*
de cette matrice. Le choix de*
estenvisagé
à la section V.C -
Finalement
les estimateurs obtenus dans les deux situationsci-dessus,
sont solutions du
problème
où B =
A* (situation T) Z* (situation M).
Mis à
part
les estimateursbayesiens évoqués
en annexe, presque tous les estimateursproposés jusqu’à présent
sont des estimateurs par les moin- dres-carrés(généralisés),
solutions duproblème (I);
seule la matrice B dif- fère d’un auteur à l’autre.Mais on constate que les estimateurs obtenus
n’appartiennent
pas àl’espace paramétrique.
Tous lesproblèmes
à résoudre doivent êtreposés
comme des
problèmes
de maximum sous contraintes.Au lieu du
problème (I)
on doit donc résoudre :La solution
numérique
duproblème
se trouvecompliquée
car on estamené à utiliser une méthode de
programmation mathématique.
Dans le tableau ci-dessous on a
regroupé :
- les choix faits
jusqu’à présent
parplusieurs
auteurs- le modèle linéaire
- la matrice de
pondération :
B- la méthode de
programmation
sans contraintes- la méthode de
programmation mathématique.
Les
comparaisons numériques permettent
de croire que les méthodes lesplus
élaborées fournissent les meilleurs résultats.(1) diag E(A.) = matrice diagonale formée avec la diagonale de E(*) E(*) = matrice déduite de A. en remplaçant
(2) M. A. D. = Déviation absolue minimum. On minimise
|W* -
X.pj’
E où1 w. - X. p.
est le vecteur des valeurs absolues des éléments de W. - X. p.E est un vecteur colonne de 1 .
V - SOLUTION
NUMERIQUE
DU PROBLEMENous donnons maintenant la solution
numérique
que nous avonsadopté.
Elle est
simple
à programmer etpeut
dans certains cas recevoir une inter-prétation statistique.
Nous avons vu que le
problème
se pose ainsimin
(W - X p*)’ B ’ (W - X p) (H)
p* 03B5 03A9*
où B est une des matrices du tableau
précédent.
A - 1 - Choix
de * (situation M).
Si on ne connait pas d’estimateursp*
de p., on
peut prendre
pour*,
la matrice obtenue enremplaçant dans 7-.
p (t)
par W.(t),
estimateurconvergent
dep (t).
On
peut
donc calculer unp( . 1)
en résolvant leproblème
B et calculerun
nouveau 2::.
enremplaçant Pi(t) par Y- p W (t-1).
Avec le nouvel estimateur
de 2:::1 obtenu
ainsi onpeut
résoudre à nou- veau leproblème (B)
et ainsi de suite.2 - Choix
de 03A3* (situation T).
Si on ne connatt pas d’estimateur*
dep* on
peut prendre
la même matricequ’à l’étape
initiale de la situationM,
avec cette matrice on résout le
problème (II),
on obtient unp ,
onpeut
alors le
reporter
dansl’expression (19)
pour obtenir un nouvel estimateur deA*,
et recommencerl’opération.
B -
Simplifiant
lesnotations,
on doit résoudre àchaque
itération le program-me
mathématique :
Dans cette
expression :
La méthode la
plus simple
dans notre cas, semble être la méthode depénalisation.
L’idée des méthodes depénalisation
est de ramener un telprogramme à la recherche d’une suite de minimums libres
appartenant
à03A9*.
Pour celaf(x)
estcorrigée
par unepénalisation.
Suivant le choix de cettepénalisation
la méthodenumérique peut
recevoir uneinterprétation sta- tistique.
1 - Choix d’une fonction de
pénalisation
Suivant Fiacco et Mc Cormick
[4]
nous avonsadopté
(Précisons
que L n’est pas ici unevraisemblance).
03B5 est un
"paramètre
deperturbation"
strictementpositif.
s
L(x)
est unepénalisation,
telle que le minimum deP(x;s) appartient
àQ*.
Dans laméthode, ayant
obtenu pour x = xo, le minimum deP(x;03B5o)
où So est la valeur initiale
de e,
onchoisit 03B51
tel que 003B51
E:o etpartant
de Xo on cherche le minimum de
P(x;03B51).
D’une manière
générale,
on obtient xn tel queP(xn;03B5n) =
minP(x;03B5n).
Quand e -
0, minP(x ;e ) -
minf(x) xEQ
*Remarque :
Contrairement aux méthodes dérivées dusimplexe,
les métho- des depénalisation exigent
laprise
encompte explicite
de toutes les con-traintes
(x 0).
Choix de
03B5o :
Ayant
choisi unpoint
initial x* intérieur àQ*,
on convient de choisir[4] :
Le choix de x* ne pose pas de difficultés étant donnée la forme des contraintes.
2 - Résolution de min
P(x;03B5n)
Nous avons utilisé
l’algorithme
deMarquardt [10],
mais toutalgo-
rithme de minimisation de fonction non linéaire est en
principe acceptable.
La convergence est assez
rapide
dans notre choix.---
(*) On peut aussi adopter pour E L(x) ; l’expression :
Ces considérations
générales exposées,
nousdonnons,
unorganigramme
assez
détaillé,
du calcul des estimateurs desprobabilités
de transition.Organigramme
du calcul des estimateurs1/
Lire les observations de la chaîne.2/
Calculer un estimateurde 03A3-1* (ou -1*
suivant lasituation).
3/
Former les termesquadratique Q
et linéaire B del’expres-
sion à minimiser à l’aide
de 03A3-1*
1(resp. -1*)
et des observations.4/
Effectuer la Procédure de MinimisationSéquentielle
Libre(PMSL).
Soitp(n)*
la valeur obtenue.5/ Calculer 2:. (resp. *)
en fonction depin)
6/
Recommencer en3/.
Arrêter le calculquand 1 pin) - p(n+1)*| 03B5p
où
Ep
est strictementpositif
et arbitrairementpetit.
Procédure de Minimisation
Séquentielle
Libre1/
Définir le domaine par desinégalités : gi 0,
i e IQ
={x ; gi 0, i~I}
2/
Former une fonctionpénalisée
P. Ici :3/
Choisir unpoint
intérieur à Q. Calculer la valeur e = Eo corres-pondante.
4/
A la n-ième itération(n = 0,
Calculer le minimum de P par une méthode itérative
(par exemple
al-gorithme
deMarquardt),
enprenant
comme valeur initiale du vecteur x, le dernierpoint
intérieur obtenu. Soitx(En)
la valeur de x pourlaquelle P(x;03B5n)
est minimum.
5/
Diminuer s. Parexemple 03B51 = c/3
6/ Avec x(03B5n)
commepoint
initialet 03B5n+1 = 03B51
recommencer en4/.
Arrêter le calcul
quand |x(03B5n) - x(En+1) |
0 où 0 est strictementpositif
etarbitrairement
petit.
4 -
Remarques
etcompléments
sur la P. M. S. L.Numéro 2 : la
pénalisation
choisie est dutype 1/gi.On
aurait pu choi-sir une
pénalisation
dutype Log gi.
Numéro 3 : le choix d’un
point
intérieur ne soulève pas de difficultés étant donné leproblème.
cf Fiacco et Mc Cormick[4]
pour une utilisation de la P.M.S.L. dans le choix d’unpoint
intérieur initial.Numéro 4 : le choix de
l’algorithme
deMarquardt
estjustifié
car ilest
rapidement convergent,
mais en contrepartie,
euégard
à lapénalisation
en
1/g i adoptée,
on introduit dans le calcul du Hessien des termes ens/g iz
très sensibles aux erreurs d’arrondis
(le
vecteur x calculé sort dudomaine).
oc En
recommençant
la minimisation libre àpartir
du dernierx(s)
ap-partenant à 03A9, obtenu,
mais avec un 61 1supérieur
à celuiqui
donne de mau-vais résultats. Ce faisant on se
rapproche plus
lentement de la frontière(et
de lasolution).
j3
En utilisant unalgorithme
de minimisation introduisant moins d’er-reurs d’arrondis
(par exemple,
méthode deFletcher-Powell)
maisplus
len-tement
convergent.
Cetéchange peut
être fait sil’opération
a recommencéeplusieurs
fois ne donnetoujours
pas de meilleurs résultats.’Y
En donnant auxcomposantes
de x, violant lescontraintes,
des va-leurs
proches
des valeursobtenues,
mais ramenant x dans Q. Ceciquand
les moyens énoncés en a
et P
ne donnent pas de résultats.b
En choisissant unepénalisation
dutype Log g1.
Numéro 5 : il est difficile de fixer a
priori
le choix du taux de di-minution de s. Ceci est affaire
d’expérience.
Nous avonsadopté 03B5n+1 = En /3
ou En+1 =
e n/2.
VI - CONCLUSION
Nous donnons pour terminer des résultats
d’expériences
de simulationsportant
sur 50échantillons,
de 1000 individus transitant entre 3 états au cours de 25périodes d’observations,
suivant la situation T. Cesexpérien-
ces
portaient
sur deux matrices de transitions et avaient pour but de com-parer les estimateurs obtenus par la méthode de
Lee, Judge
et Zellner(M. L.
ouG.L.S.)
et les estimateurs introduits dans[ 2].
Les estimateurs introduits dans[2J apparaissent
sensiblementmeilleurs,
pour estimer leséléments de
P2.
MATRICES
RESULTATS
Méthode introduite dans Méthode de Lee et collaborateurs cette étude
Moyenne
des résultats obtenusCarrés moyens des erreurs
0.018 0.016 0.013 0.018 0.016 0.013
0.019 0.019 0.023
Pl
1 0.019 0.019 0.0230.018 0.013 0.019 0.019 0.013 0.017
0.008 0.001 0.002 0.009 0.013 0.002
0.005 0.010 0.002
P2
0.006 0.012 0.0020.000 0.000 0.000 0.000 0.000 0.000
ANNEXE
I - En admettant que
(10)
est unevraisemblance,
onpeut envisager
des es-timateurs
bayesiens
dep
Il est courant de choisir comme loi de
probabilité
apriori,
pour un vecteur deparamètres positifs
dont la somme est 1 , une loi Beta multidi- mensionnelle.On notera la loi a
priori
du vecteurpi - (p
11’ ... ,Pi
Les
aij quantifient
la connaissance apriori.
Cetteexpression
est dé- finie pouraij
>0,
mais on se limiterar à aij 1, (seul
cas utilisé en pra-tique).
La loi apriori
de P est donc17 fi(pi).
Tenant
compte
de(10)
onpeut
maintenant écrire la densitéconjointe
a
postériori,
des observationsoù K est une constante
indépendante
desparamètres.
La minimisation de -
Log f(p* IW)
fournit les estimateursbayesiens
dep*.
Cette minimisations’interprète très simplement,
comme on le verra auparagraphe suivant,
dans une situation voisine.II - Une
interprétation bayesienne
de la méthode depénalisation
dans l’es- timation d’un vecteur deprobabilités
1 - On
envisage
le cas où la méthode d’estimation utilisée(M. L.
ouL. S. ) risque
de donner desestimateurs D n’appartenant
pas àl’espace paramétri-
que
On est donc amené à faire intervenir
explicitement
les contraintes2 - E stimateurs
bayesiens
Hypothèse :
le vecteur deprobabilité
p admet une loi apriori
Beta- multidimensionnelle deparamètres (a1,..., an)
où ai > 1 pouri=l,...,n.
Remarque :
La loi Beta-multidimensionnelle est définie pour ai > 0(i=l,..., n)
mais si un
al
est inférieur à 1 la densité apostériori
n’estplus
bornée sur03A9.
D’autre part la condition ai > 1 pour tout i est nécessaire pour le calculpar
pénalisation.
La densité
conjointe
apriori
s’écrit :L(Xlp)
étant la vraisemblance desobservations,
on peut choisir comme estimateurbayesien
de p, une valeurmodale
de la densité aposteriori.
Nous admettons que cette valeur est
unique.
Donc,
en notantf(p)X)
la densité apostériori,
on a :f(p|x)
aL(Xlp) B(p)
et on
cherche p E
Q tel que :min - Log f(p!x) = - Log L(X Ip) - Log B()
p~03A9
ce
qui
revient à chercherCette
expression
n’est définie que sur Q et tend vers + 00quand
p serapproche
de la frontière. La recherche de son minimum se ramène à la recherche d’un minimum libre. C’est leprincipe
des méthodes depénalisa-
tion.
3 - Estimation M. L.
Si on recherche par une méthode de
pénalisation,
l’estimateur M. L.de p, minimum de -
Log L(X|p),
p eQ,
on est amené à chercher une suite de minimums libres de la fonction -Log L(Xlp), pénalisée
par une fonction des contraintesquand
cettepénalisation
tend vers 0. Cettepénalisation peut
êtrel’expression :
où 03B5i > 0 pour tout i. On calcule donc le minimum libre de
g(p;e) = - Log L(X|p) - P(e;p),
où 03B5 =(03B51,...,03B5n)
Soit (03B5)
lepoint
pourlequel g(p;s)
est minimum.Dans la solution
numérique
de ceproblème,
on arrête le calcul quandSi est
petit
mais strictementpositif
pour touti,
on n’obtient donc pas l’es- timateur M. L. de p mais une valeurapprochée qui dépend
de E :p(e).
Sion se
reporte
à la discussion du numéro2,
on constate quel’approximation p(S)
de l’estimateur M.L. ainsi obtenu en minimisantg(p;8)
pourp E Q, est aussi solution duproblème :
Quand ai = E1
+ 1 pour i =1,...,
n.Donc
l’approximation p(E)
de l’estimateur M. L.(0),
est l’estimateurbayesien
de p, obtenu en maximisant la densité apostériori, quand
la den- sité apriori
est une loi Beta-multidimensionnelle deparamètres : (03B51+1,..., 03B5n+ 1).
Ces remarques restent valables pour une
large
classed’espaces
para-métriques
bornés. L’extension à un domaine non borné estplus
délicate.REFERENCES
[1]
ANDERSON T. W, et GCODMAN L. A.(1957) -
"Statistical Inference About MarkovChains", (The
Ann. of Math. Stat. Vol.XXVIII,
p.89-110).
[2]
ARAGON Y.(1971) -
"Sur l’estimation desprobabilités
de transitiond’une chaîne de Markov à
partir
des donnéesmarginales". (Thèse
de3ème
cycle, Toulouse).
[3] DOUSSET F. ,
CASAMITJANAR.,
GROBOILLOT J. L. & WARNIER DE WALLY A.(1967) -
"Estimation d’une matrice de Markov"(Rev.
Stat.Appl.
Vol.1,
p.87-94).
[4]
FIACCO A. V. & MAC CORMICK G. P.(1968) -
"Non LinearProgramm- ing : Sequential
Unconstrained MinimizationTechnique" (Wiley).
[5] LEE T. C.,
JUDGE G. G. & CAIN R.(1967) -
"Asampling
of the Pro-perties
of Estimators of Transition Probabilities"(Agricultural
Econo-mics,
Res.Report
n°87, University
ofIllinois).
[6] LEE T. C.,
JUDGE G.G. & TAKAYAMA T.(1965) -
"OnEstimating
theTransition Probabilities of a Markov Process"
(Journ.
of FarmEcon.,
Vol.47,
p.742-62).
[7]
LEET.C.,
JUDGE G.G. & ZELLNER A.(1968) -
"Maximum Likeli-hood and Bayesian
Estimation of Transition Probabilities"(J.
Am. Stat.Ass.,
Vol.63,
p.1162-1179).
[8]
MC GUIRE T.(1969) -
"More on LeastSquares
Estimation of the Tran- sition Matrix in aStationary
First-Order Markov Process fromsample Proportions
Data"(Psychometrika,
Vol.34,
n°3,
p.335-346).
[9]
MADANSKY A.(1959) -
"LeastSquares
Estimation in Finite Markov Processes"(Psychometrika,
Vol.XXIV,
p.137-44).
[10] MARQUARDT
D. W.(1963) -
"AnAlgorithm
forLeast-Squares
Esti-mation of Non Linear Parameters"
(Journ.
Soc. Ind.Appl. Math.,
[11] TELSER,
LESTER G.(1966) -
"LeastSquares
Estimates of Transition Probabilities"(Measurement
inEconomics,
Stanford : Stanford Univer-sity Press,
p.270-93).
[12]
ZELLNER A.(1962) -
"An Efficient Method ofEstimating Seemingly
Un-related