• Aucun résultat trouvé

2.4 M´ethodes de Monte Carlo par Chaˆınes de Markov

2.4.3 Algorithme Hastings-Metropolis

p. x(t+1)p ∼ fp(xp | x(t+1)1 , . . . , x(t+1)p−1 ).

Il convient de remarquer que toutes les valeurs simul´ees sont accept´ees comme dans le cas d’une simulation `a partir d’une loi d’int´erˆet directement simulable.

2.4.3 Algorithme Hastings-Metropolis

Contrairement `a l’algorithme d’´echantillonnage de Gibbs, l’algorithme de Hastings-Metropolis [Gelman et al., 2004] n’exige pas une connaissance pouss´ee de la loi d’int´erˆet f (x) et cette loi n’est pas forc´ement multidimensionnelle. Il repose sur l’utilisation d’une loi conditionnelle q(y | x) qui est simulable rapidement et est soit analytiquement connue (`a une constante pr`es) ou est sym´etrique, c’est-`a-dire q(x | y) = q(y | x). La loi q est appel´ee loi instrumentale ou de proposition. ´Etant

donn´e une loi f (x) et une loi conditionnelle q(y | x), la chaine (x(t)) est g´en´er´ee de la mani`ere suivante : 1. G´en´erer yt∼ q(y|x(t)). 2. Prendre x(t+1)=  yt avec proba ρ(x(t), yt), x(t) avec proba 1− ρ(x(t), yt) o`u ρ(x(t), yt) = min  f(yt) f(x(t) q(x(t) | yt) q(yt| x(t)),1  .

Notons qu’avec cet algorithme, toutes les valeurs simul´ees ne sont pas syst´emati-quement accept´ees contrairement `a l’algorithme d’´echantillonnage de Gibbs. Elles ne le sont syst´ematiquement que lorsque f (yt)

q(yt|x(t)) > f (yt−1)

q(yt−1|x(t−1)). Dans le cas o`u q est sym´etrique, l’acceptation est gouvern´ee par le rapport f (yt)/f (x(t)). La probabilit´e ρ(x(t), yt) n’est d´efinie que si f (x(t)) est non nul. Il convient donc de choisir x(0) (valeur initiale), et c’est suffisant, tel que f (x(0)) soit strictement sup´erieur `a z´ero. Aussi le support de la loi de proposition doit recouvrir celui de la loi d’int´erˆet pour que la chaˆıne puisse explorer toutes les zones de cette derni`ere.

2.4.4 Remarques

Remarque 1 : L’algorithme de Hastings-Metropolis est plus g´en´erique en ce sens qu’il permet de simuler selon pratiquement n’importe quelle loi sauf que le manque de lien entre la loi de proposition et la loi d’int´erˆet peut ˆetre n´efaste pour la conver-gence de la chaine. L’algorithme d’´echantillonnage de Gibbs peut ˆetre vu comme une combinaison d’algorithmes de Hastings-Metropolis o`u la loi de proposition pour chaque loi conditionnelle est la loi conditionnelle elle-mˆeme. L’´echantillonnage de Gibbs exploite bien les propri´et´es de la loi mais il entraine des choix tr`es limit´es des lois de proposition.

Remarque 2 : Dans nos travaux, il arrive que mˆeme les lois conditionnelles devant ˆetre utilis´ees dans l’´echantillonnage de Gibbs ne sont pas explicitement connues ; ce qui fait que pour chaque ´etape de l’´echantillonnage de Gibbs, nous utilisons l’algorithme de Hastings-Metropolis pour mettre `a jour les param`etres.

Remarque 3 : Comme dit si haut, il faudra un grand nombre d’it´erations, appel´e temps de chauffe de la chaˆıne, avant d’atteindre la convergence. Pour le contrˆole de cette convergence, nous avons utilis´e le graphique de la chaine et la stabilit´e de la moyenne a posteriori assur´ee par le Th´eor`eme ergodique mais aussi pour un des papiers nous avons utilis´e R.hat statistics [Aho, 2015] qui permet de savoir si les chaˆınes proviennent d’une mˆeme distribution. Ce qui nous am`ene `a faire plusieurs chaˆınes pour v´erifier cette convergence.

CHAPITRE

3

Effet de la distance sur le nombre d’admission de patients au

niveau d’un hˆopital

Le but de l’´etude est de mesurer l’attractivit´e des hˆopitaux et subs´equemment les classer du plus attractif au moins attractif. Le nombre moyen de patients admis en fonction de la distance qui s´epare les lieux de r´esidence des patients `a l’hˆopital peut ˆetre r´ev´elateur de l’attractivit´e de l’hˆopital dans une zone o`u des centres de soins de sant´e sont disponibles `a des distances relativement courtes des lieux de r´esidence des patients. En effet, plus un hˆopital est attractif, plus la distance compte moins pour s’y rendre. Donc un hˆopital qui a plus d’admissions au fur `a mesure qu’on s’en ´eloigne est plus attractif que celui qui en a moins. Pour ce faire, nous disposons, grˆace au PMSI, d’informations telles que le lieu de r´esidence du patient, la pathologie pour laquelle le patient est admis et dans quel hˆopital il l’est. Grˆace `a ces informations, un regroupement de patients par localit´e et par hˆopital pour une pathologie donn´ee peut ˆetre effectu´e. Ces donn´ees d’admission peuvent ˆetre vues comme des donn´ees de comptage spatialement reparties qui peuvent ˆetre d´ependantes comme il est sou-vent le cas pour les donn´ees de sant´e publique. Il est aussi possible dans une zone pr´ed´efinie pour l’´etude, d’avoir des localit´es avec z´ero admis dans un hˆopital :

a) soit il y a eu des malades mais ils ont pr´ef´er´e d’autres hˆopitaux pour admission, signifiant l’hˆopital peu attractif dans cette localit´e.

b) soit parce qu’il n’y a pas eu de malades ou `a causes des soins primaires existants, il n’ y a pas lieu d’admission ; c’est des z´eros qui ne sont pas non li´es `a l’attractivit´e de l’hˆopital. Donc ceci peut alors nous amener `a observer des donn´ees avec des exc`es de z´eros.

Dans ce chapitre, nous utilisons pour la mod´elisation de ces donn´ees, des mod`eles commun´ement appel´es Zero-Inflated Models o`u nous avons pris en compte la possible d´ependance spatiale des donn´ees au niveau des moyennes locales de la distribution

utilis´ee. Un des param`etres de la moyenne (celui de la variable distance) sera utilis´e pour comparer l’attractivit´e des hˆopitaux et donc les classer.

La premi`ere section du chapitre donne un aper¸cu sur trois Zero-Inflated Models, la seconde section pr´esente un r´esum´e d’application sur les donn´ees d’admission et la troisi`eme section, un article r´evis´e soumis `a Health Services and Outcomes Research Methodology.

3.1 Les mod`eles avec des extra-z´eros

Dans les donn´ees de comptage, il arrive qu’il y ait plus ou d’autres types de z´eros que ceux attendus selon la distribution utilis´ee pour mod´eliser ces donn´ees. Bien sˆur il peut exister des cas o`u il y a moins de z´eros que ceux attendus mais c’est rare en pratique et nous ne traitons pas de ce cas dans notre travail du fait des caract´eristiques de nos donn´ees. Il existe aussi plusieurs distributions pouvant ˆetre utilis´ees pour mod´eliser ces donn´ees mais nous ne ferons cas que de trois mod`eles : le mod`ele dit Zero-Inflated Poisson (ZIP), le mod`ele de Hurdle li´e `a la distribution de Poisson et le Zero-Inflated Negative Binomial.

Documents relatifs