HAL Id: hal-01303913
https://hal.archives-ouvertes.fr/hal-01303913
Submitted on 30 Jun 2017
HAL is a multi-disciplinary open access archive for the deposit and dissemination of sci- entific research documents, whether they are pub- lished or not. The documents may come from teaching and research institutions in France or abroad, or from public or private research centers.
L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau recherche, publiés ou non, émanant des établissements d’enseignement et de recherche français ou étrangers, des laboratoires publics ou privés.
Approche algorithmique de la recherche d’une stratégie RDU-optimale dans un arbre de décision
Gildas Jeantet, Olivier Spanjaard
To cite this version:
Gildas Jeantet, Olivier Spanjaard. Approche algorithmique de la recherche d’une stratégie RDU- optimale dans un arbre de décision. 9ème Congrès de la Société Française de Recherche Opéra- tionnelle et d’Aide à la Décision (ROADEF 2008), Feb 2008, Clermont-Ferrand, France. pp.79-94.
�hal-01303913�
stratégie RDU-optimale dans un arbre de déision
G.Jeantetet O.Spanjaard
LIP6,4plaeJussieu,75252Parisedex05
{gildas.jeantet,olivier.span jaard }lip 6.fr
Résumé Leproblèmedelareherhed'unestratégieEU-optimale(i.e.,
optimaleausensdel'utilitéespérée)dansunarbredéisionhasardseré-
soutentempslinéaireenfontiondunombred'arsparprogrammation
dynamique [11 ℄. Nous nousintéressons ii à unevariante plusdiile
deeproblème,oùl'onreherheunestratégieRDU-optimale(i.e.,opti-
maleausensdel'utilitédépendantdurang).L'utilitédépendantdurang
[10 ℄présenteuneplusgranderihessedesriptivequel'utilitéespéréear
ellepermetuntraitementnonlinéairedesprobabilités. Leproblèmeal-
gorithmiquequis'ensuit dans les arbresdéision hasardest ependant
plusdiilear laprogrammationdynamiquenes'applique plus.Nous
établissonsiiqueleproblèmeestNP-diile.Nousproposonsunalgo-
rithmede séparation etévaluation pourle résoudre, etprésentons des
résultatsnumériquesmontrantl'eaitédenotreapprohe.
Mots-Clefs. Théoriedeladéision;Algorithmique;Utilitédépendant
durang;Arbresdéisionhasard;Complexité;Séparationetévaluation.
1 Introdution
Ilest dessituationsdehoixoùlesonséquenes desationspotentielles ne
peuventêtredéterminées aveertitude. Lorsqueetteinertitudeest probabi-
lisée (autrement dit lorsque la probabilité d'ourrene de haune des onsé-
quenes estonnue),onparlededéision dansle risque.Uneationpotentielle
peut alors être vue omme une distribution de probabilité sur l'ensemble des
onséquenes.L'objetdelathéoriedeladéisiondanslerisqueestentreautres
d'étudier et demodéliserleomportementd'undéideur ensituation de hoix
entredetelles ationspotentielles (pouruneintrodutionaudomaine,voirpar
exemple l'ouvragede Gayant[4℄).Les premiers travauxdans ette optiquere-
montent aumodèle de l'espéraned'utilité (EU) proposé parvonNeumannet
Morgenstern[12℄.Dansemodèle,lesindividusassignentunevaleurnumérique,
nommée utilité, àhaque onséquene.L'évaluation d'unedistribution depro-
babilité se fait ensuite via unalul d'espérane d'utilité. Une distribution de
probabilitéestalorspréféréeàuneautresisonespéraned'utilitéestplusgrande.
Enpratique,l'ensembledesationspotentiellesestsouventdénienompré-
hension. C'est leas enpartiulier dans lesproblèmesde déisionséquentielle,
oùl'on doitprendreuneséquene dedéisionsonditionnellementàdesévéne-
arbre déision hasard. Il s'agit d'une arboresene omportant trois types de
n÷uds:lesn÷udsde déision (représentéspardesarrés),lesn÷udsde hasard
(représentés pardes erles), et lesn÷uds terminaux (lesfeuilles de l'arbores-
ene). Les branhes issues d'un n÷ud de déisionorrespondent àdiérentes
déisionspossibles,tandisqueellesissuesd'unn÷uddehasardorrespondent
auxdiérentsévénementspossibles,dontononnait lesprobabilités.Enn,les
valeursgurantau niveaudesfeuilles del'arboreseneorrespondentauxuti-
lités des diérentes onséquenes.Remarquons que l'usage veut qu'on omette
les orientations des ars lorsqu'on représente les arbres déision hasard. Nous
illustrons maintenant l'usage de et outil sur un exemple de hoix de ontrat
d'assuranepourunbienimmobilier[3℄.
Exemple 1 Considéronsunontratd'assuraneauquelonpeutdéiderdesous-
rire pour une année
1
et/ou uneannée2
.Bien évidemment,on ne sait passi l'on seraamenéounon àlefairevaloiràla suited'undommage (ambriolage,inondation...).Onsupposeiiquelaprise enharged'undommagenonouvert
oûte 2. Par ailleurs, la probabilité de subir undommage durant l'année
2
estonditionnée aux événements de l'année
1
: elle est de3 5
l'année 1, mais ellepasseà
1
4
l'année2si ona déjà subiundommage lorsde l'année 1(sinon elleresteinhangée). Lapremièreannée,on peutsousrire(déision 1)ounon (dé-
ision 0)un ontrat d'assurane ouvrant les dommages dont le oût est de 1.
Ladeuxième année, on peut ou non renouveller e ontrat pour lemême oût.
L'utilitédudéideurestaluléeenfontionduoûttotal
x = 2s + a
,oùs
estlenombrededommagesnonouvertset
a
estlenombredesousriptionsauontrat d'assurane.Onposeiiquelafontiond'utilitéu
estu(x) = 4 − x
.L'arbredé-ision hasardorrespondantàeproblème estreprésentésurla gure1.
Ilestimportantderemarquerquedansunarbredéisionhasardbinaireom-
plet(i.e.,omportantdeuxdéisions(resp.événements)possiblesàhaquen÷ud
de déision (resp.hasard) et dont haque niveauest omplètement rempli), le
nombredestratégiespossiblesestexponentieldanslenombreden÷udsdedéi-
sion(rappelonsqu'unestratégieestaratériséeparladonnéedeshoixeetués
auxdiérentsn÷uds dedéision).Plus préisément, sionnote
n
lenombreden÷uds de déision, on peut montrer que le nombre de stratégies possibles est
en
Θ(2 √ n )
(setion3).Ilestependantbienonnuqu'ilexisteunalgorithmeli-néaire(i.e.,en
O(n)
)permettantdedéterminer,parprogrammationdynamique, une stratégie optimaleau sensdu modèle EU. En eet, une telle stratégie vé-rie le priniped'optimalité : toute sous-stratégied'une stratégieoptimale est
optimale.L'idée de l'algorithmeonsistedon àproéderparindution arrière
àpartirdes n÷uds terminaux, an dedétermineren haquen÷ud l'espérane
d'utilité d'unesous-stratégieoptimale:
enunn÷uddehasard,l'espéraned'utilitéoptimaleestégaleàl'espérane
desutilitésoptimales desessuesseurs;
enunn÷udde déision,l'espéraned'utilité optimaleest égaleàlaplus
grandedesespéranesd'utilitéoptimales desessuesseurs.
D 1
H 1
0
D 2
2/5
H 3
0
b u(0) = 4
2/5
b u(2) = 2
3/5
H 4
1
b u(1) = 3
2/5
b u(1) = 3
3/5
D 3
3/5
H 5
0
b u(2) = 2
3/4
b u(4) = 0
1/4
H 6
1
b u(3) = 1
3/4
b u(3) = 1
1/4
H 2
1
D 4
2/5
H 7
0
b u(1) = 3
2/5
b u(3) = 1
3/5
H 8
1
b u(2) = 2
2/5
b u(2) = 2
3/5
D 5
3/5
H 9
0
b u(1) = 3
3/4
b u(3) = 1
1/4
H 10
1
b u(2) = 2
3/4
b u(2) = 2
1/4
Fig.1.Exempled'arbredéisionhasard.
Exemple 2 Dans l'exemple préédent du ontrat d'assurane, l'algorithme re-
montelavaleur
max( 14 5 , 3) = 3
enD 2
,3
2
enD 3
,2
enD 4
(enprenantladéision1) et
10
4
enD 5
(en prenant la déision 0). Par onséquent, l'espérane enH 1
vaut
3 × 2 5 + 3 2 × 3 5 = 21 10
etenH 2
ellevaut23
10
.Lastratégieoptimale ausensdeEU onsistedon àsousrire auontratla première annéeetàne sousrireau
ontratlaseondeannéequesil'onn'apassubidedommagelorsdelapremière.
La simpliité d'utilisation du modèle EU, ainsi que son attrait sur le plan
normatif, lui ontpermis de régner sans partage es soixante dernières années.
Pourtant,lesmises endéfaut répétéesdumodèlesur leplan desriptifontni
par éroder sa position. En partiulier, de nombreuses expérienes mettent en
évidenequelesindividus sous-évaluentlesfortesprobabilitésetsurévaluentles
faiblesprobabilités[1,7℄.Deefait,biensouvent,lemodèleEUn'estpasàmême
de rendre ompte duomportement déisionnel observé. Fae àe onstat,de
nouveauxmodèlesontétédéveloppés:ertainssefondentsurunereprésentation
alternativedel'inertitudeommel'oreparexemplelathéoriedespossibilités
[2℄,d'autresprennentenompte expliitement lapereptiondéforméedespro-
babilitésparledéideur.Dansette dernièredémarhe,Quiggin[10℄aproposé
le modèleRank Dependent Utility (RDU), qui permet de rendre ompte d'un
plus largeéventailde omportementsdéisionnels. Cependant,la non-linéarité
du ritère RDU (i.e., RDU
(λX + Y ) 6= λ
RDU(X ) +
RDU(Y )
) invalide touteunréelproblèmealgorithmiqueauvudunombreombinatoiredestratégiespos-
sibles,qui rendimpratiableleurénumérationomplète.
Leproposdeepapierestpréisémentd'étudierleproblèmeonsistantàdé-
terminerlastratégieoptimaledansunarbredéisionhasardausensdeRDUet
deproposeruneméthodeparénumérationimpliitepourlerésoudre.Lepapier
estorganiséommesuit.Dansunpremiertempsnousformalisonslaprobléma-
tiqueetrappellonslesbasesdumodèleRDU.Nousmettonsensuiteenévidene
l'impossibilitédeproéderparprogrammationdynamiquepourrésoudreepro-
blèmeetnousprouvonsqueedernierestNP-diile(setion3.3).Nousexpo-
sonsalorsunalgorithmederésolutionparénumérationimpliite, fondésurune
borne alulable en temps quadratique, et nous terminons enn en présentant
lesrésultatsd'expérimentationsnumériques(setion4).
2 Formalisation du problème
2.1 Notationset Dénitions
Dans unarbre déisionhasard
T = (N , E)
ayantpourraine unn÷ud dedéision
N r
, nous notonsN D ⊂ N
(resp.N H ⊂ N
)l'ensemble desn÷uds dedéision(resp.hasard).De plus,nousnotons
C ⊂ N
l'ensembledesn÷uds ter-minaux. Le grapheest valuéomme suit : àtout ar
E = (H, N ) ∈ E
telqueH ∈ N H
, on assoie laprobabilitép(E)
de l'événement orrespondant;à toutn÷udterminal
C ∈ C
, onassoie sonutilité notéeu(C)
. Parailleurs, nousap-pelons
past(N )
le passé deN ∈ N
, i.e. l'ensemble des arsle longdu heminallant de
N r
àN
dansT
. Enn, nous notonsS (N )
l'ensemble dessuesseursde
N
dansT
,etT (N)
lesous-arbredeT
deraineN
.Soit
T
un arbredéisionhasardetN ∆ ⊆ N
un ensemble den÷uds onte-nant:
laraine
N r
deT
,unet unseulsuesseurpourhaquen÷uddedéision
N ∈ N D ∆ = N D ∩ N ∆
,touslessuesseurspourhaquen÷uddehasard
N ∈ N H ∆ = N H ∩ N ∆
.L'ensembled'ars
∆ = {(N, N ′ ) : N ∈ N D ∆ , N ′ ∈ N ∆ } ⊆ E
dénit unestratégiede
T
dès lorsque lesous-grapheinduit parN ∆
est un arbre.Etant donnéunn÷uddedéision
N
,larestritiond'unestratégiedeT
ausous-arbreT (N )
,quin'estautrequ'unestratégiede
T (N )
,estappelléesous-stratégie.NousnotonsD
l'ensembledesstratégies.
Soit
S = {u 1 , . . . , u k }
un ensemble ni d'utilités. On appelle loterie une distributiondeprobabilitéP
surS
.OnnoteL = (p 1 , u 1 ; . . . ; p k , u k )
laloteriequiaboutitàuneutilité
u i
aveuneprobabilitép i = P({u i })
.And'allégerertainesnotations,onpeutonsidérerlaloterie
L
ommeunefontiondeS 7→ [0, 1]
telleque
L(u i ) = p i
.Dans unarbredéisionhasard,àtoutestratégieil est possibled'assoier une loterie.En eet, onpeut déterminerlaprobabilité
p C
d'obteniruneonséquene
C ∈ C
enalulant:p C = Q
(H,N ) ∈past(C) p((H, N ))
oùH ∈ N H
Lavaleurd'unestratégieselonEU(resp.RDU)estégaleàlavaleurdelaloterie
orrespondanteselonEU (resp.RDU).
Exemple 3 Dans l'exemple du ontrat d'assurane, la stratégie EU-optimale
orrespondàlaloterie
( 20 3 , 1; 20 8 , 2; 20 9 , 3)
dontl'espérane estbien46 20 = 23 10
.2.2 Rappelssur RDU
Lemodèle RDU reposesur deuxparamètres: une fontiond'utilité qui est
déjàprésentedanslemodèleEU,etunefontion
ϕ
dedéformationdesprobabi- lités.Ils'agit d'unefontionstritementroissantesur[0, 1]
telle queϕ(0) = 0
et
ϕ(1) = 1
. Cettedéformationdesprobabilitésporte, nonsurdesprobabilités simples,maissurdesumulsdeprobabilités.Pourrappel,étantdonnéeunelo-terie
L = (p 1 , u 1 ; . . . ; p k , u k )
,onappellefontion déumulative deL
lafontionG L : S 7→ [0, 1]
qui assoie àhaqueutilitéu i
la probabilité d'avoirau moins etteutilité.Plusformellement,G L (x) = P
i:u i ≥x p i
.LavaleurselonRDUd'uneloterie
L
estalorsdéniedelamanièresuivante :RDU(L) = u (1) + P k
i=2 [u (i) − u (i − 1) ]ϕ(G L (u (i) ))
où (.)orrespondà une permutation de
{1, . . . , k}
telle queu (1) ≤ . . . ≤ u (k)
.Ce ritère peut être interprété omme suit : on est sûr d'obtenir au moins
une utilité de
u (1)
, puis on est suseptible d'obtenir un supplément d'utilitéde
u (2) − u (1)
ave une massede probabilitéϕ(G L (u (2) ))
, puis un supplémentd'utilité de
u (3) − u (2)
ave une massede probabilitéϕ(G L (u (3) ))
, et ainsi desuite...
Exemple 4 ConsidéronslastratégieEU-optimaledel'exemple2.Laloterieor-
respondante est
L = ( 20 3 , 1; 20 8 , 2; 20 9 , 3)
.Sa valeur RDU se aluleomme suit:RDU(L) = 1 + ϕ( 17 20 ) × (2 − 1) + ϕ( 20 9 ) × (3 − 2)
. Supposons queϕ(p) = 0.25
pour
0 < p ≤ 0.5
,etϕ(p) = 0.75
pour0.5 < p < 1
.OnobtientalorsRDU(L) = 1 + 0.75 × 1 + 0.25 × 1 = 2
.L'intérêtdedéformerdesumulsdeprobabilités,etnondiretementlespro-
babilitéselles-mêmes(omme'estparexempleleasdanslemodèledeHanda
[5℄), est d'obtenir un ritère de hoix ompatible ave la dominane stohas-
tique. On dit qu'une loterie
L = (p 1 , u 1 ; . . . ; p k , u k )
domine stohastiquement une loterieL ′ = (p ′ 1 , u ′ 1 ; . . . ; p ′ k , u ′ k )
si∀x ∈ R, G L (x) ≥ G L ′ (x)
, autrementdit,pourtout
x ∈ R
,laprobabilitéd'obteniruneutilitéd'aumoinsx
avelaloterieL
est aumoins aussi grandequ'ave laloterieL ′
. Laompatibilité ave lado-minane stohastiquesignieque
RDU (L) ≥ RDU (L ′ )
dèslorsqueL
dominestohastiquement
L ′
[10℄.Cettepropriétéestbien entendusouhaitablepourdé- rire un omportement rationnel, et elle est bien vériée par le modèle RDU3.1 Espae des solutions
Considéronsunarbredéisionhasardbinaireomplet
T
deprofondeur2p
telquelesn÷udsdeprofondeurpairesoientdesn÷udsdedéision(oudesn÷uds
terminaux) et les n÷uds de profondeur impaire soient des n÷uds de hasard.
Nousnousintéressonsiiàomptabiliser lenombredestratégiespossibles(au-
trement dit de solutions réalisables) en fontion de la taille de l'instane. On
dénit omme taille de l'instanele nombre de n÷uds de déision.Ce nombre
est eneetdumême ordredegrandeurquelenombreden÷udsde
T
.Remar-quons qu'ily a1n÷udde déisionpourlaprofondeur
0
,4
n÷uds dedéisionpourlaprofondeur
2
,16
pourlaprofondeur4
... Le nombretotalde n÷uds dedéision dans
T
est don égal àla sommedes termes d'une suite géométrique de raison 4:n = |N D | = P p−1
i=0 4 i = 4 4−1 p − 1
. Exprimonsmaintenant le nombredestratégiesenfontionde laprofondeur.Pourela,onproède parindution
arrièresur
T
, enremontantlenombredestratégiesjusqu'àlaraine.Onom-meneparétiqueterà
2
lesn÷uds dedéisionquinepossèdentauun n÷uddedéisiondansleurdesendane. Onappliqueensuitelesrelationsde réurrene
suivantes:lenombredestratégiesàpartird'unn÷uddehasarddonnéestégal
auproduit dunombredestratégiesàpartirdesessuesseurs,etlenombrede
stratégiesàpartird'unn÷uddedéisiondonnéestégalàlasommedunombre
de stratégiesàpartir de sessuesseurs.Ainsi, lenombre totalde stratégiesà
partird'unn÷uddedéision
N D
peutsealuleràl'aidedelasuiteréurrente(u k )
suivante :u 0 = 2
,u k = 2u 2 k − 1
, oùk
indique le nombre de n÷uds de dé-ision(
N D
exlu)sur unheminquelonquedeN D
versunn÷udterminal.Leterme généralde ette suite est
2 (2 k+1 −1)
. On peut vérier failementqu'on ak = p − 1
àlaraine.Paronséquent,lenombretotaldestratégiesdansT
est|D| = u p − 1 = 2 (2 p − 1) ∈ Θ(2 √ n )
(puisquen = (4 p − 1)/3
).Ainsi,le nombredestratégies potentielles étant exponentiel de la taille de l'instane, il est nées-
sairededévelopperunalgorithmed'optimisationombinatoirepourdéterminer
la stratégieoptimale.Nous montrons i-dessous que latâheest d'autantplus
déliatequelaprogrammationdynamiquenes'appliquepluslorsqu'onoptimise
selonRDU.
3.2 Monotonie etindépendane
Ilestbienonnuquelaprogrammationdynamiquereposesurlerespetd'une
ondition de monotonie [9℄ sur la fontion de valuation. Dans notre ontexte,
etteonditionpeutseformulerommesuitsur lafontiondevaluation
V
desloteries:
∀α ∈ [0, 1], V (L) ≥ V (L ′ ) = ⇒ V (αL + (1 − α)L ′′ ) ≥ V (αL ′ + (1 − α)L ′′ )
où
L, L ′ , L ′′
sontdesloteriesquelonquesetαL + (1 − α)L ′′
estlaloteriedéniepar
(αL + (1 − α)L ′′ )(x) = αL(x) + (1 − α)L ′′ (x)
.Cetteonditionalgorithmique peutêtreinterprétée,dansleadredelathéoriedeladéision,ommeuneformedeuxloteries
L
etL ′
aveunetroisièmeL ′′
n'inversepasl'ordredespréférenes(induit par
V
) : siL
est stritement préférée àL ′
, alorsαL + (1 − α)L ′′
eststritementpréféréeà
αL ′ + (1 − α)L ′′
.PourV ≡ EU
lapropriétédemonotonieestvériée.Parontre,pour
V ≡ RDU
,lapropriétén'estplusvalide,ommelemontrel'exemplesuivant.
Exemple 5 Soient trois loteries
L = (0.5, 1; 0.5, 10)
,L ′ = (1, 5)
etL ′′ = L
.SupposonsquelespréférenesdudéideursuiventlemodèleRDUavelafontion
ϕ
suivante :ϕ(0) = 0
,ϕ(p) = 0.45
si0 < p ≤ 0.7, ϕ(p) = 1
sip > 0.7
. Lesvaleursselon
RDU
deL
etL ′
sont:RDU(L) = 1 + (10 − 1)ϕ(0.5) = 5.05 RDU(L ′ ) = 5
Ainsi, ona
RDU(L) ≥ RDU (L ′ )
.D'après la propriétéde monotonie pourα = 0.6
,ondevraitdonavoirRDU(0.6L+0.4L ′′ ) ≥ RDU(0.6L ′ +0.4L ′′ )
.Pourtant,on a:
RDU(0.6L + 0.4L ′′ ) = 1 + (10 − 1)ϕ(0.5) = 5.05
RDU(0.6L ′ + 0.4L ′′ ) = 1 + (5 − 1)ϕ(0.6 + 0.2) + (10 − 5)ϕ(0.2) = 7.25
etdon
RDU(0.6L+0.4L ′′ ) < RDU (0.6L ′ +0.4L ′′ )
.Paronséquent,lapropriétéde monotonie n'estpasvériée.
Depar laviolationduprinipedemonotonie, la miseen ÷uvre d'unepro-
éduredeprogrammationdynamiquepour
RDU
dansunarbredéisionhasardpeut onduire à une stratégie sous-optimale. Une telle proédure peut même
onduireàunestratégiestohastiquementdominée.Eneet,onsidéronsl'arbre
dedéisiondelagure2,onstruitàl'aidedel'exemple5.Dansetarbredéi-
sionhasard,lesvaleurs
RDU
desdiérentesstratégiespossiblesàlarainesont:RDU({(D 1 , H 2 )}) = 1 + (5 − 1)ϕ(0.6 + 0.2) + (8 − 5)ϕ(0.2) = 6.35
RDU({(D 1 , H 1 ), (D 2 , H 3 ), (D 3 , H 4 )}) = 1 + (10 − 1)ϕ(0.5) = 5.05 RDU({(D 1 , H 1 ), (D 2 , δ 1 ), (D 3 , δ 2 )}) = 5
RDU({(D 1 , H 1 ), (D 2 , δ 1 ), (D 3 , H 4 )}) = 7.25 RDU({(D 1 , H 1 ), (D 2 , H 3 ), (D 3 , δ 2 )}) = 5.05
Ainsi,lastratégieoptimaleàlaraine est
{(D 1 , H 1 ), (D 2 , δ 1 ), (D 3 , H 4 )}
. Pour-tant,enproédantparprogrammationdynamique,onobtienten
D 2
:RDU({(D 2 , H 3 )}) = 1 + (10 − 1)ϕ(0.5) = 5.05
etRDU({(D 2 , δ 1 )}) = 5
. C'est don lasous-stratégie
{(D 2 , H 3 )}
qui est retenue enD 2
, et de même la sous-stratégie{(D 3 , H 4 )}
quiestretenueenD 3
.Parsuite,enD 1
,'estlastratégie{(D 1 , H 2 )}
(6.35ontre5.05pour
{(D 1 , H 2 )}
),dominéestohastiquementpar{(D 1 , H 1 ), (D 2 , δ 1 ), (D 3 , H 4 )})
,quiestretournée.Un déideur utilisant le ritère RDU doit don faire du hoix résolu [8℄,
'est-à-dire qu'il doit hoisir une stratégie à la raine de l'arbre et s'y tenir
(faute de quoi il pourrait se retrouver omme i-dessus à suivre une stratégie
stohastiquementdominée).Nous nousintéressonsii àdéterminer unestraté-
gieRDU-optimalevuedelaraine(puisànepasendévier).Remarquonsqu'un
telproédénousassuredenepasrenontrerdesous-stratégiestohastiquement
D 1
H 1
D 2
0.6
H 3
b 10
0.5
b 1
0.5 b 5(δ 1 )
D 3
0.4
H 4
b 10
0.5
b 1
0.5 b 5(δ 2 )
H 2
b 1
0.2
b 5
0.6 b 8
0.2
Fig.2.RDUnevériepaslapropriétédemonotonie.
selonRDU.D'autresapprohesdehoixrésoluontétéenvisagéespourdétermi-
ner une stratégieraisonnable àl'aide duritèreRDU. Onpeut mentionneren
partiulierlestravauxdeJarayetNielsen[6℄,dontladémarhedièredeelle
duprésentpapier.En eet, ils onsidèrenthaquen÷udde déisiondel'arbre
déisionhasardommeétantunegodudéideur,etvisentàdéterminerunestra-
tégieréalisantunompromisentrees diérentsegos,en s'assurantquetoutes
les sous-stratégies sont prohes de l'optimum pour RDU et stohastiquement
non-dominées.
3.3 Complexité du problème
Nousprouvonsmaintenantqueleproblèmeonsistantàdéterminerunestra-
tégie RDU-optimale est NP-diile, si onpose que lataille d'uneinstane du
problèmeorrespondaunombreden÷uds dedéisionimpliqués.
Proposition1 La reherhe d'une stratégie RDU-optimale (problème RDU-
OPT)dansunarbre déision hasardest unproblème NP-diile.
Démonstration.Ons'appuiesurunerédutionpolynomialeduproblème3-SAT
versleproblèmeRDU-OPT.Leproblème3-SATseformuleommesuit:
INSTANCE:unensemble
X
devariablesbooléennes,uneolletionC
delausessur
X
telleque|c| = 3
pourtoutelausec ∈ C
.QUESTION : Existe-t-il une instaniation des variables booléennes de
X
quisatisfaitsimultanémenttoutesleslausesde
C
?Soient
X = {x 1 , . . . , x n }
etC = {c 1 , . . . , c m }
.Laonstrutionpolynomialed'un arbre déision hasard à partir d'une instane du problème 3-SAT se réaliseommesuit. Ondénitunn÷uddedéisionpourhaquevariable de
X
. Etantdonnée
x i
une variable deX
, le n÷ud de déision assoié dans l'arbre déi-sionhasard,notéégalement
x i
,adeuxls:lepremier(n÷uddehasardnotéV i
)orrespondàl'instaniationvraide
x i
,etleseond(n÷uddehasardnotéF i
)or-respond àl'instaniationfaux de
x i
. Soient{c i 1 , . . . , c i j } ⊆ C
le sous-ensemblede lauses dans lesquelles gurent le littéral positif
x i
, et{c i ′
1 , . . . , c i ′ k } ⊆ C
le sous-ensemble de lauses dans lesquelles gurent le littéral négatif
x ¯ i
. Pourhaquelause
c i h
(1 ≤ h ≤ j
) onréeommelsdeV i
unn÷udterminalnotéc i h
, orrespondantà la lausec i h
. On rée en outre un ls supplémentaire deV i
notéc 0
, orrespondant à une onséquenec 0
tive. De même, on rée unls de
F i
pour haque lausec i ′ h
(1 ≤ h ≤ k
), ainsi qu'un ls supplémentaire orrespondantàlaonséquenec 0
tive.Len÷udV i
omportedonj + 1
ls,tandis quele n÷ud
F i
omportek + 1
ls. Ande onstituerun uniquearbredéision hasard, on ajoute un n÷ud de hasard
H
père de tous les n÷uds dedéision
x i
(1 ≤ i ≤ n
). Enn, on rajoute un n÷ud de déision à la raine,ayant
H
omme unique ls. L'arbre déision hasard ainsi onstruit omporten + 1
n÷uds dedéision,2n + 1
n÷uds dehasardet auplus2n(m + 1)
n÷udsterminaux. Sa taille est donen
O(nm)
, e qui garantitbien la polynomialité de latransformation. A titre d'illustration, surla partie gauhede lagure3,nousdonnonsl'arbredéisionhasardobtenupourl'instanesuivantede3-SAT:
(x 1 ∨ x 2 ∨ x 3 ) ∧ (x 1 ∨ x 3 ∨ x 4 ) ∧ (x 2 ∨ x 3 ∨ x 4 )
.Remarquonsqu'onpeutétablirunebijetionentrel'ensembledesstratégiesdans
l'arbredéisionhasardetl'ensembledesinstaniationsdansleproblème3-SAT
dedépart.Il sut poure fairede poser
x i = 1
dansle problème3-SATsietseulementsil'ar
(x i , V i )
guredanslastratégie,etx i = 0
sietseulementsi'estl'ar
(x i , F i )
quiguredanslastratégie.Uneinstaniationsatisfaisante(i.e.,qui satisfaitsimultanémenttoutesleslauses)dans3-SATorrespondàunestraté-gieoùtoutelause
c i
(1 ≤ i ≤ m
)gureommeonséquenepossible(elleguredondeuneàtroisfois).Pourompléterlarédution,ils'agitdonmaintenant
dedénird'unepartlesprobabilitésassignéesauxarsissusdesn÷uds
H
,V i
etF i
,etd'autrepartlesutilitésdesonséquenesetlafontionϕ
.Larédutionvaonsisteràlesdénirdefaçonàequeseuleslesstratégiesorrespondantàdes
instaniations satisfaisantes maximisent RDU.Plus préisément, nousvisonsà
eque:
(i)
la valeur RDU d'une stratégie ne dépende que de l'ensemble (et non dumulti-ensemble) de ses onséquenes possibles (autrement dit l'ensemble des
lausessatisfaitesparl'instaniation orrespondante),
(ii)
lavaleurRDU d'unestratégieorrespondantàuneinstaniationsatisfai- santevailleexatementm
,(iii)
siunestratégieestsuseptibledeonduireàunensembledeonséquenespossiblesquieststritementinlusdansl'ensembledesonséquenesd'uneautre
stratégie,lavaleurRDU deettedernièresoit stritementsupérieure.
Pourefaire,aprèsavoiraetélaprobabilité
1
n
auxarsissusdeH
,ondénitlesautresprobabilitéset lesutilitésdelafaçonsuivante(
i 6= 0
):( p i = ( 10 1 ) i
u(c i ) = P i
j=1 10 j−1
où
p i
désignelaprobabilitédetoutaronduisantàlaonséquenec i
.Pourlesarsdetype
(V j , c 0 )
(resp.(F j , c 0 )
),onposeu(c 0 ) = 0
etonaetelaprobabilitéD L
x 1
1 4
V 1
b c 0 = 0
0.9
b c 1 = 1
0.1
F 1
b c 0 = 0
0.99
b c 2 = 11
0.01
x 2
1 4
V 2
b c 0 = 0
0.9
b c 1 = 1
0.1
F 2
b c 0 = 0
0.999
b c 3 = 111
0.001
x 3
1 4
V 3
b c 0 = 0
0.89
b c 1 = 1
0.1 b c 2 = 11
0.01
F 3
b c 0 = 0
0.999
b c 3 = 111
0.001
x 4
1 4
V 4
b c 0 = 0
0.99
b c 2 = 11
0.01
F 4
b c 0 = 0
0.999
b c 3 = 111
0.001
ϕ(p) = 8
> >
> <
> >
> :
0,
sip ∈ [0; 4×1000 1 [
1
100 ,
sip ∈ [ 4×1000 1 ; 4×100 1 [
1
10 ,
sip ∈ [ 4×100 1 ; 4×10 1 [ 1,
sip ∈ [ 4×10 1 ; 1[
Fig.3.Exemplederédution
qui omplémente à 1l'ensemble desprobabilités aetéesauxars issus de
V j
(resp.
F j
).Notonsqueettedernièreprobabilitéest bienpositivearlasomme desp i
eststritementinférieureà1.Enn,lafontionϕ
estdénieommesuit1:ϕ(p) =
0
sip ∈ [0; p n m [
p i
sip ∈ [ p i+1 n ; p n i [
pouri < m 1
sip ∈ [ p n 1 ; 1[
Atitred'illustration,surlapartiedroitedelagure3,nousindiquonslafontion
ϕ
obtenuepourl'instanede3-SATindiquée plushaut.Danslasuite,ononsidèreunestratégiequelonque
∆
,induisantuneloterienotée
L
,etonnoteI ⊆ {0, . . . , m}
l'ensembledesindiesdesonséquenespos-sible de
∆
. Remarquonsque laonséquenec 0
est toujoursprésente dans unestratégie
∆
.Onappelleα i ∈ {1, 2, 3}
lenombred'ourrenesdelaonséquenec i
dans∆
.Parabusdenotation,nousonfondonsi-dessousc i
etu(c i )
.Preuve de
(i)
.La valeur RDU d'une stratégie∆
quelonque vautRDU(L) = c 0 ×ϕ(1)+ P
i∈I (c i −c prec I (i) )ϕ P j∈I
j≥i α j p j
n
,où
prec I (i) = max{j ∈ I : j < i}
.Montronsque
∀i ∈ I, ϕ P j∈I
j≥i α j p j
n
= ϕ P j∈I
j≥i
p j
n
.
1
Remarquons qu'entouterigueurette fontion
ϕ
est roissanteseulement ausenslarge,maisleleteurpourraseonvainrefailementqu'onpeutl'adapterlégèrement
Parroissanede
ϕ
,onaϕ P j∈I
j≥i
p j
n
≤ ϕ P j∈I
j≥i α j p j
n
≤ ϕ P j∈I
j≥i 3 p n j
.
Onadon
ϕ P j∈I
j≥i
1 n
1 10
j
≤ ϕ P j∈I
j≥i α j p j
n
≤ ϕ P j∈I
j≥i
3 n
1 10
j
.
Comme
ϕ( P
j∈I j≥i
1
n ( 10 1 ) j ) = ϕ( P
j∈I j≥i
3
n ( 10 1 ) j ) = p i− 1
, on a par enadrementϕ( P
j∈I j≥i α j p j
n ) = ϕ( P
j∈I j≥i
p j
n )
.Orc 0 ×ϕ(1) = 0
.OnonlutdonqueRDU(L) = P
i ∈ I (c i − c prec I (i) )ϕ( P
j∈I j≥i
p j
n )
.Preuvede
(ii)
.Considéronsunestratégie∆ ∗
orrespondantàuneinstaniation satisfaisante,etlaloterieinduiteL ∗
oùtouteslesonséquenesc i
deC
sontpos-sibles.D'après
(i)
,onaRDU(L ∗ ) = P m
i=1 (c i − c i− 1 )ϕ( P m j=i
p j
n )
. Onremarquequepourtout
i ≤ m
,(c i −c i−1 )ϕ( P m j=i
p j
n ) = 10 i − 1 ×p i−1 = 10 i − 1 ×( 10 1 ) i − 1 = 1
.Paronséquent,
RDU(L ∗ ) = m
.Preuvede
(iii)
.Soient∆
(resp.∆ ′
)une stratégiequelonquedeloterieinduiteL
(resp.L ′
)etI ⊆ {0, . . . , m}
(resp.J = I ∪ {k}
)l'ensembledesindiesde sesonséquenespossibles.On suppose iique
k < max I
, leask = max I
étantévident.Pardénition,
{i ∈ I : i 6= k} = {i ∈ J : i 6= k}
.OnpeutdonérirelavaleurRDUde
∆
ommeunesommesdetroistermes:RDU(L) = P
i∈J
i≤k−1 (c i − c prec J (i) )ϕ P j∈I
j≥i
p j
n
+ (c k − c prec J (k) )ϕ P j∈I
j≥k
p j
n
+
P i∈J
i≥k+1 (c i − c prec J (i) )ϕ P j∈J
j≥i
p j
n
Delamêmemanière,lavaleurRDU delastratégie
∆ ′
s'éritégalementommeunesommedetroistermes :
RDU(L ′ ) = P
i∈J
i≤k−1 (c i − c prec J (i) )ϕ P
j∈J j≥i
p j
n
+ (c k −c prec J (k) )ϕ P
j∈J j≥k
p j
n
+
P i∈J
i≥k+1 (c i − c prec J (i) )ϕ P j∈J
j≥i
p j
n
Par roissane de
ϕ
, on aI ⊆ J ⇒ ∀i ≤ k − 1, ϕ( P
j∈I j≥i
p j
n ) ≤ ϕ( P
j∈J j≥i
p j
n )
.Ainsi le premier terme de
RDU (L)
est inférieur ou égal au premier terme deRDU(L ′ )
.Onvériefailementqueϕ( P
j∈I j≥k
p j
n ) = p succ I (k) − 1
etϕ( P
j∈J j≥k
p j
n ) = p prec J (k) = p k−1
, oùsucc I (i) = min{j ∈ I : j > i}
. Orp succ I (k) − 1 < p k−1
ar
succ I (k) − 1 > k − 1
.Donleseond termedeRDU(L)
est stritementin-férieur au seond terme de
RDU(L ′ )
. Enn, le troisième terme deRDU(L)
est bien évidemment égal au troisième terme de
RDU(L ′ )
. Par onséquentRDU(L) < RDU (L ′ )
.On onlut de
(i)
,(ii)
et(iii)
que toute stratégie orrespondantà une instan- iationnon-satisfaisanteprésenteunevaleurRDUstritementinférieureàm
,etquetoutestratégieorrespondantàune instaniationsatisfaisanteprésenteune
valeurRDU exatementégaleà
m
.Trouveruneinstaniationsatisfaisantedans 3-SATrevientdonàtrouverunestratégievalantm
dansRDU-OPT.Dans lasetion suivante,nous dérivonsun algorithmepour déterminerla
stratégie optimaledepuis laraine au sens de RDU.Nous proédons par énu-
mération impliitepuisqueniuneénumérationexhaustivedesstratégiesni une
4.1 Algorithmed'énumérationimpliite
Nous présentons ii une méthode par séparation et évaluation pour déter-
miner lastratégieoptimaleausensde RDU dansunarbre déisionhasard.Le
prinipedeséparationonsisteàpartitionnerl'ensembledesstratégiespossibles
en fontion du hoix d'une arête
(N, N ′ )
donnée en un n÷ud de déisionN
.Plus formellement, lesn÷uds de l'arbrede reherhesont aratériséspar une
stratégie partielle, qui dénit un sous-ensemble de stratégies. Soit
T
un arbredéisionhasardet
N Γ
unensembleden÷uds ontenant:laraine
N r
deT
,unet unseulsuesseurpourhaquen÷uddedéision
N ∈ N D Γ = N D ∩ N Γ
.L'ensembledesarsorientés
Γ = {(N, N ′ ) : N ∈ N D Γ , N ′ ∈ N Γ } ⊆ E
dénitunestratégiepartielle de
T
dèslorsquelesous-grapheinduitparN Γ
est unarbre.Unestratégie
∆
estditeompatible aveune stratégiepartielleΓ
siΓ ⊆ ∆
.Lesous-ensemble destratégiesaratérisé parune stratégiepartielle orrespondà
l'ensembledes stratégiesompatibles.Toutestratégiepartielle n'estependant
passuseptibled'êtreenvisagéedansl'arbredereherhe.Eneet,lesstratégies
partiellesrenontréesdansl'arbredereherherespeteunordredeprioritésur
lesn÷udsdedéisionséletionnésdans
N Γ
(and'éviterlesdoublons):sideuxn÷uds de déisionsontsuseptiblesde prolongerune mêmestratégie partielle,
eluidepluspetitrangseraprioritairesurl'autrepourentrerdans
N Γ
.Lerangd'unn÷udestdonnéparunefontion
rg : N D 7→ {1, 2, . . . , |N D |}
telle que:
rg(N r ) = 1
|past(N )| > |past(N ′ )| ⇒ rg(N ) > rg(N ′ )
|past(N )| = |past(N ′ )|
etEU (T (N )) > EU(T (N ′ )) ⇒ rg(N ) < rg(N ′ )
où
EU (T (N ))
orrespondàlavaleuroptimaledeEU dansT (N )
.Exemple 6 Pour l'arbre déision hasard de la gure 1, il existe une unique
fontion
rg
possibledéniepar :rg(D 1 ) = 1, rg(D 2 ) = 2, rg(D 3 ) = 4, rg(D 4 ) = 3, rg(D 5 ) = 5
.L'algorithme 1 dérit la proédure d'énumération impliite que nous pro-
posons. Il prend en argumentune stratégiepartielle
Γ
et unréelRDU opt
quiorrespond à lavaleur RDU de lameilleure stratégie trouvée jusqu'alors dans
l'exploration.Cettedernièreesteetuéeenprofondeurd'abord.L'ensemble
N 1
désignelesn÷uds dedéisionandidats pourprolongerlastratégiepartielle
Γ
.Parmi eux-i,le n÷uddont lavaleur dela fontion
rg
est minimaleest notéN min
. L'ensembleE min
de ses arêtesinidentes dénit les diérents prolonge-mentsde
Γ
envisagés(autrementdit, lesls dun÷udassoié àΓ
dansl'arbredereherhe).Pourtoutestratégiepartielle
Γ
(autrementdit,enhaquen÷uddel'arbredereherhe),ondisposed'unefontiond'évaluation
ev
représentant unebornesupérieuredelavaleurRDU detoutestratégieompatibleaveΓ
.Algorithme 1:BB
(Γ, RDU opt )
N 1 ← {N 1 ∈ N D : ∀(N, H) ∈ N D × N H , ((N, H) ∈ past(N 1 ) ⇒ (N, H ) ∈ Γ )};
N min ← arg min N∈N 1 rg(N);
E min ← {(N min , H) ∈ E : H ∈ S(N min )};
pourhaque
(N, H ) ∈ E min
fairesi
ev(Γ ∪ {(N, H )}) > RDU opt
alorsRDU temp ←
BB(Γ ∪ {(N, H )}, RDU opt );
si
RDU temp > RDU opt
alorsRDU opt ← RDU temp ;
n
n
n
retourner
RDU opt
Bienque ela nesoit paspréisé dans l'algorithme, remarquonsqu'en pra-
tiquenousutilisonsl'heuristiqueonsistantàdévelopperenprioritélelsdontla
valeurdelafontiond'évaluationestlaplusélevée.Nousdétaillonsmaintenant
lesprinipalesaratéristiquesdenotrealgorithme.
Initialisation.Uneméthodeparséparationet évaluationest notoirementplus
eae quand une bonne solution est onnue avant de démarrer la reherhe.
Dansnotreméthode,labornesupérieure(
RDU opt
)estinitialiséeavelavaleur RDUdelastratégieobtenueparprogrammationdynamiqueselonleritèreEU.En eet, on peut penser que la stratégie ainsi obtenue sera de bonne qualité,
et permettradond'éviteruneexplorationtropapprofondiedesous-espaesne
omportantpasdebonnessolutions.
Fontion d'évaluation. L'évaluation d'un ensemble de stratégies induit par
une stratégiepartielle
Γ
sefait àl'aided'unefontionev
.Le prinipedeetteévaluationestdedéterminerune loteriequidominestohastiquementtoutesles
loteriesassoiéesauxstratégiesompatiblesave
Γ
,etd'évalueretteloteriese-lonleritèreRDU.Ons'assureainsiqueette évaluation estbien unmajorant
puisqueleritèreRDUrespeteladominanestohastique,'est-à-direquesiune
loterie
L
domine stohastiquementune loterieL ′
, alorsRDU(L) ≥ RDU(L ′ )
.Pour déterminer une telle loterie, on proède par programmation dynamique
surl'arbredéisionhasard.L'initialisationdelaproéduresefaitauniveaudes
n÷uds terminaux: àtoutn÷udterminal
C ∈ C
est aetélaloterie(1, u(C))
.Ensuite, enhaquen÷ud
N ∈ N
,onremonte uneloteriequidominestohasti-quementtouteslesloteriesdusous-arbre
T (N )
.Plus préisément,en unn÷ud de hasardH
, on alule la loterieL H
induite par les loteries de sesls de lamanièresuivante:
∀u, L H (u) = P
N∈S(H) p((H, N )) × L N (u)
où
L N
orrespond à la loterie remontée au n÷udN
. Par ailleurs, en haquen÷uddedéision
D
,onappliquelarelationderéurrenesuivanteexpriméesurlesfontionsdéumulatives 2
(poursimplierl'ériture):
2
Notonsqu'onpeutmanipulerindiéremmentuneloterieousafontiondéumulative,
∀u, G L D (u) = G L N (u)
si∃N ∈ S (D) : (D, N ) ∈ Γ
∀u, G L D (u) = max N ∈S(D) G L N (u)
sinonEnn,lavaleurretournéepar
ev
estRDU(L N r )
.Exemple 7 Reprenons l'arbre déision hasard de la gure1 et faisons l'hypo-
thèse que
Γ = {(D 1 , H 1 ), (D 3 , H 6 )}
.Lesloteriesremontées enhaquen÷ud se-rontalors :
L H 3 = ( 3 5 , 2; 2 5 , 4)
,L H 4 = (1, 3)
,L H 6 = (1, 1)
,L D 2 = ( 3 5 , 3; 2 5 , 4)
(arG L D 2 = (max(1, 1), 2; max( 2 5 , 1), 3; max( 2 5 , 0), 4)
),L D 3 = L H 6 = (1, 1)
,L H 1 = ( 3 5 × 1, 1, 2 5 × 3 5 , 3; 2 5 × 2 5 , 4) = ( 3 5 , 1, 25 6 , 3; 25 4 , 4)
,L D 1 = L H 1 = ( 3 5 , 1, 25 6 , 3; 25 4 , 4)
.Lavaleur retournéeparla fontiond'évaluation pour
Γ = {(D 1 , H 1 ), (D 3 , H 6 )}
seradon
ev(Γ ) = RDU(( 3 5 , 1; 25 6 , 3; 25 4 , 4))
.4.2 Expérimentations numériques
L'algorithmeaétéimplémentéenC++etlestestontétémenéssurunordi-
nateur équipéd'unbiproesseurIntelà2.13Ghzave3.5Go demémoirevive.
Lesarbresdéisionhasardsurlesquelsnousavonstesténotrealgorithmesontdes
arbresbinairesompletsdeprofondeurpaire.Lesutilitéset lesprobabilitésont
étégénéréesdemanièrealéatoire.Lesutilitésvarientde
1
à500
.Laprofondeurdesarbresvariequantàellede
4
à14
(donde5
à5461
n÷udsdedéision),aveunealternaneden÷udsdedéisionetden÷udsdehasard.Pourhaqueniveau
de profondeur, 100arbres ont été générés. La ourbede gauhe (resp. droite)
de la gure 4 représente le nombre moyen de n÷uds développés dans l'arbre
d'exploration (resp. le temps moyen d'exéution en se. de l'algorithme) selon
la profondeur. L'axe des ordonnées est exprimé sur une éhelle logarithmique
(enbase 4)arlenombrede n÷udsdedéisionest multipliépar4en ordrede
grandeurpourhaqueinrémentdelaprofondeur.Onremarqueque,surlesins-
tanestiréesaléatoirement,laroissanedunombreden÷udsdéveloppés(resp.
dutempsd'exéution)apparaîtommelinéairedunombreden÷udsdedéision
pourlestaillestraitéesii.Lesplusgrandesinstanesserapprohentdestailles
d'arbredéisionhasardlimitesstokablesenmahine(uneaugmentationde30%
seulementdelaprofondeurpeutêtre envisagée).Lesautdeomplexité sesitue
au-delàdestaillestraitées ii.
Fig.4.Comportementdel'algorithmeenfontiondelaprofondeur.
Dans e papier,nous avonsmené une étude algorithmique duproblème de
lareherhed'unestratégieRDU-optimaledansunarbredéisionhasard.Nous
avonsenpartiuliermontréqueeproblèmeestNP-diile.Nousavonsensuite
proposé un algorithme d'énumération impliite pour déterminer une stratégie
RDU-optimale.Lestestsnumériquesonduitsmontrentqueetalgorithmeper-
metderésoudreavedestempsompétitifsdesinstanesdontlatailleapprohe
lalimitemémoireimposéeparlamahine.Unsujetd'étudeintéressantpourdes
travauxfutursseraitjustementdeonevoirdesalgorithmesderésolutionpour
desproblèmesdedéisiondanslerisquemodélisésàl'aided'undiagrammed'in-
uene.Undiagrammed'inueneestungrapheorientésansiruitreprésentant
defaçonompateunarbredéisionhasardenexploitantlessymétriesprésentes.
Parexemple, sur l'arbredela gure2, lesn÷uds
D 2
etD 3
peuventêtre fa-torisés en unseularlessous-arbresassoiés sontidentiques.Néanmoins, une
diulté supplémentairepourla résolutionest qu'unestratégie RDU-optimale
peutonduireànepasfairelemêmehoixendeuxn÷udsdedéisiondistints
assoiés à des sous-arbres pourtant identiques (alors qu'il existe toujours une
stratégieEU-optimaleoùl'onprendlamêmedéision).C'estleasparexemple
en
D 2
etD 3
pourl'arbredelagure2.Remeriements
NousremerionsPatriePernyquiaporténotreattentionsurlesujetétudié
ii, ChristopheGonzalesavequi nous avonseude multiples éhanges qui ont
ontribué àe travail,ainsique lesreleteursanonymespourleurs suggestions
pertinentes.
Référenes
1. Allais,M. (1979):Thefoundationofapositivetheoryofhoieinvolvingriskans
aritiism ofthe postulateand axiomsoftheamerianshool. InExpeted utility
hypotheses andtheAllaisparadox,pages27145.Dordreht,Holland.Originalwork
publishedin1952.
2. Dubois,D.,Prade,H.and Sabbadin,R.(2001) :Deision-theoretifoundations of
qualitative possibility theory. European Journal of Operational Researh, 128(3),
459-478.
3. Esoer,B.andSpanjaard,O.(2005):Programmationdynamique.Dansl'ouvrage
olletifOptimisationombinatoire, Volume1.EditéparV.Th.Pashos.Hermes.
4. Gayant,J.-P.(2001):Risqueetdéision,Vuibert.
5. Handa, J.(1977):Risk,probabilities andanewtheoryofardinal utility.Journal
of PolitialEonomis,85,97-122.
6. Jaray,J-Y.andNielsen,T.D.(2006):Anoperationalapproahtorationaldeision
makingbasedonrankdependentutility.EuropeanJournalofOperationalResearh,
underRisk.Eonometria,47,263-291.
8. MClennen,E.F.(1990):RationalityandDynamihoie :FoundationalExplora-
tions,CambridgeUniversityPress,Cambridge.
9. Morin, T.L.(1982):Monotoniityand theprinipleofoptimality.Journalof Ma-
thematialAnalysisandAppliations,86, 665-674.
10. Quiggin,J.(1982):Atheoryofantiipatedutility.JournalofEonomiBehavior
andOrganisation,3(4),323-343.
11. Raia, H. (1968) : Deision Analysis : Introdutory Letures on Choies under
Unertainty,Addison-Wesley.
12. von Neuman, J. and Morgenstern, O. (1947) : Theory of games and eonomi
behaviour.PrinetonUniversityPress, 2ndedition.