• Aucun résultat trouvé

Approche algorithmique de la recherche d’une stratégie RDU-optimale dans un arbre de décision

N/A
N/A
Protected

Academic year: 2022

Partager "Approche algorithmique de la recherche d’une stratégie RDU-optimale dans un arbre de décision"

Copied!
17
0
0

Texte intégral

(1)

HAL Id: hal-01303913

https://hal.archives-ouvertes.fr/hal-01303913

Submitted on 30 Jun 2017

HAL is a multi-disciplinary open access archive for the deposit and dissemination of sci- entific research documents, whether they are pub- lished or not. The documents may come from teaching and research institutions in France or abroad, or from public or private research centers.

L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau recherche, publiés ou non, émanant des établissements d’enseignement et de recherche français ou étrangers, des laboratoires publics ou privés.

Approche algorithmique de la recherche d’une stratégie RDU-optimale dans un arbre de décision

Gildas Jeantet, Olivier Spanjaard

To cite this version:

Gildas Jeantet, Olivier Spanjaard. Approche algorithmique de la recherche d’une stratégie RDU- optimale dans un arbre de décision. 9ème Congrès de la Société Française de Recherche Opéra- tionnelle et d’Aide à la Décision (ROADEF 2008), Feb 2008, Clermont-Ferrand, France. pp.79-94.

�hal-01303913�

(2)

stratégie RDU-optimale dans un arbre de déision

G.Jeantetet O.Spanjaard

LIP6,4plaeJussieu,75252Parisedex05

{gildas.jeantet,olivier.span jaard }lip 6.fr

Résumé Leproblèmedelareherhed'unestratégieEU-optimale(i.e.,

optimaleausensdel'utilitéespérée)dansunarbredéisionhasardseré-

soutentempslinéaireenfontiondunombred'arsparprogrammation

dynamique [11 ℄. Nous nousintéressons ii à unevariante plusdiile

deeproblème,oùl'onreherheunestratégieRDU-optimale(i.e.,opti-

maleausensdel'utilitédépendantdurang).L'utilitédépendantdurang

[10 ℄présenteuneplusgranderihessedesriptivequel'utilitéespéréear

ellepermetuntraitementnonlinéairedesprobabilités. Leproblèmeal-

gorithmiquequis'ensuit dans les arbresdéision hasardest ependant

plusdiilear laprogrammationdynamiquenes'applique plus.Nous

établissonsiiqueleproblèmeestNP-diile.Nousproposonsunalgo-

rithmede séparation etévaluation pourle résoudre, etprésentons des

résultatsnumériquesmontrantl'eaitédenotreapprohe.

Mots-Clefs. Théoriedeladéision;Algorithmique;Utilitédépendant

durang;Arbresdéisionhasard;Complexité;Séparationetévaluation.

1 Introdution

Ilest dessituationsdehoixoùlesonséquenes desationspotentielles ne

peuventêtredéterminées aveertitude. Lorsqueetteinertitudeest probabi-

lisée (autrement dit lorsque la probabilité d'ourrene de haune des onsé-

quenes estonnue),onparlededéision dansle risque.Uneationpotentielle

peut alors être vue omme une distribution de probabilité sur l'ensemble des

onséquenes.L'objetdelathéoriedeladéisiondanslerisqueestentreautres

d'étudier et demodéliserleomportementd'undéideur ensituation de hoix

entredetelles ationspotentielles (pouruneintrodutionaudomaine,voirpar

exemple l'ouvragede Gayant[4℄).Les premiers travauxdans ette optiquere-

montent aumodèle de l'espéraned'utilité (EU) proposé parvonNeumannet

Morgenstern[12℄.Dansemodèle,lesindividusassignentunevaleurnumérique,

nommée utilité, àhaque onséquene.L'évaluation d'unedistribution depro-

babilité se fait ensuite via unalul d'espérane d'utilité. Une distribution de

probabilitéestalorspréféréeàuneautresisonespéraned'utilitéestplusgrande.

Enpratique,l'ensembledesationspotentiellesestsouventdénienompré-

hension. C'est leas enpartiulier dans lesproblèmesde déisionséquentielle,

oùl'on doitprendreuneséquene dedéisionsonditionnellementàdesévéne-

(3)

arbre déision hasard. Il s'agit d'une arboresene omportant trois types de

n÷uds:lesn÷udsde déision (représentéspardesarrés),lesn÷udsde hasard

(représentés pardes erles), et lesn÷uds terminaux (lesfeuilles de l'arbores-

ene). Les branhes issues d'un n÷ud de déisionorrespondent àdiérentes

déisionspossibles,tandisqueellesissuesd'unn÷uddehasardorrespondent

auxdiérentsévénementspossibles,dontononnait lesprobabilités.Enn,les

valeursgurantau niveaudesfeuilles del'arboreseneorrespondentauxuti-

lités des diérentes onséquenes.Remarquons que l'usage veut qu'on omette

les orientations des ars lorsqu'on représente les arbres déision hasard. Nous

illustrons maintenant l'usage de et outil sur un exemple de hoix de ontrat

d'assuranepourunbienimmobilier[3℄.

Exemple 1 Considéronsunontratd'assuraneauquelonpeutdéiderdesous-

rire pour une année

1

et/ou uneannée

2

.Bien évidemment,on ne sait passi l'on seraamenéounon àlefairevaloiràla suited'undommage (ambriolage,

inondation...).Onsupposeiiquelaprise enharged'undommagenonouvert

oûte 2. Par ailleurs, la probabilité de subir undommage durant l'année

2

est

onditionnée aux événements de l'année

1

: elle est de

3 5

l'année 1, mais elle

passeà

1

4

l'année2si ona déjà subiundommage lorsde l'année 1(sinon elle

resteinhangée). Lapremièreannée,on peutsousrire(déision 1)ounon (dé-

ision 0)un ontrat d'assurane ouvrant les dommages dont le oût est de 1.

Ladeuxième année, on peut ou non renouveller e ontrat pour lemême oût.

L'utilitédudéideurestaluléeenfontionduoûttotal

x = 2s + a

,

s

estle

nombrededommagesnonouvertset

a

estlenombredesousriptionsauontrat d'assurane.Onposeiiquelafontiond'utilité

u

est

u(x) = 4 − x

.L'arbredé-

ision hasardorrespondantàeproblème estreprésentésurla gure1.

Ilestimportantderemarquerquedansunarbredéisionhasardbinaireom-

plet(i.e.,omportantdeuxdéisions(resp.événements)possiblesàhaquen÷ud

de déision (resp.hasard) et dont haque niveauest omplètement rempli), le

nombredestratégiespossiblesestexponentieldanslenombreden÷udsdedéi-

sion(rappelonsqu'unestratégieestaratériséeparladonnéedeshoixeetués

auxdiérentsn÷uds dedéision).Plus préisément, sionnote

n

lenombrede

n÷uds de déision, on peut montrer que le nombre de stratégies possibles est

en

Θ(2 n )

(setion3).Ilestependantbienonnuqu'ilexisteunalgorithmeli-

néaire(i.e.,en

O(n)

)permettantdedéterminer,parprogrammationdynamique, une stratégie optimaleau sensdu modèle EU. En eet, une telle stratégie vé-

rie le priniped'optimalité : toute sous-stratégied'une stratégieoptimale est

optimale.L'idée de l'algorithmeonsistedon àproéderparindution arrière

àpartirdes n÷uds terminaux, an dedétermineren haquen÷ud l'espérane

d'utilité d'unesous-stratégieoptimale:

enunn÷uddehasard,l'espéraned'utilitéoptimaleestégaleàl'espérane

desutilitésoptimales desessuesseurs;

enunn÷udde déision,l'espéraned'utilité optimaleest égaleàlaplus

grandedesespéranesd'utilitéoptimales desessuesseurs.

(4)

D 1

H 1

0

D 2

2/5

H 3

0

b u(0) = 4

2/5

b u(2) = 2

3/5

H 4

1

b u(1) = 3

2/5

b u(1) = 3

3/5

D 3

3/5

H 5

0

b u(2) = 2

3/4

b u(4) = 0

1/4

H 6

1

b u(3) = 1

3/4

b u(3) = 1

1/4

H 2

1

D 4

2/5

H 7

0

b u(1) = 3

2/5

b u(3) = 1

3/5

H 8

1

b u(2) = 2

2/5

b u(2) = 2

3/5

D 5

3/5

H 9

0

b u(1) = 3

3/4

b u(3) = 1

1/4

H 10

1

b u(2) = 2

3/4

b u(2) = 2

1/4

Fig.1.Exempled'arbredéisionhasard.

Exemple 2 Dans l'exemple préédent du ontrat d'assurane, l'algorithme re-

montelavaleur

max( 14 5 , 3) = 3

en

D 2

,

3

2

en

D 3

,

2

en

D 4

(enprenantladéision

1) et

10

4

en

D 5

(en prenant la déision 0). Par onséquent, l'espérane en

H 1

vaut

3 × 2 5 + 3 2 × 3 5 = 21 10

eten

H 2

ellevaut

23

10

.Lastratégieoptimale ausensde

EU onsistedon àsousrire auontratla première annéeetàne sousrireau

ontratlaseondeannéequesil'onn'apassubidedommagelorsdelapremière.

La simpliité d'utilisation du modèle EU, ainsi que son attrait sur le plan

normatif, lui ontpermis de régner sans partage es soixante dernières années.

Pourtant,lesmises endéfaut répétéesdumodèlesur leplan desriptifontni

par éroder sa position. En partiulier, de nombreuses expérienes mettent en

évidenequelesindividus sous-évaluentlesfortesprobabilitésetsurévaluentles

faiblesprobabilités[1,7℄.Deefait,biensouvent,lemodèleEUn'estpasàmême

de rendre ompte duomportement déisionnel observé. Fae àe onstat,de

nouveauxmodèlesontétédéveloppés:ertainssefondentsurunereprésentation

alternativedel'inertitudeommel'oreparexemplelathéoriedespossibilités

[2℄,d'autresprennentenompte expliitement lapereptiondéforméedespro-

babilitésparledéideur.Dansette dernièredémarhe,Quiggin[10℄aproposé

le modèleRank Dependent Utility (RDU), qui permet de rendre ompte d'un

plus largeéventailde omportementsdéisionnels. Cependant,la non-linéarité

du ritère RDU (i.e., RDU

(λX + Y ) 6= λ

RDU

(X ) +

RDU

(Y )

) invalide toute

(5)

unréelproblèmealgorithmiqueauvudunombreombinatoiredestratégiespos-

sibles,qui rendimpratiableleurénumérationomplète.

Leproposdeepapierestpréisémentd'étudierleproblèmeonsistantàdé-

terminerlastratégieoptimaledansunarbredéisionhasardausensdeRDUet

deproposeruneméthodeparénumérationimpliitepourlerésoudre.Lepapier

estorganiséommesuit.Dansunpremiertempsnousformalisonslaprobléma-

tiqueetrappellonslesbasesdumodèleRDU.Nousmettonsensuiteenévidene

l'impossibilitédeproéderparprogrammationdynamiquepourrésoudreepro-

blèmeetnousprouvonsqueedernierestNP-diile(setion3.3).Nousexpo-

sonsalorsunalgorithmederésolutionparénumérationimpliite, fondésurune

borne alulable en temps quadratique, et nous terminons enn en présentant

lesrésultatsd'expérimentationsnumériques(setion4).

2 Formalisation du problème

2.1 Notationset Dénitions

Dans unarbre déisionhasard

T = (N , E)

ayantpourraine unn÷ud de

déision

N r

, nous notons

N D ⊂ N

(resp.

N H ⊂ N

)l'ensemble desn÷uds de

déision(resp.hasard).De plus,nousnotons

C ⊂ N

l'ensembledesn÷uds ter-

minaux. Le grapheest valuéomme suit : àtout ar

E = (H, N ) ∈ E

telque

H ∈ N H

, on assoie laprobabilité

p(E)

de l'événement orrespondant;à tout

n÷udterminal

C ∈ C

, onassoie sonutilité notée

u(C)

. Parailleurs, nousap-

pelons

past(N )

le passé de

N ∈ N

, i.e. l'ensemble des arsle longdu hemin

allant de

N r

à

N

dans

T

. Enn, nous notons

S (N )

l'ensemble dessuesseurs

de

N

dans

T

,et

T (N)

lesous-arbrede

T

deraine

N

.

Soit

T

un arbredéisionhasardet

N ⊆ N

un ensemble den÷uds onte-

nant:

laraine

N r

de

T

,

unet unseulsuesseurpourhaquen÷uddedéision

N ∈ N D = N D ∩ N

,

touslessuesseurspourhaquen÷uddehasard

N ∈ N H = N H ∩ N

.

L'ensembled'ars

∆ = {(N, N ) : N ∈ N D , N ∈ N } ⊆ E

dénit unestratégie

de

T

dès lorsque lesous-grapheinduit par

N

est un arbre.Etant donnéun

n÷uddedéision

N

,larestritiond'unestratégiede

T

ausous-arbre

T (N )

,qui

n'estautrequ'unestratégiede

T (N )

,estappelléesous-stratégie.Nousnotons

D

l'ensembledesstratégies.

Soit

S = {u 1 , . . . , u k }

un ensemble ni d'utilités. On appelle loterie une distributiondeprobabilité

P

sur

S

.Onnote

L = (p 1 , u 1 ; . . . ; p k , u k )

laloteriequi

aboutitàuneutilité

u i

aveuneprobabilité

p i = P({u i })

.And'allégerertaines

notations,onpeutonsidérerlaloterie

L

ommeunefontionde

S 7→ [0, 1]

telle

(6)

que

L(u i ) = p i

.Dans unarbredéisionhasard,àtoutestratégieil est possible

d'assoier une loterie.En eet, onpeut déterminerlaprobabilité

p C

d'obtenir

uneonséquene

C ∈ C

enalulant:

p C = Q

(H,N ) ∈past(C) p((H, N ))

H ∈ N H

Lavaleurd'unestratégieselonEU(resp.RDU)estégaleàlavaleurdelaloterie

orrespondanteselonEU (resp.RDU).

Exemple 3 Dans l'exemple du ontrat d'assurane, la stratégie EU-optimale

orrespondàlaloterie

( 20 3 , 1; 20 8 , 2; 20 9 , 3)

dontl'espérane estbien

46 20 = 23 10

.

2.2 Rappelssur RDU

Lemodèle RDU reposesur deuxparamètres: une fontiond'utilité qui est

déjàprésentedanslemodèleEU,etunefontion

ϕ

dedéformationdesprobabi- lités.Ils'agit d'unefontionstritementroissantesur

[0, 1]

telle que

ϕ(0) = 0

et

ϕ(1) = 1

. Cettedéformationdesprobabilitésporte, nonsurdesprobabilités simples,maissurdesumulsdeprobabilités.Pourrappel,étantdonnéeunelo-

terie

L = (p 1 , u 1 ; . . . ; p k , u k )

,onappellefontion déumulative de

L

lafontion

G L : S 7→ [0, 1]

qui assoie àhaqueutilité

u i

la probabilité d'avoirau moins etteutilité.Plusformellement,

G L (x) = P

i:u i ≥x p i

.LavaleurselonRDUd'une

loterie

L

estalorsdéniedelamanièresuivante :

RDU(L) = u (1) + P k

i=2 [u (i) − u (i − 1) ]ϕ(G L (u (i) ))

où (.)orrespondà une permutation de

{1, . . . , k}

telle que

u (1) ≤ . . . ≤ u (k)

.

Ce ritère peut être interprété omme suit : on est sûr d'obtenir au moins

une utilité de

u (1)

, puis on est suseptible d'obtenir un supplément d'utilité

de

u (2) − u (1)

ave une massede probabilité

ϕ(G L (u (2) ))

, puis un supplément

d'utilité de

u (3) − u (2)

ave une massede probabilité

ϕ(G L (u (3) ))

, et ainsi de

suite...

Exemple 4 ConsidéronslastratégieEU-optimaledel'exemple2.Laloterieor-

respondante est

L = ( 20 3 , 1; 20 8 , 2; 20 9 , 3)

.Sa valeur RDU se aluleomme suit:

RDU(L) = 1 + ϕ( 17 20 ) × (2 − 1) + ϕ( 20 9 ) × (3 − 2)

. Supposons que

ϕ(p) = 0.25

pour

0 < p ≤ 0.5

,et

ϕ(p) = 0.75

pour

0.5 < p < 1

.Onobtientalors

RDU(L) = 1 + 0.75 × 1 + 0.25 × 1 = 2

.

L'intérêtdedéformerdesumulsdeprobabilités,etnondiretementlespro-

babilitéselles-mêmes(omme'estparexempleleasdanslemodèledeHanda

[5℄), est d'obtenir un ritère de hoix ompatible ave la dominane stohas-

tique. On dit qu'une loterie

L = (p 1 , u 1 ; . . . ; p k , u k )

domine stohastiquement une loterie

L = (p 1 , u 1 ; . . . ; p k , u k )

si

∀x ∈ R, G L (x) ≥ G L (x)

, autrementdit,

pourtout

x ∈ R

,laprobabilitéd'obteniruneutilitéd'aumoins

x

avelaloterie

L

est aumoins aussi grandequ'ave laloterie

L

. Laompatibilité ave lado-

minane stohastiquesignieque

RDU (L) ≥ RDU (L )

dèslorsque

L

domine

stohastiquement

L

[10℄.Cettepropriétéestbien entendusouhaitablepourdé- rire un omportement rationnel, et elle est bien vériée par le modèle RDU

(7)

3.1 Espae des solutions

Considéronsunarbredéisionhasardbinaireomplet

T

deprofondeur

2p

tel

quelesn÷udsdeprofondeurpairesoientdesn÷udsdedéision(oudesn÷uds

terminaux) et les n÷uds de profondeur impaire soient des n÷uds de hasard.

Nousnousintéressonsiiàomptabiliser lenombredestratégiespossibles(au-

trement dit de solutions réalisables) en fontion de la taille de l'instane. On

dénit omme taille de l'instanele nombre de n÷uds de déision.Ce nombre

est eneetdumême ordredegrandeurquelenombreden÷udsde

T

.Remar-

quons qu'ily a1n÷udde déisionpourlaprofondeur

0

,

4

n÷uds dedéision

pourlaprofondeur

2

,

16

pourlaprofondeur

4

... Le nombretotalde n÷uds de

déision dans

T

est don égal àla sommedes termes d'une suite géométrique de raison 4:

n = |N D | = P p−1

i=0 4 i = 4 4−1 p 1

. Exprimonsmaintenant le nombre

destratégiesenfontionde laprofondeur.Pourela,onproède parindution

arrièresur

T

, enremontantlenombredestratégiesjusqu'àlaraine.Onom-

meneparétiqueterà

2

lesn÷uds dedéisionquinepossèdentauun n÷udde

déisiondansleurdesendane. Onappliqueensuitelesrelationsde réurrene

suivantes:lenombredestratégiesàpartird'unn÷uddehasarddonnéestégal

auproduit dunombredestratégiesàpartirdesessuesseurs,etlenombrede

stratégiesàpartird'unn÷uddedéisiondonnéestégalàlasommedunombre

de stratégiesàpartir de sessuesseurs.Ainsi, lenombre totalde stratégiesà

partird'unn÷uddedéision

N D

peutsealuleràl'aidedelasuiteréurrente

(u k )

suivante :

u 0 = 2

,

u k = 2u 2 k 1

,

k

indique le nombre de n÷uds de dé-

ision(

N D

exlu)sur unheminquelonquede

N D

versunn÷udterminal.Le

terme généralde ette suite est

2 (2 k+1 −1)

. On peut vérier failementqu'on a

k = p − 1

àlaraine.Paronséquent,lenombretotaldestratégiesdans

T

est

|D| = u p − 1 = 2 (2 p 1) ∈ Θ(2 n )

(puisque

n = (4 p − 1)/3

).Ainsi,le nombrede

stratégies potentielles étant exponentiel de la taille de l'instane, il est nées-

sairededévelopperunalgorithmed'optimisationombinatoirepourdéterminer

la stratégieoptimale.Nous montrons i-dessous que latâheest d'autantplus

déliatequelaprogrammationdynamiquenes'appliquepluslorsqu'onoptimise

selonRDU.

3.2 Monotonie etindépendane

Ilestbienonnuquelaprogrammationdynamiquereposesurlerespetd'une

ondition de monotonie [9℄ sur la fontion de valuation. Dans notre ontexte,

etteonditionpeutseformulerommesuitsur lafontiondevaluation

V

des

loteries:

∀α ∈ [0, 1], V (L) ≥ V (L ) = ⇒ V (αL + (1 − α)L ′′ ) ≥ V (αL + (1 − α)L ′′ )

L, L , L ′′

sontdesloteriesquelonqueset

αL + (1 − α)L ′′

estlaloteriedénie

par

(αL + (1 − α)L ′′ )(x) = αL(x) + (1 − α)L ′′ (x)

.Cetteonditionalgorithmique peutêtreinterprétée,dansleadredelathéoriedeladéision,ommeuneforme

(8)

deuxloteries

L

et

L

aveunetroisième

L ′′

n'inversepasl'ordredespréférenes

(induit par

V

) : si

L

est stritement préférée à

L

, alors

αL + (1 − α)L ′′

est

stritementpréféréeà

αL + (1 − α)L ′′

.Pour

V ≡ EU

lapropriétédemonotonie

estvériée.Parontre,pour

V ≡ RDU

,lapropriétén'estplusvalide,ommele

montrel'exemplesuivant.

Exemple 5 Soient trois loteries

L = (0.5, 1; 0.5, 10)

,

L = (1, 5)

et

L ′′ = L

.

SupposonsquelespréférenesdudéideursuiventlemodèleRDUavelafontion

ϕ

suivante :

ϕ(0) = 0

,

ϕ(p) = 0.45

si

0 < p ≤ 0.7, ϕ(p) = 1

si

p > 0.7

. Les

valeursselon

RDU

de

L

et

L

sont:

RDU(L) = 1 + (10 − 1)ϕ(0.5) = 5.05 RDU(L ) = 5

Ainsi, ona

RDU(L) ≥ RDU (L )

.D'après la propriétéde monotonie pour

α = 0.6

,ondevraitdonavoir

RDU(0.6L+0.4L ′′ ) ≥ RDU(0.6L +0.4L ′′ )

.Pourtant,

on a:

RDU(0.6L + 0.4L ′′ ) = 1 + (10 − 1)ϕ(0.5) = 5.05

RDU(0.6L + 0.4L ′′ ) = 1 + (5 − 1)ϕ(0.6 + 0.2) + (10 − 5)ϕ(0.2) = 7.25

etdon

RDU(0.6L+0.4L ′′ ) < RDU (0.6L +0.4L ′′ )

.Paronséquent,lapropriété

de monotonie n'estpasvériée.

Depar laviolationduprinipedemonotonie, la miseen ÷uvre d'unepro-

éduredeprogrammationdynamiquepour

RDU

dansunarbredéisionhasard

peut onduire à une stratégie sous-optimale. Une telle proédure peut même

onduireàunestratégiestohastiquementdominée.Eneet,onsidéronsl'arbre

dedéisiondelagure2,onstruitàl'aidedel'exemple5.Dansetarbredéi-

sionhasard,lesvaleurs

RDU

desdiérentesstratégiespossiblesàlarainesont:

RDU({(D 1 , H 2 )}) = 1 + (5 − 1)ϕ(0.6 + 0.2) + (8 − 5)ϕ(0.2) = 6.35

RDU({(D 1 , H 1 ), (D 2 , H 3 ), (D 3 , H 4 )}) = 1 + (10 − 1)ϕ(0.5) = 5.05 RDU({(D 1 , H 1 ), (D 2 , δ 1 ), (D 3 , δ 2 )}) = 5

RDU({(D 1 , H 1 ), (D 2 , δ 1 ), (D 3 , H 4 )}) = 7.25 RDU({(D 1 , H 1 ), (D 2 , H 3 ), (D 3 , δ 2 )}) = 5.05

Ainsi,lastratégieoptimaleàlaraine est

{(D 1 , H 1 ), (D 2 , δ 1 ), (D 3 , H 4 )}

. Pour-

tant,enproédantparprogrammationdynamique,onobtienten

D 2

:

RDU({(D 2 , H 3 )}) = 1 + (10 − 1)ϕ(0.5) = 5.05

et

RDU({(D 2 , δ 1 )}) = 5

. C'est don la

sous-stratégie

{(D 2 , H 3 )}

qui est retenue en

D 2

, et de même la sous-stratégie

{(D 3 , H 4 )}

quiestretenueen

D 3

.Parsuite,en

D 1

,'estlastratégie

{(D 1 , H 2 )}

(6.35ontre5.05pour

{(D 1 , H 2 )}

),dominéestohastiquementpar

{(D 1 , H 1 ), (D 2 , δ 1 ), (D 3 , H 4 )})

,quiestretournée.

Un déideur utilisant le ritère RDU doit don faire du hoix résolu [8℄,

'est-à-dire qu'il doit hoisir une stratégie à la raine de l'arbre et s'y tenir

(faute de quoi il pourrait se retrouver omme i-dessus à suivre une stratégie

stohastiquementdominée).Nous nousintéressonsii àdéterminer unestraté-

gieRDU-optimalevuedelaraine(puisànepasendévier).Remarquonsqu'un

telproédénousassuredenepasrenontrerdesous-stratégiestohastiquement

(9)

D 1

H 1

D 2

0.6

H 3

b 10

0.5

b 1

0.5 b 5(δ 1 )

D 3

0.4

H 4

b 10

0.5

b 1

0.5 b 5(δ 2 )

H 2

b 1

0.2

b 5

0.6 b 8

0.2

Fig.2.RDUnevériepaslapropriétédemonotonie.

selonRDU.D'autresapprohesdehoixrésoluontétéenvisagéespourdétermi-

ner une stratégieraisonnable àl'aide duritèreRDU. Onpeut mentionneren

partiulierlestravauxdeJarayetNielsen[6℄,dontladémarhedièredeelle

duprésentpapier.En eet, ils onsidèrenthaquen÷udde déisiondel'arbre

déisionhasardommeétantunegodudéideur,etvisentàdéterminerunestra-

tégieréalisantunompromisentrees diérentsegos,en s'assurantquetoutes

les sous-stratégies sont prohes de l'optimum pour RDU et stohastiquement

non-dominées.

3.3 Complexité du problème

Nousprouvonsmaintenantqueleproblèmeonsistantàdéterminerunestra-

tégie RDU-optimale est NP-diile, si onpose que lataille d'uneinstane du

problèmeorrespondaunombreden÷uds dedéisionimpliqués.

Proposition1 La reherhe d'une stratégie RDU-optimale (problème RDU-

OPT)dansunarbre déision hasardest unproblème NP-diile.

Démonstration.Ons'appuiesurunerédutionpolynomialeduproblème3-SAT

versleproblèmeRDU-OPT.Leproblème3-SATseformuleommesuit:

INSTANCE:unensemble

X

devariablesbooléennes,uneolletion

C

delauses

sur

X

telleque

|c| = 3

pourtoutelause

c ∈ C

.

QUESTION : Existe-t-il une instaniation des variables booléennes de

X

qui

satisfaitsimultanémenttoutesleslausesde

C

?

Soient

X = {x 1 , . . . , x n }

et

C = {c 1 , . . . , c m }

.Laonstrutionpolynomialed'un arbre déision hasard à partir d'une instane du problème 3-SAT se réalise

ommesuit. Ondénitunn÷uddedéisionpourhaquevariable de

X

. Etant

donnée

x i

une variable de

X

, le n÷ud de déision assoié dans l'arbre déi-

sionhasard,notéégalement

x i

,adeuxls:lepremier(n÷uddehasardnoté

V i

)

orrespondàl'instaniationvraide

x i

,etleseond(n÷uddehasardnoté

F i

)or-

respond àl'instaniationfaux de

x i

. Soient

{c i 1 , . . . , c i j } ⊆ C

le sous-ensemble

(10)

de lauses dans lesquelles gurent le littéral positif

x i

, et

{c i

1 , . . . , c i k } ⊆ C

le sous-ensemble de lauses dans lesquelles gurent le littéral négatif

x ¯ i

. Pour

haquelause

c i h

(

1 ≤ h ≤ j

) onréeommelsde

V i

unn÷udterminalnoté

c i h

, orrespondantà la lause

c i h

. On rée en outre un ls supplémentaire de

V i

noté

c 0

, orrespondant à une onséquene

c 0

tive. De même, on rée un

ls de

F i

pour haque lause

c i h

(

1 ≤ h ≤ k

), ainsi qu'un ls supplémentaire orrespondantàlaonséquene

c 0

tive.Len÷ud

V i

omportedon

j + 1

ls,

tandis quele n÷ud

F i

omporte

k + 1

ls. Ande onstituerun uniquearbre

déision hasard, on ajoute un n÷ud de hasard

H

père de tous les n÷uds de

déision

x i

(

1 ≤ i ≤ n

). Enn, on rajoute un n÷ud de déision à la raine,

ayant

H

omme unique ls. L'arbre déision hasard ainsi onstruit omporte

n + 1

n÷uds dedéision,

2n + 1

n÷uds dehasardet auplus

2n(m + 1)

n÷uds

terminaux. Sa taille est donen

O(nm)

, e qui garantitbien la polynomialité de latransformation. A titre d'illustration, surla partie gauhede lagure3,

nousdonnonsl'arbredéisionhasardobtenupourl'instanesuivantede3-SAT:

(x 1 ∨ x 2 ∨ x 3 ) ∧ (x 1 ∨ x 3 ∨ x 4 ) ∧ (x 2 ∨ x 3 ∨ x 4 )

.

Remarquonsqu'onpeutétablirunebijetionentrel'ensembledesstratégiesdans

l'arbredéisionhasardetl'ensembledesinstaniationsdansleproblème3-SAT

dedépart.Il sut poure fairede poser

x i = 1

dansle problème3-SATsiet

seulementsil'ar

(x i , V i )

guredanslastratégie,et

x i = 0

sietseulementsi'est

l'ar

(x i , F i )

quiguredanslastratégie.Uneinstaniationsatisfaisante(i.e.,qui satisfaitsimultanémenttoutesleslauses)dans3-SATorrespondàunestraté-

gieoùtoutelause

c i

(

1 ≤ i ≤ m

)gureommeonséquenepossible(ellegure

dondeuneàtroisfois).Pourompléterlarédution,ils'agitdonmaintenant

dedénird'unepartlesprobabilitésassignéesauxarsissusdesn÷uds

H

,

V i

et

F i

,etd'autrepartlesutilitésdesonséquenesetlafontion

ϕ

.Larédutionva

onsisteràlesdénirdefaçonàequeseuleslesstratégiesorrespondantàdes

instaniations satisfaisantes maximisent RDU.Plus préisément, nousvisonsà

eque:

(i)

la valeur RDU d'une stratégie ne dépende que de l'ensemble (et non du

multi-ensemble) de ses onséquenes possibles (autrement dit l'ensemble des

lausessatisfaitesparl'instaniation orrespondante),

(ii)

lavaleurRDU d'unestratégieorrespondantàuneinstaniationsatisfai- santevailleexatement

m

,

(iii)

siunestratégieestsuseptibledeonduireàunensembledeonséquenes

possiblesquieststritementinlusdansl'ensembledesonséquenesd'uneautre

stratégie,lavaleurRDU deettedernièresoit stritementsupérieure.

Pourefaire,aprèsavoiraetélaprobabilité

1

n

auxarsissusde

H

,ondénit

lesautresprobabilitéset lesutilitésdelafaçonsuivante(

i 6= 0

):

( p i = ( 10 1 ) i

u(c i ) = P i

j=1 10 j−1

p i

désignelaprobabilitédetoutaronduisantàlaonséquene

c i

.Pourles

arsdetype

(V j , c 0 )

(resp.

(F j , c 0 )

),onpose

u(c 0 ) = 0

etonaetelaprobabilité

(11)

D L

x 1

1 4

V 1

b c 0 = 0

0.9

b c 1 = 1

0.1

F 1

b c 0 = 0

0.99

b c 2 = 11

0.01

x 2

1 4

V 2

b c 0 = 0

0.9

b c 1 = 1

0.1

F 2

b c 0 = 0

0.999

b c 3 = 111

0.001

x 3

1 4

V 3

b c 0 = 0

0.89

b c 1 = 1

0.1 b c 2 = 11

0.01

F 3

b c 0 = 0

0.999

b c 3 = 111

0.001

x 4

1 4

V 4

b c 0 = 0

0.99

b c 2 = 11

0.01

F 4

b c 0 = 0

0.999

b c 3 = 111

0.001

ϕ(p) = 8

> >

> <

> >

> :

0,

si

p ∈ [0; 4×1000 1 [

1

100 ,

si

p ∈ [ 4×1000 1 ; 4×100 1 [

1

10 ,

si

p ∈ [ 4×100 1 ; 4×10 1 [ 1,

si

p ∈ [ 4×10 1 ; 1[

Fig.3.Exemplederédution

qui omplémente à 1l'ensemble desprobabilités aetéesauxars issus de

V j

(resp.

F j

).Notonsqueettedernièreprobabilitéest bienpositivearlasomme des

p i

eststritementinférieureà1.Enn,lafontion

ϕ

estdénieommesuit1:

ϕ(p) =

 

 

0

si

p ∈ [0; p n m [

p i

si

p ∈ [ p i+1 n ; p n i [

pour

i < m 1

si

p ∈ [ p n 1 ; 1[

Atitred'illustration,surlapartiedroitedelagure3,nousindiquonslafontion

ϕ

obtenuepourl'instanede3-SATindiquée plushaut.

Danslasuite,ononsidèreunestratégiequelonque

,induisantuneloterie

notée

L

,etonnote

I ⊆ {0, . . . , m}

l'ensembledesindiesdesonséquenespos-

sible de

. Remarquonsque laonséquene

c 0

est toujoursprésente dans une

stratégie

.Onappelle

α i ∈ {1, 2, 3}

lenombred'ourrenesdelaonséquene

c i

dans

.Parabusdenotation,nousonfondonsi-dessous

c i

et

u(c i )

.

Preuve de

(i)

.La valeur RDU d'une stratégie

quelonque vaut

RDU(L) = c 0 ×ϕ(1)+ P

i∈I (c i −c prec I (i) )ϕ P j∈I

j≥i α j p j

n

,où

prec I (i) = max{j ∈ I : j < i}

.

Montronsque

∀i ∈ I, ϕ P j∈I

j≥i α j p j

n

= ϕ P j∈I

j≥i

p j

n

.

1

Remarquons qu'entouterigueurette fontion

ϕ

est roissanteseulement ausens

large,maisleleteurpourraseonvainrefailementqu'onpeutl'adapterlégèrement

(12)

Parroissanede

ϕ

,ona

ϕ P j∈I

j≥i

p j

n

≤ ϕ P j∈I

j≥i α j p j

n

≤ ϕ P j∈I

j≥i 3 p n j

.

Onadon

ϕ P j∈I

j≥i

1 n

1 10

j

≤ ϕ P j∈I

j≥i α j p j

n

≤ ϕ P j∈I

j≥i

3 n

1 10

j

.

Comme

ϕ( P

j∈I j≥i

1

n ( 10 1 ) j ) = ϕ( P

j∈I j≥i

3

n ( 10 1 ) j ) = p i− 1

, on a par enadrement

ϕ( P

j∈I j≥i α j p j

n ) = ϕ( P

j∈I j≥i

p j

n )

.Or

c 0 ×ϕ(1) = 0

.Ononlutdonque

RDU(L) = P

i ∈ I (c i − c prec I (i) )ϕ( P

j∈I j≥i

p j

n )

.

Preuvede

(ii)

.Considéronsunestratégie

orrespondantàuneinstaniation satisfaisante,etlaloterieinduite

L

touteslesonséquenes

c i

de

C

sontpos-

sibles.D'après

(i)

,ona

RDU(L ) = P m

i=1 (c i − c i− 1 )ϕ( P m j=i

p j

n )

. Onremarque

quepourtout

i ≤ m

,

(c i −c i−1 )ϕ( P m j=i

p j

n ) = 10 i 1 ×p i−1 = 10 i 1 ×( 10 1 ) i 1 = 1

.

Paronséquent,

RDU(L ) = m

.

Preuvede

(iii)

.Soient

(resp.

)une stratégiequelonquedeloterieinduite

L

(resp.

L

)et

I ⊆ {0, . . . , m}

(resp.

J = I ∪ {k}

)l'ensembledesindiesde ses

onséquenespossibles.On suppose iique

k < max I

, leas

k = max I

étant

évident.Pardénition,

{i ∈ I : i 6= k} = {i ∈ J : i 6= k}

.Onpeutdonérirela

valeurRDUde

ommeunesommesdetroistermes:

RDU(L) = P

i∈J

i≤k−1 (c i − c prec J (i) )ϕ P j∈I

j≥i

p j

n

+ (c k − c prec J (k) )ϕ P j∈I

j≥k

p j

n

+

P i∈J

i≥k+1 (c i − c prec J (i) )ϕ P j∈J

j≥i

p j

n

Delamêmemanière,lavaleurRDU delastratégie

s'éritégalementomme

unesommedetroistermes :

RDU(L ) = P

i∈J

i≤k−1 (c i − c prec J (i) )ϕ P

j∈J j≥i

p j

n

+ (c k −c prec J (k) )ϕ P

j∈J j≥k

p j

n

+

P i∈J

i≥k+1 (c i − c prec J (i) )ϕ P j∈J

j≥i

p j

n

Par roissane de

ϕ

, on a

I ⊆ J ⇒ ∀i ≤ k − 1, ϕ( P

j∈I j≥i

p j

n ) ≤ ϕ( P

j∈J j≥i

p j

n )

.

Ainsi le premier terme de

RDU (L)

est inférieur ou égal au premier terme de

RDU(L )

.Onvériefailementque

ϕ( P

j∈I j≥k

p j

n ) = p succ I (k) − 1

et

ϕ( P

j∈J j≥k

p j

n ) = p prec J (k) = p k−1

,

succ I (i) = min{j ∈ I : j > i}

. Or

p succ I (k) − 1 < p k−1

ar

succ I (k) − 1 > k − 1

.Donleseond termede

RDU(L)

est stritementin-

férieur au seond terme de

RDU(L )

. Enn, le troisième terme de

RDU(L)

est bien évidemment égal au troisième terme de

RDU(L )

. Par onséquent

RDU(L) < RDU (L )

.

On onlut de

(i)

,

(ii)

et

(iii)

que toute stratégie orrespondantà une instan- iationnon-satisfaisanteprésenteunevaleurRDUstritementinférieureà

m

,et

quetoutestratégieorrespondantàune instaniationsatisfaisanteprésenteune

valeurRDU exatementégaleà

m

.Trouveruneinstaniationsatisfaisantedans 3-SATrevientdonàtrouverunestratégievalant

m

dansRDU-OPT.

Dans lasetion suivante,nous dérivonsun algorithmepour déterminerla

stratégie optimaledepuis laraine au sens de RDU.Nous proédons par énu-

mération impliitepuisqueniuneénumérationexhaustivedesstratégiesni une

(13)

4.1 Algorithmed'énumérationimpliite

Nous présentons ii une méthode par séparation et évaluation pour déter-

miner lastratégieoptimaleausensde RDU dansunarbre déisionhasard.Le

prinipedeséparationonsisteàpartitionnerl'ensembledesstratégiespossibles

en fontion du hoix d'une arête

(N, N )

donnée en un n÷ud de déision

N

.

Plus formellement, lesn÷uds de l'arbrede reherhesont aratériséspar une

stratégie partielle, qui dénit un sous-ensemble de stratégies. Soit

T

un arbre

déisionhasardet

N Γ

unensembleden÷uds ontenant:

laraine

N r

de

T

,

unet unseulsuesseurpourhaquen÷uddedéision

N ∈ N D Γ = N D ∩ N Γ

.

L'ensembledesarsorientés

Γ = {(N, N ) : N ∈ N D Γ , N ∈ N Γ } ⊆ E

dénitune

stratégiepartielle de

T

dèslorsquelesous-grapheinduitpar

N Γ

est unarbre.

Unestratégie

estditeompatible aveune stratégiepartielle

Γ

si

Γ ⊆ ∆

.Le

sous-ensemble destratégiesaratérisé parune stratégiepartielle orrespondà

l'ensembledes stratégiesompatibles.Toutestratégiepartielle n'estependant

passuseptibled'êtreenvisagéedansl'arbredereherhe.Eneet,lesstratégies

partiellesrenontréesdansl'arbredereherherespeteunordredeprioritésur

lesn÷udsdedéisionséletionnésdans

N Γ

(and'éviterlesdoublons):sideux

n÷uds de déisionsontsuseptiblesde prolongerune mêmestratégie partielle,

eluidepluspetitrangseraprioritairesurl'autrepourentrerdans

N Γ

.Lerang

d'unn÷udestdonnéparunefontion

rg : N D 7→ {1, 2, . . . , |N D |}

telle que:

 

 

rg(N r ) = 1

|past(N )| > |past(N )| ⇒ rg(N ) > rg(N )

|past(N )| = |past(N )|

et

EU (T (N )) > EU(T (N )) ⇒ rg(N ) < rg(N )

EU (T (N ))

orrespondàlavaleuroptimaledeEU dans

T (N )

.

Exemple 6 Pour l'arbre déision hasard de la gure 1, il existe une unique

fontion

rg

possibledéniepar :

rg(D 1 ) = 1, rg(D 2 ) = 2, rg(D 3 ) = 4, rg(D 4 ) = 3, rg(D 5 ) = 5

.

L'algorithme 1 dérit la proédure d'énumération impliite que nous pro-

posons. Il prend en argumentune stratégiepartielle

Γ

et unréel

RDU opt

qui

orrespond à lavaleur RDU de lameilleure stratégie trouvée jusqu'alors dans

l'exploration.Cettedernièreesteetuéeenprofondeurd'abord.L'ensemble

N 1

désignelesn÷uds dedéisionandidats pourprolongerlastratégiepartielle

Γ

.

Parmi eux-i,le n÷uddont lavaleur dela fontion

rg

est minimaleest noté

N min

. L'ensemble

E min

de ses arêtesinidentes dénit les diérents prolonge-

mentsde

Γ

envisagés(autrementdit, lesls dun÷udassoié à

Γ

dansl'arbre

dereherhe).Pourtoutestratégiepartielle

Γ

(autrementdit,enhaquen÷ud

del'arbredereherhe),ondisposed'unefontiond'évaluation

ev

représentant unebornesupérieuredelavaleurRDU detoutestratégieompatibleave

Γ

.

(14)

Algorithme 1:BB

(Γ, RDU opt )

N 1 ← {N 1 ∈ N D : ∀(N, H) ∈ N D × N H , ((N, H) ∈ past(N 1 ) ⇒ (N, H ) ∈ Γ )};

N min ← arg min N∈N 1 rg(N);

E min ← {(N min , H) ∈ E : H ∈ S(N min )};

pourhaque

(N, H ) ∈ E min

faire

si

ev(Γ ∪ {(N, H )}) > RDU opt

alors

RDU temp ←

BB

(Γ ∪ {(N, H )}, RDU opt );

si

RDU temp > RDU opt

alors

RDU opt ← RDU temp ;

n

n

n

retourner

RDU opt

Bienque ela nesoit paspréisé dans l'algorithme, remarquonsqu'en pra-

tiquenousutilisonsl'heuristiqueonsistantàdévelopperenprioritélelsdontla

valeurdelafontiond'évaluationestlaplusélevée.Nousdétaillonsmaintenant

lesprinipalesaratéristiquesdenotrealgorithme.

Initialisation.Uneméthodeparséparationet évaluationest notoirementplus

eae quand une bonne solution est onnue avant de démarrer la reherhe.

Dansnotreméthode,labornesupérieure(

RDU opt

)estinitialiséeavelavaleur RDUdelastratégieobtenueparprogrammationdynamiqueselonleritèreEU.

En eet, on peut penser que la stratégie ainsi obtenue sera de bonne qualité,

et permettradond'éviteruneexplorationtropapprofondiedesous-espaesne

omportantpasdebonnessolutions.

Fontion d'évaluation. L'évaluation d'un ensemble de stratégies induit par

une stratégiepartielle

Γ

sefait àl'aided'unefontion

ev

.Le prinipedeette

évaluationestdedéterminerune loteriequidominestohastiquementtoutesles

loteriesassoiéesauxstratégiesompatiblesave

Γ

,etd'évalueretteloteriese-

lonleritèreRDU.Ons'assureainsiqueette évaluation estbien unmajorant

puisqueleritèreRDUrespeteladominanestohastique,'est-à-direquesiune

loterie

L

domine stohastiquementune loterie

L

, alors

RDU(L) ≥ RDU(L )

.

Pour déterminer une telle loterie, on proède par programmation dynamique

surl'arbredéisionhasard.L'initialisationdelaproéduresefaitauniveaudes

n÷uds terminaux: àtoutn÷udterminal

C ∈ C

est aetélaloterie

(1, u(C))

.

Ensuite, enhaquen÷ud

N ∈ N

,onremonte uneloteriequidominestohasti-

quementtouteslesloteriesdusous-arbre

T (N )

.Plus préisément,en unn÷ud de hasard

H

, on alule la loterie

L H

induite par les loteries de sesls de la

manièresuivante:

∀u, L H (u) = P

N∈S(H) p((H, N )) × L N (u)

L N

orrespond à la loterie remontée au n÷ud

N

. Par ailleurs, en haque

n÷uddedéision

D

,onappliquelarelationderéurrenesuivanteexpriméesur

lesfontionsdéumulatives 2

(poursimplierl'ériture):

2

Notonsqu'onpeutmanipulerindiéremmentuneloterieousafontiondéumulative,

(15)

∀u, G L D (u) = G L N (u)

si

∃N ∈ S (D) : (D, N ) ∈ Γ

∀u, G L D (u) = max N ∈S(D) G L N (u)

sinon

Enn,lavaleurretournéepar

ev

est

RDU(L N r )

.

Exemple 7 Reprenons l'arbre déision hasard de la gure1 et faisons l'hypo-

thèse que

Γ = {(D 1 , H 1 ), (D 3 , H 6 )}

.Lesloteriesremontées enhaquen÷ud se-

rontalors :

L H 3 = ( 3 5 , 2; 2 5 , 4)

,

L H 4 = (1, 3)

,

L H 6 = (1, 1)

,

L D 2 = ( 3 5 , 3; 2 5 , 4)

(ar

G L D 2 = (max(1, 1), 2; max( 2 5 , 1), 3; max( 2 5 , 0), 4)

),

L D 3 = L H 6 = (1, 1)

,

L H 1 = ( 3 5 × 1, 1, 2 5 × 3 5 , 3; 2 5 × 2 5 , 4) = ( 3 5 , 1, 25 6 , 3; 25 4 , 4)

,

L D 1 = L H 1 = ( 3 5 , 1, 25 6 , 3; 25 4 , 4)

.

Lavaleur retournéeparla fontiond'évaluation pour

Γ = {(D 1 , H 1 ), (D 3 , H 6 )}

seradon

ev(Γ ) = RDU(( 3 5 , 1; 25 6 , 3; 25 4 , 4))

.

4.2 Expérimentations numériques

L'algorithmeaétéimplémentéenC++etlestestontétémenéssurunordi-

nateur équipéd'unbiproesseurIntelà2.13Ghzave3.5Go demémoirevive.

Lesarbresdéisionhasardsurlesquelsnousavonstesténotrealgorithmesontdes

arbresbinairesompletsdeprofondeurpaire.Lesutilitéset lesprobabilitésont

étégénéréesdemanièrealéatoire.Lesutilitésvarientde

1

à

500

.Laprofondeur

desarbresvariequantàellede

4

à

14

(donde

5

à

5461

n÷udsdedéision),ave

unealternaneden÷udsdedéisionetden÷udsdehasard.Pourhaqueniveau

de profondeur, 100arbres ont été générés. La ourbede gauhe (resp. droite)

de la gure 4 représente le nombre moyen de n÷uds développés dans l'arbre

d'exploration (resp. le temps moyen d'exéution en se. de l'algorithme) selon

la profondeur. L'axe des ordonnées est exprimé sur une éhelle logarithmique

(enbase 4)arlenombrede n÷udsdedéisionest multipliépar4en ordrede

grandeurpourhaqueinrémentdelaprofondeur.Onremarqueque,surlesins-

tanestiréesaléatoirement,laroissanedunombreden÷udsdéveloppés(resp.

dutempsd'exéution)apparaîtommelinéairedunombreden÷udsdedéision

pourlestaillestraitéesii.Lesplusgrandesinstanesserapprohentdestailles

d'arbredéisionhasardlimitesstokablesenmahine(uneaugmentationde30%

seulementdelaprofondeurpeutêtre envisagée).Lesautdeomplexité sesitue

au-delàdestaillestraitées ii.

Fig.4.Comportementdel'algorithmeenfontiondelaprofondeur.

(16)

Dans e papier,nous avonsmené une étude algorithmique duproblème de

lareherhed'unestratégieRDU-optimaledansunarbredéisionhasard.Nous

avonsenpartiuliermontréqueeproblèmeestNP-diile.Nousavonsensuite

proposé un algorithme d'énumération impliite pour déterminer une stratégie

RDU-optimale.Lestestsnumériquesonduitsmontrentqueetalgorithmeper-

metderésoudreavedestempsompétitifsdesinstanesdontlatailleapprohe

lalimitemémoireimposéeparlamahine.Unsujetd'étudeintéressantpourdes

travauxfutursseraitjustementdeonevoirdesalgorithmesderésolutionpour

desproblèmesdedéisiondanslerisquemodélisésàl'aided'undiagrammed'in-

uene.Undiagrammed'inueneestungrapheorientésansiruitreprésentant

defaçonompateunarbredéisionhasardenexploitantlessymétriesprésentes.

Parexemple, sur l'arbredela gure2, lesn÷uds

D 2

et

D 3

peuventêtre fa-

torisés en unseularlessous-arbresassoiés sontidentiques.Néanmoins, une

diulté supplémentairepourla résolutionest qu'unestratégie RDU-optimale

peutonduireànepasfairelemêmehoixendeuxn÷udsdedéisiondistints

assoiés à des sous-arbres pourtant identiques (alors qu'il existe toujours une

stratégieEU-optimaleoùl'onprendlamêmedéision).C'estleasparexemple

en

D 2

et

D 3

pourl'arbredelagure2.

Remeriements

NousremerionsPatriePernyquiaporténotreattentionsurlesujetétudié

ii, ChristopheGonzalesavequi nous avonseude multiples éhanges qui ont

ontribué àe travail,ainsique lesreleteursanonymespourleurs suggestions

pertinentes.

Référenes

1. Allais,M. (1979):Thefoundationofapositivetheoryofhoieinvolvingriskans

aritiism ofthe postulateand axiomsoftheamerianshool. InExpeted utility

hypotheses andtheAllaisparadox,pages27145.Dordreht,Holland.Originalwork

publishedin1952.

2. Dubois,D.,Prade,H.and Sabbadin,R.(2001) :Deision-theoretifoundations of

qualitative possibility theory. European Journal of Operational Researh, 128(3),

459-478.

3. Esoer,B.andSpanjaard,O.(2005):Programmationdynamique.Dansl'ouvrage

olletifOptimisationombinatoire, Volume1.EditéparV.Th.Pashos.Hermes.

4. Gayant,J.-P.(2001):Risqueetdéision,Vuibert.

5. Handa, J.(1977):Risk,probabilities andanewtheoryofardinal utility.Journal

of PolitialEonomis,85,97-122.

6. Jaray,J-Y.andNielsen,T.D.(2006):Anoperationalapproahtorationaldeision

makingbasedonrankdependentutility.EuropeanJournalofOperationalResearh,

(17)

underRisk.Eonometria,47,263-291.

8. MClennen,E.F.(1990):RationalityandDynamihoie :FoundationalExplora-

tions,CambridgeUniversityPress,Cambridge.

9. Morin, T.L.(1982):Monotoniityand theprinipleofoptimality.Journalof Ma-

thematialAnalysisandAppliations,86, 665-674.

10. Quiggin,J.(1982):Atheoryofantiipatedutility.JournalofEonomiBehavior

andOrganisation,3(4),323-343.

11. Raia, H. (1968) : Deision Analysis : Introdutory Letures on Choies under

Unertainty,Addison-Wesley.

12. von Neuman, J. and Morgenstern, O. (1947) : Theory of games and eonomi

behaviour.PrinetonUniversityPress, 2ndedition.

Références

Documents relatifs

8.3.5 Avant de voter sur l’exclusion d’un membre qui n’a pas suivi le Code de conduite tel qu’approuvé par les membres ou à un Code de conduite similaire adopté par

FETE DES MERES fête des mères. fête des mères

Si on tire au hasard une boule dans cette urne, quelle est la probabilité qu’elle porte le numéro 7.. Wacim s’apprête à tirer

Chercher sur Internet l‘algorithme DSW (c’est un algorithme qui prend en entrée un arbre de recherche binaire afin de réaliser son équilibrage) et l’algorithme de

Les algorithmes Min-Max et Alpha-Bétâ sont largement utilisés pour déterminer le meilleur coup qu'une intelligence artificielle (joueur cybernétique) doit réaliser lorsqu'elle

À chaque gare centrale sont rattachées des gares satellites et on peut aussi aller directement d’une gare centrale à une de ses gares satellites rattachées.. Par contre, on ne peut

Mike Assistant Prof 3 no.

Le probl` eme de cet exercice consiste ` a d´ eterminer le nombre de points du plan contenus dans un rectangle donn´ e.. Ce genre de situation apparait tr` es souvent dans les