• Aucun résultat trouvé

Mod`ele d´ependant avec retours diff´er´es

Dans ce mod`ele, chaque demande peut induire, avec une probabilit´e p, un retour de produit selon un d´elai exponentiel de taux γ.

Dans ce mod`ele `a r´eutilisation directe, les produits retourn´es peuvent ˆetre utilis´es afin de servir de nouvelles demandes (Figure 4.2). Le stock est alors commun aux produits neufs et retourn´es. Ce mod`ele sera d´esign´e par le Mod`ele 3 dans la suite de ce document.

Figure 4.2 – Mod`ele 3 : Retours d´ependants et diff´er´es

.

Dans ce mod`ele, l’´etat du syst`eme peut ˆetre r´esum´e par deux variables (X(t), Y (t)) o`u `a un instant t : X(t) est le niveau de stock (incluant les produits neufs et retour-n´es) et Y (t) est le nombre produits en train d’ˆetre retourn´es1 `a l’instant t. Nous devons alors distinguer deux cas :

– Le cas observable : le responsable de production connaˆıt Y (t) `a chaque instant et prend ses d´ecisions en se basant sur cette information.

– Le cas non observable : le responsable ne connaˆıt pas le nombre Y (t).

Nous ´etudierons chacun de ces deux cas s´epar´ement (sections 4.3.1 et 4.3.2), en essayant de trouver dans chaque cas la politique qui minimise le coˆut. Puis, en section 4.4, nous terminerons par une ´etude num´erique en vue, entre autres, de comparer ses deux cas et d’´evaluer l’importance de la prise en compte de Y (t) et de l’observabilit´e des retours.

La structure du coˆut est rappel´ee dans le tableau suivant qui r´esume ´egalement les principales notations utilis´ees.

x = niveau de stock (produits neufs et retourn´es) `a l’instant t = 0 y = nombre de produits en cours de retour `a l’instant t = 0 µ = taux de production

λ = taux de demande γ = taux du d´elai de retour

p (q) = probabilit´e qu’une demande satisfaite soit (ne soit pas) retourn´ee ch = coˆut de possession d’une unit´e de stock par unit´e de temps cp = coˆut de production unitaire

cl = coˆut unitaire de vente perdue cr = coˆut unitaire de retour de produit α = taux d’actualisation

Rappelons qu’une politique π sp´ecifie quand est-ce qu’il faut produire ou pas, pour chaque ´etat du syst`eme, l’objectif ´etant de trouver la politique minimisant le coˆut total actualis´e sur un horizon infini. En adoptant la d´emarche utilis´ee pour les mod`eles 1 et 2, nous montrons que ce probl`eme peut ˆetre mod´elis´e par un processus de d´ecision markovien (MDP) dans le cas observable. Pour le cas non-observable, le probl`eme peut ˆetre mod´elis´e par un processus de d´ecision markovien partiellement observable (POMDP pour Partially Observed Markov Decision Process).

4.3.1 Cas des retours observables

4.3.1.1 Equations d’optimalit´´ e

La structure de la politique optimale dans le cas observable sera discut´ee dans la section suivante. Dans la pr´esente section, nous pr´esentons les ´equations d’op-timalit´e qui permettent de calculer le coˆut optimal actualis´e associ´e `a la politique optimale dans le cas observable. Nous restreignons notre analyse aux politiques mar-koviennes stationnaires ´etant donn´e qu’il existe une politique optimale stationnaire markovienne d’apr`es Puterman (1994). Nous d´efinissons les processus stochastiques suivants lorsqu’une politique π (quelconque) est appliqu´ee, partant initialement d’un stock x et d’un nombre y de produits en train d’ˆetre retourn´es :

– Uπ

x,y(t) : nombre de demandes clients n’ayant pas ´et´e satisfaites jusqu’`a l’instant t

– Vπ

x,y(t) : nombre de produits ayant ´et´e retourn´es jusqu’`a l’instant t

– Wπ

x,y(t) : nombre de pi`eces ayant ´et´e fabriqu´ees jusqu’`a l’instant t

– Xπ

x,y(t) : niveau du stock `a l’instant t

Ayant soulign´e que le cas observable peut ˆetre mod´elis´e par un MDP, nous d´e-finissons ´egalement vπ(x, y) comme le coˆut total actualis´e associ´e `a une politique π et `a l’´etat initial (x, y). Si α est le taux d’actualisation (α > 0), alors vπ(x, y) est la somme des coˆuts de production, de possession des stocks, de ventes perdues et de retours : vπ(x, y) = E ·Z 0 e−αt(cl dU (t) + cr dV (t) + cp dW (t) + ch dX(t)) ¸

Nous cherchons `a trouver la politique optimale π minimisant vπ(x, y). Soit v(x, y) := vπ∗

(x, y) la fonction optimale du coˆut, alors : v(x, y) = min

π vπ(x, y)

Nous mod´elisons ce probl`eme par MDP `a temps continu. En vue d’uniformiser ce MDP, nous supposons que y est born´e par M . Cette derni`ere hypoth`ese n’est pas cruciale vu que nos r´esultats restent valables pour n’importe quel M . Nous pouvons alors uniformiser ce MDP (Lippman, 1975; Puterman, 1994) avec un taux C = λ + µ + γM . Il peut ensuite ˆetre montr´e que la valeur optimale de la fonction de coˆut v´erifie les ´equations d’optimalit´e suivantes :

v(x, y) = T v(x, y), ∀ (x, y) ∈ IN × IN O`u l’op´erateur T est d´efini par

T v(x, y) := 1

C + α [cH x + µ T0 v(x, y) + λ p T1 v(x, y) + λ (1 − p) T2 v(x, y) + γ T3 v(x, y)]

et

T0 v(x, y) := min [v(x, y); cp+ v(x + 1, y)] T1 v(x, y) :=    v(x − 1, y + 1) si x > 0 et y < M v(x, y) + cl si x = 0 v(x − 1, y) si x > 0 et y = M T2 v(x, y) := ½ v(x − 1, y) si x > 0 v(x, y) + cl si x = 0 T3 v(x, y) := ½ y [v(x + 1, y − 1) + cr] + (M − y) v(x, y) si y > 0 M v(x, y) if y = 0

L’op´erateur T0 est associ´e `a la d´ecision optimale de production. L’op´erateur T1

(resp. T2) est associ´e `a une demande qui induira (resp. n’induira pas) un retour de produit. Finalement, l’op´erateur T3 correspond au retour d’un produit.

Partant de ces ´equations d’optimalit´e, la fonction optimale du coˆut v ainsi que la politique optimale S peuvent ˆetre calcul´ees par it´eration de valeur (Puterman, 1994), suivant une m´ethode dynamique similaire `a celles pr´esent´ees pour les mod`eles 1 et 2 (sections 3.4.2 et 4.2.3).

4.3.1.2 Structure de la politique optimale dans le cas observable

Sur la base des ´etudes num´eriques que nous avons men´ees selon l’approche (calcul du coˆut optimal) pr´esent´ee ci-dessus, nous conjecturons que la politique optimale dans le cas observable est du type suivant :

Conjecture 1 Il existe une courbe de commutation S(y) telle qu’il est optimal de produire si et seulement si x < S(y). De plus, cette courbe poss`ede la propri´et´e suivante :

S(y) − 1 ≤ S(y + 1) ≤ S(y)

Le terme « de commutation » dans la Conjecture 1 se r´ef`ere `a la fronti`ere entre la production et la non production.

Cette politique optimale peut ˆetre vue comme une politique base-stock d´ependante :

– Base-stock car il s’agit de toujours produire jusqu’`a un seuil S(y) donn´e ;

– Et d´ependante car ce seuil S(y) d´epend du nombre de produits y en cours de retours.

La figure 4.3 pr´esente la politique optimale pour un exemple num´erique.

Figure 4.3 – Politique optimale : probl`eme actualis´e & retours observables

(λ = 0.9, µ = 1, p = 0.10, α = 0.1, γ = 10, ch = 1, cp = 0, cl = 45, cr = 15) La d´emonstration analytique de la Conjecture 1 s’av`ere difficile `a cause de la forte corr´elation entre la demande et les retours. Nous rappelons cependant que nous avons d´emontr´e analytiquement l’optimalit´e de la politique base-stock lors de retours observables dans le cas particulier o`u le d´elai moyen de retour 1/γ → 0. Ce cas particulier n’est autre que le Mod`ele 2 que nous avons pr´esent´e au d´ebut de ce chapitre (section 4.2).

4.3.2 Heuristique pour le cas des retours non observables

Lorsque le nombre de produits retourn´es n’est pas observable, nous consid´erons une heuristique bas´ee uniquement sur le niveau de stock. Cette heuristique est une politique base-stock telle que le syst`eme produit si et seulement si le niveau de stock est inf´erieur `a S, ce dernier ´etant inchang´e dans le temps. Notons ˜vS(x, y) le coˆut

actualis´e `a horizon infini associ´e `a cette politique. La fonction ˜vS(x, y) satisfait les mˆemes ´equations d’optimalit´e que v except´e le fait que l’op´erateur T0, associ´e `a la d´ecision de production, est dans ce cas remplac´e par l’op´erateur ˜T0 d´efini comme suit : ˜ T0v(x, y) := ½ v(x + 1, y) + cp si x < S v(x, y) autrement

Nous pouvons alors rechercher num´eriquement le base-stock level ˜S minimisant ˜

vS(0, 0)2. Nous d´enotons alors ˜v(0, 0) := minSS(0, 0). Le ˜S obtenu est fixe et ne d´epend pas de y.

Une politique plus ´elabor´ee pourrait tenir compte de N (t), le nombre de pi`eces qui sont dans le march´e (nombre d’unit´es vendues moins le nombre d’unit´es retourn´ees). Alors nous savons que Y (t), le nombre de produits dans le march´e qui vont ˆetre retourn´es, est distribu´e selon une loi binomiale B(N (t), p). Nous ne consid´ererons cependant pas cette politique lors de cette ´etude.

4.3.3 Calcul de S

et S

(y)

Le calcul du base-stock level optimal S(y) relatif au cas observable (resp. S

relatif au cas non observable) se fait num´eriquement lors du calcul du coˆut optimal actualis´e qui lui est associ´e, et ce suivant le mˆeme principe que pour les mod`eles 1 et 2 (voir sections 3.4.2 et 4.2.3).

2. Bien que les tests num´eriques ont tous montr´e que ˜S est le mˆeme quel que soit le ˜vS(x, y) minimis´e, nous nous focaliserons principalement sur le ˜S minimisant ˜vS(0, 0) car c’est pour un syst`eme initialement neutre (x = 0, y = 0) que nous r´ealiserons notre ´etude num´erique en section 4.4.