• Aucun résultat trouvé

Disponible à / Available at permalink :

N/A
N/A
Protected

Academic year: 2021

Partager "Disponible à / Available at permalink :"

Copied!
243
0
0

Texte intégral

(1)

- - -

- - -

Dépôt Institutionnel de l’Université libre de Bruxelles / Université libre de Bruxelles Institutional Repository

Thèse de doctorat/ PhD Thesis Citation APA:

Teghem, J. (1976). Comportement optimal des clients dans quelques modèles d'attente (Unpublished doctoral dissertation). Université libre de Bruxelles, Faculté des sciences, Bruxelles.

Disponible à / Available at permalink : https://dipot.ulb.ac.be/dspace/bitstream/2013/214390/1/2ea71866-41c2-4ea3-a04e-9f67fb61ef34.txt

(English version below)

Cette thèse de doctorat a été numérisée par l’Université libre de Bruxelles. L’auteur qui s’opposerait à sa mise en ligne dans DI-fusion est invité à prendre contact avec l’Université (di-fusion@ulb.ac.be).

Dans le cas où une version électronique native de la thèse existe, l’Université ne peut garantir que la présente version numérisée soit identique à la version électronique native, ni qu’elle soit la version officielle définitive de la thèse.

DI-fusion, le Dépôt Institutionnel de l’Université libre de Bruxelles, recueille la production scientifique de l’Université, mise à disposition en libre accès autant que possible. Les œuvres accessibles dans DI-fusion sont protégées par la législation belge relative aux droits d'auteur et aux droits voisins. Toute personne peut, sans avoir à demander l’autorisation de l’auteur ou de l’ayant-droit, à des fins d’usage privé ou à des fins d’illustration de l’enseignement ou de recherche scientifique, dans la mesure justifiée par le but non lucratif poursuivi, lire, télécharger ou reproduire sur papier ou sur tout autre support, les articles ou des fragments d’autres œuvres, disponibles dans DI-fusion, pour autant que :

Le nom des auteurs, le titre et la référence bibliographique complète soient cités;

L’identifiant unique attribué aux métadonnées dans DI-fusion (permalink) soit indiqué;

Le contenu ne soit pas modifié.

L’œuvre ne peut être stockée dans une autre base de données dans le but d’y donner accès ; l’identifiant unique (permalink) indiqué ci-dessus doit toujours être utilisé pour donner accès à l’œuvre. Toute autre utilisation non mentionnée ci-dessus nécessite l’autorisation de l’auteur de l’œuvre ou de l’ayant droit.

--- English Version ---

This Ph.D. thesis has been digitized by Université libre de Bruxelles. The author who would disagree on its online availability in DI-fusion is invited to contact the University (di-fusion@ulb.ac.be).

If a native electronic version of the thesis exists, the University can guarantee neither that the present digitized version is identical to the native electronic version, nor that it is the definitive official version of the thesis.

DI-fusion is the Institutional Repository of Université libre de Bruxelles; it collects the research output of the University, available on open access as much as possible. The works included in DI-fusion are protected by the Belgian legislation relating to authors’ rights and neighbouring rights.

Any user may, without prior permission from the authors or copyright owners, for private usage or for educational or scientific research purposes, to the extent justified by the non-profit activity, read, download or reproduce on paper or on any other media, the articles or fragments of other works, available in DI-fusion, provided:

The authors, title and full bibliographic details are credited in any copy;

The unique identifier (permalink) for the original metadata page in DI-fusion is indicated;

The content is not changed in any way.

It is not permitted to store the work in another database in order to provide access to it; the unique identifier (permalink) indicated above must always be used to provide access to the work. Any other use not mentioned above requires the authors’ or copyright owners’ permission.

(2)

Faculté des Sciences

COMPORTEMENT OPTIMAL OES CLIENTS

Thèse présentée en vue du grsde de Docteur en ( Grade légal )

de l'obtention Sciences

Année acedétnique 1975 - 1976

Jacques TEGHEM Jr.

(3)

F

I

O ' '«>

(4)

UNIVERSITE LIBRE DE BRUXELLES Faculté des Sciences

B HP

^13 Z

COMPORTEMENT OPTIMAL OE5 CLIENTS OANS QUELQUES MOOELES O'ATTENTE

Thèse présentée en vue du grade de Docteur en ( Grade légal )

de l'obtention Sciences

Année académique 1 975 - 1 976

Jacques TEGHEM Jr.

(5)

Thèse Annexe

J.TEGHEM, Jr.

Dans le cadre des processus de décision markovien , les méthodes de A.F.Veinott, Jr. | 1] et E.Lanery [2] , relatives à l'obtention d'une tactique "bias optimal", sont deux présen­

tations d'un même algorithme.

La détermination d'une nouvelle expression du gain asymptotique moyen total, permet de montrer que cet algorithme est une généralisation de l'algorithme de R.A.Howard f 31 ,

relatif à l'obtention d'une tactique "g-optinale".

[1] A.F.Veinott,Jr. Ann.Math.Stat., Vo].3T, n°2 (1966)

On finding optimal policies in discrète dynamic programming with no discounting.

[2] E. Lanery. RIRO, n°5 (106T)

Etude asymptotique des systèmes markoviens à comma.nde [3] R.A.Howard. MIT Press (i960)

Dynamic programming and markov processes.

(6)

C'est avec un vif plaisir, que je remercie Madame le Professeur J.Loris-Teghem pour l'intérêt constant qu'elle a porté à la réalisation de ce travail et pour les conseils précieux qu'elle m'a prodigués.

(7)

INTRODUCTION

LES MODELES D'OPTIMISATION DANS LES FILES D'ATTENTE

Durant les vingt dernières années, les modèles de file d'attente ont été abondamment étudiés. Il suffit de consulter quelques publications qui dressent un bilan du développement de la théorie des files d'attente -par exemple, Saaty [ 50,5ll et Bhat (U3]- pour constater que la bibliographie est particuliè­

rement riche en ce domaine et que, même pour les sytèmes d'attente les plus généraux, de très nombreuses propriétés ont été

mises en évidence.

Jusqu'il y a quelques années cependant, parmi les nom­

breuses études consacrées aux files d'attente, très rares étaient celles qui abordaient des problèmes d'optimisation dans un

système d'attente. Ceci s'explique probablement par le fait qu'il existait assez peu d'applications directes de la théorie des files d'attente et, comme aucun problème concret ne

venait donner de nouvelles orientations, les recherches se sont essentiellement orientées vers la description de modèles

-souvent très élaborés- et non pas vers l'optimisation de certains éléments de ces modèles.

Néanmoins depuis une dizaine d'années -mais surtout

dans les cinq dernières années- cette situation s'est profondément modifiée. Les problèmes pratiques de files d'attente qui se

sont posés, notamment au niveau de la gestion des grands centres

(8)

d'attente.

Dans un premier stade, ce furent les modèlee statiques d'optimisation qui retinrent l'attention. Dans ce type de

modèle, on détermine, parmi plusieurs structures de systèmes d'attente, celle qui optimise un critère de coût ou de profit ; le terme "statique" signifiant ici, qu'une fois fixés les éléments caractéristiques du système, ceux-ci ne sont plus susceptibles d'être modifiés durant toute l'évolution du système dans le temps.

L'élément à optimiser peut être, selon les cas, le nombre

de serveurs, le taux de service, la discipline de file, etc...

(Pour une synthèse des résultats obtenus dans le domaine des modèles statiques d'optimisation, voir l'introduction du rapport

de M- Gill [ 12] et le rapport de Crabill , Gross et Magazine f l] ).

(9)

Théorie des files d'attente

Mais la majorité des travaux récents consacrés aux problèmes d'optimisation de files d'attente traitent de modèles dynamiques d'optimisation : dans ces modèles, l'optimisation porte sur des éléments caractéristiques qui peuvent être modifiés suivant l'évolution du système dans le temps.

N.B.

On peut concevoir des problèmes d'optimisation relevant à la fois des modèles statiques et dynamiques : il suffit d'imaginer un système dont deux éléments caractéristiques doivent être optimisés, l'un étant constant dans le temps, l'autre

pouvant être modifié au cours de l'évolution du système.

Néanmoins cette dichotomie "statique-dynamique" permet de classifier aisément les divers problèmes étudiés, puisque jusqu'à présent, la plupart des auteurs se sont restreints

(10)

à l'optimisation d'un seul élément caractéristique à la fois.

Parmi les modèles dynamiques -appelés parfois aussi modèles de contrôle- on peut distinguer deux grandes catégories,

selon que l'élément à contrôler est caractéristique du processus de service -c'est-à-dire du comportement de la station- ou du processus d'arrivée- c'est-à-dire du comportement des clients.

a) Contrôle du_grocessus_de_service.

Assez curieusement, on peut remarquer que très souvent, les structures sous-jacentes aux principaux modèles de contrôle du processus de service, n'avaient pas encore été étudiées malgré l'abondance de la littérature consacrée aux files d'attente.

C'est notamment un des mérites de Naor-et de son "école"- d'avoir, un des premiers,décrit plusieurs de ces structures, ouvrant ainsi la voie à de nombreuses recherches dans le domaine du contrôle des files d'attente.

Deux types principaux de problèmes de contrôle du processus de service ont été envisagés.

A.l) Serveurs_amovibles.

Il était assez logique de choisir, en premier lieu,

le nombre de serveurs comme variable de contrôle, et donc d'étudier un système d'attente avec un nombre fini de serveurs amovibles

("removable servers") c'est-à-dire des serveurs qui peuvent à

(11)

V

tout instant, être mis en service ou mis au repos. Parallèlement, on introduit une structure de coût comprenant des coûts de fonct- tionnement des serveurs par unité de temps, des coûts fixes de mise en service et de mise au repos d'un serveur, et un coût d'entretien par unité de temps et par client présent dans le système.

Yadin et Naor,[l5l, ont, les premiers, introduit

la notion de serveur amovible dans une file M/G/1, en particulier la notion de politique (0,k), politique qui consiste, pour le

serveur, à arrêter de servir quand il n'y a plus de clients

dans le système et à commencer à servir lorsqu'il y a k clients dans la file.

Ensuite, Heyman ( 7l , Heyman et Marshall ( 81 , Bell [ U] , Blackburn ( 6] , Balachadran [ 2] et Balachadran et Tijms [ 3l , ont étudié , pour différentes variantes d'un système M/G/1, le problème de la détermination de la politique optimale à appliquer par un serveur amovible pour minimiser le coût total actualisé de la station ; Heyman (7l a également montré que dans le cas du critère

du coût asymptotique moyen par unité de temps, la politique optimale est une politique (0,k) pour un système M/G/1.

Sobel [13] a considéré ce même problème pour une file Gl/G/1 et M- Gill [ 12] , Magazine [il] et Lippmanf 10] ont étudié le cas de plusieurs serveurs amovibles : en particulier, à l'aide d'une nouvelle technique d'optimisation, Lippman [ 10] 'démontre l'optimalité d'une politique (£,k) dans le cas d'une file

M/M/S à horizon fini et infini, pour les critères de coût total

(12)

actualise et coût asymptotique moyen par unité de temps.

Jaiswal et Simha [ 9) ont traité le cas d'un serveur amovible dans un système d'attente à source finie et récemment

Bell f 5] et Tijms ( 1 ] le cas d'un serveur amovible dans un modèle avec priorités.

A.2) Taux_de_service variable

Ce sont également Yadin et Naor [ 2H] qui ont, les

premiers généralisé le problème du serveur amovible en considérant, dans un sytème M/M/1 que la station a le choix entre plusieurs taux de service (u <u <...<u.<.,.<u ; le cas du serveur amovible

O 1 1 r

correspondant à VJq = 0 et r=l) ; à chacun de ces taux de service correspond un coût de fonctionnement différent et chaque change­

ment de taux de service entraîne un coût fixe pour la station.

Dans leur article, Yadin et Naor n'envisagent pas la détermina­

tion d'une politique optimale pour la station, mais ils intro­

duisent la classe très large des politiques avec hystérèse ; une telle politique est déterminée par deux ensembles de paramètres

i

{R,<...<R.<...<R } et {s =0<S,<...<S.<...<R : si le taux de

1 1 r oïl r-1

service est p. (p. ,) et que le nombre de clients présents dans le système passe de R^-l(S^+l) à R^(S^), on choisit comme nouveau taux de service p . v. Pour le cas de deux taux de service,

Gebhard f2l] a étudié deux types particuliers de politiques.

La détermination d'une politique optimale étant un problème

complexe pour ce modèle général, divers auteurs ont particularisé

(13)

VII

ce modèle.

Crabill I 19l considère par exemple que les coûts fixes de change­

ment de taux de service sont nuis : il montre que, dans ce cas particulier, une politique optimale -au sens du critère du coût

asymptotique moyen par unité de temps- est caractérisée par r-1 nombres entiers et que le taux de service utilisé est une fonction non décroissante du nombre de clients présents dans le système.

Sabeti f 22] a étudié un modèle analogue avec des coûts actualisés.

Brosh ( l8l et Beja ( l6] considèrent ce même modèle, mais dans le cas d'un système d'attente M/M/1 à capacité finie et avec

seulement deux taux de service ; ils montrent que pour la politique optimale, le taux de service utilisé est une fonction monotone

du nombre de clients présents dans le système, mais, étant donné la capacité finie de la file, cette fonction n'est pas nécessaire­

ment non décroissante. Tout récemment Beja et Teller [17l ont généralisé ce résultat au cas d'un nombre fini de taux de service et Schassberger ( 23] étudie ce modèle, dans le cas d'une file M/G/1, en introduisant certaines hypothèses sur les distributions

de temps de service.

Récemment, Crabill [20] a montré que, pour un modèle avec deux taux de service et des coûts fixes de changement de taux de service non nuis, la politique optimale appartenait à la classe des politiques avec hystérèse. Yadin et Zacks [ 25.26] ,

introduisent quant à eux, un modèle dans lequel le taux de service variable peut être choisi dans un intervalle fermé de la droite réelle plutôt que dans un ensemble fini et ils caractérisent la politique optimale pour un tel modèle.

(14)

En dehors de ces deux types principaux, d'autres modèles de contrôle du processus de service ont été examinés.

Signalons par exemple les modèles à plusieurs classes de clients;, dans lesquels la décision porte sur la discipline de file et sur J priorités éventuelles à accorder à certaines classes de clients.

Ce problème assez général est actuellement étudié par plusieurs chercheurs et il connaîtra probablement, d'ici quelques années, un important développement.

On trouve une bibliographie complète sur ce sujet dans le rapport de Crabill, Gross et Magazine ( l] .

b) Contrôle du procèssus_d^arrivée.

On peut concevoir différemment le contrôle du processus d'arrivée, selon que ce contrôle est effectué par la station ou par les clients eux-mêmes.

B.1 ) Çontrôle_du_processus_d^arrivée_par_1a_station.

Dans cette première catégorie de problèmes, Miller ( 31) a considéré un système M/M/S desservant plusieurs classes de clients, mais avec la particularité qu'il n'y a pas de possibi­

lité d'attente pour les clients. Le gain obtenu par la station pour le service d'un client diffère selon la classe d'apparte­

nance du client et, d'autre part, la station peut refuser à certains moments de servir des cDients de différentes classes.

(15)

IX . -

En fonction de l'état du système, c'est-à-dire du nombre de

serveurs libres, Miller détermine quels sont les types de clients à accepter dans le système pour maximiser les gains de la station.

Différents auteurs, parmi lesquels Scott f 32] et Emmons [ 28] , ont, par la suite, généralisé le modèle de Miller en introduisant notamment une possibilité d'attente pour les clients ; l'admission des clients des différentes classes dans la file dépend dès

lors du nombre de clients présents dans le système ; Cramer ( 27]

a amélioré ce modèle en introduisant un nombre infini de classes de clients dans un système dont la capacité peut être finie.

Kakalik

J

29] a, quant à lui, considéré un système d'attente M/G/1 dans lequel la station peut modifier les taux naturels d'arrivée des différentes classes de clients en fonction du nombre de clients présents dans le système. Il montre que, pour la structure de coût considérée, la politique optimale est du type "tout ou rien" en ce sens que, en fonction de l'état du système, soit on accepte les clients d'une classe suivant le taux naturel d'arrivée, soit on n'accepte aucun client de cette classe (taux d'arrivée nul).

Finalement signalons le modèle M/M/S de Low { 30]

dans lequel, d'une part le taux d'arrivée est une fonction (* ) . ^ décroissante d'un prix d'entrée dans le système fixe par

la station, et, d'autre part, chaque client impose à la station un coût d'entretien qui est fonction du nombre de clients

présents dans le système au moment de son arrivée. Dans ce modèle, la station doit déterminer le prix d'entrée en fonction du

nombre de clients présents dans le système, de manière à maximiser le gain total actualisé de la station. Sous des

(16)

conditions très générales sur les coûts, Low montre que le prix d'entrée optimal est une fonction non décroissante du nombre de clients dans le système.

B.2) Comgortement_02timal_deB_client s.

Pour contrôler le processus d'arrivée, il existe une conception tout à fait différente -et plus réaliste dans certains cas- qui consiste à laisser les clients décider eux-mêmes s'ils joignent ou non le système.

C'est une nouvelle fois Naor [ 38] qui, le premier, a introduit cette conception originale. Il considère en effet un système M/M/1 avec impatience a priori des clients, auquel est associée une structure de coût qui comprend d'une part, pour un client qui joint la file, un coût d'attente par unité de

temps passée dans le système et un gain représentant l'obtention du service, et d'autre part, une pénalité pour un client qui ne joint pas la file. Naor détermine alors le comportement des clients, non seulement dans le cas où chaque client optimise son propre revenu (optimisation individuelle), mais

également dans le cas où les clients optimisent globalement leurs revenus (optimisation sociale).

Yechiali [40,Ul] a généralisé ce modèle, respectivement pour une file GI/M/1 et GI/M/S. De plus, Yechiali introduit

^ ^ (* ) . X

la notion de prix d'entree dans le système , impose aux clients par la station ; la considération de ce prix d'entrée comme

(*): Il existe une controverse (cf. Leeman (35,36] et Saaty (391) sur l'opportunité de contrôler les arrivées en imposant aux clients un droit d'entrée dans le système.

(17)

variable de contrôle permet alors à Yechiali d'étudier le problème de l'optimisation des gains de la station face à un comportement optimal (individuel ou collectif) des clients.

Différentes variantes de ce modèle principal ont

été examinées: Adiri et Yechiali (33l ont recherché le comporte­

ment optimal des clients de plusieurs classes différentes dans un système M/M/1 à régime de priorités (absolue et relative) et Knudsen ( 3^1 a introduit une structure de coût plus générale, avec notamment pour l'obtention du service, des gains différents selon l'état du système' aux instants d'arrivée des clients.

Tout récemment, ce modèle a été généralisé par Lippman et Stidham [ 3Tl , qui traitent le cas de l'horizon fini et du coût total actualisé, tout en considérant que les gains des clients sont représentés par des variables aléatoires qui dépendent de l'état du système à l'arrivée des clients.

Ce bref résumé des principaux problèmes de décision dans des systèmes d'attente ne se veut pas exhaustif ; il a pour seul but de dresser un cadre à notre travail et de permettre de situer plus aisément celui-ci.

PRESENTATION DU TRAVAIL

Le fil conducteur de notre travail est l'étude du

comportement optimal des clients -suivant la conception introduite

(18)

par Naor [ 38) pour une file M/M/1 et développée ensuite, principalement par Yechiali | 1+0,Hl] pour des files GI/M/1 et GI/M/S- dans différentes situations d'attente.

s_ijjie_Er emiè re_part ie_j[Çhapi t re|_I jl I jl II_ e£_ lyl » nous avons supposé que-les clients pouvaient être non seulement impatients a priori (balking process), mais également impatients a posteriori (reneging process), c'est-à-dire que le temps dont les

clients disposent est limité ; dans les articles de Naor [ 38) et Yechiali [ 1+0,Ul] , ai-nsi que dans les autres travaux consacrés au comportement optimal des clients ([ 33) ,( 3l+l et [ 37) ) , les clients disposent toujours d'un temps illimité.

Dans les premier et deuxième chapitres, nous considérons un système M/M/S -avec impatience a priori- dans lequel les

clients peuvent être impatients a posteriori : chaque client dispose, dans le cas du chapitre I, d'un certain temps d'attente (impatience relative) ou, dans le cas du chapitre II, d'un certain temps de séjour (impatience absolue) ; ce temps est distribué

suivant une loi exponentielle négative de paramètre a.

Etant donné un gain G représentant la valorisation du service, un prix de service (ou prix d'entrée) 0 et un coût de séjour

c par unité de temps passée dans le système, les clients décident, en fonction de l'état du système à leur arrivée, s'ils joignent ou non la file, sachant que d'une part, s'ils ne joignent pas la file, ils encourent une pénalité t et que d'autre part, s'ils joignent la file mais qu'ils la quittent ensuite par impatience a posteriori, ils encourent une pénalité t-j (dans les articles de Naor [ 38) et Yechiali I U0,l+ll , on a a=0

(19)

XIII

et la pénalité n'a donc pas de raison d'être).

Nous envisageons -dans les chapitres I et II, respectivement pour l'impatience relative et absolue- le comportement optimal des clients suivant deux critères d'optimalité ; l'optimisation individuelle (chaque client optimise son propre bénéfice) et l'optimisation sociale

(les clients optimisent leur "gain collectif").

Pour chaque type d'optimisation, la politique optimale des clients est une politique déterministe avec limite de contrôle, c'est- à-dire une politique qui consiste à joindre la file, avec une probabilité 1, s'il y a moins d'un certain nombre de clients

(limite de contrôle) dans le système et à ne pas joindre la

file dans les autres cas. Grâce à la mise en évidence de diverses propriétés du système, nous déterminons une nouvelle manière

-pour une file M/M/S- de caractériser la limite de contrôle correspondant à l'optimisation sociale (cf. relations

(l.ll) et (il.Il)) ; comme dans les références [33l,f 3^1,(3T1, I 38]

,[ Uo)

et f *411 , cette limite de contrôle n'est jamais

supérieure à celle correspondant à l'optimisation individuelle.

Nous étudions alors, de manière détaillée, la variation des limites de contrôle correspondant à ces deux types d'optimisation, en fonction des paramètres a et S, et nous en donnons une interprétation économique.

De nombreux résultats sont obtenus ; signalons, à titre d'exemple que :

- dans le cas c6 pour l'impatience rela-

(20)

sation sociale ne l'est pas ; dans le cas ^ {t t - pour l'impatience relative (absolue) des clients, la limite

de contrôle correspondant à l'optimisation individuelle ne dépend pas de a, alors que celle correspondant à

l'optimisation sociale est une fonction non décroissante de a.

- la limite de contrôle correspondant à l'optimisation indivi­

duelle est supérieure ou égale au produit par S de cette même limite de contrôle dans le cas d'un seul serveur

(S= 1 ) , alors que cette relation n'est pas nécessairement vérifiée pour la limite de contrôle correspondant à

l'optimisation sociale.

Ensuite nous traitons le cas de l'optimisation totale (la station est supposée entièrement contrôlée par les clients et elle impose un prix d'entrée qui contraint les clients à

avoir un comportement individuel similaire au comportement social optimal pour un prix d'entrée nul), ainsi que celui de l'optimi­

sation des gains de la station, face à un comportement indivi­

duel ou collectif des clients. Nous démontrons notamment que

la limite de contrôle correspondant à l'optimisation de la station face à un comportement individuel des clients, n'est jamais

supérieure à la limite de contrôle correspondant à l'optimisation

(21)

XV

totale (cf. proposition 5» chapitre l).

Enfin dans le chapitre TT, nous comparons pour les différents critères d'optimisation, les limites de contrôle selon le type d'impatience considérée (relative ou absolue).

A titre d'exemple, signalons le résultat suivant : dans le cas 9+^^-£>0, la limite dé contrôle correspondant au comportement optimal individuel de clients impatients relatifs, est

supérieure ou égale à cette meme limite pour des clients impatients absolus ; par contre, cette propriété n'est pas

nécessairement vérifiée pour la limite de contrôle correspondant au comportement optimal social des clients.

Le troisième chapitre est consacré à l'étude théiorique d'un système GI/M/S avec impatience a priori et a posteriori (relative et absolue).

En effet, l'étude du comportement optimal des clients dans un système GI/M/S, nécessite la détermination -sous la forme la plus explicite possible- de la distribution stationnaire de la

chaîne de Markov incluse au processus "nombre de clients dans le système", obtenue en restreignant le processus aux instants qui précèdent immédiatement les instants d'arrivée. Or,

pour déterminer cette distribution stationnaire, la méthode de Finch ( U7I -utilisée par Yechiali ( Uo] pour l'étude du comportement optimal des clients dans un système GI/M/1 sans impatience a posteriori -ne peut être généralisée au cas de

l'impatience a posteriori, en raison de la difficulté de calculer

(22)

directement les probabilités de transition de cette chaîne de Markov.

C'est pourquoi, dans le chapitre III, nous proposons une méthode originale pour déterminer les probabilités de transition et la distribution stationnaire de cette chaîne de Markov incluse, dans un sytème GI/M/S avec impatience a priori et a posteriori.

Subba Rao et Jaisval [ 53l ont proposé, pour l'obtention de la distribution -en régime transitoire- du nombre de clients dans un système M/G/1 &vec impatience des clients, une méthode qui fait appel à la notion de "transformée discrète".

En premier lieu, nous avons entièrement développé cette méthode des transformées discrètes pour un système GI/M/S avec impatience à priori et a posteriori des clients (cf. paragraphe III.2).

Ensuite, à l'aide des résultats obtenus, nous déterminons un système linéaire ( c f. ( 111.40 ) ), dont la solution unique est

la distribution stationnaire de la chaîne de Markov incluse, et tel que cette solution puisse être déterminée explicitement d'une manière itérâtive (cf. paragraphe III.2.3). De plus, grâce à

l'emploi des transformées discrètes, nous mettons en évidence une matrice X(-A ) (cf.(111.36)) , dont on peut montrer qu'elle est identique à une matrice de probabilités de transition

conditionnelles de la chaîne de Markov incluse {cf.propriété 2).

Dans le chapitre IV, nous indiquons trois possibilités d'extension des résultats des chapitres précédents.

(23)

XVII

Dans_une_deuxième_partie_Xçha2itres_V_et_Vl2 « nous

avons considéré un système d'attente dont le serveur est amovible et applique une politique (0,k) (cf. §A. 1 . de cette introduction).

Dans le cinquième chapitre, nous mettons en évidence plusieurs propriétés théoriques des politiques (0,k) dans un

système M/G/1 à capacité finie N(>k) ou infinie.

En premier lieu, nous déterminons la distribution stationnaire du processus "nombre de clients présents" dans le système

à capacité infinie, successivement pour le processus à paramètre continu et pour la chaîne de Markov incluse à ce processus,

obtenue en le restreignant aux instants qui suivent immédiatement les instants de départ. Pour déterminer ces distributions

stationnaires, nous appliquons avec succès la méthode utilisée par Cohen (4U] pour le cas classique k=1.

Ensuite nous nous intéressons à la période d'occupation d'ordre k (c’est-à-dire le temps qui s'écoule depuis l'instant où le

serveur commence un service alors qu'il y a k clients dans le système jusqu'au moment où, pour la première fois, le système est vide) dans un système à capacité finie N. Nous montrons d'abord que les résultats, obtenus par On Hashida [1+8]

pour la période d'occupation d'ordre k, peuvent, grâce à un argument par génération, se déduire des résultats obtenus par Cohen (U5I pour la période d'occupation d'ordre 1. Nous obtenons également -dans le cas où un régime stationnaire existe pour le

(24)

système à capacité infinie- l'intéressante relation suivante : .la période d'occupation moyenne d'ordre k pour un système M/0/1 à capacité finie N peut s'exprimer comme le produit de cette même période pour le système M/G/1 a cayiacité

infinie par la probabilité qu'il y ait moins de N clients dans le s.vstème à capacité infinie quand le serveur applique la politique (0 , k) .

Ces résultats nous permettent alors d'établir des rf-lations fon d amen t. a 1 e s' en t re les distributions stationnaires COrrespondant respectivement à l'application des politiques ( 0 , k ) et (0,1) dans un système à capacité infinie. Nous

:nontrons que le produit par k de la probabilité d'avoir j clients dans le système quand le serveur applique la politique fo,k) est éfyal , si j<k, à la probabilité qu'il y ait au plus ,i clients dans le système et, si i probabilité qu'il y ait entre j-k+1 et j clients da,ns le système quand le serveur applique la politique (0,1).

Enfin, nous terminons ce cinquième chapitre en examinant les propriétés d'une polit, i que (0,k) lorsque la capacité du système est finie. Nous déterminons la distribution s t, n t i on n a i re du processus a paramètre continu et. celle de la cil aine de Markov incluse ; nous généralisons, au cas de la

capacité finie, les relations fondamentales entre les politiqtte (0,k) et (0,1 ) et. nous mettons en évidence d'intéressantes

relations concernant le nombre moyen de clients dans le systè.me

(25)

XIX

Dans le sixième chapitre, nous étudions le comportement optimal des clients - pouvant être impatients a priori - dans un système M/M/1 dont le serveur amovible applique une politique

(0,k). Nous introduisons donc la même structure de coût qu'aux chapitres I et II, mais avec (puisque les clients

ne sont pas susceptibles d'être impatients a posteriori).

Tout d'abord, nous introduisons des hypothèses sur la structure de coût et sur le paramètre k, afin d'obliger les clients qui trouvent le serveur au repos, de joindre le système.

Nous calculons alors le temps de séjour moyen d'un client qui décide de joindre le système dans un état donné, afin de déterminer la politique déterministe avec limite de contrôle qui est optimale pour le critère de l'optimisation individuelle.

Nous montrons que cette limite optimale de contrôle est

indépendante de la valeur k, mais, (j^u'en vertu des hypothèses introduites sur la structure de coût, elle est toujours

supérieure ou égale à k. '

Nous considérons ensuite l'optimisation sociale des clients ; en tenant compte de propriétés démontrées au chapitre V, nous mettons en évidence une manière simple de déterminer la politique déterministe avec limite de contrôle qui est optimale pour ce critère. Nous montrons que cette limite optimale est une fonction non décroissante de k, mais qu'il est possible -contrairement à la limite de contrôle relative à l'optimisation individuelle- qu'elle soit strictement inférieure à k.

(26)

Cette dernière propriété nous permet dès lors de mettre en évidence qu'il n'est pas toujours possible -contrairement à ce qui se produit dans les autres études consacrées au comportement optimal des clients- d'optimiser totalement la station, c'est-à- dire d'imposer un prix d'entrée qui contraint les clients à

avoir un comportement individuel similaire au comportement social optimal pour un prix d'entrée nul.

En ce qui concerne l'optimisation de la station, nous supposons que la station contrôle, non seulement le prix

d'entrée 0, mais égalem.ent le paramètre k de la politique (0,k) appliquée par le serveur. Pour cela, nous introduisons une deuxième structure de coût relative au fonctionnement d'un serveur amovible -des coûts de fonctionnement par unité de temps du serveur au repos et en activité, ainsi que des coûts fixes de mise en service et de mise au repos du serveur- et nous discutons la compatibilité des deux structures de coût.

Nous définissons ensuite la fonction économique -à deux variables- de la station, représentant le revenu moyen par

unité de temps de la station, face à un comportement individuel ou collectif des clients ; nous en étudions les propriétés

et nous montrons notamment, que cette fonction est unimodale en chacune des variables, l'autre variable étant fixée.

Enfin, nous caractérisons une solution optimale de ce -problème et nous décrivons une procédure pour déterminer une telle

solution.

(27)

XXI

Dans une troisième partie (Chapitres VIT et VTTI), nous examinons un système d'attente M/M/1 à taux de service variable et dont le serveur applique une politique avec hystérèse

(cf.§A.2 de cette introduction).

Dans le chapitre VII, nous généralisons les relations fondamentales -que nous avons établies au chapitre V- entre les distributions stationnaires correspondant respectivement à des politiques (0,k) et (0,1) d'un serveur amovible, au cas de politiques avec hystérèse uniforme dans un système à plusieurs taux de service (y =0<y < . . . <\i „< . . . <y }.

o 1 -c m

Une politique avec hystérèse uniforme (A,H) est déterminée par un ensemble de paramètres A={A =0,A.,...,A ="} et par H la

1 2 m

longueur des hystérêses, de manière telle que si le taux

service est nombre de clients présents

dans le système passe de

. l,

l l

p=1 p=1

A +1 ) P â I

p=1

A +H(

P

i

AP 9

le serveur choisit comme nouveau taux de service Nous montrons que le produit par H de la probabilité d'avoir j

clients dans le système quand le serveur applique la politique (Â,H) est égal, si j<H, à la probabilité qu'il y ait au

plus j clients dans le système et, si j>H, à la probabilité qu'il y ait entre j-H+1 et j clients dans le système quand le serveur applique la politique (A,l).

(28)

Dans le chapitre VIII, nous examinons la possibilité d'étudier le comportement optimal des clients dans un système à taux de service variaVe et nous indiquons les difficultés et l'intérêt d'une telle étude.

(29)

P

remière

P

artie

CLIENTS IMPATIENTS

(30)

On considère un système d'attente caractérisé comme suit :

- S guichets avec, chacun, un serveur en permanence ;

- le processus des arrivées est un processus de Poisson de paramètre X ;

- les durées de service sont distribuées suivant une loi exponen>

tielle négative de paramètre p ;

- connaissant l'état du système-c.-à-d. le nombre de clients dans le système- au moment de leur arrivée, les clients ont la possibilité de ne pas joindre la file (impatience a

priori). Soit D^ la probabilité stationnaire conditionnelle de joindre la file pour un client trouvant i personnes

dans le système à son arrivée ; 1 - est donc la probabilité de ne pas joindre la file dans les memes conditions ;

- chaque client ne dispose que d'un certain temps d'attente ; ces temps disponibles pour l'attente en file sont distribués suivant une loi exponentielle négative de paramètre a. Si le temps d'attente d'un client atteint le temps disponible, ce client quitte la file sans être servi (impatience a

posteriori) ; cependant un client se faisant servir n'est jamais impatient (impatience a po st er ior i ^-rel at i ve ) ;

- les variables aléatoires représentant les interarrivées, les durées de service et les temps d'attente disponibles sont des variables mutuellement indépendantes ;

(31)

2

- la discipline de file est la suivante : lorsque le serveur commence un nouveau service, il sert le client, qui, parmi ceux qui sont en file, est arrivé le premier.

On associe à ce système une structure de coût et de gain^ identique pour chaque client :

- un client qui décide de ne pas joindre la file paye une pénalité de ^ (“ > £ > 0) ;

- un client qui termine son service obtient un gain de g.

Plus précisément : g = G - 0 avec G gain obtenu {“ > G > 0) 6 prix demandé par le

serveur pour le service (œ > 0 > 0) ;

- chaque unité de temps passée dans le système par un client entraîne pour celui-ci un coût c («> > c > 0) ;

- un client qui, après avoir joint la file, la quitte par

impatience a posteriori, paye une pénalité de ^ ^ N. B. Dans les modèles de Naor [ 38) et Yechiali [ Uo) , I Ul], les

clients ne sont pas impatients a posteriori ; On a donc a = 0 et la pénalité n'a pas de raison d'être.

Hypothèses.

Afin d'éliminer des cas triviaux, nous supposons que

et

g - - > - £

c + - l) > 0

(I. 1 )

(

1

.

2

)

(32)

Ces hypothèses seront justifiées au paragraphe suivant.

L'hypothèse (l.l) implique que pour G,c,u et Z fixés, on a

e e [ 0, G + £ -

(1.3)

Classification des stratégies.

On ne considère que les stratégies stationnaires (politiques) ; soit C l'ensemble de aes stratégies.

Une politique est donc déterminée par un ensemble de valeurs {D^, i = 0,1,2,...}. Définissons différents sous-ensembles de politique s.

C ^ : ensemble des politiques avec limite de contrôle.

Une politique avec limite de contrôle n (n = 0,1,2,...) est définie par

1 > D. >0

1

D . = 0

1

, 1 < n , i > n Soit l'ensemble de ces politiques.

Une politique avec limite de contrôle infinie est définie par

D . > 0 , V i 1

Soit S l'ensemble de ces politiques.

On a donc Cpy = ( '-’ S ) U S nei ^

, avec I = {0,1,...}

Cj^ : ensemble des politiques déterministes.

Une politique déterministe est définie par

D . 1 0 ou 1 V i

(33)

k

C : ensemble des politiques déterministes avec limite de DCL

contrôle.

On a, par définition, C = C H c DuL D OJj

1.2. Optimisation individuelle.

Supposons dans ce paragraphe, que chaque client se comporte de manière individuelle, c'est-à-dire qu'il cherche à optimiser son propre gain sans s'occuper des autres clients ; chaque client est donc un preneur de décision.

1.2.1. Détermination_de_la_politique_optimale.

Appelons (i > 0) un client qui trouve i clients dans le système à son arrivée et W(A^) le temps moyen que

A^ va passer dans le système s'il joint la file.

Si 3^ représente la probabilité que A^ soit servi s'il joint la file, on a

1 i < S

e.1 , i-S+1

n

a

1 ni i > S

où représente la probabilité pour qu'un client qui est le m*^ en file, ne quitte pas le système par impatience avant que

le nombre de clients devant lui n'ait diminué d'une unité.

En généralisant les résultats de Ancker et Gafarian (h2]

au cas où il y a S serveurs, on obtient

(34)

et donc

SM + (m - 1 )g

"* SM + moi

3.

1

___ ^

Sm + ( i - S + 1 )a

i < S

i > S

Dès lors, si joint la file, l'espérance mathématique de son gain vaut

G(A.) = g3. - -e,(l - 3.) - cW(A.)

On a de manière évidente

W(A^)

M i < S

PROPOSITION 1.

Démonstration»

a) Remarque préliminaire.

Plaçons-nous à un instant quelconque et supposons qu'il y ait j + S clients dans le système (S clients aux guichets, j clients en file). Le temps moyen qui s'écoule depuis cet instant jusqu'au moment du premier départ d'un de ces j + S

clients -soit par fin de service d'un des S clients aux guichets.

(35)

6

soit par impatience a posteriori d'un des j clients en file- vaut --- ^---

Sy + ja

(E[min(T^,... ,Tg,T^ ••..,Tj)]

avec (i = = exponentielle négative de paramètre y T!^ (i = = exponentielle négative de paramètre a T.,...,T„,T',...,T! = variables indépendantes)

1 S I ’ J

b) Supposons d'abord que (i > S) se fasse servir

(événement de probabilité 3^). Dans ce cas, le temps moyen passé dans le système vaut, étant donné a) :

1_______

Sy+(i-S+1 )a +

1_______

Sy+(i-S)a +

+ 1 - +

Sy+a 2 y

— +1 y

i-S+ 1 l t = 1

1 Sy+ ta

c) Supposons maintenant que (i > S) parte par impatience a posteriori (événement de probabilité 1 - 3^)

Considérons l'ensemble des i clients dans le système et A^.

Parmi ces clients :

• A^ partira le premier avec la probabilité

1 - a. „ , = -T---7-s—^^—7;—:—r-r- ; dans ce cas, le temps moyen

i-S+1 sy + (1 - S + 1)a ’ ’ ^ •'

passé par A . 1

________ 1________

Sy + (1 - S + 1)a dans le système vaut

(36)

• partira le deuxième avec la probabilité

■ “i-s> ' s;. * ! 1 -°s t 1 )a >

moyen passé par dans le système vaut 1 1

Sp +(i - S +1)a Sp + (i - S)a

A^ partira le (i - S + l)eme

avec la probabilité

“i-S+1 ■ “i-S... “2'^’ ~ “1^ “ Sp + (i - S + 1)a i dans ce cas, le temps moyen passé par A^ dans le système vaut

1 .1 Sp + ( i - S + 1 )a +

...

+ Sp + a

Dès lors, si A^ quitte la file par impatience à posteriori, le temps moyen qu'il passe dans le système vaut

(i - S)

Sp + (i - s +ÏTa i - S + 1 ' Sp + (i - S)a

+

...

+ i - S + 1 ' Sp + 2a i - S + 1 * Sp + a i-S+1

y ______ î______ _____i f; i-S+1*Sp +

X “ I Sp + ta

d) Par conséquent, pour i ^ S i-S+1

^(^i) = iI7

_______§J!_________ __ (I + y

+ ( i - S + 1 )a ''P Sp + ta i-S+ 1

+ (i - S -t- 1 )g ( y t 1 N Sp + ( i - S + 1 )a'' i - S + 1 * Sp + ta''

(37)

8

____________S__________ __

SM + ( i - S + 1 )a

T — 1

____________ 1____________ / r , SM ^ ta vx

^ SM + (i - S + 1)a' 'Sm + ta SM + ta''

________ i + 1

SM + ( i - S + 1 )a '

c . q,. f. d .

On a donc finalement

G(A. )

i<S

SM + ( i-S+ 1 )a^® SM--^^ ( i-S+1 )a-c( i+1 ) ) i>S

(I.U)

Si ne joint pas la file, son gain vaut -t.

L'espérance mathématique du gain de A^ vaut donc

D. G(A^) + (1 - D^)(-£)

Dès lors, le comportement optimal de A^ sera de

- joindre la file (D^ = 1) si G(A£) > -t

- ne pas joindre la file = 0) si G(A^) < -i- De plus, étant donné que pour i > S,

G(A^)-G(A^^^ ) = (sp+( i-S+1 )aHSM+( i-S + 2 )a) ^"^1 â ® ~ M^ ’

(38)

et que

G(As) 1 g - J

les hypothèses (l.l) et (1.2) impliquent que GCA^) est une fonction non croissante de i (Si a > 0, G(A^) est une fonction strictement décroissante de i pour i > S - l)

Par conséquent, la politique optimale appliquée par des clients se comportant individuellement, sera une politique déterministe avec limite de contrôle.

( S )

Soit n la limite de contrôle.

s On a donc

D. = 1 et G(A.) > -l <—► i < n' '

D. = 0 et G(A.) < -t i > n^^^

1 1 - s

c'est-à-dire qu'un client joindra la file si et seulement s'il

( S ) V

y a moins de n clients dans le système quand il arrive.

s

Détermination de n(S)

L'inégalité G(A^) > -t peut s'écrire, pour i aU^ - t)

Sy(g + l + •) > ( i + 1)(c + a(-£^ - t))

ou encore, grâce à l'hypothèse (1.2), sy

c + a(£^ - Z)

Oi{l. - l)

(g + £ + --- ) > i + 1

AI

(39)

est tel que

- 10 -

Etant donné que le nombre n(S)

G(A ,g)) < -i < G(A ,3) ) .

n n -1

on obtient finalement

n^^^ < S V < n<2> . 1

s s s (1.5)

avec

s c

a(l. - £)

( g + •^ + --- r;---)

( 1 . 6 )

1.2.2. Propriétés de la limite de contrôle n(S)

En vertu des hypothèses (l.l) et (l.2), on a

et par conséquent

V > 1 s -

> S

Remarque : Interprétation de l'hypothèse (l.l) L'hypothèse (l.l) exprime que

G(A^) > - •^ , V i < S

c'est-à-dire qu'un client qui trouve un guichet libre lorsqu'il arrive, joindra toujours la file (D^ = 1,Vi < S)

(40)

La relation (1.6) peut s'écrire

'’s ' ' * * a(i'( -T)- ^

Dès lors,

a) si_£^ fonction décroissante de a. Va > 0 ; b) si_£^_^_£ , ne dépend pas de a

c) si , V est une fonction croissante de a, pour

0 < a < £—^ £ . (valeurr de a qui vérifient l'hypothèse (l.2)).

Interprétation économique.

■ • t représente .a pénalité infligée à un client qui ne joint pas

I

la file ;

• ^ représente le coît tot.il moyen imposé à un client qui joint la fi e mais qui la luitte ensuite par impatience avant d'être servi = teups moyen passé en file par un client impatient a posteriori).

Far conséquent, l'hypothèse (1.2), qui peut encore s'écrire a ^ c. # 0, revient à supposer que le coût total moyen imposé à n client impatient a posteriori est

supérieur è celui mpcsé à un client impatient a priori', autrement dit, la qu'^ntité x^sitive c + a - t) pénalise, par unité

(41)

12

de temps passée dans la file, le feit pour un client d'avoir joint la file et de ne pas et ’e servi, prr i apport e.u fait de ne pas joindre la file.

Dès lors, l'h;'pothèse (1.2) implique qu'un client ne se "risque" à joindre la file que si J a probabilité qu'il soit servi est suffisamment éjrande, c'est-à-dire si la file n'est pas trop encombrée (moins de n^ clients).

De plus, si > Z (Z^ < £), plus le taux d'impatience est grand, plus la pénalité c + a(£^ - Z) est grande (petite) et plus (moins) le client "hésite" à joindre la file ; si i “ cette pénalité est indépendante de la valeur de a et le taux d'impatience n'influence donc pas le comportement des clients

(en particulier, ce comportement est le même que les clients soient impatients a posteriori ou non).

Remarque. Interprétation de l'hypothèse (1.2).

L'interprétation économique ci-dessus fournit également l'interprétation de l'hypothèse (1.2).

D'autre part, on constate que si l'hypothèse (1.2) n'était pas vérifiée (c + a(£.^ - Z) < O), il en résulterait G(A^) > -Z et ^ c'est-à-dire qu'un client joindrait la file quel que soit l'état du système à son arrivée ; la politique optimale serait dore la politique déterministe avec limite de

contrôle infinie. (Remarquons d'ailleurs que si l'on avait

- £ < g - f'c’^ction G(A^) serait même croissante i, ce qui n'aurait plus guère de signification économique).

avec

(42)

une fonction croissante de S :

„<=> > * 1 s - s

Soient 2 valeurs, et Sp, de S ; à partir de la relation (l.5), on obtient aisément

S, (Sp) (s,) S (S )

s; “s ' - ' < ”s ' < sf % " * ‘

en particulier pour S. = S et Sp = 1, on peut écrire

n"> < n< = > < S(n<'> * 1).

S - s

Pour terminer ce paragraphe, constatons que le processus des arrivées ne joue aucun rôle da.ns la détermination de la

T

politique optimale appliquée par des clients se comportent individuellement. Ceci laisse présager que si les clients u'allient pour optimiser en commun leur gain, on ne trouvera pas nécessairement la même politique optimale, puisque le processus des arrivées interviendra inévitablement dans la détermination d'une telle politique.

Cette supposition se vérifiera au paragraphe suivant, consacré à l'optimisation sociale.

(43)

lU

1.3. Optimisation sociale.

Supposons que les clients se comportent de manière col­

lective, c'est-à-dire qu'ils recherchent à optimiser le gain moyen total par client, ou, ce qui revient au même, par unité de

temps ; tous les clients sont donc sous le contrôle d'un seul preneur de décision, représentant le bien général.

Désignons par G le gain moyen total par unité de temps si les clients appliquent une politique R ; nous noterons G “ G (n) si R est une politique avec limite de contrôle

RR •

n et G = G (®) si R est une politique avec limite de contrôle infinie.

Nous dirons que deux politiques R et R' sont G-équivalentes

Dans le cas particulier où les clients ne sont pas

impatients a posteriori (a = 0), Yechiali a démontré les 2 lemmes suivants (cf. I40] théorème 3 p.358 et lemme U. p.357) :

Lemme 1.

Si l'ensemble des états possibles du système est fini, il existe une politique déterministe avec limite de contrôle qui maximise G .

Lemme 2.

Pour toute politique R G C , il existe une politique O

G-équivalente R' G ^CL*

Il est aisé de constater que les démonstrations 4e ces lemmes restent valables pour le cas de clients impatients à posteriori (a ^ 0).

(44)

Dès lors, en vertu du lemme 2, nous pouvons nous limiter à la considération des politiques R avec limite de contrôle.

1.3.1. Propriété s_du_ s jrst |çê_l°rs une politique G C .

— —— — — — — — ^ j_,

Soit {D^} , i > 0, une suite de nombres réels tels que 0 < D. < 1 Vi > 0.

1 -

Considérons la politique R(n) avec limite de contrôle n

(l < n < <*>) déterminée par les n premiers termes de la suite ; la capacité du système est donc limitée à n.

Désignons par p^^’’^{n), ou pour alléger la notation O

par p?(n), (O < i < n) la probabilité stationnaire qu'il y ait i clients dans le système si la politique R(n) est appliqué e.

Par la méthode des bilans de probabilité, on obtient aisément r X D

(n)=

ly

i-1 R /_\

Pj.,(n)

Sy + (i - S)a ^i-1 (n)

0 < i < min(n,S)

S < i < n

(1.7)

et

(45)

16

min(n,s)

j=o I

. n-S i-1

X ^

n

( su + kci )

n

D

k= 1_____________ p=o ^

. n-S j-1 • n-S j-1 ’

X-^ n (Sy + ka) HD X*^ n (Sy+ka) n D k=i P=o ^ ___________ P=o ^

j! y*^ j=S+1 S! y^

0< i<min ( n .S

n-S i-1

n

(Sy+ka)

n

D

k=i-S+1 £-=0. S! y'

. n-S j-1

. , x*^ n

(Sy + ka)

n

D

k=1__________ p = o P

j=o j!

. S< i< n

. n-S j-1

n (sy+ka) no

^ k

=

j

-S+ 1___________p=o ^ J=s+1 S! y

N . B.

Nous adoptons la convention d'écriture : m- 1

n (...)= 1

k= m

m- 1

et ^ (...)= 0 k=m

, Cette convention reste valable pour tout le travail.

Propriété 1.

On peut vérifier aisément que

p^(n) - p^(n + 1) = p^(n) P

n+ 1 ( n + 1 ) 0 < i < n,

>» >» R En particulier, cette propriété implique que pV(n) fonction décroissante de n.

est une

(46)

Désignons par

min(n,S-1)

v^(n)= I (S-i)p^(n)

i = o

le nombre moyen de serveurs inoccupés et par P (n) la

probabilité qu'un client qui arrive dans le système, se joigne à la file et soit servi.

N. B.

On a, par application directe de la propriété 1,

v^(n + 1) = v^(n)(l - p^^^(n + 1))

( 1 . 8 )

Propriété ^

P^(n) = ^ (S - v^(n))

En effet, par définition.

P^(n) = [ D p^(n) B.

i =o

et par conséquent, on obtient successivement

„ min(n-1,S-l) n-1

^ ^i ^ Su + (i - S + l)a^i

1=0 i=S

min(n-1 ,S-1 )/ . . . \ „ n-1

= î - .1

1 = 0 i = S

Su R / \

(en tenant compte de (I.T) )

(47)

18

rn i n ( n , s )

i=S+l

= ^ (S - V^(n))

On sait, en vertu de l'équilibre du système en

régime stationnaire, que, par unité de temps, le nombre moyen de clients qui partent par impatience a posteriori est égal au nombre moyen de clients qui joignent la file moins le nombre moyen de clients servis ; étant donné la propriété 2, le nombre moyen de départs, par unité de temps, dus à

l'impatience a posteriori vaut donc

i = o

y» R

Désignons par N^(n) le nombre moyen de clients présents dans le système

N . B.

On a, par application directe de la propriété 1,

N^(n + 1) = Nj(n)(l - p^^^(n + 1)) + (n + 1) i(n +

Propriété sT

( n )

s I

1 = 0

1 ) (1.9)

(48)

Démonstration.

Démontrons cette propriété par récurrence a) Soit n < S

On a {n) = n l i = 1 Comme

X

a

n- 1

1 D. p.(n ) -

1=0

la propriété est démontrée

b) Si la propriété est pour n + 1

R, -R-

-R

La propriété étant vraie pour n, il vient, grâce à la relation (1.9) :

n ” 1

N^(n + 1) = ^ D. pj(n) + (1 - ^)(S - v^(n)))(l - 1 ( n + D)

“i = o

+ ( n + 1 ) p^^ 1 ^ ^ ^

et, en tenant compte de la propriété 1 et de la relation (I.8),

N^(n + 1) = - ^ D. p^(n + 1) + (1 - ^)(S - V^(n + I))

s Cl . 1 1 et

1=0

- ï “n * ’> - =<’ - a> * '>

+ (n + 1 ) p^^ ^(n + 1 )

(49)

20

Or, étant donné

R ! 1) = X D

Sy + (n + 1 - S)a

pjn^ i 1 ) , (en vertu de (1.7))

On trouve

■ a ^n ^ ^n+1 ^ + 1) + (n + l)p^^^(n+1) =0

ce qui montre que la propriété est vraie pour n + 1

c . q.f . d .

Remarque.

La propriété 3 peut encore s'écrire

N^(n) = (S - v^(n)) + p?(n) - y(S - V^(n))) ;

s “ i-o ^ ^

On constate donc que le nombre moyen de clients présents dans le système est égal au nombre moyen de serveurs occupés,

augmenté du produit du nombre moyen -par unité de temps- de clients impatients à posteriori, par le temps moyen passé en file par un client impatient a posteriori

Propriété ITT Soit

L^(n + 1)

n + 1 - (n) ______________s

V ( n )

(cette fonction interviendra dans les paragraphes suivants)

(50)

On a les relations

En particulier, cette propriété implique que la fonction P

L (n) est une fonction croissante de n.

Démonstration.

a) On peut écrire, en tenant compte de (l.8),

v^(n)(L^(n + 1) - L^(n)) = n + 1 - N^(n) - (l - p^(n))(n - N^(n-

S ti s

La relation (1.9) montre que le deuxième membre de cette

égalité vaut 1 et, par conséquent, le point a) de la propriété est démontré.

b) Etant donné a), on obtient

L^{n + 1) = I —T--- + 1) , n > S

£=S+1 v^(£)

Comme

L (S + 1 ) =

S + 1 - N^(S)

-W-

= 1 +

v^(S)

et

L^(S) =

S - N (S - 1 )

__________S

v^(s - 1)

= 1,

(51)

22

on trouve finalement

L^(n + 1) + n

l=S

I

v^(£)

n > S - 1 .

c . q. f . d .

Rem ar que b .

a) Si les clients appliquent une politique R avec limite de contrôle infinie et que l'on suppose qu'il existe un régime stationnaire, on obtient alors

p.(<») = lim p.(n)

et l'on introduit de manière équivalente

-R R

v^(oo) =

(s

- i ) p. («)

i=o ^

P^(oo) = [ D. p^(») B.

i = o

N^(oo) = J i p^{<») s i = 1 ^

b) Si R est la politique déterministe avec limite de contrôle n, nous omettrons volontairement d'indiquer l'indice R dans les différentes notations introduites jusqu'ici ; nous écrirons donc G(n), p^(n), v(n), etc...

Notons, de plus, que pour une telle politique, on a n- 1

I D. p.(n) =

1=0

- p_^(„) 1

(52)

1.3.2. Détermination_de_la_gol it Î3ue_02t i5âl.S

Détermination de G^(n) et G^(°°)

On a, par définition.

G^(n) = g X nombre moyen de clients servis par unité de temps + (--c) X nombre moyen de clients dans le système par unité

de temps +

(--Z^ X nombre moyen de clients quittant le système par impatience a posteriori, par unité de temps + {--Z) X nombre moyen de clients ne joignant pas la file

par unité de temps.

et, avec les notations introduites au paragraphe précédent.

G^(n) = g

n- 1

.p(S - v^(n)) - c N^(n) - 1 D^p^(n) - y(S-v^(n))) i = o

-^X ( 1 - [ p^(n) ) i = o

En tenant compte de (1.7), on peut encore écrire :

G^(n) = X

n-1 P (g + )SD - (i + 1)c

l Dj p.(n)( SP . (i - s . i)a * ^ - i,) 1 “ O

+

min(n-1,S-l) (g + -^.)m ~ c

X y D. p.(n)( + Z - Z.) - X Z

1 = 0

et donc, en vertu de ( I. !+) ,

G^(n) = ^ J Di Pi(n)(G(A^) + l) - X l.

i = o

(53)

2k

De la même manière, on peut déterminer OO

, V r. _R,

G^(“) = ^ l Di Pi(~)(G(A.) + l) - \ t.

1 = 0

PROPOSITION 2. Il existe une politique optimale qui est * •

, . . . . ( S )

déterministe avec limite de contrôle n telle que r,(S) < ^(S)

n < n O - s

Démonstration.

Une politique optimale sera déterminée par un ensemble optimal {D^} (i = 0,1,2,...) qui réalise

pR({D .} ) max G 1 {D.}

1

où R({D^}) est la politique déterminée par l'ensemble {D^}

En vertu du lemme 2, il existe une politique optimale R G ((U

s )U s).

Etant donné que l'on a

n n

•G(A.)+^<0 , Vi>n

1 - s

• D. p^(n) > 0 , Vi,Vn

(S) (définition de n^^^)

• p^(n) fonction décroissante de n (propriété 1) il est clair que l'on aura nécessairement

D. = 0 Vi > n^^^

1 - s

Par conséquent l'on peut se restreindre, pour la

recherche d'une politique optimale, à l'ensemble des politiques R G ( S ). L'ensemble des états possibles du système est

n<n ^

alors fini puisqu'il se réduit aux valeurs i = 0,1,2,...,n (n <

- S

(54)

Dans ce cas, le leranie 1 assure l'existence d'une politique optimale déterministe avec limite de contrôle, ce qui démontre la proposition.

c.q.i*.d.

Détermination de (S)

( q ^ ^ .

n est donc la limite de contrôle optimale du point O

de vue de l'optimisation sociale ; en vertu de la proposition ci-de s sus , (S) est caractérisée par

G(n^^ ^ ) = max /„v G(n)

° o<n<n^^^

- - s

Propriété 5• La fonction discrète G(n) est unimodale .

Démonstration .

G(n) peut s'écrire min(n-1,S-2 )

G(n)=X I Pj^(n) (g + £ -

i = o ^

n-1 Sp ( g+£. )-(-£.-£)( i-S+1 )a -(i+l)c

* '

.J

, ---su ! (i-S.l)a--- > - i — O *" 1

et, en tenant compte de (1.7),

min(n,S-l) a(-^ - t)

G(n)= I ip (n)(p(g+£ + --- --- i = 1

))

+ p.(n)(Sp(g+£ + i = S

a(£, - l)

■))

^ i P . ( n ) ( c+a -£ )) - X£

i = 1

(55)

26

n min(n,S-l) n

= {c+a{l.-l)){\> (s I p.(n)+ I ip.(n))- I ip.(n)}- XI

^ ^ i=S ^ i=1 ^ i=1 ^

= (c+a(£ -£)){v (S-v{n))-N (n)}- XI

I s s

où \) est donné par la relation (1.6).

s

Par conséquent, l'inégalité G(n) > G(n+1) est équivalente, étant donné l'hypothèse (l.2), à

V (v(n) - v(n+l)) + N (n) - N (n+l) < 0

S SS

ou, en vertu des relations (1.8) et (1.9), à

Vg v(n) p^^^(n+1) + N^(n) p^^^(h+l) - (n+1) p^^^(n+1 ) < 0.

Finalement, l'inégalité G(n) > G(n+1) est équivalente aV

n+1 - N (n)

V < ------- = L(n+1). (1.10)

^ v(n)

Comme la fonction L(n) est une fonction croissante de n (propriété U), G(n) est bien une fonction unimodale.

c . q. f . d .

La limite de contrôle

G ( n G ( n

(S) O

(S) ) -

) - G (n(S)

est dès lors caractérisée

+ 1 ) > 0 -1 ) > 0 par

(56)

ou, en vertu de (l.lO), par

) < V < L(n^^^ + 1 )

O - s O (1.11)

N .B.

Cette maniéré de déterminer n(S)

-en utilisant la fonction L(n)- n'avait pas été introduite par Naor l38J (modèle sans impatience a posteriori : cas a=o). Grâce à la propriété U, cette nouvelle caractérisation de n(S)

d'étudier plus aisément les propriétés de n

va nous permettre (S)

1.3.3. Progriétés_de_la_limite_de_çontrôle n(S)

En vertu de la proposition du paragraphe précédent, on

_(S) ^ _(S)

< n

Comme

V > 1 s -

et

L(S) = 1

on a toujours

(S) > S.

(57)

28

Variation de n(S)

par rapport à

Lemme 3.

L(S+ 1 ) ne dépend pas de a.

a.

L(n) est une fonction décroissante de a pour n>S+1 .

En effet, on a L(S+1) = 1+ --- , où v(S) ne v(S) _ ^

dépend pas de a puisque lorsque la capacité du système est égale au nombre de serveurs, les clients ne sont jamais

impatients a posteriori.

D'autre part, en vertu de (1.8) et du fait que p^^^(n+l), pour n>S, est une fonction décroissante de a, on montre aisément par récurrence que v(-C), pour £>S, est une fonction croissante de a ; dès lors, la propriété U prouve que L(n) est une fonction décroissante de a pour n > S +1 .

PROPOSITION 3. Si l alors

1 > £ et si

vaut S quel

pour a que soit

= a > 0, a > a.

Etant donné que L(S+1) ne dépend pas de a, cette proposition découle immédiatement du fait que, si > ■£., est une fonction non croissante de a (a > 0).

rappo rt de Vs

Pour l'étude générale de la variation de n(S)

par à a, reprenons les trois cas envisagés pour la variation ( et de (S) ) par rapport à a.

(58)

a) si_£^ ^» il est aisé de constater par un cont re-exemple que

v(s) (s) y.

-contrairement an - n' n'est pas nécessairement une fonc-

s O

tien non croissante de a(a> o). (Par exemple, si S = 1, on a X = 1 . U = 2, c = 10, g + £ = 21 et - l = ^,

n^ =2 pour a = 0 et n^ =3 pour a = 1 ; ou encore si S = 1, X = 2, y = 1, c = 2, g + £ = 20 et ^ , on a '= 2 pour a = o et n^ =3 pour a = 1, alors que

( S )

( s )

n' -10 pour a - o et n =9 pour a=l). On peut constater

S 5

( S )

également par un contre-exemple que n^ n'est pas non plus une fonction unimodale de a. (Par exemple, si S = 1, X = 100,

(S) = U on a n

y = 1, c = 1, -£ = 10 et g+^ ■ P ^ 1.500.000,

( S ) ( S )

pour a= 0, n' =3 pour a= 2, n^ =4 pour a = U et

( q \

n^ =3 pour a = 500).

(S)

b) si_4^_= 4» comme ne dépend pas de a, o est une fonction non décroissante de a (a > O).

Par conséquent, contrairement au cas de l'optimisation individuelle, si - t, on ne retrouve pas nécessairement le même résultat quelle que soit la valeur de a. La limite

optimale de contrôle n^ pour des clients impatients a

posteriori (a>o) n'est jamais inférieure à cette même limite pour des clients non impatients a posteriori.

c) Si £, <£» comme V est une fonction croissante de a, n^ est une fonction non décroissante de a (0 < a < •

(59)

30

Remarque. Si l'hypothèse (1.2) n'était pas vérifiée, il est

aisé de montrer que la fonction G (n) serait une fonction crois­

sante de n et, par conséquent, la politique optimale serait une politique avec limite de contrôle infinie.

Variation de n avec S.

______________________ O________________

Désignons par p*(n) (0 < i < n) les probabilités stationnaires du système et par V (n) le nombre moyen de

serveurs inoccupés, lorsque le système comprend (S-l) serveurs (et que les clients appliquent une politique déterministe avec limite de contrôle n).

Lerame 4. -*

V ( n- 1 ) < v(n) Pour n>S

Démonstration par récurrence.

• la propriété est vraie pour n=S c'est-à-dire v (S-1) < v(S).

Posons P “

On a

V*(S-1) I (S-1-i) P*(S-1) i=o

S-2

I (S-1-i) i = o

S-1

1

j =o

i P_

i !

(60)

et

S- 1

v(S) = I (S-i) p^(S)

1 = 0

S-2 i S-1 i

I (s-1-i) I

t

* tr

i = o_____________________ 1 = 0_____

j=oJ‘ S!

_★

L'inégalité v (S-l) < v(S) est donc équivalente à

«S S-2 ^i S-1 ^i - fr I (s-'-i) (.1 TT)'

1 = 0 1=0

ou encore a

) ■ siTAïf ï jm

p-S

Pour vérifier la relation -*V (S-l) < V(S ) , il suffit donc de montrer que

, \ S-1 S-1

(2s-

-p) < y y 1-

S! (p-s)î - > nt j = o -c-o

j+-^ = P

S<p<2S-2^,

ce qui s'écrit aussi

S-1

us-p) i I

j=p-S+1

ou encore

(2S-1-P) <

I n (-^)

j=p-S+i £=1 P

Références

Documents relatifs

The peptide endothelin (ET) was first identified as a potent vasoconstrictor produced by endothélial cells. It is one of the most potent endogenous vascular smooth

Increased antigen spécifie responses may also hâve been caused by a nonspecific general increased immune response in patients with bladder cancer or increased nonspecific

Cependant, cette action est loin d'avoir pleinement atteint ses objectifs d'égalisation juridique et sociale des enfants illégitimes par rapport aux légitimes, puisque, ainsi que

Observons en tout premier lieu , que la charge é- tant héréditaire, il ne fallait pas dresser d'tmyt-pr pour la transmettre [l26].- Si un imyt-pr a été fait, c'est qu'une

Hormis les principales fibres de synthèse utilisées actuellement, les fibres de chrysotile présentent, de par leurs caractéristiques mé- caniques, un potentiel important d'agents

oeuvre commune. C'est la pratique surtout qui a suggéré l'idée et le fond du manuel. Là, sont réunies des remarques personnelles ti­ rées de l'expérience, rédigées sous forme

enfant ou un adolescent sur ses loisirs, il ne pensera pas à l'école, qui lui semble le plus souvent comme une contrainte, mais bien au temps dont il dispose librement après

résista pas longtemps à ces secousses nouvelles et sou- vent répétées, et il fut bientôt affect é du délire des ivre-.. Sa femme le fit contenir par plusieurs hommes;