Présentation - Génération des comportements

2.3 G´en´eration des comportements

2.3.1 Pr´esentation

Cette première partie présente les objectifs poursuivis lors de la conception de l’algorithme. Nous décrivons ensuite son fonctionnement, puis de quelle fa¸con il répond au besoin ciblé. 2.3.1.1 Objectifs

L’algorithme présenté dans cette partie a pour but de prendre en compte différents besoins utilisateurs : généricité, flexibilité et reproductibilité.

Les premiers critères de généricité et de flexibilité sont liés au besoin d’utiliser un algorithme indépendant du domaine étudié. Il pourra être appliqué à l’identique dans différents cas d’utilisation, avec une simple redéfinition de ses éléments de base et sans modification de sa structure. Outre cette indépendance, il s’agit de limiter les changements de configuration entre différentes simulations. L’intervention sur un algorithme n’est en effet pas envisageable pour tous les utilisateurs, car elle nécessite des connaissances poussées, et ce même si des points d’entrée adéquats sont fournis. Nous cherchons donc à rendre cette configuration la plus limitée possible. Intro- duire dans l’algorithme des éléments de contrôle de haut niveau permet de répondre à cette problématique.

Le second point concerne la reproductibilité des résultats. Suivant les besoins de l’utilisateur, celui-ci peut souhaiter avoir une génération totalement déterministe, afin d’être en mesure de reproduire la configuration initiale demandée, ou introduire différents degrés d’aléatoire. Si l’objectif est d’expérimenter des comportements émergents, il peut en effet être intéressant d’introduire des comportements non spécifiés, voire même potentiellement aberrants, afin d’étudier leur influence sur les résultats de la simulation. L’algorithme prend donc en compte ces besoins variés12.

L’approche utilisée par Reynolds [Reynolds, 1999] pour le suivi de chemin flou, que nous avons vu dans le Chapitre 1, présente une certaine similitude avec les résultats que nous cherchons à obtenir. Le modèle qu’il introduit permet de contraindre faiblement la trajectoire des

12. Notons qu’en théorie il suffit de stocker les graines des générateurs aléatoires utilisés afin de reproduire les données à l’identique. En pratique cela reste très difficile : les générateurs et leur fonctionnement sont souvent dépendants de la plateforme, et la maˆıtrise du processus est insuffisante pour répondre au besoin dès lors que plusieurs générateurs aléatoires influent les uns sur les autres.

Afin de répondre aux besoins présentés ci-dessus, nous avons construit un algorithme indé- pendant du domaine étudié, permettant de spécifier globalement le déterminisme et offrant la possibilité d’être contrôlé de manière fine [Lacroix et al., 2008a].

L’algorithme s’applique sur un élément de l’environnement e ∈ E associé à un ensemble O d’objets. e peut par exemple être un agent et O représenter ses paramètres, ou e peut être une règle de comportement et O contenir ses préconditions. . . Chaque élément o ∈ O est associé à un facteur de probabilité po ∈ [0, 1], ainsi qu’à deux fonctions distinctes. La première, do, est un processus déterministe sur o et la seconde, ndo, est une fonction quelconque, non nécessairement déterministe. A chaque pas de temps t, Ot ⊂ O est l’ensemble des objets qui peuvent être sélectionnés. Enfin un facteur global de déterminisme γ ∈ [0, 1] est spécifié : plus le facteur γ sera grand, plus il y aura de chances que du non-déterminisme soit utilisé au sein de l’algorithme. L’algorithme fonctionne de la manière suivante (Alg. 4). Soit α le résultat du tirage d’une variable aléatoire réelle suivant la loi uniforme sur [0, 1]. Si α est inférieur à γ, le facteur global de déterminisme, alors du non-déterminisme peut être appliqué. Dans ce cas, pour chaque objet de e on tire un second nombre pseudo-aléatoire β depuis une distribution réelle uniforme sur [0, 1], puis on compare β et le facteur de probabilité po de l’objet considéré. Si β < po on applique la procédure non déterministe ndo, sinon on applique la procédure déterministe. Finalement, dans le cas où α est supérieur à γ, l’algorithme est purement déterministe : la procédure doest utilisée pour chacun des objets de e.

Exemple 9 Le fonctionnement de l’algorithme peut être illustré sur un exemple simple, celui du comportement de joueurs de football13_{. Pour ce faire, considérons que e est un agent footballeur.} Dans le cadre de cet exemple, O ne contient qu’un élément o1, « tirer », associé au facteur de probabilité po1. La procédure déterministe do1 est la séquence (droite, gauche) répétée : aux pas de temps pairs l’agent tire à droite, aux pas de temps impairs il tire à gauche. La procédure non-déterministe ndo1 est le tirage aléatoire d’une valeur dans la séquence (droite, gauche) avec les coefficients (3₄,1₄).

Observons l’influence de γ et de po sur les probabilités de tirer à droite et à gauche. À un pas de temps impair do1 sélectionne la gauche, et on a alors :

pgauche = γ · (po1· 3 4 + (1 − po1) · 1) + (1 − γ) · 1 pdroite = γ · (po1· 1 4 + (1 − po1) · 0) + (1 − γ) · 0

Algorithme 4 Processus générique d’instanciation d’un élément quelconque associé à des objets. Entrées : e associé à O. po ∈ [0, 1] facteur de probabilité de o, do et ndo process sur o respec-

tivement d´eterministe ou non. γ ∈ [0, 1] facteur global de d´eterminisme.

1: au pas de temps t : Ot⊂ O l’ensemble des objets disponibles

2: α ← uniform random([0, 1])

3: si α < γ alors

4: pour tout o ∈ Ot faire

5: β ← uniform random([0, 1]) 6: si β < po alors 7: ex´ecuter ndo 8: sinon 9: ex´ecuter do 10: fin si 11: fin pour 12: sinon

13: pour tout o ∈ O faire

14: ex´ecuter do 15: fin pour 16: fin si ⇔ pgauche = 1 − γ · po1· 1 4 pdroite = γ · po1· 1 4

Si l’utilisateur fixe γ = 0, pgauche= 1 et pdroite = 0 aux pas de temps impairs, et l’inverse aux pas de temps pairs. Le joueur tirera toujours à gauche, puis à droite, et ainsi de suite : l’algorithme est déterministe. Par ailleurs, comme on peut le voir dans les équations, plus γ augmente et plus la probabilité de tirer à droite augmente. Finalement, po1 influence les probabilités de manière similaire, même si il joue un rôle limité dans un exemple simple comme celui-ci.

Comme l’illustre l’exemple ci dessus, les paramètres γ et les poi influencent la probabilité d’utilisation de la fonction non-déterministe associée à l’objet en cours. Avec plusieurs para- mètres, les facteurs poi permettent de diminuer la probabilité d’utilisation de la fonction non- déterministe indépendament de γ, ce qui fournit des possibilités de contrôle fines.

2.3.1.3 R´eponse aux besoins

Analysons maintenant dans quelle mesure cet algorithme permet de répondre aux différents critères spécifiés, et intéressons nous tout d’abord à la généricité et à la flexibilité. Nous avions déterminé qu’il était nécessaire que l’algorithme soit indépendant du domaine étudié, et qu’il soit facilement configurable. L’application à l’exemple des joueurs de football, puis au modèle de données (illustré dans la Section 2.3.2), permet d’établir la généricité du processus. Il est bien utilisable sur différents domaines d’application14, et l’indépendance au domaine étudié est respectée.

Cette indépendance se fait cependant au détriment de la facilité de configuration, car le paramétrage rendu nécessaire par le critère de généricité reste relativement important. Il est

soient utilisées. Par ailleurs, plus γ augmente, et plus la probabilité d’utiliser les fonctions non- déterministes est élevée (α étant tiré uniformément entre 0 et 1). Ce critère introduit donc un premier élément de contrôle.

Le second élément intervient dès lors que la possibilité d’introduire du non-déterminisme est validée. Dans ce cas, chacun des objets de O a une chance d’appliquer sa procédure non déterministe ndo. Cette chance est limitée par le paramètre po. Il n’est donc pas possible de savoir à l’avance quels sont les objets qui vont appliquer leur procédure non-déterministe, ou combien d’entre eux vont le faire. Ce second niveau d’aléatoire induit par le tirage de β implique que même si le choix du non-déterminisme a été fait à la première étape, seuls certains des objets, sélectionnés eux aussi aléatoirement, appliqueront la procédure non-déterministe fournie par le concepteur. Ce mécanisme permet d’obtenir des tirage très variés, tout en contrôlant la « quantité » de non-déterminisme qui va être introduite : par exemple, si les po sont faibles il y aura peu de chance que leur procédure ndo soit utilisée. Le mécanisme permet en outre à l’utilisateur d’équilibrer finement (avec les po) entre des objets risquant de produire des résultats inattendus ou non souhaités (à cause de ndo), et d’autres qu’au contraire il souhaite voir varier. Ce mécanisme peut ainsi être vu comme un « générateur aléatoire de comportements aléa- toires », si on assimile l’expression des objets de O au comportement de l’élément e.

Dans le document Normer pour mieux varier ? La différenciation comportementale par les normes, et son application au trafic dans les simulateurs de conduite (Page 73-76)