The DART-Europe E-theses Portal

(1)

HAL Id: tel-00335934

https://tel.archives-ouvertes.fr/tel-00335934

Submitted on 31 Oct 2008

HAL is a multi-disciplinary open access archive for the deposit and dissemination of sci- entific research documents, whether they are pub- lished or not. The documents may come from teaching and research institutions in France or abroad, or from public or private research centers.

L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau recherche, publiés ou non, émanant des établissements d’enseignement et de recherche français ou étrangers, des laboratoires publics ou privés.

graphes dans une mémoire d’entreprise : application sur le serveur Atanor

Bruno Pinaud

To cite this version:

Bruno Pinaud. Contribution à la visualisation des connaissances par des graphes dans une mémoire d’entreprise : application sur le serveur Atanor. Autre [cs.OH]. Université de Nantes, 2006. Français.

�tel-00335934�

(2)

Eole Dotorale STIM

Sienes et Tehnologies de l'Information et des Matériaux

Année 2006

N° E.D. : 366256

THESE DE DOCTORAT

Spéialité: INFORMATIQUE

Présentée et soutenue publiquement par

Bruno PINAUD

le 22mai2006

à l'Eole polytehnique de l'université de Nantes

Contribution à la visualisation des onnaissanes par des

graphes dans une mémoire d'entreprise : appliation sur

le serveur Atanor

Jury

Rapporteurs: Jin-Kao Hao, Professeurà lafaulté dessienes d'Angers,

Gilles Venturini, Professeur àl'Eole polytehnique de l'université de Tours,

Examinateurs : Henri Briand, Professeurà l'Eole polytehnique del'universitéde Nantes,

PasaleKuntz, Professeur àl'Eole polytehnique del'université deNantes,

Christel Vrain, Professeurà lafaulté dessienes d'Orléans,

Invités: Jean-Bernard Fournier,Président dudiretoire dePerformanSeCorp.,

Jaques Philippé,Expert sientiquepour PerformanSeCorp.

Direteur de thèse : Henri Briand

Co-enadrante :Pasale Kuntz

Laboratoire:Laboratoire d'Informatiquede NantesAtlantique

2,ruede laHoussinière BP92208

(3)

(4)

CettethèseaétéréaliséegrâeàlaoopérationduLaboratoired'Informa-

tique de Nantes Atlantique (LINA), de l'Eole polytehnique de l'université

de Nantes (Polyteh'Nantes), et de la soiété KnoweSia SAS liale de Per-

formanSe Corp. (Carquefou-44).Je tienstout d'abord àremerier Monsieur

HenriBriandpour avoiraepté d'êtremondireteur dethèse.Jetiens aussi

à remerier vivement Madame Pasale Kuntz pour sa très grande patiene

etson importanteimpliationdans montravailpar un enadrement de tous

lesinstants.JeremerieaussiMessieursJean-Bernard Fournier,PatrikBru-

net, Serge Baquedano et Jaques Philippépour m'avoir aueilli ausein de

PerformanSe et m'avoir fait onane. Je remerie aussi l'ensemble de mes

ollèguesde KnoweSia etPerformanSe, ainsiquel'ensembledu personnel du

départementinformatiquedePolyteh'Nantespourl'ambianedetravailtrès

haleureuseetlaonvivialité.Jeremerie aussivivementMadameCatherine

Galais pour ses nombreuses reletures pointues de publiations anglophones

etsa bonne humeur permanente.

Jetiens aussi àremeriermafamilleetmes amis lesplusprohes notam-

mentVinent Georay, Vinent Fagard,Grégory Fernandez, Marina Goure-

man et William Dupuy pour leur soutien, leur aide et les nombreux bons

moments passés tous ensemble. Je remerie aussi les membres de l'équipe

COD pour leur soutien et leur aide notamment Julien Blanhard, Jérme

Davidainsi queRémiLehn sans quitout e travailn'auraitpas été possible.

JeremerieaussiMessieursGilleVenturinietJin-KaoHaod'avoiraepté

d'êtrelesrapporteursde mathèse,pour l'attentionave laquelleilsl'ontlue

etévaluéeainsiquepourlesremarquesetritiquesonstrutivesqu'ilsm'ont

adressées.

(5)

(6)

1 Introdution 1

2 Représentation visuelle des graphes 11

2.1 Le traé statique . . . 13

2.2 Le traé dynamique . . . 18

2.3 Le traé des grands graphes . . . 21

2.4 Traé tridimensionnel . . . 29

2.5 Au delà des représentations sommets-liens . . . 30

2.6 Les langagesde desription . . . 32

2.7 Conlusion . . . 35

3 Traé de graphes en niveaux 37 3.1 Formalisationdu problème de traé. . . 39

3.2 Etat de l'art pour leproblème statique . . . 40

3.3 Les paysages de reherhe . . . 47

3.4 Les graphes-paysages . . . 52

3.5 Analyse statistiquepour des petits graphes . . . 56

3.6 Analyse statistiquepour des grands graphes . . . 61

4 Présentation de l'algorithme AGH 67 4.1 Prinipe de base des AG. . . 69

4.2 L'algorithme AGH . . . 70

4.3 Validationexpérimentale . . . 77

4.4 Comparaison des stratégies de reherhe loale . . . 81

4.5 Inuene des diérents opérateurs . . . 82

4.6 Comparaisons ave la reherhe Tabou . . . 85

5 Extensions de AGH 89 5.1 Traé dynamique . . . 90

(7)

6 Appliation sur Atanor 101

6.1 Desriptif générald'Atanor . . . 103

6.2 Le modèle des logigrammes . . . 110

6.3 Le modèle Graph'Atanor . . . 112

6.4 Comparaisons expérimentales des modèles . . . 114

6.5 Conlusion . . . 119

7 Conlusion 121 Bibliographie 127 Annexes 141 A L'annuaire GVSR 143 A.1 Desription du ontenu . . . 144

A.2 Desription tehnique . . . 146

B Implémentation de AGH 149

(8)

1.1 Cyle de vie d'une mémoired'entreprise [28℄. . . 3

1.2 Une arte ognitiveréalisée ave le logiielFreemind. . . 5

1.3 Un arbre de défaillane. . . 6

1.4 Un arbre de déision. . . 6

1.5 Un graphe oneptuel . . . 7

2.1 Importanede la onvention de traé . . . 15

2.2 Diérentes onventions de traé . . . 16

2.3 Illustration du respet des ritères esthétiques. . . 17

2.4 Illustration du prinipe de bonne ontinuité des ars [137℄. . . 17

2.5 Illustration d'un traé dynamique. . . 20

2.6 Exemple de sheye . . . 22

2.7 Illustrations des TopologialFisheyes . . . 23

2.8 Arbres hyperboliques . . . 25

2.9 Illustrations de la méthode Online graph drawing . . . 27

2.10 Ahage inrémental de lastruture d'un site web . . . 28

2.11 Exemple de one trees . . . 29

2.12 Représentation dans un espae3D hyberbolique. . . 31

2.13 Métaphore du iruit életronique . . . 31

2.14 Métaphore botanique . . . 32

2.15 Illustrations des treemaps . . . 33

3.1 Un graphe propre . . . 40

3.2 L'heuristique de Sugiyama. . . 41

3.3 Un graphe non orienté . . . 45

3.4 Surfae quadratique . . . 49

3.5 Surfae unimodale . . . 50

3.6 Surfae multimodale simple . . . 50

3.7 Surfae unimodale àgros grains . . . 50

3.8 Surfae multimodale àstruture ombinative . . . 51

3.9 Surfae multimodale sans struture partiulière . . . 51

(9)

3.12 Extrait d'un graphe-paysage assoié àun petit graphe. . . 53

3.13 Un graphe-paysage . . . 54

3.14 Zoomsur legraphe-paysage de lagure 3.13. . . 55

3.15 Distribution des valeurs de laFDC . . . 57

3.16 Hauteur relative des optimaloaux. . . 59

3.17 Probabilitéd'atteindre un optimum loal. . . 60

3.18 Exemple d'appliation de l'opérateurde la médiane. . . 64

3.19 Distribution du nombre de solution

D c G

^. ^. ^. ^. ^. ^. ^. ^. ^. ^. ^. ^. ⁶⁵

3.20 Comparaison entre

d(G)

^et ^le^nombre ^de ^solutions

D c G

^. ^. ^. ^. ⁶⁶

4.1 Prinipegénéral d'un algorithmegénétique. . . 69

4.2 Opérateurs de roisements. . . 74

4.3 Croisementintra-niveaux . . . 75

5.1 Analyse de la qualité des traés. . . 95

5.2 Evolutiondu ritèrede similarité . . . 96

6.1 Positionnementd'Atanor dans l'entreprise . . . 104

6.2 Le module Expert d'Atanor. . . 106

6.3 Module Pratiien :hoixd'une panne. . . 107

6.4 Module Pratiien :exemple de test proposé à l'utilisateur. . . 108

6.5 Diérents indies du module Manager . . . 109

6.6 Les diérents modèles d'Atanor etleurs interations. . . 110

6.7 Formalisation des onnaissanes par logigramme. . . 111

6.8 Le modèle Graph'Atanor . . . 113

6.9 Hiérarhiedes proessus métiers ave Graph'Atanor . . . 115

6.10 Dupliation de sommetspartie 1 . . . 116

6.11 Dupliation de sommetspartie 2 . . . 117

6.12 Dupliation de sous-arbres. . . 118

A.1 La page d'aueil du site. . . 144

A.2 Capture d'éran d'une he-logiiel. . . 145

(10)

3.1 Modélisationd'un graphe-paysage . . . 55

4.1 Justiation des paramètres des opérateurs de AGH . . . 80

4.2 Justiation des paramètres des opérateurs de AGH2 . . . 80

4.3 Justiation des paramètres générauxde AGH . . . 81

4.4 Comparaison entre AGH etAGH2 . . . 81

4.5 % moyen de meilleures solutionstrouvées entre AGH etAG. . 83

4.6 Comparaison entre AGH, DMa etDMb . . . 84

4.7 Comparaison entre AGH etTS . . . 86

4.8 Hauteur relative moyenne . . . 88

5.1 Comparaison entre AGH etDMb pour lesgrands graphes . . 98

(11)

(12)

3.1 Estimationde laprobabilité de trouver un optimum loal . . 59

3.2 Analyse des GP des grands graphes . . . 62

4.1 Shéma de base d'un algorithme génétique . . . 70

4.2 Algorithme génétiquehybridé . . . 71

4.3 Appliation des opérateurs de roisements.. . . 73

4.4 Prinipede lastratégie de reherhe loale . . . 76

4.5 Opérateur de mutation . . . 77

4.6 Stratégie d'optimisationloale RL2 . . . 79

4.7 Méthode de traé ave une reherhe Tabou[83℄. . . 87

5.1 Proédure

AGH D

^pour ^le ^traé ^dynamique ^. ^. ^. ^. ^. ^. ^. ^. ^. ^. ⁹²

5.2 Générateur de traésdynamiques . . . 94

(13)

(14)

Introdution

Cette thèse a été menée dans le adre d'une onvention CIFRE établis-

sant une ollaboration entre la soiété KnoweSia SAS (Carquefou, Loire-

Atlantique), spéialisée dans le domaine de la gestion et de la valorisation

des onnaissanes, et l'équipe COD (COnnaissanes & Déision) du LINA

(Laboratoired'Informatique de Nantes Atlantique).

La Gestion des Connaissanes

Parmilesproblèmesstratégiquesatuelsauxquelssontonfrontéeslesen-

treprises, onpeut notammentiterlagestiondedonnées distribuéesdontles

volumes ont explosé ou enore la baisse du niveau d'expertise dans ertains

domaines ausée par l'érosion du nombre d'experts (pyramide des âges qui

vieillit, mobilité importante). Dans un ontexte fortement onurrentiel où

la duréede vie de la plupartdes produits diminue onstamment et lesteh-

nologies etméthodes utilisées pour la fabriation etla distribution évoluent

sansesse,ilestimportantdepouvoironserverenvued'uneréutilisationles

informations pertinentes et les onnaissanes aquises. Cette mémorisation

struturée des onnaissanes est d'autant plus diile à eetuer que d'une

part,les struturesdes produits sontde plus en plusomplexes (multipliité

destehnologiesetdesateurs,grandnombrede omposants),etqued'autre

partlesaratéristiquesdessouresde onnaissanesrelativesàes systèmes

sontdemultiplessortes(individuelles,olletives,taites,proédurales,...).

Eneet,enplusdesonnaissanesexpliites(ourrierséletroniques,pro-

édures, notes de servie, ...), ilfautaussi prendre en omptetout lesavoir

impliiteoutaite(bonnespratiques,savoir-faire,...);'estàdirel'ensemble

des onnaissanes qui ne sont pas failement formalisables ave des formes

syntaxiques usuelles [2, 36℄. Le apital d'une entreprise n'est pas seulement

(15)

omposé de ses biens matériels et outils de prodution. Sans l'ensemble des

savoir-faire, la performane de es outils se restreint fortement. Il fautdon

apitaliser ette onnaissane taite, 'est à dire la onserver et l'analyser

pour larendreaessibleauxutilisateursonernés, lafaireévolueretpar e

biais faireainsi évoluer l'entreprise.

LaGestiondesConnaissanes (GC)peutêtrepréisémentdénieomme

uneapproheglobaleettransversalequiregroupel'ensembledes méthodeset

tehniques permettant de formaliser, partager, diuser et enrihir le apital

intelletuel de l'entreprise. L'objetif sous-jaent est de pouvoir fournir à

haquelassed'utilisateurslesonnaissanes pertinentes aubonmoment.La

gestiondes onnaissanesest donunproessusanthropoentréquiregroupe

un ensemble de tâhes diiles. Elle peut prendre plusieurs aspets au sein

d'uneorganisationetêtretraitée enutilisantde multiplesapprohes [36℄. Le

travailde ette thèses'insrit dansle adredu développement d'un Système

de Gestion des Connaissanes (SGC) ou serveur de onnaissanes que l'on

peut qualier de mémoire d'entreprise. Le proessus de réation d'une telle

mémoire est onsidéré omme le passage d'une mémoire de travail à une

mémoireorganisationnelle.Ellesedénitommeunapitaldeonnaissanes

aessible indépendammentdes ateursqui l'ont réée[109℄.

Il fautnoter que l'utilisationde l'informatique n'est a priori pas obliga-

toire en GC. Mais, omme le font remarquer de plus en plus d'auteurs [2,

28,106℄, ettedernière estamenéeàjouerun rlede plusen plus important.

Au-delà des fontionnalités qu'elle apporte (e.g. diusion de l'information,

utilisationd'éditeursgraphiques adaptés),l'utilisationdel'informatiqueper-

met de renforer l'interativitéave l'utilisateur quipeut ainsi être plaé au

÷ur du proessus de GC.

Cyle de vie d'une mémoire d'entreprise

Une démarhe de gestion des onnaissanes est assoiée au yle de vie

d'une mémoire d'entreprise. Il peut être shématisé par un proessus om-

plexe qui intègre, entre la détetion des besoins et l'utilisation, diérentes

phases[28℄(gure1.1).Ladétetiondes besoinspermetde qualierleprojet

en terme d'ambition, de limites, d'impat organisationnel, et de quantier

les moyens néessaires à sa bonne réalisation. Ensuite, une fois reensées

les souresde onnaissanes disponibles etvalides qui peuvent être utilisées

(doumentationspapiers,experts humains,bases de données, ...), plusieurs

typesde mémoiressont envisageables: e.g.une GestionEletroniquede Do-

uments (GED), une mémoire à base de as, une doumentation tehnique

(16)

et Evolution Maintenance

Evaluation Utilisation

Diffusion

Détection des besoins Construction

Fig.1.1 Cyle de vie d'une mémoired'entreprise [28℄.

La onstrutiond'une mémoireà base de onnaissanes néessite la mise

en plae d'un formalisme préis pour représenter les onnaissanes (ontolo-

gies, modélisation objets, réseaux sémantiques, règles de produtions, ...).

Sur le plan opérationnel, es représentations sont onçues à partir de mé-

thodes d'ingénierie des onnaissanes. Citons par exemple laméthode Com-

monKADS [124℄ qui propose des modèles génériques permettant d'interpré-

ter lesdonnées reueilliesdes experts ouenorela méthode MKSM 1

[40℄ qui

onsisteàonstruireundoument,appelélivredeonnaissanes,quiontient

les desriptions textuelles et graphiques des modèles de onnaissanes obte-

nus après extration des expertises. Il existe de nombreuses méthodologies

qui sont bien souvent spéialisées selon le seteur d'ativité de l'entreprise.

Chaque méthode utilise ses proprestehniques de reueil de données parfois

defaçon omplémentaire,ommel'entretien,l'observationdiretedel'expert

en situation de travail, ou enore l'utilisation d'éditeurs graphiques onçus

spéiquement. Ces éditeurs, utilisés diretement par l'expert, failitent la

transmission direte des onnaissanes sur la base du formalisme de la mé-

moire.

A tout momentdu yle de vie,dès qu'ilfautréaliserune interfaeentre

le ontenu de la mémoire et ses usagers, des représentations visuelles adap-

tées s'avèrent des médiateurs eaes qui permettent de failiter le dia-

logue [5, 23℄. Ces représentations doivent être simples à appréhender et à

omprendrepourlesdiérentes lassesd'utilisateurs.Ellesdoiventpermettre

d'apporter aux intervenants humains un substrat artiielqui transrive un

grand nombre d'informations et qui soit un support à leurs onnaissanes

et à leurs intuitions pour que non seulement ils puissent exprimer plus fai-

lement leurs savoirs taites et impliites mais aussi déouvrir des nouvelles

onnaissanes (e.g. relations).

1

(17)

La visualisation en Gestion des Connaissanes

Diérents travauxen psyhologie ognitive,en partiulier issus de l'éole

de la Gestalt [77℄, ont mis en évidene la apaité du erveau à analyser

rapidement des omposantes graphiques, et à pouvoir raisonner sur des re-

présentations visuelles. C'est don naturellement que onjointement à l'uti-

lisationgrandissantedes Tehnologiesde l'Informationetde laCommunia-

tion (TIC) s'est développée la visualisation d'information. La dénition de

Cardetal. [18℄est souventprise ommeréférene:... the useof omputer-

supported, interative, visualrepresentations of abstrat data to amplify og-

nition. Mais omme le font remarquer Eppler et Burkhard [15, 39℄, ette

dénition atteint ses limites lorsque l'on veut traiter le as spéique de la

visualisation de onnaissanes. En eet, les méthodes utilisées en visualisa-

tion d'information visent souvent lagénériité et n'intègrent pas toujours la

sémantiquedes données etleur domained'utilisation.Deplus, es méthodes

peuvent être parfois diiles à appréhender pour un utilisateur non initié.

En GC, an de failiter les transferts de onnaissanes, il est néessaire de

développer des méthodes de visualisation qui permettent de respeter la sé-

mantiquedes données et de masquer les diérents aspets ombinatoires et

algorithmiquesquandelaest néessaire:Knowledgevisualization examines

theuseofvisualrepresentationstoimprove thetransferofknowledgebetween

at least two persons or group of persons (Burkhard [15℄).

La visualisation d'information et la visualisation de onnaissanes ex-

ploitent don toutes deux nos talents innés pour la manipulation de repré-

sentations graphiques de façon omplémentaire : la première vise générale-

ment à analyser de grandes quantités de données pour en failiterla leture

etla ompréhension, etla seonde viseà failiterl'éhange etla réationde

onnaissanes en mettant à disposition des outils pour permettre aux per-

sonnes de failement exprimer et formaliser e qu'elles savent [39℄. La paire

indissoiable {modèle, représentation visuelle} dépend à la fois des onnais-

sanes dont on dispose, du mode de raisonnement sur es onnaissanes et

des diérents points de vue utilisateurs onsidérés dans le SGC. D'une fa-

çongénérale,lavisualisationdeonnaissanes est undomaineenpleinessor,

stimuléenpartiulierparlestravauxsurlesreprésentationsvisuellesduWeb

sémantique, etl'analysede etaspet fondamentaldansun proessusde GC

n'en est qu'à ses débuts.

La très grandemajoritédes représentations visuelles atuelles proposées

sontbasées,aumoinsimpliitement,d'unpointdevueformelsurdesmodèles

d'arbres ou plus généralement de graphes. De façon générale, les modèles

(18)

Fig. 1.2 Une arte ognitive réaliséeave lelogiiel Freemind.

tiques [85℄. Dans e modèle, les onepts sont représentés par les sommets

d'ungrapheetlesrelationssémantiques parlesarêtes.Lamajeurepartiedes

tehniques présentées i-dessous pourraient être onsidérées, dans le adre

d'une représentation desriptive, omme des spéialisations des réseaux sé-

mantiques.

Représentation par arbres

Lesreprésentationssous formed'arbres,quisontparmilesplus abouties,

regroupent des tehniques très diérentes :

Les artes ognitives ont été développées pour failiter la transrip-

tiond'idéessurunsupportvisuel[16℄.Autourd'unsommetentraldes

idéessontreprésentéesenréantdiérentesarboresenes.Al'origine,

lesreprésentationsétaienteetuées manuellementmais diérentes so-

lutions logiiellespermettent d'enrihirla représentation. On peut no-

tammentiter MindManager 2

, VisualMind 3

et lesdiérentes solutions

proposées par The Brain 4

, etdans le domaine du logiiellibre, Free-

Mind 5

qui est une solutiontrès aboutie (gure 1.2).

Les arbres de défaillane [88℄ sont prinipalement utilisés dans le do-

maine de la sûreté de fontionnement. Ils permettent de représenter

graphiquementl'ensembledes pannesd'un systèmequipeuventsepro-

duire pour un évènement donné (gure 1.3). Un même système peut

don avoirplusieurs arbresde défaillanepossibles.Ce mode de repré-

sentation est très employé dans le monde industriel quand la séurité

est primordiale (aéronautique,automobile, himie, nuléaire,...).

Les arbres de déision, et plus généralement les graphes d'indutions,

ontétéinitialementutilisésen apprentissageautomatique[143℄;ilsres-

2

http://www.mmdfrane.fr/

3

http://www.visual-mind.om/

4

http://www.thebrain.om

5

(19)

Défaut 1 Défaillance

A Défaillance

B

Défaut 2 Perte système S1

OU

ET

Fig.1.3 Un arbre de défaillane.

Est−ce qu’il y a des films intéressants au cinéma ?

chez moi Je reste chez moi Je reste

me promener Je vais

me promener Je vais fait−il ? Quel temps

Pluie Couvert

Température Fraîche Correcte

Je vais au cinéma

Non Oui

Beau

Fig.1.4 Un arbre de déision.

tent des modèles privilégiésd'exploration des données à lafois pour la

desription et le lassement. Dans ette représentation, haque n÷ud

est assoié à un test sur un attribut, les feuilles orrespondant au ré-

sultat nal et haque ar est assoié à une réponse possible d'un test

(gure1.4).

Représentation par graphes

La plupart des représentations par graphes en GC se retrouvent asso-

iées à trois grandes lasses de modèles dont les intersetions peuvent être

importantes :lesgraphes oneptuels,lesontologiesetlesréseaux bayésiens.

Les graphes oneptuels ont été à l'origine proposés omme une re-

présentation graphique de la logique de premier ordre. Ils permettent

de simplier la mise en relation entre la logique et les langues natu-

relles [126℄ pour obtenir une représentation des données qui soit li-

sibleetutilisableauseinde traitementsautomatiques.EnGC, ilssont

(20)

Fig. 1.5 Un grapheoneptuel représentant une ontologie de la géométrie

prospetive réalisé ave TooCom [44℄.

et ilsonstituent un formalismeadapté pour la représentation d'onto-

logie [44℄ (gure 1.5).

L'ingénierie ontologique vise à la onstrution et l'exploitation d'on-

tologies en onservant souvent une ertaine indépendane par rapport

auxusagesopérationnelsqui peuventen être fait.Dansunemémoireà

basedeonnaissanes,lesontologiespermettentd'expliiterlatermino-

logieoulesonepts liésàun métierouàun groupedonnéd'individus

au sein d'une organisation. Du fait de l'importaneroissante en GC,

diérents logiiels proposent des représentations graphiques tels que

Protégé 6

,Os-Skill [117℄ou enoreITM de Mondea 7

.

Les réseaux bayésiens, utilisés initialement en apprentissage automa-

tique, peuvent s'interpréter omme des graphes d'états auxquels sont

ajoutés des probabilités de transition sur les ars. Des logiiels sont

maintenant utilisésen GC : BayesiaLab etBest 8

.

Desreprésentationsgraphiquesspéiquesontétédéveloppéespourdes

méthodes lassiquesde GC telque CommonKADS [24℄.

6

http://protege.stanford.edu/index.html

7

http://www.mondea.om/

8

(21)

Contexte de la thèse

L'originede ette thèserelève d'uneproblématiquede visualisationasso-

iée àun SGC. Leserveur de onnaissanes Atanor développé par lasoiété

KnoweSia est une mémoire métier proédurale. Il a été onçu an de gérer

unedémarheomplètedegestiondesonnaissanesenfusionnantl'expertise

tehniqueet lesdiérentes ressoures humainesdisponibles.Cette démarhe

est orientée vers le déploiement et l'opérationnalisation des onnaissanes

portantsurdessystèmesomplexesàpartirdesouresmultiples[54,55℄.Ata-

nor permet de rendre aessible la onnaissane diretement sur les postes

de travail des utilisateurs naux. Ils se retrouvent don au entre de leur

proessus d'aquisition en naviguant diretement au sein des onnaissanes

qu'ils désirent utiliser. Ces onnaissanes maintenues par l'outil sont ati-

vables et présentées sous une forme multimédia [107℄. L'arhiteture d'Ata-

nor est fondée sur trois modules prinipaux qui proposent diérentes vues

sur lesmodèlesde onnaissanes utilisés :

lemoduleExpert estdestinéauxexpertspouronstruireetfaireévoluer

lesmodèles de onnaissanes;

les utilisateurs ont à leur disposition le module Pratiien pour, dans

un ontexte opérationnel, ativer laonnaissane;

lemoduleManager permetd'aéderàdesindiesstruturelsetopéra-

tionnelssur l'utilisationdu serveur etdes onnaissanes qu'ilontient.

Chaque modèle néessite une représentation visuelle spéique adaptée aux

besoins propres des utilisateurs onernés. Dans ette thèse nous nous foa-

lisons sur le moduleExpert.

Unpremiermodèlevisuelbasésuruneextensiondesarbresdedéfaillane

et des arbres de déision avait été proposé à l'origine du développement

d'Atanor [55℄. Cependant, son instaniation dans diérents ontextes appli-

atifsamisen évidene diérentes limites, laprinipale étant laprésene de

nombreuses redondanes qui peuvent entraver l'interprétation synthétique

dufontionnementd'un proessusetmasquer despointsritiques.L'objetif

appliatif de ette thèse a été de proposer un nouveau modèle de représen-

tation pour le module Expert d'Atanor ainsi que lesalgorithmes néessaires

àsa représentation visuelle.

Contribution et organisation de la thèse

Lastrutureatuelledesonnaissanes du serveurAtanornousaonduit

à privilégierune représentation par graphes, plus préisément sous la forme

(22)

donnés dans des niveaux représentant les diérentes étapes du proessus

au sens de l'expert. L'implémentation de ette représentation néessite la

mise en ÷uvre d'une méthodologie proposant à l'utilisateur un traé lisible

etintelligible.

Le hapitre2 présente une étudebibliographique orientée vers les usages

des diérentsproblèmes de représentation visuelle des graphes: le problème

lassique du traé statique sur un support de taille standard, le problème

dynamique où legraphe à traer évolue sur une éhelle de temps restreinte,

le traé des graphes de grandes tailles, les problèmes émergents des traés

en trois dimensions ainsi que lesreprésentationsbasées sur d'autres odages

des graphes. Nous présentons aussi les langages de desription de graphes

les plus utilisés dans les logiiels. Nous rappelons dans e hapitre que la

générationd'unbontraé estsouventdiileentermedeomplexité,etles

ritèresutiliséspourestimerlaqualitédestraéssontsouventsubjetifsvoire

ontraditoires puisqu'ilssont liésà lapereption du traé par l'utilisateur.

Ces ritères setraduisent par des ontraintes de lisibilitéà satisfairemo-

délisées omme des ontraintes d'optimisations [27℄. Parmi les nombreuses

ontraintes, diérentstravauxont montré l'importaneen terme de lisibilité

etdemémorisationdelaminimisationdunombrederoisementsd'ars[110℄.

Nousnous sommesdonfoalisés surelle-i. Pour lestraésd'un grapheen

niveaux, la rédution du nombre de roisements d'arsonsiste àtrouverun

ordre optimaldes sommets dans haun des niveaux. Lehapitre3 présente

eproblèmed'optimisation.L'étudebibliographiquedesdiérentesméthodes

de résolutionsonnues montrequel'analysedes paysages dereherhe asou-

ventéténégligée.Cetteétudeestfondamentaleandeonevoiruneméthode

derésolution eae.Nousmontronsparune étudedesriptiveetstatistique

des paysages de reherhe assoiés àdiérentes tailles de graphes qu'ilssont

fortementmultimodauxetquelaqualitédes optimaloaux esttrès variable.

Nous en onluons qu'un algorithme évolutionnaire et partiulièrement un

algorithme génétique(AG)sembleêtre une voie prometteuse.

Le hapitre 4 présente une desription omplète, ainsi que la validation

desdiérentsopérateursdel'algorithmegénétiquequenousavonsdéveloppé.

Il possède deux partiularités : deux opérateurs de roisement spéiques

aux traés en niveaux et une hybridation par une reherhe loale. Les ex-

périmentations montrent que et algorithme surlasse les méthodes exates

lassiques et donne dans la plupart des as de meilleurs résultats en terme

de qualité et plus rapidementque les autresmétaheuristiques développées à

notre onnaissanepour e problème.

Le hapitre 5 présente deux extensions de l'AG. La première est onsa-

rée au problème de traé dynamique qui doit tenir ompte simultanément

(23)

qu'uneertaine persistanede lareprésentation dansletempsande limiter

les eorts de réinterprétation de l'utilisateur. Nous proposons une heuris-

tique pour e problème. La deuxième extension dépasse le adre appliatif

et porte sur la omparaison de l'AG ave des méthodes de desentes mul-

tiplespour des graphes de grandestailles quine peuvent plus être traéssur

des supports de taillestandard. L'objetif initialde ette omparaisonétait

de mieux omprendre lesomportements respetifs de l'AGetdes desentes

multiples pour des orpus d'instanes variés. Nous montrons sur des jeux

de données signiatifs que la performane de l'AG diminue au-delà d'une

ertainetailledes graphesàause probablementde hangements importants

dans lastruture des espaes de reherhe.

Le hapitre 6 est onsaré à l'appliation sur Atanor. Ses aratéris-

tiques prinipales et le modèle atuellement utilisé pour la représentation

des onnaissanes sontprésentés. En utilisantun exempleréel d'appliation,

renontré dansun projetsur lamaintenanede mahinesde triautomatique

deourrierde laPoste,nousomparonslesmodèlesdereprésentations.Nous

montronsl'intérêt de lavisualisationdes onnaissanes par notre modèle de

graphes pour l'améliorationde la lisibilitédes traés ainsi que leur exploita-

tion par lesdiérentes lasses d'utilisateurs.

(24)

Représentation visuelle des

graphes

Il faut imaginer dans sa tête des trus qu'on appelle sommets, et pour

toute pairede sommets soit une arête quiles joint,soit une non-arête quiles

laisse sans joint : ei est un graphe selon Berge.

P. Rosenstiehl [118℄

Sommaire

2.1 Le traé statique . . . 13

2.2 Le traé dynamique . . . 18

2.3 Le traé des grands graphes . . . 21

2.3.1 Distorsion dutraé . . . 21

2.3.2 Stratégie dereherhe d'information . . . 24

2.3.3 Projetions dansd'autresespaes . . . 24

2.3.4 Ahage partiel . . . 26

2.4 Traé tridimensionnel . . . 29

2.5 Au delà des représentations sommets-liens . . . . 30

2.6 Les langages de desription . . . 32

Uneonséquene de ladénition d'ungraphedonnée en exergue parl'un

desplus élèbresmaîtresdudomaineest qu'ilssontlesoutilsprivilégiéspour

simultanémentmodéliseretreprésenter visuellementunsystème derelations

entre des entités. Quand on étudie la théorie des graphes, on pourrait très

bienparler de graphe en termede fontion en 0 et 1 (...),mais non, on les

traite en forme degure parequ'on veut visualiserl'objet,mettre despoints

(25)

pour représenter des sommets; les arêtes e sont des lignes ontinues qu'on

dessine sur le plan et e sont des propriétés d'un type graphique et visuel

qu'on étudie (...) 1

. Un des intérêts majeurs des graphes est eetivement

depouvoiraratériserlespropriétésd'unsystèmederelationsviaunarsenal

ombinatoire sophistiqué [9℄ tout en failitant l'aès à es strutures om-

plexesvianotammentdesreprésentationsvisuellesadaptées.Bergeproposait

devoirledessindanssatête!Maisheureusement,depuislespremierstravaux

de Knuth [75℄ dans les années 60, la représentation visuelle des graphes sur

des supports plus partageables est devenue un domaine de reherhe à part

entière,animé par laommunauté Graph Drawing 2

. L'intérêtroissantes

dernièresannéespouredomaineeststimuléparlesappliationsoù,dansde

nombreuxdomaines(e.g.GestiondesConnaissanes,Toile,Réseauxsoiaux,

Réseauxsémantiques,...)lesréseauxrenontrésneessentdeseomplexier

ne pouvant plus être traités aisément àla main.

Il est souvent plus faile de justier du reours à un modèle de graphe

dansunadreappliatifquededévelopper,etmêmeplussimplementdehoi-

sir une méthode de traé adaptée à sa problématique parmi les nombreuses

méthodes et tehniques existantes. Commele notent Mutzel et Jünger[103℄

dans un ouvrage olletif réent onsaré aux logiiels de traés, la om-

plexité de mise au point d'outils eaes de visualisation est généralement

sous-estimée par les novies; lesutilisateurs essayent souvent de développer

dessolutionspareux-mêmesqui,inne,nerépondentguèreàleursvéritables

besoins. Une part de la omplexité réside dans la néessité de maîtriser des

résultatsprovenant à la foisdes mathématiques(essentiellementthéorie des

graphes, optimisation ombinatoire, géométrie algorithmique) et de l'infor-

matique (essentiellement algorithmiqueet strutures de données, mais aussi

génie logiielet interfaes homme-mahine).

Ce hapitre,restreint auxusages, présente un panorama synthétique des

prinipales problématiques dont relève une démarhe de représentation vi-

suelle de graphes. Pour de plus amples détails sur les algorithmes mis en

÷uvre et leurs implémentations,nous renvoyons à trois ouvrages réents de

référene : Graph DrawingAlgorithms for the Visualization of Graphs de

Di-Battistaet al.[27℄, Drawing GraphsMethods and Models sous la dire-

tiondeKaufmannetWagner[71℄etGraphDrawingSoftwaresousladiretion

de Mutzel et Jünger [103℄. Les représentations en niveaux qui sont utilisées

dans lasuite de lathèse, sont détailléesspéiquement dans le hapitre 3.

1

itation extraite de http://perso.wanadoo.fr/jaques.nimier/entretien_

berge.htm

2

Unsymposiuminternationalsurletraédegraphes(Int.Symp.onGraphDrawing)est

organiséannuellementavedesatespubliéssouslaformedeLetureNotesinComputer

(26)

Les diérentes parties de e hapitre sont organisées selon l'ordre des

graphes à manipuler et les objetifs visés par la représentation visuelle. Le

paragraphe2.1rappellelesproblèmes de base soulevés par lareprésentation

visuelle des graphes en les illustrant sur le problème du traé statique. Les

paragraphes suivants sont dédiésà des extensions du traé statique en plein

essor :

le paragraphe 2.2 traite du traé dynamique où le grapheévolue dans

letemps;

leparagraphe2.3présenteletraédesgrandsgraphes,dontl'ordrepeut

atteindre plusieurs milliers de sommets. Cette problématique onnaît

un intérêt roissant dû à l'explosiondes quantités de données à mani-

puler dans de nombreux domaines;

le paragraphe 2.4 est onsaré aux représentations tridimensionnelles

qui ontémergé es dernières années.

Au delà de es représentations que l'on peut qualier de lassiques puis-

qu'ellesreprésententdefaçonexpliitelesarêtesdes graphespardesourbes,

ilexiste aussi d'autres méthodes quiutilisentdesodagespartiuliersoudes

métaphores graphiques pour représenter les graphes. Certaines sont présen-

tées dans le paragraphe2.5.

Diérentslangagesde desriptionontétéproposéspour oderlesgraphes

etfailiterleur manipulation.Les prinipauxlangagesemployéssont dérits

dans le paragraphe2.6.

2.1 Le traé statique

Dans la suite nous onsidérons un graphe

G = (V, E)

âve ûn ênsemble

V

^de^sommetsêtûn ênsemble

E

^d'arêtes ^assoiées^à ^une^relation^binaire^sur

V × V

^. ^Selon^les âs, ^la^relation^peut ^être ^symétrique ôu^non ^(on ^parle âlors

d'ars). Le problème générique de traé le plus lassique onsiste à dessiner

G

^sous ^une ^formeintelligible sur un support standard bidimensionnel[27℄.

L'utilisateur n'étant pas forément un expert en ombinatoire, la qualité

du dessin est déisive pour l'appropriation de la représentation [111℄. Pour

préiser ette notion, qui reste in ne subjetive, on retient généralement

quatre onepts de base (Di-Battistaet al. [27℄) : laonvention de traé, les

ontraintes physiques, lesritèresesthétiques etles ontraintes sémantiques.

1. La onvention de traé

Ellespéielesrèglesgéométriquesde leturedutraéquisontsouvent

inhérentes aux pratiquesen vigueurdans le domained'appliation.La

gure 2.1-a montre un extrait d'un système de hiers sans utiliser la

(27)

sontdiilesàlire.Enrevanhe,lagure2.1-butiliselareprésentation

habituelleaveunearboreseneetlesheminsd'aès auxhierssont

plus simples à lire. La gure 2.2 montre diérents exemples de traés

d'un graphe

G

^assoiés ^à ^diérentes ^onventions ^: ^(a) représentation polygonale où haque ar est représenté par une ligne polygonale, (b)

représentation retiligne où haque ar est représenté par un segment

de droite, () représentation orthogonale où les sommets sont plaés

aux intersetions d'une grille et les ars sont positionnés sur la grille

et (d) représentation en niveaux ou hiérarhique où les sommets sont

rangésdans des niveaux vertiaux ouhorizontauxetlessommetsd'un

mêmeniveau ne sont pas reliés entre euxpar des ars.

2. Les ontraintes physiques

Les ontraintes du support de l'÷il humain imposent notamment des

éarts minimums à respeter entre les entités géométriques (points,

boîtes, ...) représentant les sommets et les ourbes représentant les

ars.

3. Les ritères esthétiques

Ils tentent de formaliser les propriétés à satisfaire pour failiter la li-

sibilité d'un traé. Ces ritères sont dénis par des ontraintes ombi-

natoires:minimisationdu nombrede roisementsd'ars,minimisation

de la sommedes longueurs des ars ou de l'ar de longueur maximale,

minimisationdesoudesdanslestraésorthogonaux,... Iln'existepas

d'ordonnanementgénériquede es ritères;l'interprétationde haque

traédépendantdesapropresémantiqueetde lasensibilitédel'utilisa-

teur.Cependant,destravauxenpsyhologieognitiveontmontréquela

rédutiondes roisementsestundesritèresprépondérantspourlalisi-

bilitéetlamémorisation[110℄ (gure2.3).Purhase [111℄aaussi mon-

tré que les prinipales préférenes portaient sur : la minimisation des

roisements, la minimisation des oudes, le positionnement horizontal

des étiquettes représentant les sommets et la jontion des ars d'hé-

ritage (ars de même origine). Plus réemment Ware et al. [137℄ ont

montré, en s'appuyant sur les travaux de la théorie de la Gestalt [77℄,

qu'une bonne ontinuité des ars est néessaire en plus de la rédu-

tiondunombrederoisements.Eneet,lorsquelareherhedehemins

estimportantedansun graphe,laletureest failitéelorsquelesangles

formés par lesars ne sont pas trop aigus (gure 2.4).

4. Les ontraintes sémantiques

Ellessont assoiées à l'interprétationdes omposantes du graphe; par

exemple, des proximités sémantiques doivent être respetées dans le

(28)

/

bin

dev

etc

home lib

tmp usr

ls mv rm

group

passwd

remi

bruno libc.so

bin

lib X11R6

these these.lyx

gzip libkdecore.so

X11 lib

X11 rgb.txt

(a) Auune onventionpartiulière

/

bin dev etc home lib tmp usr

ls mv rm group passwd remi bruno libc.so bin lib X11R6

these

these.lyx

gzip libkdecore.so X11 lib

X11

rgb.txt

(b) Lareprésentationarboresenteonventionnelledudomaine.

Fig.2.1 Deuxreprésentations d'unmême extraitd'un système de hiers.

(29)

c

e

f

d a

b

g

(a)Représentationpolygo-

nale

a

d

e

c b

f g

(b) Représentationretiligne

b a

g

c

f e

d

() Représentationhortogonale

a

f b

d g

c

e

(d)Représentationenniveaux

Soit un graphe

G

^ave

V = {a, b, c, d, e, f, g}

^et

E = {(a, b), (a, g), (a, e), (b, d), (c, d), (c, e), (d, f), (e, f )}

^.

Fig.2.2Diérentesreprésentationsd'unmêmegrapheenutilisantplusieurs

onventions de traé.

(30)

(a) Pasd'optimisationdu nombre deroi-

sementsd'ars(37roisements).

(b) Nombrederoisementsréduitaumaxi-

mum(5roisements).

Fig.2.3 Illustrationdu respet des ritères esthétiques.

c e

f

d a

b

g

(a) Représentation polygonale

lassique.

c e

f

d a

b

g

(b) Utilisation de lignes dont

lesanglessontaplanispourper-

mettreunemeilleureleturedu

traé.

Fig. 2.4Illustration du prinipe de bonne ontinuité des ars [137℄.

(31)

Lorsque la onvention de traé est xée ainsi que lesdiérentes ontraintes,

deux problèmes se posent généralement: le problème d'optimisationassoié

est bien souvent NP-diile [48℄ et, lorsque l'on herhe à optimiser simul-

tanémentplusieursritèresesthétiques, lesontraintes assoiéessont inom-

patibles. On doit alors avoir reours à des algorithmes approhés ou des

heuristiques qui, basés sur des approhes très diérentes, ne onduisent pas

néessairement à des traés identiques. Le hoix de la méthode est alors un

problème déliat pour l'utilisateur (de plus amples détails sur les méthodes,

leurs hoix etles ontraintes assoiés sont donnés dans le hapitre 3 dans le

adre du traé en niveaux).

De plus, les expérimentations (voir les hallenges du Symposium Graph

Drawing 3

) ont montré que les résultats des algorithmes automatiques ne

devaientpasêtresystématiquementonsidérésommelesmeilleuressolutions

pourun problèmedonné:ilspeuventêtresouventaméliorésa posteriori àla

main.A lamanièredu traé statique,lesdiérentsonepts énonés servent

de support auxautres typesde traés. Des ontraintes supplémentaires sont

ajoutées pour tenir omptedes spéiités du traéà produire.

2.2 Le traé dynamique

Dans un ontexte dynamique où les données à représenter évoluent sur

une éhelle de temps restreinte, des modiations du graphe telles que des

ajouts ou retraits de sommets et/ou d'arêtes entraînent des hangements

visuels sur le traé. La solution naïve qui onsiste à reonsidérer à haque

instant

t

^le ^problème ^omme ^un ^nouveau ^problème indépendant se heurte à deux éueils : (i) elle peut être inutilement oûteuse en temps de alul en

refaisantdesalulsdéjàfaitsen

t−1

^,êt⁽ⁱⁱ⁾êlle^peut^perturber^laârte^men-

tale de l'utilisateur. En eet, ontrairement au traé statique où l'ensemble

desontraintesliéesautraésontonnuesàl'avaneetne hangentpasdans

letemps, letraé dynamique doit prendre en omptelefait que l'utilisateur

s'estdéjàappropriéletraé présentéàl'instantpréédent.Don, en plusdes

ontraintes énonées préédemment pour le traé statique qui doivent tou-

joursêtrerespetées,laleturedes dessinsdansun ontexte évolutifonduit

àl'introdutionde ontraintes additionnelles.A haque instant

t

^,^le^nouveau

traé d'un graphe

G t

^doit ^également ^permettre ^une ^transition ^aisée ^pour

l'utilisateurave letraédugraphe

G t −1

^présenté^à^l'instant^préédent^;^l'ob-

jetif étant de limiter l'eort ognitif néessaire àl'interprétation des traés

suessifs.

3

Voir la partie GD Contest sur les diérents sites de la onférene : http://www.

(32)

Deux approhes majeures sont proposées. La première onsiste à mettre

enévideneleshangementsviadesanimationsgraphiques.Ellesdoiventêtre

susammentlentespourpermettreàl'utilisateurd'enregistrerlesdiérentes

modiationsopérées surlegraphe[14, 25℄.Laseonde, etlapluspopulaire,

onsiste à préserver au mieux la stabilité des traés en limitant les pertur-

bations apportées sur le nouveau traé par rapport aux préédents [22, 33℄.

La stabilité est une notion omplexe qui dépend des aratéristiques géo-

métriques et ombinatoires du traé, mais aussi des faultés de pereption

et de mémorisation de l'utilisateur. Cependant, deux fateurs prédominants

semblent se dégager :

lespositions des sommetsdoivent hanger lemoins possible. Leur sta-

bilitésembleplusimportantequeelle des arêtes:lessommetsservent

de repères spatiaux alors que les arêtes sont essentiellement utilisées

pour déouvrir des relationsentre des sommets déjàloalisés;

l'ordre relatif des omposantes du graphe dans le repère géométrique

adopté doit être onservé tant que ela est possible ar l'utilisateur

repère les omposantsles uns par rapportaux autres.

Pour rendre opérationnelles es ontraintes de stabilité et ainsi, mesurer le

degré de onservation de la arte mentale de l'utilisateur entre les traés

de deux graphes suessifs, diérentes métriques basées sur des indies de

similaritéont été proposées [12℄. Lagure 2.5 illustre leprinipede la prise

en ompte d'un ritère de similarité dans le traé d'un graphe en niveaux.

Le ritèreest simplementbasé sur lapositiondes sommetsdans haun des

niveaux. Le traé de la gure 2.5-a est le traé initial ave 2 roisements

après optimisation. A

t + 1

^, l'utilisateur ajoute deux sommets et quelques ars. Sur les gures 2.5-b et 2.5-, les nouveaux sommets et les nouveaux

ars sont représentés ave des traits en pointillés. La gure 2.5-b représente

le graphe à

t + 1

âve ômme ûnique ôntrainte ^la ^rédution ^du ^nombre

de roisements d'ars; il en reste ii 7. Malgré la taille réduite du graphe,

des hangements importantssont introduits etdeux pairesde sommetssont

inversées (sommets à fond foné) par rapport à la gure originale. De plus

lesdiérentsars (dessinés ave des traits épais) assoiés àes sommetsont

aussi été déplaés. Pour palier àe problème,le traéde lagure2.5- tient

ompteduritèredesimilaritéavelepremiertraé.Onretrouveexatement

legraphe d'originemais le traé omporte 9 roisements.

Comme pour tout problème multiobjetifsqui onsisteà trouver un bon

ompromis entre les diérents paramètres [20℄, la diulté du traé dyna-

mique est qu'il faut à haque étape trouver un traé réalisant un bon om-

promis entre la onservation de laarte mentale de l'utilisateur, la lisibilité

du traé et le temps de alul (les préonisations habituelles stipulent qu'il

(33)

(a) Legrapheinitialàl'instant

t

^ave²^roisements^d'ars.

(b) Legrapheà

t + 1

âveûniquement ûneoptimisationdunombrede roisements.Lesarsengrasetlessommetsfonésonthangédeplae.

Ilreste7roisementsd'ars.

() Legrapheà

t + 1

ên^tenantômpte^d'un^ritère^de^similaritéêt^d'une

optimisationdunombrederoisements.Ilreste9roisements.

Les sommets v08 et v19 ont été ajoutés au graphe après l'étape (a). Ces sommets

etleurs ars sont représentés en pointillés dans les gures (b) et ().

Fig. 2.5 Exemple de transitions entre un graphe

G t

^et

G t+1

^dans ^un

(34)

qu'un utilisateur ait une impression de uidité entre les traés [135℄). Ce-

pendant, si des heuristiques ont été proposées pour les grandes familles de

traés(orthogonaux,enniveaux,...),leproblèmeresteenorelargementou-

vertetànotreonnaissanepeu delogiielsintègrentatuellementlagestion

dynamique de façoneae.

2.3 Le traé des grands graphes

Dès que le grapheà représenter ades aratéristiques quine permettent

plus une représentation exhaustive de haque omposante sur un support

de taille standard omme un éran d'ordinateur, les algorithmes lassiques

de traés de graphes ne sont plus appliables seuls. La plupart doivent être

ombinés ave des outils d'interation qui dièrent selon le type de graphes

à représenter et il devient alors diile d'avoir une méthodologiegénérique.

Deux exemples permettent de onrétiser les nouveaux ordres de grandeur

misenjeu.Lesgraphesdeontatsoudeo-itationsdanslesréseauxsoiaux

peuvent porter maintenant sur des entaines de milliers de sommets [131℄.

Pour estimerdes paramètresdérivant lastruture des relationssurlaToile,

Rekaetal.[112℄travaillentsurdesgrapheséhantillonsde300000douments

et 1 500 000 liens (estimé à environ 0.3% de la Toile lors de la parution de

l'artile en 1999). En plus du problème d'ahage sur un éran statique de

taille limitée, il faut également prendre en ompte les problèmes aigus de

gestion de lamémoire etdu tempsde alul.

Lesdiérentesméthodesmisesen÷uvrepeuventêtrelasséesenplusieurs

atégories aratérisées par un ordre des graphes àtraer roissant : (1) ap-

pliationd'unedistorsionsur lestraésomme lefameuxsheye,(2) utili-

sationd'une ombinaisondes stratégies de traés de graphesetde reherhe

d'informations, (3) utilisation des propriétés spéiques de la struture à

traer pour optimiserla plae disponible, (4) ahage partiel du graphe.

2.3.1 Distorsion du traé

Les premières tehniques apparues sont basées sur un prinipe de distor-

sion des gures; le but étant de fournir à l'utilisateur une vue unique de

l'ensemble de la struture à traer en appliquant diverses transformations.

Latehnique des sheyes [123℄ permetde visualiser desgrandesstrutures

de données que e soit des arbres ou des graphes. Elle onsiste à dessiner

une partiede lastruture leplus lisiblementpossible,en sefoalisantsur un

sommetpréis,appeléentre,etsonvoisinageimmédiatpuisàappliquerune

(35)

Fig. 2.6 Un graphe qui représente les frontières ommunes entre les dif-

férents pays du ontinent européen. Dessin réalisé ave le logiiel Aisee

http://www.aisee.om.

sopique.L'utilisateuradondes informationssurlapositionduentre etde

son voisinagepar rapport àl'ensembledu grapheetpeut exploiteraumieux

les informations intéressantes pour lui sur la partie lairement dessinée (-

gure2.6).L'inonvénientmajeurdeettetehnique dereprésentationest que

l'éhelledes distanes entre lessommetsévolue. Plus on s'éloignedu entre,

plus l'éhelle est réduite de façonnon linéaireetles distanes ompressées.

Réemment,Gansner et al. [46℄ ont proposé une méthode pour éviter e

problème de ompression des distanes. Au lieu de vouloir représenter l'en-

semblede la struture, leur méthode simpliela représentation en alulant

uneapproximationdes partiesdugraphesur lesquellesl'utilisateur n'estpas

foalisé.Lagure2.7-areprésenteuneartographied'Internetquiest illisible

sionveut diretement traerl'ensembledu graphe(87931sommetset87930

arêtes). Sur la gure 2.7-b, l'utilisateur se foalise sur la partie en haut à

(36)

(a) Graphe représenté en entier (87931

sommetset 87930arêtes).

(b) Fousenhautàgauhedelagure. () Foussurlebasdelagure.

Fig. 2.7 Diérentes représentations d'une artographied'Interneten utili-

sant des Topologialsheyes.Extrait de [46℄.

ettepartie estomplètementdessiné.Ensuite,en fontionde l'éloignement,

lespartiespériphériquesde lareprésentation sont deplus enplus simpliées.

Un dégradé des ouleurs du rouge vers le vert permet d'indiquer le niveau

de simpliation. Cette tehnique permet aussi à l'utilisateur de naviguer

dans le graphe en déplaçant la partie sur laquelle il se foalise. La simpli-

ation progressive de la struture permet d'aider à la onservation de la

arte mentale de l'utilisateur. L'inonvénient prinipal est que pour aluler

les diérentes approximations, il est néessaire de onserver en mémoire le

(37)

2.3.2 Stratégie de reherhe d'information

De plus en plus les méthodes lassiques développées par laommunauté

Graph Drawing sont ombinées ave des approhes développées dans le

ontexte plus général de la visualisation d'information (voir la thèse de T.

Munzner[102℄quiproposeunebibliographiepourlavisualisationde grandes

strutures de données). Lesapprohes proposées, développées réemmenten

ommun par les deux ommunautés [59℄, intègrent plusieurs stratégies très

diérentes : distorsionde la représentation, partitionnement,navigation. La

représentationexhaustivedesomposantesdugraphen'étantpluspossible,le

problèmeestsouventabordéommeunproblèmedereherhed'information:

il s'agit de prourer à l'utilisateur une panoplie d'outils qui peuvent être

ombinés dans une stratégie de reherhe [90℄. La séletion des modes de

représentation est souvent laissée à l'utilisateur; la reherhe atuelle est

plutt axée sur le développement de nouvelles méthodes apables de traiter

des tailles roissantes. Bien que la question de la omparaison, en terme

d'usage, soitde plus en plus disutée ausein notamment de laommunauté

InfoViz,lesanalysesderetourd'expérienerestentenoretrèslimitées[10℄.

Une autre grande famille de méthodes se réfère expliitement à la stra-

tégie proposée en reherhe d'informations par Shneiderman [125℄ : Over-

view rst, zoom and lter, then details-on-demand. La démarhe est alors

la suivante : (i) proposer à l'utilisateur une vue marosopique de la stru-

ture, (ii) lui permettre de se foaliser sur un sous-graphe par lustering [8℄

ou fragmentation [4℄, et (iii) rendre aessible les aratéristiques préises

d'une donnée séletionnée. Ce proessus itératifs'arrêtelorsque l'utilisateur

aaquis susammentd'informationspourrépondreàdesbesoinsnon nées-

sairement spéiés préalablement. Une des diultés est ii d'appliquer des

transformations qui restent ompréhensibles par l'utilisateur pour éviter de

trop perturber saarte mentale.

2.3.3 Projetions dans d'autres espaes

Pour des graphes dont l'ordre peut atteindre plusieurs milliers de som-

mets, les méthodes de traés génériques qui plongent le graphe dans un es-

pae eulidien deviennent diilement exploitables. Ces méthodes doivent

être spéialisées pour utiliser au maximum les propriétés de la struture à

dessiner etoptimiserlaplaedisponiblepour letraé.Par exemple,pour les

arbres, Xerox Researh a mis au point une tehnique qui utilise un espae

hyberbolique pour représenter des arbres; e sont les arbres hyperboliques

(gure 2.8) 4

. Ave ette tehnique, prohe du sheye, l'arbre est dessiné

4

(38)

(a) L'arbred'origine.

(b) L'arbreaprèsundéplaementduentre.

Fig.2.8 Deuxvues du site web de Xerox Researh Centre Europe repré-

sentées ave des arbres hyperboliques. Extrait de http://www.xre.xerox.

(39)

dansun espaehyperboliqueetl'utilisateursefoalisesur un sommetetson

voisinage.Plusons'éloignede esommet,moinsily ade détailssurlagure

(gure2.8-a,leentrede lagureest symbolisé parlen÷udappeléxre).La

navigations'eetue endéplaçantlessommets. Lapartielairementdessinée

sesitueauentre delagure.Unpointimportantdeettereprésentationest

que l'utilisateur sait toujours où se situe le entre de l'arbre qu'il visualise

(gure2.8-b).Enrevanhe, lesparties de laguretrop éloignéesdu sommet

sur lequel est foalisé l'utilisateur peuvent ne pas apparaître.

2.3.4 Ahage partiel

Sur des graphes dont l'ordre est enore plus important -au delà de 100

000 sommets-, la omplexitédes méthodes préédentes ne permet plus leur

appliationsurl'intégralitédelastruture.De partl'importanede sataille,

ettestruturepeutne pas êtreentièrementstokée enmémoirelorsdel'ini-

tialisationdesalgorithmesde traé.L'approheOnlineGraphDrawing[63℄

permetdanseas àl'utilisateurdeseonentrerdansun premiertempssur

unsous-graphe,oufenêtrede visualisation,quipeutêtreentièrementmontré

sur son éran en utilisant seulement les tehniques du traé statique (logi-

al frame, leretangle noté

F 1

^sur ^la ^gure ^2.9-a).^Ensuite l'utilisateur peut faireglisser ettefenêtrepour visualiserlasuitedu graphe(lesdiérentes fe-

nêtres

F i

^sur ^la^gure ^2.9-a).^Au ^fur^et ^à^mesure ^de l'exploration,les parties manquantes sont alulées et stokées en mémoire. Ces diérentes fenêtres

de visualisation respetent les ontraintes du traé statique (gure 2.9-b).

Les transitions entre les fenêtres sont onçues pour préserver au mieux la

arte mentale de l'utilisateur en ne hangeant que quelques sommets lors

du passage d'une fenêtre à la suivante ouen eetuant un déplaement des

sommetspour préparerla transitionvers une autrefenêtre.On retrouveune

problématiqueprohe du traé dynamique.

D'autres approhes utilisent des ahages inrémentaux. Soit en mon-

trant initialement les omposantes les plus importantes puis en omplétant

peu à peu lareprésentation selon lesdésirs de l'utilisateur[140℄, soitomme

dans Tulip[3℄, en dénissant préalablement une métrique sur le graphe qui

permetd'aherdefaçoninrémentaleuntraévisuellementprohedutraé

omplet ave un nombre très réduit d'éléments. La gure 2.10 illustre ette

dernière tehnique en montrant l'ahage en 4 étapes d'un graphe d'ordre

restreintquireprésentent lastrutured'un site web. Il fautnoterquelapre-

mièreétapede lareprésentation quiontientmoinsde 6.5% des sommetsde

(40)

Le grand graphe non entièrement stockable en mémoire

(a) Prinipegénéraldelaméthode

a

g f e c d

b

a c

f i

e b

d h

a

e c d

b

f i h

Nouveaux sommets

sommet g supprimé F1

F2 F3

La fenêtre de visualisation initiale

Le tracé suivant après déplacement de la fenêtre de visualisation de réajuster la position des sommets Un autre déplacement qui permet

(b)Extraitdesreprésentationspartiellessuessives.

Fig. 2.9 Illustrations de la méthode Online graph drawing. Adaptées

depuis [63℄.

(41)

(a) 200éléments (b) 600éléments

() 1000éléments (d)3200éléments

Fig. 2.10 Ahage inrémental de la struture d'un site web ave Tulip.

Extrait de [4℄.

(42)

Fig. 2.11 Un one trees pour représenter un système de hiers Unix.

2.4 Traé tridimensionnel

Depuis les premiersprototypes des années90 [58, 127℄ et l'exemple bien

onnus des one-trees [116℄ (gure 2.11), l'aessibilité roissante à la fois

des langages de développement pour des environnements tri-dimensionnels

(e.g. VRML, Virtual Reality Modeling Language) 5

et des moyens de aluls

disponibles, onduit à un intérêt grandissant pour les représentations vi-

suelles des graphes en 3D [84℄, en partiulier pour les strutures de grande

taille. L'ouvrageAtlas of Cyberspae 6

,limité auxreprésentations assoiées

à la toile [31℄, et le site Visual Complexity 7

donnent un large aperçu des

possibilitésdes artographiestri-dimensionnelles.

Les travauxsur l'appropriationhumainede ettenouvelleapprohe n'en

sontqu'àleurdébut[115, 136℄.Quandelleest utiliséeàbonesient,lesinté-

rêts avanés sont souvent que ladimension supplémentaire permet un ajout

d'informations et une plus grande exibilité pour plaer les sommets et les

ars [56, 72℄.Cependant, lesrestitutionsatuellessur lessupports lassiques

restentbidimensionnelles,etparonséquentlestraésrésultantpeuventêtre

omplexes et diiles à appréhender. Pour éviter l'utilisationd'algorithmes

spéiques souvent omplexes, les données à représenter doivent se prêter

5

http://www.graphomp.om/info/spes/vrml10.html

6

Voiraussilesitehttp://www.ybergeography.org/atlas/atlas.htmlassoiéàet

ouvragequiontientdesreprésentationsplusréentes.

7

(43)

naturellement à une représentation en 3D. L'ajout de la nouvelle dimen-

siondoitréellementapporterdesinformationssupplémentairesàl'utilisateur

etnon pas une omplexitéarue du traé.

Un problème réurrent, bien onnu des graphistes, dû à l'ajout de la

troisième dimension, est elui de l'olusion [135℄. Ce phénomène se pro-

duit de façon générale lorsque un objet se retrouve masqué par un autre

(voir l'exempledu haut de la gure2.11). L'olusion peut prendre diverses

formes pour le traé de graphes et peut, selon l'angle de vision de l'utilisa-

teur,modierlareprésentation[84℄:deux sommetspeuventêtre vusomme

un seul, des roisements supplémentaires inexistants dans la représentation

apparaissent,des sommetsetdes arspeuvent sesuperposer etréerdenou-

veaux sommets, ... Sur le plan théorique, les projetions utilisées doivent

limiter la perte d'information. Pour faire fae à es limitations, les logiiels

intègrent des outils de navigation de type rotation, déplaement, zoom qui

augmententl'eaité de l'utilisationde l'espaede représentation.

Pour lesstruturesde grandetaille,une extensiondumodèledes graphes

hyperboliques présenté préédemment a été développée pour une famille de

graphespeu denses[101℄.L'espae hyperbolique3Dpermetàl'utilisateurde

sefoalisersur un sommetpartiuliertout en onservant une vue globalede

l'ensemblede lastruture (gure 2.12).

2.5 Au delà des représentations sommets-liens

Au-delà des représentations visuelles lassiques des graphes, où les som-

mets et les ars sont expliitement traés, se sont développées es dernières

années, essentiellement pour les arbres, des nouvelles approhes basées sur

des métaphores graphiques; itons par exemple elle du iruitéletronique

(gure2.13) ou de lamétaphore botanique [74℄(gure 2.14).

Pour tenter debraverlaomplexitéinhérenteauxgrandstraés,d'autres

modesde représentationontété proposés. Ilspeuventêtrebaséspar exemple

sur une représentation matriielle omme dans les travaux de Ghoniem et

al.[49℄,ouenore,pourlesarbres,parunpavageduplanave laméthodedes

Treemap[64℄ (gure 2.15). L'avantage prinipalde ette méthode populaire

estquedesarbresdeplusieursentainesdesommetspeuventêtrereprésentés

surunsupportdepetitetailletoutenrestantlisiblesetompréhensiblespour

un utilisateur ayant intégré lemode de leture.

Cesméthodes,parrapportauxreprésentationslassiquesdesgraphes,ont

l'inonvénientde néessiterpourl'utilisateurunepériode d'appropriationdu

(44)

Fig. 2.12 Graphe représentant un extrait des liens d'un site web dans un

espae 3D hyperbolique. Extrait de [100℄.

Fig. 2.13 Utilisation de la métaphore du iruit életronique pour repré-

senter un arbre.

(45)

Fig. 2.14 Visualisationd'un système de hiers par une métaphore bota-

nique [74℄.

2.6 Les langages de desription

Chaque ommunauté d'utilisateurs utilise souvent ses propres logiiels

de représentation plus ou moins adaptés spéiquement aux besoins d'un

domaine. Malheureusement, la grande majorité de es logiiels utilise leur

propre format de desription de données bien souvent sous la forme d'un

hier texte. Par onséquent, la mise en plae d'un jeu d'essai ommun à

plusieurs logiiels pour, par exemple omparer leurs fontionnalités respe-

tives, n'estpas évidente;lespossibilitésd'importationoud'exportationave

diérentslangagesde desriptiondedonnéesétantbiensouventlimitées.Ce-

pendant,stimuléespar l'émergeneréentedessolutionsutilisantXML 8

,des

tentativesd'uniformisationsonten développement.D'une façongénérale, les

langagesde desription permettentpour laplupartde simplementdénirun

graphe en dérivant l'ensemble de ses sommets et de ses arêtes ave leurs

attributsde style (e.g.ouleurs, formes, tailles, noms).On peut notamment

iter parmiles plus usités :

le langage dot qui aété misaupoint pour lasuite logiiellegraphviz

8

(46)

(a) Prinipederéationd'untreemap.

(b) Exemple ave unsystème de hiers d'environ une douzaine

de répertoires et 240 hiers réalisé ave TreeMap Java Library

(http://treemap.soureforge.net).Chaqueretangle ommeelui

aveunfondfonéreprésenteunhier.Lesregroupementsdees

retangles(exempleduretangleavedesbordsépaisaubasdela

gure)représententlesdiérentsrépertoires.

Fig.2.15 LesTreemaps :prinipede onstrutionetexemplesur un arbre

de grande taille.

(47)

de AT&T 9

[45℄ permet notamment de traer des graphes en niveaux.

Ce langagepermet en plus de regrouperdes objets ayant des attributs

ommuns pour former des sous-graphes.

le langage GML (Graph Modeling Language), qui a été développé

pour la plate-forme Graphlet 10

, dans un but d'uniformisation des dif-

férents langagesde desription existant à l'époque de sa réation. Par

rapportaulangagedot,GMLpermetdedériredesinformationsspéi-

quesnéessaires pourlavisualisationd'information.Desinformations

arbitraires(assoiationde données externesàunsommetpar exemple)

peuventêtreajoutéesdanslesdesriptionsdesomposantes dugraphe.

Ainsi un hier GML peut permettre d'émuler de nombreux langages

de desription.

LeslangagesbaséssurXMLommeGraphXML[60℄quiestonçu

ommeunformatd'éhangeentreappliationsdetraésetvisualisation

de graphes oumêmeave d'autres typesd'appliations.Il aaussi pour

avantage d'être plusgénérique etplus simpleà utiliserqueGML en e

quionernelesdonnées externes.On peut aussi iterXGMML 11

qui

est une transformation du langage GML en XML. Plus réemment, le

langage GXL [141℄ (Graph eXhange Language) vise à réer un for-

matd'éhange entre appliationsquisoitle plusstandard possible.Ce

langagepermet notammentd'émuler tous eux ités préédemment.

Les librairies en C++ omme LEDA (Library of Eient Data

types and Algorithms)quiest onstituée d'un ensemblede lasses ave

ses propres strutures de données, son propre système de gestion de

mémoireetbeauoup de méthodes etd'algorithmesspéiquespour la

desriptionetlamanipulationde graphesd'un pointde vue plus théo-

rique que les langages préédents [96℄. On peut aussi iter la librairie

GTL (Graph Template Library) 12

, qui peut être vue omme une ex-

tensiondes librairiesSTL 13

pour la manipulationet ladesription des

graphes.

9

http://www.graphviz.org/

10

http://www.infosun.fmi.uni-passau.de/Graphlet/

11

Uneversiondetravaildesspéiationsest disponibleà:http://www.s.rpi.edu/

~puninj/XGMML/draft-xgmml-20010628.html

12

http://infosun.fmi.uni-passau.de/GTL/

13