HAL Id: tel-00335934
https://tel.archives-ouvertes.fr/tel-00335934
Submitted on 31 Oct 2008
HAL is a multi-disciplinary open access archive for the deposit and dissemination of sci- entific research documents, whether they are pub- lished or not. The documents may come from teaching and research institutions in France or abroad, or from public or private research centers.
L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau recherche, publiés ou non, émanant des établissements d’enseignement et de recherche français ou étrangers, des laboratoires publics ou privés.
graphes dans une mémoire d’entreprise : application sur le serveur Atanor
Bruno Pinaud
To cite this version:
Bruno Pinaud. Contribution à la visualisation des connaissances par des graphes dans une mémoire d’entreprise : application sur le serveur Atanor. Autre [cs.OH]. Université de Nantes, 2006. Français.
�tel-00335934�
Eole Dotorale STIM
Sienes et Tehnologies de l'Information et des Matériaux
Année 2006
N° E.D. : 366256
THESE DE DOCTORAT
Spéialité: INFORMATIQUE
Présentée et soutenue publiquement par
Bruno PINAUD
le 22mai2006
à l'Eole polytehnique de l'université de Nantes
Contribution à la visualisation des onnaissanes par des
graphes dans une mémoire d'entreprise : appliation sur
le serveur Atanor
Jury
Rapporteurs: Jin-Kao Hao, Professeurà lafaulté dessienes d'Angers,
Gilles Venturini, Professeur àl'Eole polytehnique de l'université de Tours,
Examinateurs : Henri Briand, Professeurà l'Eole polytehnique del'universitéde Nantes,
PasaleKuntz, Professeur àl'Eole polytehnique del'université deNantes,
Christel Vrain, Professeurà lafaulté dessienes d'Orléans,
Invités: Jean-Bernard Fournier,Président dudiretoire dePerformanSeCorp.,
Jaques Philippé,Expert sientiquepour PerformanSeCorp.
Direteur de thèse : Henri Briand
Co-enadrante :Pasale Kuntz
Laboratoire:Laboratoire d'Informatiquede NantesAtlantique
2,ruede laHoussinière BP92208
CettethèseaétéréaliséegrâeàlaoopérationduLaboratoired'Informa-
tique de Nantes Atlantique (LINA), de l'Eole polytehnique de l'université
de Nantes (Polyteh'Nantes), et de la soiété KnoweSia SAS liale de Per-
formanSe Corp. (Carquefou-44).Je tienstout d'abord àremerier Monsieur
HenriBriandpour avoiraepté d'êtremondireteur dethèse.Jetiens aussi
à remerier vivement Madame Pasale Kuntz pour sa très grande patiene
etson importanteimpliationdans montravailpar un enadrement de tous
lesinstants.JeremerieaussiMessieursJean-Bernard Fournier,PatrikBru-
net, Serge Baquedano et Jaques Philippépour m'avoir aueilli ausein de
PerformanSe et m'avoir fait onane. Je remerie aussi l'ensemble de mes
ollèguesde KnoweSia etPerformanSe, ainsiquel'ensembledu personnel du
départementinformatiquedePolyteh'Nantespourl'ambianedetravailtrès
haleureuseetlaonvivialité.Jeremerie aussivivementMadameCatherine
Galais pour ses nombreuses reletures pointues de publiations anglophones
etsa bonne humeur permanente.
Jetiens aussi àremeriermafamilleetmes amis lesplusprohes notam-
mentVinent Georay, Vinent Fagard,Grégory Fernandez, Marina Goure-
man et William Dupuy pour leur soutien, leur aide et les nombreux bons
moments passés tous ensemble. Je remerie aussi les membres de l'équipe
COD pour leur soutien et leur aide notamment Julien Blanhard, Jérme
Davidainsi queRémiLehn sans quitout e travailn'auraitpas été possible.
JeremerieaussiMessieursGilleVenturinietJin-KaoHaod'avoiraepté
d'êtrelesrapporteursde mathèse,pour l'attentionave laquelleilsl'ontlue
etévaluéeainsiquepourlesremarquesetritiquesonstrutivesqu'ilsm'ont
adressées.
1 Introdution 1
2 Représentation visuelle des graphes 11
2.1 Le traé statique . . . 13
2.2 Le traé dynamique . . . 18
2.3 Le traé des grands graphes . . . 21
2.4 Traé tridimensionnel . . . 29
2.5 Au delà des représentations sommets-liens . . . 30
2.6 Les langagesde desription . . . 32
2.7 Conlusion . . . 35
3 Traé de graphes en niveaux 37 3.1 Formalisationdu problème de traé. . . 39
3.2 Etat de l'art pour leproblème statique . . . 40
3.3 Les paysages de reherhe . . . 47
3.4 Les graphes-paysages . . . 52
3.5 Analyse statistiquepour des petits graphes . . . 56
3.6 Analyse statistiquepour des grands graphes . . . 61
3.7 Conlusion . . . 66
4 Présentation de l'algorithme AGH 67 4.1 Prinipe de base des AG. . . 69
4.2 L'algorithme AGH . . . 70
4.3 Validationexpérimentale . . . 77
4.4 Comparaison des stratégies de reherhe loale . . . 81
4.5 Inuene des diérents opérateurs . . . 82
4.6 Comparaisons ave la reherhe Tabou . . . 85
4.7 Conlusion . . . 86
5 Extensions de AGH 89 5.1 Traé dynamique . . . 90
6 Appliation sur Atanor 101
6.1 Desriptif générald'Atanor . . . 103
6.2 Le modèle des logigrammes . . . 110
6.3 Le modèle Graph'Atanor . . . 112
6.4 Comparaisons expérimentales des modèles . . . 114
6.5 Conlusion . . . 119
7 Conlusion 121 Bibliographie 127 Annexes 141 A L'annuaire GVSR 143 A.1 Desription du ontenu . . . 144
A.2 Desription tehnique . . . 146
B Implémentation de AGH 149
1.1 Cyle de vie d'une mémoired'entreprise [28℄. . . 3
1.2 Une arte ognitiveréalisée ave le logiielFreemind. . . 5
1.3 Un arbre de défaillane. . . 6
1.4 Un arbre de déision. . . 6
1.5 Un graphe oneptuel . . . 7
2.1 Importanede la onvention de traé . . . 15
2.2 Diérentes onventions de traé . . . 16
2.3 Illustration du respet des ritères esthétiques. . . 17
2.4 Illustration du prinipe de bonne ontinuité des ars [137℄. . . 17
2.5 Illustration d'un traé dynamique. . . 20
2.6 Exemple de sheye . . . 22
2.7 Illustrations des TopologialFisheyes . . . 23
2.8 Arbres hyperboliques . . . 25
2.9 Illustrations de la méthode Online graph drawing . . . 27
2.10 Ahage inrémental de lastruture d'un site web . . . 28
2.11 Exemple de one trees . . . 29
2.12 Représentation dans un espae3D hyberbolique. . . 31
2.13 Métaphore du iruit életronique . . . 31
2.14 Métaphore botanique . . . 32
2.15 Illustrations des treemaps . . . 33
3.1 Un graphe propre . . . 40
3.2 L'heuristique de Sugiyama. . . 41
3.3 Un graphe non orienté . . . 45
3.4 Surfae quadratique . . . 49
3.5 Surfae unimodale . . . 50
3.6 Surfae multimodale simple . . . 50
3.7 Surfae unimodale àgros grains . . . 50
3.8 Surfae multimodale àstruture ombinative . . . 51
3.9 Surfae multimodale sans struture partiulière . . . 51
3.12 Extrait d'un graphe-paysage assoié àun petit graphe. . . 53
3.13 Un graphe-paysage . . . 54
3.14 Zoomsur legraphe-paysage de lagure 3.13. . . 55
3.15 Distribution des valeurs de laFDC . . . 57
3.16 Hauteur relative des optimaloaux. . . 59
3.17 Probabilitéd'atteindre un optimum loal. . . 60
3.18 Exemple d'appliation de l'opérateurde la médiane. . . 64
3.19 Distribution du nombre de solution
D c G
. . . . . . . . . . . . 653.20 Comparaison entre
d(G)
et lenombre de solutionsD c G
. . . . 664.1 Prinipegénéral d'un algorithmegénétique. . . 69
4.2 Opérateurs de roisements. . . 74
4.3 Croisementintra-niveaux . . . 75
5.1 Analyse de la qualité des traés. . . 95
5.2 Evolutiondu ritèrede similarité . . . 96
6.1 Positionnementd'Atanor dans l'entreprise . . . 104
6.2 Le module Expert d'Atanor. . . 106
6.3 Module Pratiien :hoixd'une panne. . . 107
6.4 Module Pratiien :exemple de test proposé à l'utilisateur. . . 108
6.5 Diérents indies du module Manager . . . 109
6.6 Les diérents modèles d'Atanor etleurs interations. . . 110
6.7 Formalisation des onnaissanes par logigramme. . . 111
6.8 Le modèle Graph'Atanor . . . 113
6.9 Hiérarhiedes proessus métiers ave Graph'Atanor . . . 115
6.10 Dupliation de sommetspartie 1 . . . 116
6.11 Dupliation de sommetspartie 2 . . . 117
6.12 Dupliation de sous-arbres. . . 118
A.1 La page d'aueil du site. . . 144
A.2 Capture d'éran d'une he-logiiel. . . 145
3.1 Modélisationd'un graphe-paysage . . . 55
4.1 Justiation des paramètres des opérateurs de AGH . . . 80
4.2 Justiation des paramètres des opérateurs de AGH2 . . . 80
4.3 Justiation des paramètres générauxde AGH . . . 81
4.4 Comparaison entre AGH etAGH2 . . . 81
4.5 % moyen de meilleures solutionstrouvées entre AGH etAG. . 83
4.6 Comparaison entre AGH, DMa etDMb . . . 84
4.7 Comparaison entre AGH etTS . . . 86
4.8 Hauteur relative moyenne . . . 88
5.1 Comparaison entre AGH etDMb pour lesgrands graphes . . 98
3.1 Estimationde laprobabilité de trouver un optimum loal . . 59
3.2 Analyse des GP des grands graphes . . . 62
4.1 Shéma de base d'un algorithme génétique . . . 70
4.2 Algorithme génétiquehybridé . . . 71
4.3 Appliation des opérateurs de roisements.. . . 73
4.4 Prinipede lastratégie de reherhe loale . . . 76
4.5 Opérateur de mutation . . . 77
4.6 Stratégie d'optimisationloale RL2 . . . 79
4.7 Méthode de traé ave une reherhe Tabou[83℄. . . 87
5.1 Proédure
AGH D
pour le traé dynamique . . . . . . . . . . 925.2 Générateur de traésdynamiques . . . 94
Introdution
Cette thèse a été menée dans le adre d'une onvention CIFRE établis-
sant une ollaboration entre la soiété KnoweSia SAS (Carquefou, Loire-
Atlantique), spéialisée dans le domaine de la gestion et de la valorisation
des onnaissanes, et l'équipe COD (COnnaissanes & Déision) du LINA
(Laboratoired'Informatique de Nantes Atlantique).
La Gestion des Connaissanes
Parmilesproblèmesstratégiquesatuelsauxquelssontonfrontéeslesen-
treprises, onpeut notammentiterlagestiondedonnées distribuéesdontles
volumes ont explosé ou enore la baisse du niveau d'expertise dans ertains
domaines ausée par l'érosion du nombre d'experts (pyramide des âges qui
vieillit, mobilité importante). Dans un ontexte fortement onurrentiel où
la duréede vie de la plupartdes produits diminue onstamment et lesteh-
nologies etméthodes utilisées pour la fabriation etla distribution évoluent
sansesse,ilestimportantdepouvoironserverenvued'uneréutilisationles
informations pertinentes et les onnaissanes aquises. Cette mémorisation
struturée des onnaissanes est d'autant plus diile à eetuer que d'une
part,les struturesdes produits sontde plus en plusomplexes (multipliité
destehnologiesetdesateurs,grandnombrede omposants),etqued'autre
partlesaratéristiquesdessouresde onnaissanesrelativesàes systèmes
sontdemultiplessortes(individuelles,olletives,taites,proédurales,...).
Eneet,enplusdesonnaissanesexpliites(ourrierséletroniques,pro-
édures, notes de servie, ...), ilfautaussi prendre en omptetout lesavoir
impliiteoutaite(bonnespratiques,savoir-faire,...);'estàdirel'ensemble
des onnaissanes qui ne sont pas failement formalisables ave des formes
syntaxiques usuelles [2, 36℄. Le apital d'une entreprise n'est pas seulement
omposé de ses biens matériels et outils de prodution. Sans l'ensemble des
savoir-faire, la performane de es outils se restreint fortement. Il fautdon
apitaliser ette onnaissane taite, 'est à dire la onserver et l'analyser
pour larendreaessibleauxutilisateursonernés, lafaireévolueretpar e
biais faireainsi évoluer l'entreprise.
LaGestiondesConnaissanes (GC)peutêtrepréisémentdénieomme
uneapproheglobaleettransversalequiregroupel'ensembledes méthodeset
tehniques permettant de formaliser, partager, diuser et enrihir le apital
intelletuel de l'entreprise. L'objetif sous-jaent est de pouvoir fournir à
haquelassed'utilisateurslesonnaissanes pertinentes aubonmoment.La
gestiondes onnaissanesest donunproessusanthropoentréquiregroupe
un ensemble de tâhes diiles. Elle peut prendre plusieurs aspets au sein
d'uneorganisationetêtretraitée enutilisantde multiplesapprohes [36℄. Le
travailde ette thèses'insrit dansle adredu développement d'un Système
de Gestion des Connaissanes (SGC) ou serveur de onnaissanes que l'on
peut qualier de mémoire d'entreprise. Le proessus de réation d'une telle
mémoire est onsidéré omme le passage d'une mémoire de travail à une
mémoireorganisationnelle.Ellesedénitommeunapitaldeonnaissanes
aessible indépendammentdes ateursqui l'ont réée[109℄.
Il fautnoter que l'utilisationde l'informatique n'est a priori pas obliga-
toire en GC. Mais, omme le font remarquer de plus en plus d'auteurs [2,
28,106℄, ettedernière estamenéeàjouerun rlede plusen plus important.
Au-delà des fontionnalités qu'elle apporte (e.g. diusion de l'information,
utilisationd'éditeursgraphiques adaptés),l'utilisationdel'informatiqueper-
met de renforer l'interativitéave l'utilisateur quipeut ainsi être plaé au
÷ur du proessus de GC.
Cyle de vie d'une mémoire d'entreprise
Une démarhe de gestion des onnaissanes est assoiée au yle de vie
d'une mémoire d'entreprise. Il peut être shématisé par un proessus om-
plexe qui intègre, entre la détetion des besoins et l'utilisation, diérentes
phases[28℄(gure1.1).Ladétetiondes besoinspermetde qualierleprojet
en terme d'ambition, de limites, d'impat organisationnel, et de quantier
les moyens néessaires à sa bonne réalisation. Ensuite, une fois reensées
les souresde onnaissanes disponibles etvalides qui peuvent être utilisées
(doumentationspapiers,experts humains,bases de données, ...), plusieurs
typesde mémoiressont envisageables: e.g.une GestionEletroniquede Do-
uments (GED), une mémoire à base de as, une doumentation tehnique
et Evolution Maintenance
Evaluation Utilisation
Diffusion
Détection des besoins Construction
Fig.1.1 Cyle de vie d'une mémoired'entreprise [28℄.
La onstrutiond'une mémoireà base de onnaissanes néessite la mise
en plae d'un formalisme préis pour représenter les onnaissanes (ontolo-
gies, modélisation objets, réseaux sémantiques, règles de produtions, ...).
Sur le plan opérationnel, es représentations sont onçues à partir de mé-
thodes d'ingénierie des onnaissanes. Citons par exemple laméthode Com-
monKADS [124℄ qui propose des modèles génériques permettant d'interpré-
ter lesdonnées reueilliesdes experts ouenorela méthode MKSM 1
[40℄ qui
onsisteàonstruireundoument,appelélivredeonnaissanes,quiontient
les desriptions textuelles et graphiques des modèles de onnaissanes obte-
nus après extration des expertises. Il existe de nombreuses méthodologies
qui sont bien souvent spéialisées selon le seteur d'ativité de l'entreprise.
Chaque méthode utilise ses proprestehniques de reueil de données parfois
defaçon omplémentaire,ommel'entretien,l'observationdiretedel'expert
en situation de travail, ou enore l'utilisation d'éditeurs graphiques onçus
spéiquement. Ces éditeurs, utilisés diretement par l'expert, failitent la
transmission direte des onnaissanes sur la base du formalisme de la mé-
moire.
A tout momentdu yle de vie,dès qu'ilfautréaliserune interfaeentre
le ontenu de la mémoire et ses usagers, des représentations visuelles adap-
tées s'avèrent des médiateurs eaes qui permettent de failiter le dia-
logue [5, 23℄. Ces représentations doivent être simples à appréhender et à
omprendrepourlesdiérentes lassesd'utilisateurs.Ellesdoiventpermettre
d'apporter aux intervenants humains un substrat artiielqui transrive un
grand nombre d'informations et qui soit un support à leurs onnaissanes
et à leurs intuitions pour que non seulement ils puissent exprimer plus fai-
lement leurs savoirs taites et impliites mais aussi déouvrir des nouvelles
onnaissanes (e.g. relations).
1
La visualisation en Gestion des Connaissanes
Diérents travauxen psyhologie ognitive,en partiulier issus de l'éole
de la Gestalt [77℄, ont mis en évidene la apaité du erveau à analyser
rapidement des omposantes graphiques, et à pouvoir raisonner sur des re-
présentations visuelles. C'est don naturellement que onjointement à l'uti-
lisationgrandissantedes Tehnologiesde l'Informationetde laCommunia-
tion (TIC) s'est développée la visualisation d'information. La dénition de
Cardetal. [18℄est souventprise ommeréférene:... the useof omputer-
supported, interative, visualrepresentations of abstrat data to amplify og-
nition. Mais omme le font remarquer Eppler et Burkhard [15, 39℄, ette
dénition atteint ses limites lorsque l'on veut traiter le as spéique de la
visualisation de onnaissanes. En eet, les méthodes utilisées en visualisa-
tion d'information visent souvent lagénériité et n'intègrent pas toujours la
sémantiquedes données etleur domained'utilisation.Deplus, es méthodes
peuvent être parfois diiles à appréhender pour un utilisateur non initié.
En GC, an de failiter les transferts de onnaissanes, il est néessaire de
développer des méthodes de visualisation qui permettent de respeter la sé-
mantiquedes données et de masquer les diérents aspets ombinatoires et
algorithmiquesquandelaest néessaire:Knowledgevisualization examines
theuseofvisualrepresentationstoimprove thetransferofknowledgebetween
at least two persons or group of persons (Burkhard [15℄).
La visualisation d'information et la visualisation de onnaissanes ex-
ploitent don toutes deux nos talents innés pour la manipulation de repré-
sentations graphiques de façon omplémentaire : la première vise générale-
ment à analyser de grandes quantités de données pour en failiterla leture
etla ompréhension, etla seonde viseà failiterl'éhange etla réationde
onnaissanes en mettant à disposition des outils pour permettre aux per-
sonnes de failement exprimer et formaliser e qu'elles savent [39℄. La paire
indissoiable {modèle, représentation visuelle} dépend à la fois des onnais-
sanes dont on dispose, du mode de raisonnement sur es onnaissanes et
des diérents points de vue utilisateurs onsidérés dans le SGC. D'une fa-
çongénérale,lavisualisationdeonnaissanes est undomaineenpleinessor,
stimuléenpartiulierparlestravauxsurlesreprésentationsvisuellesduWeb
sémantique, etl'analysede etaspet fondamentaldansun proessusde GC
n'en est qu'à ses débuts.
La très grandemajoritédes représentations visuelles atuelles proposées
sontbasées,aumoinsimpliitement,d'unpointdevueformelsurdesmodèles
d'arbres ou plus généralement de graphes. De façon générale, les modèles
Fig. 1.2 Une arte ognitive réaliséeave lelogiiel Freemind.
tiques [85℄. Dans e modèle, les onepts sont représentés par les sommets
d'ungrapheetlesrelationssémantiques parlesarêtes.Lamajeurepartiedes
tehniques présentées i-dessous pourraient être onsidérées, dans le adre
d'une représentation desriptive, omme des spéialisations des réseaux sé-
mantiques.
Représentation par arbres
Lesreprésentationssous formed'arbres,quisontparmilesplus abouties,
regroupent des tehniques très diérentes :
Les artes ognitives ont été développées pour failiter la transrip-
tiond'idéessurunsupportvisuel[16℄.Autourd'unsommetentraldes
idéessontreprésentéesenréantdiérentesarboresenes.Al'origine,
lesreprésentationsétaienteetuées manuellementmais diérentes so-
lutions logiiellespermettent d'enrihirla représentation. On peut no-
tammentiter MindManager 2
, VisualMind 3
et lesdiérentes solutions
proposées par The Brain 4
, etdans le domaine du logiiellibre, Free-
Mind 5
qui est une solutiontrès aboutie (gure 1.2).
Les arbres de défaillane [88℄ sont prinipalement utilisés dans le do-
maine de la sûreté de fontionnement. Ils permettent de représenter
graphiquementl'ensembledes pannesd'un systèmequipeuventsepro-
duire pour un évènement donné (gure 1.3). Un même système peut
don avoirplusieurs arbresde défaillanepossibles.Ce mode de repré-
sentation est très employé dans le monde industriel quand la séurité
est primordiale (aéronautique,automobile, himie, nuléaire,...).
Les arbres de déision, et plus généralement les graphes d'indutions,
ontétéinitialementutilisésen apprentissageautomatique[143℄;ilsres-
2
http://www.mmdfrane.fr/
3
http://www.visual-mind.om/
4
http://www.thebrain.om
5
Défaut 1 Défaillance
A Défaillance
B
Défaut 2 Perte système S1
OU
ET
Fig.1.3 Un arbre de défaillane.
Est−ce qu’il y a des films intéressants au cinéma ?
chez moi Je reste chez moi Je reste
me promener Je vais
me promener Je vais fait−il ? Quel temps
Pluie Couvert
Température Fraîche Correcte
Je vais au cinéma
Non Oui
Beau
Fig.1.4 Un arbre de déision.
tent des modèles privilégiésd'exploration des données à lafois pour la
desription et le lassement. Dans ette représentation, haque n÷ud
est assoié à un test sur un attribut, les feuilles orrespondant au ré-
sultat nal et haque ar est assoié à une réponse possible d'un test
(gure1.4).
Représentation par graphes
La plupart des représentations par graphes en GC se retrouvent asso-
iées à trois grandes lasses de modèles dont les intersetions peuvent être
importantes :lesgraphes oneptuels,lesontologiesetlesréseaux bayésiens.
Les graphes oneptuels ont été à l'origine proposés omme une re-
présentation graphique de la logique de premier ordre. Ils permettent
de simplier la mise en relation entre la logique et les langues natu-
relles [126℄ pour obtenir une représentation des données qui soit li-
sibleetutilisableauseinde traitementsautomatiques.EnGC, ilssont
Fig. 1.5 Un grapheoneptuel représentant une ontologie de la géométrie
prospetive réalisé ave TooCom [44℄.
et ilsonstituent un formalismeadapté pour la représentation d'onto-
logie [44℄ (gure 1.5).
L'ingénierie ontologique vise à la onstrution et l'exploitation d'on-
tologies en onservant souvent une ertaine indépendane par rapport
auxusagesopérationnelsqui peuventen être fait.Dansunemémoireà
basedeonnaissanes,lesontologiespermettentd'expliiterlatermino-
logieoulesonepts liésàun métierouàun groupedonnéd'individus
au sein d'une organisation. Du fait de l'importaneroissante en GC,
diérents logiiels proposent des représentations graphiques tels que
Protégé 6
,Os-Skill [117℄ou enoreITM de Mondea 7
.
Les réseaux bayésiens, utilisés initialement en apprentissage automa-
tique, peuvent s'interpréter omme des graphes d'états auxquels sont
ajoutés des probabilités de transition sur les ars. Des logiiels sont
maintenant utilisésen GC : BayesiaLab etBest 8
.
Desreprésentationsgraphiquesspéiquesontétédéveloppéespourdes
méthodes lassiquesde GC telque CommonKADS [24℄.
6
http://protege.stanford.edu/index.html
7
http://www.mondea.om/
8
Contexte de la thèse
L'originede ette thèserelève d'uneproblématiquede visualisationasso-
iée àun SGC. Leserveur de onnaissanes Atanor développé par lasoiété
KnoweSia est une mémoire métier proédurale. Il a été onçu an de gérer
unedémarheomplètedegestiondesonnaissanesenfusionnantl'expertise
tehniqueet lesdiérentes ressoures humainesdisponibles.Cette démarhe
est orientée vers le déploiement et l'opérationnalisation des onnaissanes
portantsurdessystèmesomplexesàpartirdesouresmultiples[54,55℄.Ata-
nor permet de rendre aessible la onnaissane diretement sur les postes
de travail des utilisateurs naux. Ils se retrouvent don au entre de leur
proessus d'aquisition en naviguant diretement au sein des onnaissanes
qu'ils désirent utiliser. Ces onnaissanes maintenues par l'outil sont ati-
vables et présentées sous une forme multimédia [107℄. L'arhiteture d'Ata-
nor est fondée sur trois modules prinipaux qui proposent diérentes vues
sur lesmodèlesde onnaissanes utilisés :
lemoduleExpert estdestinéauxexpertspouronstruireetfaireévoluer
lesmodèles de onnaissanes;
les utilisateurs ont à leur disposition le module Pratiien pour, dans
un ontexte opérationnel, ativer laonnaissane;
lemoduleManager permetd'aéderàdesindiesstruturelsetopéra-
tionnelssur l'utilisationdu serveur etdes onnaissanes qu'ilontient.
Chaque modèle néessite une représentation visuelle spéique adaptée aux
besoins propres des utilisateurs onernés. Dans ette thèse nous nous foa-
lisons sur le moduleExpert.
Unpremiermodèlevisuelbasésuruneextensiondesarbresdedéfaillane
et des arbres de déision avait été proposé à l'origine du développement
d'Atanor [55℄. Cependant, son instaniation dans diérents ontextes appli-
atifsamisen évidene diérentes limites, laprinipale étant laprésene de
nombreuses redondanes qui peuvent entraver l'interprétation synthétique
dufontionnementd'un proessusetmasquer despointsritiques.L'objetif
appliatif de ette thèse a été de proposer un nouveau modèle de représen-
tation pour le module Expert d'Atanor ainsi que lesalgorithmes néessaires
àsa représentation visuelle.
Contribution et organisation de la thèse
Lastrutureatuelledesonnaissanes du serveurAtanornousaonduit
à privilégierune représentation par graphes, plus préisément sous la forme
donnés dans des niveaux représentant les diérentes étapes du proessus
au sens de l'expert. L'implémentation de ette représentation néessite la
mise en ÷uvre d'une méthodologie proposant à l'utilisateur un traé lisible
etintelligible.
Le hapitre2 présente une étudebibliographique orientée vers les usages
des diérentsproblèmes de représentation visuelle des graphes: le problème
lassique du traé statique sur un support de taille standard, le problème
dynamique où legraphe à traer évolue sur une éhelle de temps restreinte,
le traé des graphes de grandes tailles, les problèmes émergents des traés
en trois dimensions ainsi que lesreprésentationsbasées sur d'autres odages
des graphes. Nous présentons aussi les langages de desription de graphes
les plus utilisés dans les logiiels. Nous rappelons dans e hapitre que la
générationd'unbontraé estsouventdiileentermedeomplexité,etles
ritèresutiliséspourestimerlaqualitédestraéssontsouventsubjetifsvoire
ontraditoires puisqu'ilssont liésà lapereption du traé par l'utilisateur.
Ces ritères setraduisent par des ontraintes de lisibilitéà satisfairemo-
délisées omme des ontraintes d'optimisations [27℄. Parmi les nombreuses
ontraintes, diérentstravauxont montré l'importaneen terme de lisibilité
etdemémorisationdelaminimisationdunombrederoisementsd'ars[110℄.
Nousnous sommesdonfoalisés surelle-i. Pour lestraésd'un grapheen
niveaux, la rédution du nombre de roisements d'arsonsiste àtrouverun
ordre optimaldes sommets dans haun des niveaux. Lehapitre3 présente
eproblèmed'optimisation.L'étudebibliographiquedesdiérentesméthodes
de résolutionsonnues montrequel'analysedes paysages dereherhe asou-
ventéténégligée.Cetteétudeestfondamentaleandeonevoiruneméthode
derésolution eae.Nousmontronsparune étudedesriptiveetstatistique
des paysages de reherhe assoiés àdiérentes tailles de graphes qu'ilssont
fortementmultimodauxetquelaqualitédes optimaloaux esttrès variable.
Nous en onluons qu'un algorithme évolutionnaire et partiulièrement un
algorithme génétique(AG)sembleêtre une voie prometteuse.
Le hapitre 4 présente une desription omplète, ainsi que la validation
desdiérentsopérateursdel'algorithmegénétiquequenousavonsdéveloppé.
Il possède deux partiularités : deux opérateurs de roisement spéiques
aux traés en niveaux et une hybridation par une reherhe loale. Les ex-
périmentations montrent que et algorithme surlasse les méthodes exates
lassiques et donne dans la plupart des as de meilleurs résultats en terme
de qualité et plus rapidementque les autresmétaheuristiques développées à
notre onnaissanepour e problème.
Le hapitre 5 présente deux extensions de l'AG. La première est onsa-
rée au problème de traé dynamique qui doit tenir ompte simultanément
qu'uneertaine persistanede lareprésentation dansletempsande limiter
les eorts de réinterprétation de l'utilisateur. Nous proposons une heuris-
tique pour e problème. La deuxième extension dépasse le adre appliatif
et porte sur la omparaison de l'AG ave des méthodes de desentes mul-
tiplespour des graphes de grandestailles quine peuvent plus être traéssur
des supports de taillestandard. L'objetif initialde ette omparaisonétait
de mieux omprendre lesomportements respetifs de l'AGetdes desentes
multiples pour des orpus d'instanes variés. Nous montrons sur des jeux
de données signiatifs que la performane de l'AG diminue au-delà d'une
ertainetailledes graphesàause probablementde hangements importants
dans lastruture des espaes de reherhe.
Le hapitre 6 est onsaré à l'appliation sur Atanor. Ses aratéris-
tiques prinipales et le modèle atuellement utilisé pour la représentation
des onnaissanes sontprésentés. En utilisantun exempleréel d'appliation,
renontré dansun projetsur lamaintenanede mahinesde triautomatique
deourrierde laPoste,nousomparonslesmodèlesdereprésentations.Nous
montronsl'intérêt de lavisualisationdes onnaissanes par notre modèle de
graphes pour l'améliorationde la lisibilitédes traés ainsi que leur exploita-
tion par lesdiérentes lasses d'utilisateurs.
Représentation visuelle des
graphes
Il faut imaginer dans sa tête des trus qu'on appelle sommets, et pour
toute pairede sommets soit une arête quiles joint,soit une non-arête quiles
laisse sans joint : ei est un graphe selon Berge.
P. Rosenstiehl [118℄
Sommaire
2.1 Le traé statique . . . 13
2.2 Le traé dynamique . . . 18
2.3 Le traé des grands graphes . . . 21
2.3.1 Distorsion dutraé . . . 21
2.3.2 Stratégie dereherhe d'information . . . 24
2.3.3 Projetions dansd'autresespaes . . . 24
2.3.4 Ahage partiel . . . 26
2.4 Traé tridimensionnel . . . 29
2.5 Au delà des représentations sommets-liens . . . . 30
2.6 Les langages de desription . . . 32
2.7 Conlusion . . . 35
Uneonséquene de ladénition d'ungraphedonnée en exergue parl'un
desplus élèbresmaîtresdudomaineest qu'ilssontlesoutilsprivilégiéspour
simultanémentmodéliseretreprésenter visuellementunsystème derelations
entre des entités. Quand on étudie la théorie des graphes, on pourrait très
bienparler de graphe en termede fontion en 0 et 1 (...),mais non, on les
traite en forme degure parequ'on veut visualiserl'objet,mettre despoints
pour représenter des sommets; les arêtes e sont des lignes ontinues qu'on
dessine sur le plan et e sont des propriétés d'un type graphique et visuel
qu'on étudie (...) 1
. Un des intérêts majeurs des graphes est eetivement
depouvoiraratériserlespropriétésd'unsystèmederelationsviaunarsenal
ombinatoire sophistiqué [9℄ tout en failitant l'aès à es strutures om-
plexesvianotammentdesreprésentationsvisuellesadaptées.Bergeproposait
devoirledessindanssatête!Maisheureusement,depuislespremierstravaux
de Knuth [75℄ dans les années 60, la représentation visuelle des graphes sur
des supports plus partageables est devenue un domaine de reherhe à part
entière,animé par laommunauté Graph Drawing 2
. L'intérêtroissantes
dernièresannéespouredomaineeststimuléparlesappliationsoù,dansde
nombreuxdomaines(e.g.GestiondesConnaissanes,Toile,Réseauxsoiaux,
Réseauxsémantiques,...)lesréseauxrenontrésneessentdeseomplexier
ne pouvant plus être traités aisément àla main.
Il est souvent plus faile de justier du reours à un modèle de graphe
dansunadreappliatifquededévelopper,etmêmeplussimplementdehoi-
sir une méthode de traé adaptée à sa problématique parmi les nombreuses
méthodes et tehniques existantes. Commele notent Mutzel et Jünger[103℄
dans un ouvrage olletif réent onsaré aux logiiels de traés, la om-
plexité de mise au point d'outils eaes de visualisation est généralement
sous-estimée par les novies; lesutilisateurs essayent souvent de développer
dessolutionspareux-mêmesqui,inne,nerépondentguèreàleursvéritables
besoins. Une part de la omplexité réside dans la néessité de maîtriser des
résultatsprovenant à la foisdes mathématiques(essentiellementthéorie des
graphes, optimisation ombinatoire, géométrie algorithmique) et de l'infor-
matique (essentiellement algorithmiqueet strutures de données, mais aussi
génie logiielet interfaes homme-mahine).
Ce hapitre,restreint auxusages, présente un panorama synthétique des
prinipales problématiques dont relève une démarhe de représentation vi-
suelle de graphes. Pour de plus amples détails sur les algorithmes mis en
÷uvre et leurs implémentations,nous renvoyons à trois ouvrages réents de
référene : Graph DrawingAlgorithms for the Visualization of Graphs de
Di-Battistaet al.[27℄, Drawing GraphsMethods and Models sous la dire-
tiondeKaufmannetWagner[71℄etGraphDrawingSoftwaresousladiretion
de Mutzel et Jünger [103℄. Les représentations en niveaux qui sont utilisées
dans lasuite de lathèse, sont détailléesspéiquement dans le hapitre 3.
1
itation extraite de http://perso.wanadoo.fr/jaques.nimier/entretien_
berge.htm
2
Unsymposiuminternationalsurletraédegraphes(Int.Symp.onGraphDrawing)est
organiséannuellementavedesatespubliéssouslaformedeLetureNotesinComputer
Les diérentes parties de e hapitre sont organisées selon l'ordre des
graphes à manipuler et les objetifs visés par la représentation visuelle. Le
paragraphe2.1rappellelesproblèmes de base soulevés par lareprésentation
visuelle des graphes en les illustrant sur le problème du traé statique. Les
paragraphes suivants sont dédiésà des extensions du traé statique en plein
essor :
le paragraphe 2.2 traite du traé dynamique où le grapheévolue dans
letemps;
leparagraphe2.3présenteletraédesgrandsgraphes,dontl'ordrepeut
atteindre plusieurs milliers de sommets. Cette problématique onnaît
un intérêt roissant dû à l'explosiondes quantités de données à mani-
puler dans de nombreux domaines;
le paragraphe 2.4 est onsaré aux représentations tridimensionnelles
qui ontémergé es dernières années.
Au delà de es représentations que l'on peut qualier de lassiques puis-
qu'ellesreprésententdefaçonexpliitelesarêtesdes graphespardesourbes,
ilexiste aussi d'autres méthodes quiutilisentdesodagespartiuliersoudes
métaphores graphiques pour représenter les graphes. Certaines sont présen-
tées dans le paragraphe2.5.
Diérentslangagesde desriptionontétéproposéspour oderlesgraphes
etfailiterleur manipulation.Les prinipauxlangagesemployéssont dérits
dans le paragraphe2.6.
2.1 Le traé statique
Dans la suite nous onsidérons un graphe
G = (V, E)
ave un ensembleV
desommetsetun ensembleE
d'arêtes assoiéesà unerelationbinairesurV × V
. Selonles as, larelationpeut être symétrique ounon (on parle alorsd'ars). Le problème générique de traé le plus lassique onsiste à dessiner
G
sous une formeintelligible sur un support standard bidimensionnel[27℄.L'utilisateur n'étant pas forément un expert en ombinatoire, la qualité
du dessin est déisive pour l'appropriation de la représentation [111℄. Pour
préiser ette notion, qui reste in ne subjetive, on retient généralement
quatre onepts de base (Di-Battistaet al. [27℄) : laonvention de traé, les
ontraintes physiques, lesritèresesthétiques etles ontraintes sémantiques.
1. La onvention de traé
Ellespéielesrèglesgéométriquesde leturedutraéquisontsouvent
inhérentes aux pratiquesen vigueurdans le domained'appliation.La
gure 2.1-a montre un extrait d'un système de hiers sans utiliser la
sontdiilesàlire.Enrevanhe,lagure2.1-butiliselareprésentation
habituelleaveunearboreseneetlesheminsd'aès auxhierssont
plus simples à lire. La gure 2.2 montre diérents exemples de traés
d'un graphe
G
assoiés à diérentes onventions : (a) représentation polygonale où haque ar est représenté par une ligne polygonale, (b)représentation retiligne où haque ar est représenté par un segment
de droite, () représentation orthogonale où les sommets sont plaés
aux intersetions d'une grille et les ars sont positionnés sur la grille
et (d) représentation en niveaux ou hiérarhique où les sommets sont
rangésdans des niveaux vertiaux ouhorizontauxetlessommetsd'un
mêmeniveau ne sont pas reliés entre euxpar des ars.
2. Les ontraintes physiques
Les ontraintes du support de l'÷il humain imposent notamment des
éarts minimums à respeter entre les entités géométriques (points,
boîtes, ...) représentant les sommets et les ourbes représentant les
ars.
3. Les ritères esthétiques
Ils tentent de formaliser les propriétés à satisfaire pour failiter la li-
sibilité d'un traé. Ces ritères sont dénis par des ontraintes ombi-
natoires:minimisationdu nombrede roisementsd'ars,minimisation
de la sommedes longueurs des ars ou de l'ar de longueur maximale,
minimisationdesoudesdanslestraésorthogonaux,... Iln'existepas
d'ordonnanementgénériquede es ritères;l'interprétationde haque
traédépendantdesapropresémantiqueetde lasensibilitédel'utilisa-
teur.Cependant,destravauxenpsyhologieognitiveontmontréquela
rédutiondes roisementsestundesritèresprépondérantspourlalisi-
bilitéetlamémorisation[110℄ (gure2.3).Purhase [111℄aaussi mon-
tré que les prinipales préférenes portaient sur : la minimisation des
roisements, la minimisation des oudes, le positionnement horizontal
des étiquettes représentant les sommets et la jontion des ars d'hé-
ritage (ars de même origine). Plus réemment Ware et al. [137℄ ont
montré, en s'appuyant sur les travaux de la théorie de la Gestalt [77℄,
qu'une bonne ontinuité des ars est néessaire en plus de la rédu-
tiondunombrederoisements.Eneet,lorsquelareherhedehemins
estimportantedansun graphe,laletureest failitéelorsquelesangles
formés par lesars ne sont pas trop aigus (gure 2.4).
4. Les ontraintes sémantiques
Ellessont assoiées à l'interprétationdes omposantes du graphe; par
exemple, des proximités sémantiques doivent être respetées dans le
/
bin
dev
etc
home lib
tmp usr
ls mv rm
group
passwd
remi
bruno libc.so
bin
lib X11R6
these these.lyx
gzip libkdecore.so
X11 lib
X11 rgb.txt
(a) Auune onventionpartiulière
/
bin dev etc home lib tmp usr
ls mv rm group passwd remi bruno libc.so bin lib X11R6
these
these.lyx
gzip libkdecore.so X11 lib
X11
rgb.txt
(b) Lareprésentationarboresenteonventionnelledudomaine.
Fig.2.1 Deuxreprésentations d'unmême extraitd'un système de hiers.
c
e
f
d a
b
g
(a)Représentationpolygo-
nale
a
d
e
c b
f g
(b) Représentationretiligne
b a
g
c
f e
d
() Représentationhortogonale
a
f b
d g
c
e
(d)Représentationenniveaux
Soit un graphe
G
aveV = {a, b, c, d, e, f, g}
etE = {(a, b), (a, g), (a, e), (b, d), (c, d), (c, e), (d, f), (e, f )}
.Fig.2.2Diérentesreprésentationsd'unmêmegrapheenutilisantplusieurs
onventions de traé.
(a) Pasd'optimisationdu nombre deroi-
sementsd'ars(37roisements).
(b) Nombrederoisementsréduitaumaxi-
mum(5roisements).
Fig.2.3 Illustrationdu respet des ritères esthétiques.
c e
f
d a
b
g
(a) Représentation polygonale
lassique.
c e
f
d a
b
g
(b) Utilisation de lignes dont
lesanglessontaplanispourper-
mettreunemeilleureleturedu
traé.
Fig. 2.4Illustration du prinipe de bonne ontinuité des ars [137℄.
Lorsque la onvention de traé est xée ainsi que lesdiérentes ontraintes,
deux problèmes se posent généralement: le problème d'optimisationassoié
est bien souvent NP-diile [48℄ et, lorsque l'on herhe à optimiser simul-
tanémentplusieursritèresesthétiques, lesontraintes assoiéessont inom-
patibles. On doit alors avoir reours à des algorithmes approhés ou des
heuristiques qui, basés sur des approhes très diérentes, ne onduisent pas
néessairement à des traés identiques. Le hoix de la méthode est alors un
problème déliat pour l'utilisateur (de plus amples détails sur les méthodes,
leurs hoix etles ontraintes assoiés sont donnés dans le hapitre 3 dans le
adre du traé en niveaux).
De plus, les expérimentations (voir les hallenges du Symposium Graph
Drawing 3
) ont montré que les résultats des algorithmes automatiques ne
devaientpasêtresystématiquementonsidérésommelesmeilleuressolutions
pourun problèmedonné:ilspeuventêtresouventaméliorésa posteriori àla
main.A lamanièredu traé statique,lesdiérentsonepts énonés servent
de support auxautres typesde traés. Des ontraintes supplémentaires sont
ajoutées pour tenir omptedes spéiités du traéà produire.
2.2 Le traé dynamique
Dans un ontexte dynamique où les données à représenter évoluent sur
une éhelle de temps restreinte, des modiations du graphe telles que des
ajouts ou retraits de sommets et/ou d'arêtes entraînent des hangements
visuels sur le traé. La solution naïve qui onsiste à reonsidérer à haque
instant
t
le problème omme un nouveau problème indépendant se heurte à deux éueils : (i) elle peut être inutilement oûteuse en temps de alul enrefaisantdesalulsdéjàfaitsen
t−1
,et(ii)ellepeutperturberlaartemen-tale de l'utilisateur. En eet, ontrairement au traé statique où l'ensemble
desontraintesliéesautraésontonnuesàl'avaneetne hangentpasdans
letemps, letraé dynamique doit prendre en omptelefait que l'utilisateur
s'estdéjàappropriéletraé présentéàl'instantpréédent.Don, en plusdes
ontraintes énonées préédemment pour le traé statique qui doivent tou-
joursêtrerespetées,laleturedes dessinsdansun ontexte évolutifonduit
àl'introdutionde ontraintes additionnelles.A haque instant
t
,lenouveautraé d'un graphe
G t
doit également permettre une transition aisée pourl'utilisateurave letraédugraphe
G t −1
présentéàl'instantpréédent;l'ob-jetif étant de limiter l'eort ognitif néessaire àl'interprétation des traés
suessifs.
3
Voir la partie GD Contest sur les diérents sites de la onférene : http://www.
Deux approhes majeures sont proposées. La première onsiste à mettre
enévideneleshangementsviadesanimationsgraphiques.Ellesdoiventêtre
susammentlentespourpermettreàl'utilisateurd'enregistrerlesdiérentes
modiationsopérées surlegraphe[14, 25℄.Laseonde, etlapluspopulaire,
onsiste à préserver au mieux la stabilité des traés en limitant les pertur-
bations apportées sur le nouveau traé par rapport aux préédents [22, 33℄.
La stabilité est une notion omplexe qui dépend des aratéristiques géo-
métriques et ombinatoires du traé, mais aussi des faultés de pereption
et de mémorisation de l'utilisateur. Cependant, deux fateurs prédominants
semblent se dégager :
lespositions des sommetsdoivent hanger lemoins possible. Leur sta-
bilitésembleplusimportantequeelle des arêtes:lessommetsservent
de repères spatiaux alors que les arêtes sont essentiellement utilisées
pour déouvrir des relationsentre des sommets déjàloalisés;
l'ordre relatif des omposantes du graphe dans le repère géométrique
adopté doit être onservé tant que ela est possible ar l'utilisateur
repère les omposantsles uns par rapportaux autres.
Pour rendre opérationnelles es ontraintes de stabilité et ainsi, mesurer le
degré de onservation de la arte mentale de l'utilisateur entre les traés
de deux graphes suessifs, diérentes métriques basées sur des indies de
similaritéont été proposées [12℄. Lagure 2.5 illustre leprinipede la prise
en ompte d'un ritère de similarité dans le traé d'un graphe en niveaux.
Le ritèreest simplementbasé sur lapositiondes sommetsdans haun des
niveaux. Le traé de la gure 2.5-a est le traé initial ave 2 roisements
après optimisation. A
t + 1
, l'utilisateur ajoute deux sommets et quelques ars. Sur les gures 2.5-b et 2.5-, les nouveaux sommets et les nouveauxars sont représentés ave des traits en pointillés. La gure 2.5-b représente
le graphe à
t + 1
ave omme unique ontrainte la rédution du nombrede roisements d'ars; il en reste ii 7. Malgré la taille réduite du graphe,
des hangements importantssont introduits etdeux pairesde sommetssont
inversées (sommets à fond foné) par rapport à la gure originale. De plus
lesdiérentsars (dessinés ave des traits épais) assoiés àes sommetsont
aussi été déplaés. Pour palier àe problème,le traéde lagure2.5- tient
ompteduritèredesimilaritéavelepremiertraé.Onretrouveexatement
legraphe d'originemais le traé omporte 9 roisements.
Comme pour tout problème multiobjetifsqui onsisteà trouver un bon
ompromis entre les diérents paramètres [20℄, la diulté du traé dyna-
mique est qu'il faut à haque étape trouver un traé réalisant un bon om-
promis entre la onservation de laarte mentale de l'utilisateur, la lisibilité
du traé et le temps de alul (les préonisations habituelles stipulent qu'il
(a) Legrapheinitialàl'instant
t
ave2roisementsd'ars.(b) Legrapheà
t + 1
aveuniquement uneoptimisationdunombrede roisements.Lesarsengrasetlessommetsfonésonthangédeplae.Ilreste7roisementsd'ars.
() Legrapheà
t + 1
entenantompted'unritèredesimilaritéetd'uneoptimisationdunombrederoisements.Ilreste9roisements.
Les sommets v08 et v19 ont été ajoutés au graphe après l'étape (a). Ces sommets
etleurs ars sont représentés en pointillés dans les gures (b) et ().
Fig. 2.5 Exemple de transitions entre un graphe
G t
etG t+1
dans unqu'un utilisateur ait une impression de uidité entre les traés [135℄). Ce-
pendant, si des heuristiques ont été proposées pour les grandes familles de
traés(orthogonaux,enniveaux,...),leproblèmeresteenorelargementou-
vertetànotreonnaissanepeu delogiielsintègrentatuellementlagestion
dynamique de façoneae.
2.3 Le traé des grands graphes
Dès que le grapheà représenter ades aratéristiques quine permettent
plus une représentation exhaustive de haque omposante sur un support
de taille standard omme un éran d'ordinateur, les algorithmes lassiques
de traés de graphes ne sont plus appliables seuls. La plupart doivent être
ombinés ave des outils d'interation qui dièrent selon le type de graphes
à représenter et il devient alors diile d'avoir une méthodologiegénérique.
Deux exemples permettent de onrétiser les nouveaux ordres de grandeur
misenjeu.Lesgraphesdeontatsoudeo-itationsdanslesréseauxsoiaux
peuvent porter maintenant sur des entaines de milliers de sommets [131℄.
Pour estimerdes paramètresdérivant lastruture des relationssurlaToile,
Rekaetal.[112℄travaillentsurdesgrapheséhantillonsde300000douments
et 1 500 000 liens (estimé à environ 0.3% de la Toile lors de la parution de
l'artile en 1999). En plus du problème d'ahage sur un éran statique de
taille limitée, il faut également prendre en ompte les problèmes aigus de
gestion de lamémoire etdu tempsde alul.
Lesdiérentesméthodesmisesen÷uvrepeuventêtrelasséesenplusieurs
atégories aratérisées par un ordre des graphes àtraer roissant : (1) ap-
pliationd'unedistorsionsur lestraésomme lefameuxsheye,(2) utili-
sationd'une ombinaisondes stratégies de traés de graphesetde reherhe
d'informations, (3) utilisation des propriétés spéiques de la struture à
traer pour optimiserla plae disponible, (4) ahage partiel du graphe.
2.3.1 Distorsion du traé
Les premières tehniques apparues sont basées sur un prinipe de distor-
sion des gures; le but étant de fournir à l'utilisateur une vue unique de
l'ensemble de la struture à traer en appliquant diverses transformations.
Latehnique des sheyes [123℄ permetde visualiser desgrandesstrutures
de données que e soit des arbres ou des graphes. Elle onsiste à dessiner
une partiede lastruture leplus lisiblementpossible,en sefoalisantsur un
sommetpréis,appeléentre,etsonvoisinageimmédiatpuisàappliquerune
Fig. 2.6 Un graphe qui représente les frontières ommunes entre les dif-
férents pays du ontinent européen. Dessin réalisé ave le logiiel Aisee
http://www.aisee.om.
sopique.L'utilisateuradondes informationssurlapositionduentre etde
son voisinagepar rapport àl'ensembledu grapheetpeut exploiteraumieux
les informations intéressantes pour lui sur la partie lairement dessinée (-
gure2.6).L'inonvénientmajeurdeettetehnique dereprésentationest que
l'éhelledes distanes entre lessommetsévolue. Plus on s'éloignedu entre,
plus l'éhelle est réduite de façonnon linéaireetles distanes ompressées.
Réemment,Gansner et al. [46℄ ont proposé une méthode pour éviter e
problème de ompression des distanes. Au lieu de vouloir représenter l'en-
semblede la struture, leur méthode simpliela représentation en alulant
uneapproximationdes partiesdugraphesur lesquellesl'utilisateur n'estpas
foalisé.Lagure2.7-areprésenteuneartographied'Internetquiest illisible
sionveut diretement traerl'ensembledu graphe(87931sommetset87930
arêtes). Sur la gure 2.7-b, l'utilisateur se foalise sur la partie en haut à
(a) Graphe représenté en entier (87931
sommetset 87930arêtes).
(b) Fousenhautàgauhedelagure. () Foussurlebasdelagure.
Fig. 2.7 Diérentes représentations d'une artographied'Interneten utili-
sant des Topologialsheyes.Extrait de [46℄.
ettepartie estomplètementdessiné.Ensuite,en fontionde l'éloignement,
lespartiespériphériquesde lareprésentation sont deplus enplus simpliées.
Un dégradé des ouleurs du rouge vers le vert permet d'indiquer le niveau
de simpliation. Cette tehnique permet aussi à l'utilisateur de naviguer
dans le graphe en déplaçant la partie sur laquelle il se foalise. La simpli-
ation progressive de la struture permet d'aider à la onservation de la
arte mentale de l'utilisateur. L'inonvénient prinipal est que pour aluler
les diérentes approximations, il est néessaire de onserver en mémoire le
2.3.2 Stratégie de reherhe d'information
De plus en plus les méthodes lassiques développées par laommunauté
Graph Drawing sont ombinées ave des approhes développées dans le
ontexte plus général de la visualisation d'information (voir la thèse de T.
Munzner[102℄quiproposeunebibliographiepourlavisualisationde grandes
strutures de données). Lesapprohes proposées, développées réemmenten
ommun par les deux ommunautés [59℄, intègrent plusieurs stratégies très
diérentes : distorsionde la représentation, partitionnement,navigation. La
représentationexhaustivedesomposantesdugraphen'étantpluspossible,le
problèmeestsouventabordéommeunproblèmedereherhed'information:
il s'agit de prourer à l'utilisateur une panoplie d'outils qui peuvent être
ombinés dans une stratégie de reherhe [90℄. La séletion des modes de
représentation est souvent laissée à l'utilisateur; la reherhe atuelle est
plutt axée sur le développement de nouvelles méthodes apables de traiter
des tailles roissantes. Bien que la question de la omparaison, en terme
d'usage, soitde plus en plus disutée ausein notamment de laommunauté
InfoViz,lesanalysesderetourd'expérienerestentenoretrèslimitées[10℄.
Une autre grande famille de méthodes se réfère expliitement à la stra-
tégie proposée en reherhe d'informations par Shneiderman [125℄ : Over-
view rst, zoom and lter, then details-on-demand. La démarhe est alors
la suivante : (i) proposer à l'utilisateur une vue marosopique de la stru-
ture, (ii) lui permettre de se foaliser sur un sous-graphe par lustering [8℄
ou fragmentation [4℄, et (iii) rendre aessible les aratéristiques préises
d'une donnée séletionnée. Ce proessus itératifs'arrêtelorsque l'utilisateur
aaquis susammentd'informationspourrépondreàdesbesoinsnon nées-
sairement spéiés préalablement. Une des diultés est ii d'appliquer des
transformations qui restent ompréhensibles par l'utilisateur pour éviter de
trop perturber saarte mentale.
2.3.3 Projetions dans d'autres espaes
Pour des graphes dont l'ordre peut atteindre plusieurs milliers de som-
mets, les méthodes de traés génériques qui plongent le graphe dans un es-
pae eulidien deviennent diilement exploitables. Ces méthodes doivent
être spéialisées pour utiliser au maximum les propriétés de la struture à
dessiner etoptimiserlaplaedisponiblepour letraé.Par exemple,pour les
arbres, Xerox Researh a mis au point une tehnique qui utilise un espae
hyberbolique pour représenter des arbres; e sont les arbres hyperboliques
(gure 2.8) 4
. Ave ette tehnique, prohe du sheye, l'arbre est dessiné
4
(a) L'arbred'origine.
(b) L'arbreaprèsundéplaementduentre.
Fig.2.8 Deuxvues du site web de Xerox Researh Centre Europe repré-
sentées ave des arbres hyperboliques. Extrait de http://www.xre.xerox.
dansun espaehyperboliqueetl'utilisateursefoalisesur un sommetetson
voisinage.Plusons'éloignede esommet,moinsily ade détailssurlagure
(gure2.8-a,leentrede lagureest symbolisé parlen÷udappeléxre).La
navigations'eetue endéplaçantlessommets. Lapartielairementdessinée
sesitueauentre delagure.Unpointimportantdeettereprésentationest
que l'utilisateur sait toujours où se situe le entre de l'arbre qu'il visualise
(gure2.8-b).Enrevanhe, lesparties de laguretrop éloignéesdu sommet
sur lequel est foalisé l'utilisateur peuvent ne pas apparaître.
2.3.4 Ahage partiel
Sur des graphes dont l'ordre est enore plus important -au delà de 100
000 sommets-, la omplexitédes méthodes préédentes ne permet plus leur
appliationsurl'intégralitédelastruture.De partl'importanede sataille,
ettestruturepeutne pas êtreentièrementstokée enmémoirelorsdel'ini-
tialisationdesalgorithmesde traé.L'approheOnlineGraphDrawing[63℄
permetdanseas àl'utilisateurdeseonentrerdansun premiertempssur
unsous-graphe,oufenêtrede visualisation,quipeutêtreentièrementmontré
sur son éran en utilisant seulement les tehniques du traé statique (logi-
al frame, leretangle noté
F 1
sur la gure 2.9-a).Ensuite l'utilisateur peut faireglisser ettefenêtrepour visualiserlasuitedu graphe(lesdiérentes fe-nêtres
F i
sur lagure 2.9-a).Au furet àmesure de l'exploration,les parties manquantes sont alulées et stokées en mémoire. Ces diérentes fenêtresde visualisation respetent les ontraintes du traé statique (gure 2.9-b).
Les transitions entre les fenêtres sont onçues pour préserver au mieux la
arte mentale de l'utilisateur en ne hangeant que quelques sommets lors
du passage d'une fenêtre à la suivante ouen eetuant un déplaement des
sommetspour préparerla transitionvers une autrefenêtre.On retrouveune
problématiqueprohe du traé dynamique.
D'autres approhes utilisent des ahages inrémentaux. Soit en mon-
trant initialement les omposantes les plus importantes puis en omplétant
peu à peu lareprésentation selon lesdésirs de l'utilisateur[140℄, soitomme
dans Tulip[3℄, en dénissant préalablement une métrique sur le graphe qui
permetd'aherdefaçoninrémentaleuntraévisuellementprohedutraé
omplet ave un nombre très réduit d'éléments. La gure 2.10 illustre ette
dernière tehnique en montrant l'ahage en 4 étapes d'un graphe d'ordre
restreintquireprésentent lastrutured'un site web. Il fautnoterquelapre-
mièreétapede lareprésentation quiontientmoinsde 6.5% des sommetsde
Le grand graphe non entièrement stockable en mémoire
(a) Prinipegénéraldelaméthode
a
g f e c d
b
a c
f i
e b
d h
a
e c d
b
f i h
Nouveaux sommets
sommet g supprimé F1
F2 F3
La fenêtre de visualisation initiale
Le tracé suivant après déplacement de la fenêtre de visualisation de réajuster la position des sommets Un autre déplacement qui permet
(b)Extraitdesreprésentationspartiellessuessives.
Fig. 2.9 Illustrations de la méthode Online graph drawing. Adaptées
depuis [63℄.
(a) 200éléments (b) 600éléments
() 1000éléments (d)3200éléments
Fig. 2.10 Ahage inrémental de la struture d'un site web ave Tulip.
Extrait de [4℄.
Fig. 2.11 Un one trees pour représenter un système de hiers Unix.
2.4 Traé tridimensionnel
Depuis les premiersprototypes des années90 [58, 127℄ et l'exemple bien
onnus des one-trees [116℄ (gure 2.11), l'aessibilité roissante à la fois
des langages de développement pour des environnements tri-dimensionnels
(e.g. VRML, Virtual Reality Modeling Language) 5
et des moyens de aluls
disponibles, onduit à un intérêt grandissant pour les représentations vi-
suelles des graphes en 3D [84℄, en partiulier pour les strutures de grande
taille. L'ouvrageAtlas of Cyberspae 6
,limité auxreprésentations assoiées
à la toile [31℄, et le site Visual Complexity 7
donnent un large aperçu des
possibilitésdes artographiestri-dimensionnelles.
Les travauxsur l'appropriationhumainede ettenouvelleapprohe n'en
sontqu'àleurdébut[115, 136℄.Quandelleest utiliséeàbonesient,lesinté-
rêts avanés sont souvent que ladimension supplémentaire permet un ajout
d'informations et une plus grande exibilité pour plaer les sommets et les
ars [56, 72℄.Cependant, lesrestitutionsatuellessur lessupports lassiques
restentbidimensionnelles,etparonséquentlestraésrésultantpeuventêtre
omplexes et diiles à appréhender. Pour éviter l'utilisationd'algorithmes
spéiques souvent omplexes, les données à représenter doivent se prêter
5
http://www.graphomp.om/info/spes/vrml10.html
6
Voiraussilesitehttp://www.ybergeography.org/atlas/atlas.htmlassoiéàet
ouvragequiontientdesreprésentationsplusréentes.
7
naturellement à une représentation en 3D. L'ajout de la nouvelle dimen-
siondoitréellementapporterdesinformationssupplémentairesàl'utilisateur
etnon pas une omplexitéarue du traé.
Un problème réurrent, bien onnu des graphistes, dû à l'ajout de la
troisième dimension, est elui de l'olusion [135℄. Ce phénomène se pro-
duit de façon générale lorsque un objet se retrouve masqué par un autre
(voir l'exempledu haut de la gure2.11). L'olusion peut prendre diverses
formes pour le traé de graphes et peut, selon l'angle de vision de l'utilisa-
teur,modierlareprésentation[84℄:deux sommetspeuventêtre vusomme
un seul, des roisements supplémentaires inexistants dans la représentation
apparaissent,des sommetsetdes arspeuvent sesuperposer etréerdenou-
veaux sommets, ... Sur le plan théorique, les projetions utilisées doivent
limiter la perte d'information. Pour faire fae à es limitations, les logiiels
intègrent des outils de navigation de type rotation, déplaement, zoom qui
augmententl'eaité de l'utilisationde l'espaede représentation.
Pour lesstruturesde grandetaille,une extensiondumodèledes graphes
hyperboliques présenté préédemment a été développée pour une famille de
graphespeu denses[101℄.L'espae hyperbolique3Dpermetàl'utilisateurde
sefoalisersur un sommetpartiuliertout en onservant une vue globalede
l'ensemblede lastruture (gure 2.12).
2.5 Au delà des représentations sommets-liens
Au-delà des représentations visuelles lassiques des graphes, où les som-
mets et les ars sont expliitement traés, se sont développées es dernières
années, essentiellement pour les arbres, des nouvelles approhes basées sur
des métaphores graphiques; itons par exemple elle du iruitéletronique
(gure2.13) ou de lamétaphore botanique [74℄(gure 2.14).
Pour tenter debraverlaomplexitéinhérenteauxgrandstraés,d'autres
modesde représentationontété proposés. Ilspeuventêtrebaséspar exemple
sur une représentation matriielle omme dans les travaux de Ghoniem et
al.[49℄,ouenore,pourlesarbres,parunpavageduplanave laméthodedes
Treemap[64℄ (gure 2.15). L'avantage prinipalde ette méthode populaire
estquedesarbresdeplusieursentainesdesommetspeuventêtrereprésentés
surunsupportdepetitetailletoutenrestantlisiblesetompréhensiblespour
un utilisateur ayant intégré lemode de leture.
Cesméthodes,parrapportauxreprésentationslassiquesdesgraphes,ont
l'inonvénientde néessiterpourl'utilisateurunepériode d'appropriationdu
Fig. 2.12 Graphe représentant un extrait des liens d'un site web dans un
espae 3D hyperbolique. Extrait de [100℄.
Fig. 2.13 Utilisation de la métaphore du iruit életronique pour repré-
senter un arbre.
Fig. 2.14 Visualisationd'un système de hiers par une métaphore bota-
nique [74℄.
2.6 Les langages de desription
Chaque ommunauté d'utilisateurs utilise souvent ses propres logiiels
de représentation plus ou moins adaptés spéiquement aux besoins d'un
domaine. Malheureusement, la grande majorité de es logiiels utilise leur
propre format de desription de données bien souvent sous la forme d'un
hier texte. Par onséquent, la mise en plae d'un jeu d'essai ommun à
plusieurs logiiels pour, par exemple omparer leurs fontionnalités respe-
tives, n'estpas évidente;lespossibilitésd'importationoud'exportationave
diérentslangagesde desriptiondedonnéesétantbiensouventlimitées.Ce-
pendant,stimuléespar l'émergeneréentedessolutionsutilisantXML 8
,des
tentativesd'uniformisationsonten développement.D'une façongénérale, les
langagesde desription permettentpour laplupartde simplementdénirun
graphe en dérivant l'ensemble de ses sommets et de ses arêtes ave leurs
attributsde style (e.g.ouleurs, formes, tailles, noms).On peut notamment
iter parmiles plus usités :
le langage dot qui aété misaupoint pour lasuite logiiellegraphviz
8
(a) Prinipederéationd'untreemap.
(b) Exemple ave unsystème de hiers d'environ une douzaine
de répertoires et 240 hiers réalisé ave TreeMap Java Library
(http://treemap.soureforge.net).Chaqueretangle ommeelui
aveunfondfonéreprésenteunhier.Lesregroupementsdees
retangles(exempleduretangleavedesbordsépaisaubasdela
gure)représententlesdiérentsrépertoires.
Fig.2.15 LesTreemaps :prinipede onstrutionetexemplesur un arbre
de grande taille.
de AT&T 9
[45℄ permet notamment de traer des graphes en niveaux.
Ce langagepermet en plus de regrouperdes objets ayant des attributs
ommuns pour former des sous-graphes.
le langage GML (Graph Modeling Language), qui a été développé
pour la plate-forme Graphlet 10
, dans un but d'uniformisation des dif-
férents langagesde desription existant à l'époque de sa réation. Par
rapportaulangagedot,GMLpermetdedériredesinformationsspéi-
quesnéessaires pourlavisualisationd'information.Desinformations
arbitraires(assoiationde données externesàunsommetpar exemple)
peuventêtreajoutéesdanslesdesriptionsdesomposantes dugraphe.
Ainsi un hier GML peut permettre d'émuler de nombreux langages
de desription.
LeslangagesbaséssurXMLommeGraphXML[60℄quiestonçu
ommeunformatd'éhangeentreappliationsdetraésetvisualisation
de graphes oumêmeave d'autres typesd'appliations.Il aaussi pour
avantage d'être plusgénérique etplus simpleà utiliserqueGML en e
quionernelesdonnées externes.On peut aussi iterXGMML 11
qui
est une transformation du langage GML en XML. Plus réemment, le
langage GXL [141℄ (Graph eXhange Language) vise à réer un for-
matd'éhange entre appliationsquisoitle plusstandard possible.Ce
langagepermet notammentd'émuler tous eux ités préédemment.
Les librairies en C++ omme LEDA (Library of Eient Data
types and Algorithms)quiest onstituée d'un ensemblede lasses ave
ses propres strutures de données, son propre système de gestion de
mémoireetbeauoup de méthodes etd'algorithmesspéiquespour la
desriptionetlamanipulationde graphesd'un pointde vue plus théo-
rique que les langages préédents [96℄. On peut aussi iter la librairie
GTL (Graph Template Library) 12
, qui peut être vue omme une ex-
tensiondes librairiesSTL 13
pour la manipulationet ladesription des
graphes.
9
http://www.graphviz.org/
10
http://www.infosun.fmi.uni-passau.de/Graphlet/
11
Uneversiondetravaildesspéiationsest disponibleà:http://www.s.rpi.edu/
~puninj/XGMML/draft-xgmml-20010628.html
12
http://infosun.fmi.uni-passau.de/GTL/
13