Les outils d’extraction d’architectures logicielles

2.7. LES OUTILS D’EXTRACTION D’ARCHITECTURES LOGICIELLES 43

• Les extracteurs de faits(facts extractors).

• Les outils de partitionnement (clustering).

• Les outils de correspondance.

2.7.1 Les extracteurs de faits

Les extracteurs de faits sont les outils les plus connus qui supportent l’extraction de l’architec-ture logicielle. Leur rôle est de fournir une représentation du code source (connue sous le nom de modèle source) indépendante du langage de programmation.

L’outil Columbus

L’extracteur de faits Columbus [Ferenc et al., 2002,Ferenc et al., 2004,Beszédes et al., 2005]

analyse des systèmes C++ et représente la structure statique du code source selon le schéma Co-lumbus [Ferenc et Beszedes, 2002]. Les opérations essentiels de l’outil sont : (1) l’analyse du code source qui vise à créer plusieurs instances du schéma de Columbus ; Une instance contient des entités et des relations représentées selon le schéma de Columbus [Ferenc et Beszedes, 2002] ; (2) La liaison des instances créées et leur filtrage qui visent à fusionner les différentes instances de la première étape dans un même schéma ; Et (3) la transformation du schéma en un de ces formats : les formats XML (CPPML, GXL [Holt et al., 2000a] et FAMIX XMI [Ti-chelaar et al., 2000]), RSF [Müller et Klashinsky, 1988], HTML et Maisa. Ces opérations sont effectuées via trois types de plug-ins : Lesplug-ins Extractorqui analysent les fichiers sources et créent un fichier contenant les informations extraites, les plug-ins Linker qui fusionnent et filtrent les informations extraites des premiers plug-ins et les plug-ins Exporter qui exportent les fichiers dans de nombreux formats.

Les outils d’ingénierie inverse des modèles UML

Plusieurs outils fournissent un moyen d’extraction des faits en élaborant des modèles UML comme un digramme de classes en notation UML. En effet, presque tous les outils CASE (Computer-aided Software Engineering) [Muller et al., 2012] offrent la fonctionnalité d’ingé-nierie inverse en des modèles UML.

Autre que les outils CASE, Rational Rose [Quatrani, 2002], qui a été utilisé par l’approche Focus [Ding et Medvidovic, 2001] et Medvidovic et al. [Medvidovic et al., 2003] prend en charge l’ingénierie inverse des systèmes C++ et Java et donne comme résultat une vue ar-borescente comprenant des classes, des interfaces, leurs associations et fournit également un diagramme de classes UML.

L’outil Ptidej

Alors que les outils mentionnés donnent la structure statique du code source, plusieurs outils extraient la structure dynamique. Ptidej(Pattern Trace Identification, Detection, and Enhance-ment in Java) [Guéhéneuc, 2004] construit des diagrammes de classes à partir du code source Java. Plus précisément, Ptidej englobe deux outils d’analyse. Le premier outil,PADL ClassFile creator, analyse la structure statique du système. Le deuxième outil, Caféine, donne la structure dynamique des programmes Java en analysant le comportement d’exécution des programmes.

Les auteurs ont développé un méta-modèle appelé PADL [Albin-Amiot et Guéhéneuc, 2001]

qui décrit un programme comme diagramme de classes en termes de classes, de méthodes et de relations.

2.7. LES OUTILS D’EXTRACTION D’ARCHITECTURES LOGICIELLES 45 Les extracteurs d’un graphe MDG

Il existe de nombreux outils qui extraient les informations du code source sous forme d’un graphe de dépendance des modules, dénoté MDG (Module Dependency Graph). Ce dernier représente un code source tel que les nœuds représentent les modules et les arcs représentent les dépendances entre eux. Par exemple, l’outil Chava [Korn et al., 1999] pour l’analyse des programmes Java. Les entités extraites sont : classes, interfaces, paquets, fichiers, méthodes, et variables ; Et les relations sont les relations d’héritage et de réalisation, des relations de décla-ration et d’appel des méthodes. Autres outils qui génèrent un graphe MDG : CIA [Chen, 1995]

pour C, Acacia [Chen et al., 1998] pour C et C++.

En outre, l’outil Gadget [Gargiulo et Mancoridis, 2001] extrait la structure dynamique à partir des programmes Java, il rassemble les données lors de l’exécution des programmes. La sortie est un graphe DDG(Dynamic Dependency Graph)où les nœuds représentent des classes ou des objets et les arcs représentent des relations telles que les invocations des méthodes.

2.7.2 Les outils de partitionnement

Les outils de partitionnement fournissent un moyen de groupement des entités de code source telles que les fichiers système ou les classes. Généralement, ces outils commencent par une partition (groupement) initiale et essaient de l’améliorer selon certains criteres.

L’outil Bunch

L’outil Bunch supporte plusieurs algorithmes à base de recherche. Mancoridis et al. [Mancoridis et al., 1999, Mitchell et Mancoridis, 2006] définissent d’une part une fonction d’évaluation (fitness function) qui guide les algorithmes vers la meilleure partition et d’autre part plusieurs algorithmes de partitionnement.

• La fonction d’évaluation

La fonction d’évaluation, dénotée MQ2.1, est celle qui dirige l’algorithme ; elle évalue une partition selon les critères de cohésion forte et de couplage faible. Mathématiquement, la fonction est en relation avec 2 mesures importantes mesurant les propriétés de connec-tivité :A_imesurant l’intra-connectivité dans un cluster i etE_ijqui mesure la connectivité entre 2 clusters distincts i et j. La fonction, qui a été considérée comme base pour d’autres travaux, [Praditwong et al., 2011,Qiu et al., 2015,Chardigny, 2009], est la suivante, avec kle nombre de clusters d’une partition.

MQ=







∑^k_i=1Ai

k −∑^k_i,_j=1E_i,j k(k−1)

∀k>1

A_i k=1

(2.1)

• Algorithmes

Dans cette section, on présente les trois algorithmes adaptés par l’outil Bunch. Principa-lement, ces algorithmes cherchent à minimiser le couplage entre deux clusters différents, c.à.d la valeurE_ijet à maximiser la cohésion forte à l’intérieur de chaque cluster, c.à.d la valeurA_i.

L’algorithme optimal de clustering : Cet algorithme génère toutes les partitions pos-sibles, puis une évaluation de toutes les partitions est établie grâce à la fonction fitness. Une partition des modules est un ensemble de parties non vides qui sont

deux à deux disjointes et qui recouvrent tous les modules du système. Une généra-tion de toutes les partigénéra-tions donne comme résultat un grand nombre interdisant ainsi sa réalisation sur les systèmes complexes.

L’algorithme sous optimale : Cet algorithme commence avec une partition aléatoire et essaie de trouver une partition voisine plus meilleure. L’algorithme s’arrête quand une partition n’a pas de voisines ayant une fitness plus élevée. Donc au lieu de générer toutes les partitions comme l’algorithme précédent, une seule partition voi-sine est générée, si elle est meilleure alors elle devient la partition courante. Cette instruction sera répétée jusqu’à arriver à la condition d’arrêt de l’algorithme. Cet al-gorithme est celui de Hill Climbing et il présente comme inconvénient le maximum local.

L’algorithme génétique : Cet algorithme consiste à commencer avec une population N qui contient plusieurs partitions initiales arbitraires et à les améliorer jusqu’à ce que les partitions convergent. L’amélioration se passe comme suit : sélectionner un pourcentage de N et trouver un voisin meilleur pour chaque individu de la popula-tion. Une nouvelle population sera alors générée en sélectionnant N partitions avec remplacement de la population existante. L’algorithme s’arrête quand les partitions convergent vers leur fitness maximale ou quand le nombre de génération dépasse un nombre maximal de génération. A la fin la meilleure partition est choisie de la population finale.

En résumé, Mancordis et al. ont adapté les algorithmes à base de recherche sur la mo-dularisation logicielle tout en développant un outil de clustering nommé Bunch. De plus, Mancordis a mentionné dans [Mancoridis et al., 1998] que pour un système complexe, le nombre de clusters peut être très large. Pour cela, il faut faire un clustering pour les clusters, ce qui crée une hiérarchie des sous-systèmes ayant le système comme racine de la hiérarchie et les modules au dernier niveau.

2.7.3 Les outils de correspondance

Les outils de correspondance prennent en charge l’extraction en faisant correspondre les entités du code source du système à des connaissances de haut niveau. Une connaissance de haut niveau pourrait être considérée comme une architecture conceptuelle qui reflète le point de vue de l’architecte.

L’outil Reflexion Model

L’outil ReflexionModel [Murphy et al., 1995,Murphy et Notkin, 1997,Murphy et al., 2001] est basé sur l’élaboration d’un modèle qui calcule les différences entre le modèle de haut niveau des développeurs et le modèle source. L’outil aide l’ingénieur à valider son modèle mental structurel d’un système. L’outil ReflexionModel prend trois inputs : un modèle de haut niveau proposé par l’ingénieur, un modèle source qui représente le code source et une carte définie par l’architecte.

La carte spécifie comment les deux modèles (le modèle de haut niveau et le modèle source) peuvent être correspondus. L’outil calcule un modèle (appelé modèle de réflexion) qui met en évidence les convergences (où le modèle source est conforme au modèle de haut niveau), les divergences (où le modèle source comprend des relations non prévues par le modèle de haut niveau) et les absences (où le modèle source ne comprend pas des relations prédites par le modèle de haut niveau).

2.8. CONCLUSION 47

Dans le document Thèse de Doctorat. Mira ABBOUD. Contribution à l élaboration d un processus d extraction des architectures logicielles: Méta-modèle, méthode et outil (Page 43-47)