Localisation de faute(s) - Aide à l'analyse de traces d'exécution dans le contexte des microcon

12 Introduction 117

13 R`egles d’association 121

13.1 Introduction . . . 121

13.2 D´efinition d’une r`egle d’association . . . 122

13.3 ´Evaluation des r`egles d’association . . . 122

13.3.1 Support . . . 123

13.3.2 Confiance . . . 123

13.3.3 Lift . . . 124

13.4 L’algorithme LCM . . . 124

14 Recherche de r`egles d’association en utilisant une seule trace

d’ex´ecution 127

14.1 Introduction . . . 127

14.2 Groupement des cycles . . . 128

14.3 Fiabilit´e des r`egles d’association . . . 129

15 Évaluation 133 15.1 Programmes et erreurs . . . 133 15.2 Résultats . . . 134 16 CoMET 139 16.1 Architecture . . . 139 16.2 Fonctionnalités . . . 140 17 Conclusion 145

R´esum´e

Notre approche de localisation de faute, présentée dans le chapitre 9, est basée sur l’hypothèse que les cycles d’une trace d’exécution sont indépendants. Par conséquent, elle risque d’être peu efficace dans le cas où les cycles d’une même exécution interagissent entre eux.

Pour faire de la localisation de faute pour ce type de cas, dans cette partie de la thèse, nous nous intéressons à lafouille de données et spécialement à la

recherche de règles d’association, présentées dans le chapitre13. La principale motivation de l’utilisation de la fouille de données dans notre approche est l’extraction d’informations de comportements considérés comme bons et des comportements considérés comme fautifs, afin de les comparer et ainsi localiser la faute. Ainsi basée sur l’utilisation des cycles d’une trace d’exécution, notre approche est présentée dans le chapitre14.

Le chapitre15concerne l’´evaluation de cette contribution et le chapitre16

Chapitre 12

Introduction

Au cours du développement d’une application, des fautes peuvent être introduites dans le code. L’exécution des instructions fautives peut entrainer des erreurs et des défaillances pourront (ou non) être observées. Une fois une défaillance identifiée, il est nécessaire de la corriger : c’est l’étape de débogage. Cela consiste en premier lieu à rechercher la cause de la défaillance, c’est-à-dire l’instruction erronée. On parle alors de localisation de faute.

La localisation de faute(s) peut être définie comme étant le processus de repérage de faute(s) conduisant à des défaillances. Le repérage précis de fautes ´

etant très difficile, la plupart des méthodes de localisation de faute(s) essayent plutôt d’identifier les parties du code source susceptibles de contenir la faute. Dans la deuxième partie de cette thèse, nous avons présenté une approche de localisation de faute utilisant une seule trace d’exécution. Notre approche effectue en premier une détection de cycles. Le résultat obtenu est une trace divisée en cycles. Notre approche utilise ensuite les«méthodes par différence de traces » sur la trace découpée pour localiser l’instruction fautive. Cette approche est basée sur l’analogie entre les exécutions du programme et les cycles. Nous sommes conscients que l’analogie n’est pas parfaite et que l’ind´ e-pendance entre les cycles ne peut pas être garantie. Cependant, les résultats de nos expérimentations (chapitre 10), ont montré la pertinence de cette hy-pothèse.

Par ailleurs, il existe également des cas où les multiples cycles d’une même exécution interagissent entre eux de plusieurs fa¸cons. Notre approche de loca-lisation de faute risque donc d’être peu efficace pour ce type de cas.

Ainsi, dans le but de faire de la localisation de faute(s) pour des pro-grammes où les cycles d’une même exécution interagissent entre eux, nous nous sommes intéressé à la fouille de données.

La fouille de données tire son nom du terme anglais data mining. C’est une méthode qui a pour objectif de trouver la pépite, non pas d’or, mais de connaissances. Elle est définie comme étant «the non trivial process of identi-fying valid, novel, potentially useful, and ultimately understandable patterns in data» [33]. La fouille de données est ainsi constitué d’un ensemble d’ou-tils informatique servant à rechercher et à extraire de l’information (utile et inconnue) de gros volumes de données stockées dans des bases ou des entre-pôts de données. La fouille de données s’effectue en respectant un ensemble de

Figure 12.1 – Treillis des d´efaillance

processus d’extraction de l’information, en passant par les phases de stockage de données, d’interprétation des résultats, aussi de filtrage et nettoyage. Selon le problème traité, de nombreuses techniques de fouille de données existent, comme le regroupement, la classification ou la recherche de règles d’associa-tion.

Dans cette partie de la thèse nous nous intéressons à la recherche de règles d’association dans le but de localiser la faute dans les programmes de micro-contrôleurs. Ce travail est inspiré des travaux de Cellier et al. [21] concernant la localisation de faute(s) en utilisant la fouille de données. La localisation de faute(s) proposée par Cellier et al. [21] est basée sur la recherche de règles d’as-sociation [13] mais également sur l’analyse formelle de concepts [64, 20], qui est une méthode de classification non supervisée (clustering). Comme illustré dans la Figure12.1, le résultat proposé est un treillis des défaillances que l’in-génieur doit parcourir et explorer pour localiser la faute. Chaque concept dans le treillis représente une ou plusieurs lignes du code source, avec les valeurs du

lift etsupport correspondant au concept. L’ingénieur commence par analyser le treillis de bas en haut, c’est-à-dire en commen¸cant par analyser le concept défaillant, puis analyser les concepts d’au-dessus et ainsi de suite jusqu’à la localisation de la faute.

Il est important de préciser que la localisation de faute, dans cette partie, concerne des programmes qui continuent leurs exécutions un certain moment après l’apparition de la défaillance. C’est précisément une situation où une méthode de localisation de faute basée sur l’analyse statistique des cycles de la

119

trace, peut fournir un mauvais diagnostic. Ainsi, la principale motivation pour utiliser la fouille de données est d’extraire des informations de comportements considérés comme bons et des comportements considérés comme fautifs, afin de les comparer et localiser la faute. La technique de fouille de données utilisée par notre approche est la recherche de règles d’association, discutée dans le chapitre13. Dans le chapitre14nous présentons notre approche de localisation de faute basée sur l’utilisation des règles d’association.

Chapitre 13

Dans le document Aide à l'analyse de traces d'exécution dans le contexte des microcontrôleurs 32 bits (Page 126-134)