• Aucun résultat trouvé

MELANIE : un système d'analyse et d'interprétation automatique d'images de gels d'électrophorèse bidimensionnelle : traitement de l'image et systèmes experts

N/A
N/A
Protected

Academic year: 2022

Partager "MELANIE : un système d'analyse et d'interprétation automatique d'images de gels d'électrophorèse bidimensionnelle : traitement de l'image et systèmes experts"

Copied!
251
0
0

Texte intégral

(1)

Thesis

Reference

MELANIE : un système d'analyse et d'interprétation automatique d'images de gels d'électrophorèse bidimensionnelle : traitement de

l'image et systèmes experts

FUNK, Matthieu

Abstract

MELANIE (Medical ELelectrophoresis ANalysis Interactive Expert system) est un projet de recherche pluridisciplinaire en cours au Centre Universitaire d'Informatique et à la Clinique Médicale de Genève. Le projet a pour objectif l'analyse et l'interprétation automatiques d'images de gels d'électrophorèse bidimensionnelle. Les développements sont effectués pour permettre une meilleure compréhension de certains phénomènes biologiques dans l'optique finale d'aider à l'établissement d'un diagnostic. Ce dernier est fourni par un système expert qui constitue la partie centrale du processus d'interprétation. Il exige d'une part des données sur l'échantillon à analyser et d'autre part l'expertise permettant de simuler le raisonnement. Les données sont fournies par l'image, après qu'elle ait subi un traitement pour éliminer toutes les informations parasites et extraire celles qui sont significatives. L'expertise, quant à elle, est constituée par l'ensemble des connaissances biochimiques et médicales concernant l'électrophorèse bidimensionnelle. Comme celles-ci sont embryonnaires, un système [...]

FUNK, Matthieu. MELANIE : un système d'analyse et d'interprétation automatique d'images de gels d'électrophorèse bidimensionnelle : traitement de l'image et systèmes experts . Thèse de doctorat : Univ. Genève, 1987, no. Sc. 2236

DOI : 10.13097/archive-ouverte/unige:105879

Available at:

http://archive-ouverte.unige.ch/unige:105879

Disclaimer: layout of this document may differ from the published version.

1 / 1

(2)

\

1

UNIVERSITE DE GENEVE

DEPARTEMENT D'INFORMATIQUE

FACULTE DES SCIENCES PROFESSEUR C.PELLEGRINI

MELANIE

UN SYSTEME D'ANALYSE ET D'INTERPRETATION AUTOMATIQUE

D'IMAGES DE GELS D'ELECTROPHORESE BIDIMENSIONNELLE .

TRAITEMENT DE L'IMAGE ET SYSTEMES EXPERTS

THESE

PRESENTEE A LA FACULTE DES SCIENCES DE L'UNIVERSITE DE GENEVE

POUR OBTENIR LE GRADE DE DOCTEUR ES SCIENCES MENTION INFORMATIQUE

par

Matthieu FUNK de GENEVE

THESE N° 2236

Editée à. Genève

LE CONCEPT MODERNE/EDITIONS 1987

(3)

Chez le même éditeur

Xavier Comtesse, Philippe Cordey, Place Neu'!" à l'informatique, 1984 (Prix Universitaire 1985 de la Chambre de Commerce et de /'Industrie de Genève).

Bich-Thuy Luong-Dong-Thi, Une approche de conception d'une base de données cohérentes et complètes, 1986.

Jacques Guyot, Un modèle de traitements pour les bases de données:

un formalisme pour la conception, la validation et l'exécution de la spécification d'une application, 1986.

Ron D. Appel, MELANIE, un système d'analyse et d'interprétation automatique d'images de gels d'électrophorèse bidimensionnelle - systèmes experts et apprentissage automatique, 1987.

(4)

La faculté des sciences, sur le préavis de Messieurs C. PELLEGRINI, pro- fesseur ordinaire et directeur de thèse (Dpt d'informatique), B. LEVRAT, professeur ordinaire (Dpt d'informatique), J.-P. HATON, professeur (Cen- tre de recherche en informatique, Université de Nancy), autorise l'impression de la présente thèse, sans exprimer d'opinion sur les propositions qui y sont énoncées.

Thèse N° 2236 Genève, le 27 janvier 1987

Le Doyen:

Jean-Pierre IMHOF

Impression d'après le manuscrit de l'auteur

Copyright by Le concept moderne/Editions Genève -1987 ISBN 2-88242-002-1

(5)
(6)

Remerciements

Je tiens à remercier le Professeur Christian Pellegrini qui a accepté de diriger cette thèse et qui, par ses encouragements et ses commentaires, en a permis la réalisation. Je tiens aussi à remercier le Professeur Jean- Paul Hatton et le Professeur Bernard Levrat pour leurs commentaires et leur participation au jury de thèse. Je remercie également le Docteur Denis Hochstrasser, médecin du groupe MELANIE, sans qui le projet n'aurait jamais vu le jour et qui a su communiquer son enthousiasme aux membres du groupe.

Mes remerciements vont aussi à tous ceux qui ont directement colla- boré au projet MELANIE, et plus particulièrement : Jean-François L'haire, ingénieur du groupe et constructeur de toutes les parties matérielles du système, Professeur Gerhard Wanner, pour ses précieuses idées et ses con- seils mathématiques, André Didelot et Roger Mérat, ingénieurs systèmes grâce à qui les machines étaient opérationnelles 24 heures sur 24, Clau- dia Rosu, Enrique Bellido, Christian Roch et Jean-Marc Bost, collègues ou diplomants qui ont développé certaines parties du logiciel et Valérie Augs- burger, qui a pris soin à ce que le groupe ne manque jamais de gels.

Je remercie encore Dorothée Hauser et Alain Jacquesson pour leur aide dans la recherche documentaire, ainsi que toutes les autres personnes qui ont participé de près ou de loin à ce travail, en particulier les dactylos et les correcteurs.

Enfin, je tiens tout spécialement à exprimer ma reconnaissance à Ron Appel, avec qui j'ai eu le privilège et le plaisir de partager les années de travail depuis les débuts du projet MELANIE.

(7)
(8)

Table des matières

Table des matières

Table des figures I

II

Introduction I.1

1.2 1.3

Motivations médicales Motivations informatiques Cadre du travail . . . . . .

Informatique médicale - Historique 11.1 Le raisonnement médical

11.2 Historique . . . . . . . .

III MELANIE - Présentation générale

IIl.1 Le génie logiciel et le modèle SADT III.2 Architecture du système MELANIE . 111.3 Ressources . . . . . . . . . .

li

ii

vi 1

2 3 5

6 6 8

14 14

19 23

(9)

TABLE DES MATIERES iii IV La technique de l'électrophorèse bidimensionnelle 26

V

IV.1 Procédé biochimique original IV.2 Nouvelle technique . . . .

IV.2.1 Préparation de l'échantillon . IV.2.2 Gels bidimensionnels

IV.3 Développements actuels . . .

MELANIA - Acquisition des données V.1 Introduction . .

V.2 L'image digitale V.2.1 Historique

V.2.2 Modélisation d'une image V.3 Acquisition graphique -la digitalisation

V.3.1 Matériel V.3.2 Logiciels

V.4 Acquisition symbolique .

26 27 29

30 31

33

33 34 34 38 41 41 57 63

VI Traitement graphique et reconnaissance des formes 65 Vl.1 Introduction . . . .

Vl.2 Les techniques d'amélioration Vl.2.1 Transformation de contrastes Vl.2.2 Modification d'histogramme Vl.2.3 Lissage . . . .

65 67 69 74 80

(10)

iv TABLE DES MATIERES

Vl.2.4 Accentuation de contours . . . . . . . . . . . 87 Vl.3 Techniques d'extraction des caractéristiques des images . 91

Vl.3.1 Regroupement de points Vl.3.2 Détection de contours Vl.4 Conclusion . . . . . . . . . . .

92 104 114

VII MELANIX - Traitement graphique 116 VIl.1 Introduction . . . . . 116

VIl.2 Solutions traditionnelles et systèmes de traitements des électrophorèses bidimensionnelles . . . . . . . . . . . 120

VIl.2.1 Méthodes traditionnelles 120

VIl.2.2 Systèmes informatiques de traitement des élec- trophorèses bidimensionnelles . . . . . . 121 Vll.3 MELANIX - Le traitement de l'image dans MELANIE 126 Vll.3.1 Elimination du bruit de fond et des traînées 127 VIl.3.2 Elimination du bruit local (lissage) 129 Vll.3.3 Détection et séparation des taches . 137 VIl.3.4 Extension des taches et quantification 146 VIl.3.5 Options de visualisation . . . . . 147 VII.4 Exemples de quelques résultats obtenus . 149

VIII MELANID - Base de données 152

VIIl.1 Base de données . . . . . . . 152 VIIl.1.1 Le gestionnaire de bases de données TROLL 153

(11)

TABLE DES MATIERES v

VIll.1.2 Le système de bases de données EMPRESS/32 154

VIll.2Structure de la base de données 154

VIIl.3 Comparaison automatique . . . 158

VIIl.3.1 Description de l'algorithme 158

VIIl.3.2 Evaluation de l'algorithme 159

IX L'intelligence artificielle 160

X

IX.1 Caractérisation d'un programme d'intelligence artificielle 162 IX.2 Représentation des connaissances . 164

IX.2.1 Représentation procédurale 165

IX.2.2 Représentation déclarative 167

IX.2.3 Représentation mixte IX.2.4 Remarques .

IX.3 Les systèmes experts

172 175 175 IX.3.1 Architecture d'un système expert 177 IX.3.2 Avantages de l'architecture d'un système expert 178

MELANIS - Analyse et interprétation

X.1 Les systèmes de productions ..

X.2 Construction du système expert X.2.1 Exposé du problème ..

X.2.2 Particularités du domaine d'application X.2.3 Premier projet . . . . . . . .

180

180 182 183 183 186

(12)

vi TABLE DES MATIERES

X.3

X.2.4 Premier prototype (MELANIS-1) X.2.5 Second prototype (MELANIS-2) MELANIL - Apprentissage .

XI Conclusion

Annexe A

Bibliographie

188 192 193

194

196

201

(13)
(14)

Table des Figures

IIl.1 Les deux types de noeuds d'un diagramme SADT 16 III.2 Schémas SADT de la rédaction d'une thèse 18 III.3 Schéma SADT de MELANIE . . .

....

20 III.4 Gel avec artefacts, trainées, et bruit de fond 22 IIl.5 Schéma de la configuration MELANIE . . . 24 IV.1 Le procédé de l'électrophorèse bidimensionnelle

.. . . .

28 V.1 Schéma SADT de MELANIA . . . . . . . . . . . . 34 V.2 Image transmise par cable sous-marin en 1921 35 V.3 Exemples de traitements d'images par ordinateur 37 V.4 Une image digitalisée, avec plusieurs valeurs de 6,,, et plu-

sieurs niveaux de gris . . . . . . . . . . . . . . . . . . 39 V.5 Tête de la caméra et boîtier Hasselblad 43

V.6 Forme du cadre . . . . 44

V.7 Schéma du connecteur 45

V.8 Information d'état 48

VII

(15)

viii TABLE DES FIGURES

V.9 Schéma de la carte MDB 40801. 16 53

V.10 Spécifications de la caméra HIDID 55

V.11 Protocole de lecture des pixels d'une image. 61 V.12 Schéma fonctionnel du gestionnaire de la caméra 63

VI.1 Système de repère . . . . 66

VI.2 Fonction de correspondance 70

VI.3 Fonctions de transformation 72

VI.4 Transformation logarithmique 73

VI.5 Une fonction de densité . . 75

VI.6 Egalisation d'histogramme 77

VI.7 Exemple de spécification d'histogramme 79

VI.8 Moyenne directe avec différents rayons 82

VI.9 Masque flou

. . .

87

VI.10 Dérivation statistique (Wallis) 90

VI.11 Une image et son histogramme 93

VI.12 Histogramme bimodal 96

VI.13 Gel plus sombre à droite 98

VI.14 Bord idéal et bord bruité . 105

Vl.15 Le laplacien

. . .

110

VI.16 L'opérateur de Hueckel 112

VII.1 Exemples de gels . . . : . . . . . . . . . . . . 118

(16)

TABLE DES FIGURES

VIl.2 Gel avec différents bruits . . . VIl.3 Analyse d'un gel par le système TYCHO Vll.4 Schéma SADT de MELANIX . . . . Vll.5 Elimination du bruit de fond et des traînées Vll.6 Courbe de la chaleur sur une barre de métal VII. 7 Processus de lissage vu en une dimension . Vll.8 Image lissée et non lissée

VIl.9 Filtre A VIl.10 Filtre B

VII.Il Détection des taches : phase 2.

VIl.12 Taches voisines vues en pseudo-3D VIl.13 Bosse et col .

VIl.14 Tache saturée

VIl.15 Deux taches voisines saturées

VIl.16Mise en évidence des taches communes VIl.17 Exemple de traitement (sérum) . . VIl.18 Exemple de traitement (foie de rat) VIIl.1 Schéma SADT de MELANIO . . . . VIll.2 Structure de la base de données IX.1 Un réseau sémantique

IX.2 Réseau sémantique pour Homme{Marcus)

ix 119 123 127 130 131 135 138 139 139 140 142 143 145 145 149 150 151 153 155 171 172

(17)

X

IX.3

X.1 X.2

TABLE DES FIGURES

Architecture d'un système expert idéal ..

Architecture d'un système de productions Schéma SADT de MELANIS-1

177 182 190

(18)

Chapitre I Introduction

MELANIE (Medical ELelectrophoresis ANalysis Interactive Expert system) est la dénomination générale d'un projet de recherche pluridisciplinaire re- groupant des membres de la Faculté de Médecine et du Département d'In- formatique de la Faculté des Sciences de l'Université de Genève. Le projet a pour objectifs l'amélioration et la mise au point de procédés permettant de réaliser une cartographie protéique (gels d'électrophorèse bidimensionnelle), ainsi que la mise au point d'un système interactif d'aide à l'analyse et à l'interprétation d'images obtenues par cette méthode. Les développements sont effectués pour permettre une meilleure compréhension de certains phénomènes biologiques et dans l'optique finale d'aide à l'établissement d'un diagnostic.

Dans le cadre de ce projet, deux recherches sont conduites parallèlement.

La première concerne l'ensemble des procédés biochimiques permettant la fabrication d'un gel d'électrophorèse bidimensionnelle à partir d'un échan- tillon tissulaire, cellulaire ou d'un liquide physiologique provenant d'un pa- tient. La seconde s'occupe du système informatique comportant les métho- des d'acquisition, de traitement, d'analyse et d'interprétation de l'image.

L'ampleur de ce projet est telle que son développement qui débuta en 1983, s'étendra sur plusieurs années encore. Actuellement, à l'Université de Genève, cinq personnes s'y consacrent à plein temps. D'autre part, ce

1

(19)

2 CHAPITRE I. INTRODUCTION

projet a fait l'objet de plusieurs thèses et travaux de diplômes.

1.1 Motivations médicales

Poser les diagnostics de plus en plus précocement, par des tests sophistiqués, sensibles et spécifiques est très important. A l'heure actuelle, le clinicien ne peut attendre les symptômes d'une maladie pour poser son diagnostic, mais il doit baser son évaluation sur les résultats de nombreuses analyses. Lors de l'hospitalisation d'un patient, multiples sont les tests demandés pour le dépistagè de maladies diverses, par souci de ne rien omettre. Il est pri- mordial que des recherches minutieuses soient entreprises, afin de découvrir des tests diagnostiques et thérapeutiques très sensibles, plus globaux, mais toujours spécifiques.

Jusqu'à maintenant, en raison des méthodes utilisées dans les labora- toires de biochimie clinique, chaque élément (protéine) de l'échantillon à étudier engendrait une analyse particulière. Pouvoir, par une seule analy- se, évaluer de nombreuses protéines cellulaires ou tissulaires, accroîtrait la sensibilité et la spécificité de tests précoces de maladies.

Il a été montré que le nombre de protéines différentes dans le corps hu- main se situe entre 60'000 et 100'000 [McK78]. En admettant que des tech- niques biochimiques permettent de séparer un grand nombre de protéines, une modification de la carte des protéines ainsi obtenue renseignerait sur l'intégrité, la structure et même la fonction des diverses cellules et tis- sus humains. Dans de nombreuses maladies, spécialement en oncologie et immunologie, il existe une altération d'une ou plusieurs protéines codées génétiquement. L'apparition, la disparition ou simplement l'évolution d'une tache sur la carte correspondant à une ou plusieurs protéines serait la si- gnature de la maladie.

L'électrophorèse bidimensionnelle est une nouvelle méthode d'a- nalyse biochimique, dont le principe est de séparer les protéines dans un premier gel selon leur point isoélectrique, puis, dans un second gel rectan- gulaire sur lequel on pose le premier, selon leur poids moléculaire. On peut

(20)

Motivations informatiques 3

ainsi obtenir une carte en deux dimensions des protéines analysées. Il est possible de séparer plus de 3'000 protéines différentes d'un échantillon tissu- laire ou cellulaire de quelques milligrammes. Les analyses sont relativement simples et peu coûteuses (probablement une cinquantaine de francs pour une électrophèse bidimensionnelle).

Pour qu'une nouvelle technique soit acceptée en clinique, elle doit pré- senter des avantages par rapport aux techniques précédentes. Il s'agit souvent d'une sensibilité accrue. Il est indéniable que la sensibilité de l'électrophorèse bidimensionnelle est considérable. Un système d'analyse de gels d'électrophorèse bidimensionnelle pourrait donc bien être à la base de la construction d'un outil sophistiqué d'aide au diagnostic.

1.2 Motivations informatiques

Le grand nombre d'informations contenues dans un gel d'electrophorèse bidimensionnelle (plus de 3'000 taches d'intensité et de taille variables) ne permet pas une analyse ou comparaison à !'oeil nu. Seul un traite- ment informatisé permettrait de prendre en compte et de manipuler autant de données. La deuxième partie du projet MELANIE a donc pour but la mise au point d'outils puissants, interactifs et rapides, pour l'analyse et l'interprétation des gels.

Vu la spécificité du problème, la masse considérable et la nature des informations, la nouveauté de la technique biochimique et l'évolution des connaissances sur l'interprétation des données, aucune méthode connue ni algorithme classique ne peuvent être utilisés pour développer ces outils. De ce fait, ce projet présente de nombreux intérêts pour le chercheur in- formaticien. Il ne s'agit pas d'appliquer des théories éprouvées, mais au contraire de développer de nouvelles méthodes dans plusieurs domaines de l'informatique non encore complètement explorés. En effet, plusieurs as- pects du projet, du point de vue informatique, peuvent être relevés :

e Le projet est pluridisciplinaire. Le travail en collaboration avec des non-informaticiens met en place un environnement très motivant.

(21)

4 CHAPITRE I. INTRODUCTION

L'interaction entre deux domaines de recherche de pointe entraine les deux équipes à s'encourager mutuellement et à avancer plus rapide- ment. D'autre part, mener à terme un projet inter-disciplinaire est un défi qui est rarement relevé avec succès. Dans le cas du projet MELANIE, le fait que chaque équipe y trouve un intérêt équivalent est un atout majeur pour la réussite. Enfin, pour l'informaticien, l'espoir de pouvoir contribuer (même de manière modeste) au progrès de la médecine donne un intérêt particulier à son travail.

• La recherche se fait tant en informatique théorique qu'en informatique appliquée. Il est toujours plus intéressant de pouvoir implanter et tester sur un cas pratique les nouvelles théories étudiées, que de rédiger de longs recueils dont on ne sait si les idées décrites seront jamais utilisées.

• Le projet se veut une application complète. Il ne se limite pas à l'étude d'outils pouvant être incorporés dans de plus grands projets. MELANIE considère toute la résolution d'un problème donné, depuis l'acquisition des données jusqu'à leur interprétation, en pas- sant par leur traitement, leur stockage et l'induction de nouvelles connaissances.

Le traitement d'images de gels d'électrophorèse bidimension- nelle fait intervenir des connaissances tant numériques que symboliques et graphiques. Le mélange de données quantifiables, d'images graphiques et de connaissances symboliques médicales exi- ge l'élaboration de nouvelles techniques d'intégration des données. D'autre part, l'utilisation de méthodes d'intelligence artificielle et en particulier des systèmes experts est impérative.

• Le système final doit être utilisable par l'homme. L'interaction homme-machine soulève un problème intéressant, puisque le système informatique doit pouvoir être utilisé par un clinicien ayant peu (ou pas) de connaissances dans ce domaine.

L'expert médical est non-existant. L'état peu avancé de la con- naissance sur l'interprétation des gels d'électrophorèse bidimension- nelle fait que, contrairement à la construction classique d'un système

(22)

Cadre du travail 5

expert qui repose sur l'expert humain, il faut trouver d'autres métho- des pour l'acquisition de la connaissance. Sur le plan de la recherche, la construction d'un système expert sans l'aide d'un expert humain s'oriente dans une direction nouvelle de l'intelligence artificielle.

L'informatique est indispensable. Contrairement à la grande majorité des systèmes experts développés jusqu'à ce jour, MELANIE intervient dans un domaine ne pouvant pas évoluer de manière sa- tisfaisante sans l'aide de l'informatique. A l'exception de quelques rares programmes, tous les systèmes experts se situent à un niveau académique, dans des applications où d'autres méthodes plus effi- caces ou moins coûteuses existent, et restent finalement des outils pédagogiques uniquement. L'aboutissement d'un projet tel que ME- LANIE présenterait en revanche un intérêt important, tant pour l'in- formaticien que pour le médecin.

1.3 Cadre du travail

On s'intéresse ici principalement à la partie informatique du projet MELANIE et plu~ précisément aux développements informatiques dont il a fait l'objet durant la période 1983-1986.

Les travaux ont donné lieu à deux thèses de doctorat qui ont été pré- sentées à la Faculté des Sciences de l'Université de Genève. La première décrit les traitements graphiques effectués sur les images des gels, ainsi qu'un premier prototype de système expert d'aide à l'interprétation des gels. La seconde traite plus particulièrement de l'évolution du système expert, ainsi que de la construction d'un système d'acquisition automatique des connaissances (apprentissage).

Le présent texte constitue le premier de ces deux travaux. Il peut être considéré individuellement, mais le lecteur désirant connaître globalement les travaux effectués en informatique dans le cadre du projet MELANIE entre 1983 et 1986 se référera également au second texte ([App87]).

(23)

Chapitre II

Infor:matique médicale Historique

Avant de décrire le système MELANIE et les différentes phases de son dé- veloppement, il est important de situer ce système dans le contexte de l'informatique médicale. On retracera donc les grandes étapes de l'évolution des systèmes d'informations médicaux.

Dans cette description, on se limitera aux systèmes informatiques liés directement aux problèmes de l'aide au diagnostic médical. L'utilisation de l'informatique dans des techniques de traitement de données, telles que la radiographie, le scanner ou des systèmes médicaux auxiliaires, n'entre pas dans le cadre de ce travail. En effet, ces systèmes qui permettent soit de transformer des données, soit de contrôler des processus, ne sont jamais le moteur de la décision médicale.

11.1 Le raisonnement médical

Afin de bien cerner les problèmes liés au diagnostic médical, on présentera brièvement les réflexions générales qui le caractérisent.

6

(24)

Le raisonnement médical 7

Face à un patient, le médecin a pour tâche d'acquérir certaines infor- mations et de les confronter avec ses connaissances, afin de déterminer un diagnostic et de proposer un traitement. Souvent, face à un problème com- plexe, le praticien décompose la recherche du diagnostic en sous-buts plus spécifiques. Il pose un nombre restreint d'hypothèses et essaie de les vérifier à l'aide des données du patient. Ainsi, au lieu de chercher une réponse à la question de quelle maladie s'agit-il?, il sera confronté à des sous-problèmes mieux définis, tels que le patient souffre-t-il d'un cancer du Foie?. Ces hy- pothèses proviennent en général d'indications particulièrement frappantes [Fie84].

Le médecin va alors comparer les hypothèses avec l'état du patient, dans le but d'éliminer celles qui sont contradictoires, puis il va rechercher les signes cliniques lui permettant de confirmer les hypothèses restantes.

Toutefois, d'autres problèmes sont à prendre en compte. Des incerti- tudes peuvent apparaître dans le raisonnement du médecin, dues soit à sa connaissance incomplète des mécanismes de certaines thérapeutiques, soit à la carence des données. En effet, des données peuvent être manquantes ou incomplètes et la subjectivité du patient ainsi que celle du médecin in- troduisent des informations erronées. Néanmoins, le médecin doit prendre une décision, malgré ces incertitudes.

D'autre part, et selon le principe de la rationnalité limitée de Newell et Simon [NS72], le raisonnement clinique est limité par l'aptitude humaine à traiter un nombre restreint d'informations à la fois. Le médecin est amené à simplifier le problème, en sélectionnant les données qui lui paraissent les plus pertinentes et en schématisant sa connaissance.

Elstein [ESS78] distingue quatre composantes du raisonnement médical : 1. Acquisition des informations sur le patient,

2. Formulation d'hypothèses,

3. Confrontation des hypothèses avec les signes cliniques, 4. Confirmation et élimination des hypothèses.

(25)

8 CHAPITRE II. INFORMATIQUE MÉDICALE -HISTORIQUE

Le processus peut être répété, si l'évaluation des hypothèses ne donne pas satisfaction.

11.2 Historique

L'aide à la décision et au diagnostic médical trouve ses origines au début des années 50. C'est à cette époque que plusieurs nouveaux développements de l'informatique virent le jour simultanément. B. Kleinmuntz [Kle84] dis- tingue quatre domaines qui suscitèrent un intérêt particulier dans le monde scientifiquê :

1. La controverse entre les prédictions clinique et statistique.

Plusieurs études contradictoires furent entreprises pour démontrer que beaucoup de prédictions peuvent être mieux effectuées par des moyens statistiques que par des moyens intuitifs. P. E. Meehl [Mee54], s'appuyant sur ses propres expériences, fut le premier à montrer la supériorité des statistiques sur les méthodes utilisant le jugement des médecins. Parmi ses détracteurs, R. Holt [Hol58,Hol78] oppose qu'un être humain ne peut être compris sans le jugement subjectif et l'esprit de synthèse d'un clinicien. Enfin, A. Elstein [ESS78] donne plusieurs raisons de l'insuffisance du jugement clinique. Premièrement, l'hom- me peut être induit en erreur, car il concentre sa pensée sur des carac- téristiques du problème qui ne sont pas toujours pertinentes. Deuxiè- mement, le clinicien ne pense pas de manière probabiliste. Troisiè- mement, il tend à acquérir trop d'informations, ce qui surcharge sa capacité d'interprétation.

Il faut toutefois garder à l'esprit que certaines tâches, telles que l'auscultation, l'examen de l'expression du faciès du patient, ne peu- vent pas (en tous cas jusqu'à ce jour) être effectuées par une machine.

Pour plus de réfénces, on consultera [Blo80].

2. La théorie de la décision. A la même époque, des statisticiens, tels que L. J. Savage [Sav54], ainsi que R. S. Ledley et L. Lusted [1159], se basant sur les travaux de F. P. Ramsey [Ram31] et de De Finetti

(26)

Historique 9 [DF37], complétèrent l'idée de probabilités subjectives par celle de la théorie de la décision, en y incorporant l'approche bayesienne des probabilités. Ces auteurs expliquèrent l'importance de cette approche pour l'aide à la décision médicale en illustrant leurs propos par des exemples liés aux problèmes cliniques. Nous donnons celui proposé par Savage [Sav72] :

Un médecin est confronté au cas suivant : un patient se trouve dans un des trois états mutuellement exclusifs A, B ou C, avec des probabilités p(A) = 0.01, p(B) = 0.09 et p( C)

=

0.9. S'il n'effectue pas d'intervention chirurgicale d'urgence, le patient décédera dans le cas A, se remettra dif- ficilement de sa maladie dans le cas B et sera bien portant le lendemain dans le cas C. Par contre, si ! 'intervention chirurgicale a lieu, il s'en remettra au bout d'une conva- lescence de six mois, durant laquelle il ne pourra toucher de salaire. Selon cette théorie, chaque décision soutenable du médecin peut être représentée en associant les valeurs U4 , U3 , U2 , U1 aux quatre conséquences possibles : décès, guérison sans opération avec ses coûts, guérison rapide et guérison post-opératoire avec ses coûts. Ainsi, l'opération est jugée préférable, si et seulement si

Notons que cette approche présente un inconvénient majeur, dans la mesure où elle part du principe que le patient ne souffre que d'une seule maladie et que les données sont toujours correctes.

Pour une description plus approfondie de l'utilisation des statistiques bayesiennes en médecine, on se référera aux articles de Winkler et Hays [WH75], Pryor et Warner [PW72], Pauker et Kassirer [PK80], ainsi que Lusted [Lus68].

3. L'approche formelle du raisonnent médical. Ledley et Lusted [1159] réalisèrent qu'un outil quelconque était nécessaire au médecin pour l'aider à poser un diagnostic. Les premiers de ces outils furent

(27)

10 CHAPITRE II. INFORMATIQUE MÉDICALE - HISTORIQUE

des manuels employés pour les diagnostics différentiels, mais ils a- vaient l'inconvénient d'être difficilement utilisables durant une consul- tation. D'autres systèmes furent développés pour assister le médecin.

Mentionnons l'appareil mécanique de F. A. Nash [Nas65] qui permet- tait de comparer une série de 82 symptômes de manière à sélectionner un diagnostic parmi les 337 maladies que l'appareil connaissait.

Le but de l'approche formelle du raisonnement médical était d'utiliser les capacités de stockage de l'ordinateur et d'appliquer des méthodes logiques, afin de détecter le bon diagnostic. Néanmoins, les chercheurs réalisèrent l'explosion combinatoire qui découlait de la composition des d_ifférents symptômes. Malgré les progrès technologiques effectués dans la conception des ordinateurs modernes, ce problème reste ac- tuel.

4. L'intelligence artificielle. Les travaux de A. Newell et H. Si- mon [NS61] sur la simulation du comportement psychologique humain donnèrent naissance à cette nouvelle science. Il faudra pourtant atten- dre le début des années 70 pour voir appliquer de manière croissante les méthodes de l'intelligence artificielle au problème de la prise de décision médicale. Plusieurs systèmes furent développés. Néanmoins, certaines techniques de résolution de problèmes et de représentation de la connaissance ne purent être directement appliquées. En effet, il n'existait alors pas de moyens de représenter les connaissances in- exactes ou incertaines, ni de raisonner en tenant compte des facteurs de plausibilité.

L'approche formelle de la prise de décision médicale (cf. paragraphe 3. ci-dessus) permit d'appliquer le principe du modus ponens (voir chapitre IX) à la représentation de la connaissance. Ceci conduisit à la définition du format Si - Alors qui fut à la base de la structure de la connaissance dans les premiers systèmes experts. Le but de ces systèmes, appelés aussi par la suite knowledge-based systems, est, dans la plupart des cas, celui de poser un diagnostic et de proposer une thérapie. Ils furent appliqués dans des domaines aussi variés que l'oncologie [SSB*81], les infections bactériennes du sang [Sho76], la médecine interne générale [MPM75,MPM82], les facteurs étiologiques du glaucome [WKAS78], les tests de fonctions pulmonaires [Kea78].

(28)

Historique 11

La caractéristique principale d'un système expert est sa séparation en deux parties, à savoir une base de connaissances et un moteur d'inférence. La description détaillée du fonctionnement d'un tel sys- tème sera reprise au chapitre IX.

A l'origine de l'évolution des systèmes experts, on trouve le pro- gramme MYCIN [Sho76], premier système digne de ce nom. Il a été conçu dans le but de fournir une aide pour poser un diagnostic et proposer un traitement pour les maladies infectieuses du sang. Cette assistance peut s'avérer souvent nécessaire dans un milieu hospitalier, car le médecin traitant n'est pas forcément un expert des maladies infectieuses qui peuvent apparaître durant une hospitalisation. Il doit souvent prendre des décisions sur le traitement à effectuer et sur les médicaments à prescrire en l'absence d'informations complètes, par exemple lorsque le temps à disposition ne permet pas d'attendre les résultats des tests de laboratoires, qui peuvent parfois durer plusieurs jours.

MYCIN est composé de trois sous-programmes. Le premier est un système de consultation qui, à partir des informations sur un pa- tient et de sa propre base de connaissances sur les maladies infec- tieuses, décide du traitement et des médicaments à prescrire. Le deuxième est un programme d'explication. Il répond aux questions de l'utilisateur, pendant ou après une séance de consultation, afin de convaincre le praticien de l'exactitude des résultats et du chemine- ment de son raisonnement. Le troisième est un système d'acquisition de nouvelles règles que l'expert désire ajouter à MYCIN.

Dans MYCIN, la connaissance est représentée sous la forme d'expres- sions du type Si fait Alors action. Une des principales nouveautés par rapport aux systèmes antérieurs est l'adjonction d'un facteur de certitude. Celui-ci permet d'exprimer la plausibilité de la conclusion d'une règle, lorsque les hypothèses sont vérifiées.

Le moteur d'inférence est basé sur l'utilisation des règles de produc- tions (voir chapitre IX). La partie gauche d'une règle est considérée comme vraie, si la combinaison des valeurs associées à chacune de ses prémisses dépasse un seuil prédéfini. Si plusieurs règles contribuent à la conclusion d'un même paramètre, leurs facteurs de certitude sont

(29)

12 CHAPITRE II. INFORMATIQUE MÉDICALE -HISTORIQUE

combinés fonctionnellement, afin de former un facteur de certitude qui sera associé à la conclusion. Cette combinaison des facteurs de certitudes est proche de la théorie probabiliste.

En 1977, Weiss, Kulikowsky et Safir [WKS77] construisirent CASNET, un système de diagnostic médical principalement basé sur l'étude des facteurs étiologiques du glaucome. CASNET ne considère pas une ma- ladie comme un état statique, mais comme un processus dynamique, modélisé par un réseau interconnectant des états physiopathologiques par leurs relations causales. Le système pose un diagnostic en déter- minant le modèle de cheminement causal physiopathologique présent chez un patient, puis en identifiant ces modèles avec une catégorie de maladies. Dans ce système, les facteurs de certitude sont rattachés aux liens du réseau. Le modèle causal, qui fait l'originalité de CASNET, permet également de prédire l'évolution de la maladie, avec ou sans traitement.

INTERNIST [Pop81], développé pendant plus de 15 ans, a pour but de simuler une consultation de médecine interne. Sa version la plus récente, INTERNIST-II, contient les profils de plus de 500 maladies et environ 3550 manifestations de ces maladies. Ces profils provien- nent de l'examen de la littérature, ainsi que de la collaboration avec des médecins. Les profils des maladies sont stockés dans une vaste structure arborescente, dont chaque noeud représente une maladie à laquelle est associée une liste de manifestations et de coefficients reflétant le lien entre une manifestation et la maladie.

Parmi les autres systèmes experts médicaux connus à ce jour, men- tionnons encore PIP [SP78J, système de diagnostic de maladies ré- nales, qui innove dans la manière de représenter la connaissance sous forme de frames (voir chapitre IX). Les frames sont centrés sur les maladies, les états cliniques et physiologiques du patient et contien- nent des données inhérentes à des états d'autres patients.

IRIS [TK77], autre système de diagnostic, utilise pour la représenta- tion de la connaissance à la fois les réseaux sémantiques et les règles de productions. Enfin, citons PUFF [Kea78] qui, comme système de test des fonctions pulmonaires, est un des seuls réellement utilisés dans la pratique.

(30)

Historique 13

Ayant présenté les quatre domaines de recherche informatique qui furent appliqués au problème de l'aide au diagnostic médical et les nombreux systèmes qui en découlèrent, force est de constater qu'avoir obtenu si peu de résultats utilisables dans un environnement hospitalier est une déception pour le monde scientifique. Cette option, qui est également mentionnée par C. O. Barnett [Bar82], est expliquée par Kleinmuntz [Kle84] dans les termes suivants: un programme d'aide au diagnostic médical est comparable à un programme simulant un joueur d'échecs de classe A, ce qui est acceptable pour le jeu d'échec, mais inacceptable en médecine, où seule une perfor- mance de Maître ou de Grand Maître est satisfaisante. En d'autres termes, en médecine, l'enjeu est bien plus considérable qu'au jeu d'échecs ( ou de Go, ... ) et les programmes doivent être plus que simplement compétents, mais de premier ordre. Kleinmuntz termine en prédisant qu'avec plus de ressources, d'initiative et de temps, des programmes de niveau Grand Maître pourront être construits.

Terminons par l'explication de E. Feigenbaum et A. Barr [FB81,FC82]. Les systèmes experts médicaux n'ont pas été utilisés dans la pratique mé- dicale, car ils ne sont pas indispensables aux médecins qui pratiquent par- faitement leur profession sans leur aide. Barr et Feigenbaum donnent deux éléments nécessaires pour assurer le succès des systèmes futurs : un choix judicieux du problème médical et une collaboration avec un ex- pert intéressé. De plus, le domaine d'application doit être res- treint et le travail doit être celui qu'un médecin ne peut exécuter lui-même.

(31)

Chapitre III

MELANIE - Présentation générale

Les chapitres suivants seront consacrés à la description du système MELANIE et de ses différentes composantes. Dans le présent chapitre, on présentera d'abord, outre la structure générale du système, l'environnement dans le- quel MELANIE a évolué, c'est-à-dire les collaborations dont le projet a béné- ficié, ainsi que le matériel sur lequel il a été développé.

Afin de décrire le système de manière structurée, on utilisera la méthode SADT1 ( Structured Analysis Design Technique), un modèle de présentation et de communication sous forme de diagrammes.

111.1 Le génie logiciel et le modèle SADT

Depuis l'avènement de la révolution informatique, les performances des ordinateurs se sont constamment améliorées, tandis que leur coût n'a cessé de diminuer. En effet, alors qu'il y a dix ans, seuls les grandes entreprises et les laboratoires de recherches pouvaient s'offrir le luxe de posséder une

1SADT est une marque déposée de Softech Inc.

14

(32)

Le génie logiciel et le modèle SADT 15 telle machine, aujourd'hui, des ordinateurs de puissance comparable ou supérieure sont à la portée de tout un chacun. A l'inverse, le développement des logiciels tend à augmenter en complexité, tout particulièrement dans les différents domaines de l'informatique appliquée. Les moyens matériels et financiers mis en oeuvres dans un projet augmentent constamment et leur durée de vie s'allonge. Le nombre de personnes impliquées dans un même projet suit cette progression, ce qui soulève un grave problème de communication et de compréhension. Les projets informatiques deviennent difficiles à maîtriser et sont souvent sujets à des erreurs de conception. Un autre aspect de cette évolution est la difficulté croissante d'entretenir les logiciels après leur développement. Les informaticiens ayant participé à l'élaboration du logiciel ne sont pas forcément ceux qui seront chargés de son entretien et s'ils le sont, ils peuvent ne pas se souvenir du détail de son fonctionnement.

Ainsi est née la science du génie logiciel qui propose des outils, des techniques et des méthodes permettant d'appliquer le savoir informatique de manière systématique, afin d'atteindre les objectifs fixés dans le cadre d'un projet. Le but principal est de faciliter la définition des objectifs et d'améliorer la communication et la compréhension entre les différents par- ticipants d'un projet. L'article de P. Freeman [Fre83] présente une analyse détaillée du problème du transfert de la technologie et le lecteur intéressé est invité à s'y référer.

Dans le cadre du projet MELANIE, nous avons été confronté au problème décrit ci--dessus. En effet, la durée prévue pour la construction du système, ainsi que le nombre de chercheurs provenant de milieux scientifiques diffé- rents, nous a amené à employer les méthodes du génie logiciel. Le projet a été conçu au moyen du modèle SADT [Ros77]. Ce modèle comporte un langage graphique et un ensemble de méthodes pour utiliser ce langage.

Un modèle SADT comprend un ensemble ordonné de diagrammes. Chaque diagramme est représenté séparément, sous forme d'un graphe contenant entre trois et six noeuds reliés par des arcs. Il existe deux types de dia- grammes, les actigrammes et les datagrammes. Sur les premiers, les noeuds représentent les activités et les arcs le flux des données circulant entre les ac- tivités, alors que les noeuds des seconds contiennent des données reliées par des arcs représentant des activités. Les actigrammes et les datagrammes

(33)

16 CHAPITRE III. MELANIE -PRÉSENTATION GÉNÉRALE

Entrées

Données de corc~Je

Activné

Mécanismes a) Actigramrne

Sorties Activités cn\atriœs

Activités de contnlle

EqtJ4>emenls de stockage

b)Datagrarrune

Activnés utUisatrices

Figure IIl.1: Les deux types de noeuds d'un diagramme SADT sont complémentaires, mais en pratique, les diagrammes d'activités sont plus fréquemment utilisés que les diagrammes de données. Néanmoins, ces derniers sont importants pour contrôler la cohérence et l'intégrité du modèle représenté par les actigrammes.

La figure 111.1 illustre les noeuds de ces deux genres de graphes. Notons que quatre types d'arcs sont définis pour chaque noeud. Les arcs prove- nenant de la gauche d'un noeud véhiculent des informations d'entrée, tan- dis que ceux qui partent vers la droite du noeud symbolisent les sorties.

Dans sa partie supérieure, un noeud reçoit des informations de contrôle, alors que dans sa partie inférieure, ce sont les mécanismes qui y pénètrent.

Les concepts d'entrée, de sortie, de contrôle et de mécanisme relient dans un diagramme chaque noeud à son contexte. Les sorties d'un noeud pro- duisent les entrées et les contrôles d'autres noeuds. A certains noeuds, les sorties correspondent aux sorties du diagramme vers l'environnement extérieur (autres diagrammes). Chaque sortie doit être connectée soit à un autre noeud, soit à l'environnement extérieur. De façon comparable, les entrées et les contrôles doivent provenir des sorties d'autres noeuds ou de l'environnement extérieur. Les entrées, les contrôles et les sorties peuvent être reliés à des noeuds d'autres graphes.

Dans un actigramme, les entrées et les sorties représentent le flux des données, alors que les mécanismes sont les processeurs (mécaniques ou hu- mains). Les contrôles sont des données utilisées mais non modifiées par les activités.

(34)

Le génie logiciel et le modèle SADT 17

La limitation imposée à la complexité d'un graphe (pas plus de six noeuds) fait qu'il est facile de le représenter sur une seule page.

A titre d'exemple, la figure 111.2 illustre les étapes importantes de la rédaction d'une thèse. On peut considérer ce diagramme comme faisant partie d'un ensemble de diagrammes schématisant tout le cheminement d'un doctorant (développement du projet, rédaction de la thèse, sou- tenance de la thèse). La figure 111.2a représente le contexte extérieur du diagramme rédaction d'une thèse, tel qu'on le trouvera dans le dia- gramme de niveau plus général. Les entrées sont composées d'idées et de papier, qui se retrouveront transformés à la sortie sous forme de thèse. Les mécanismes utilisés sont le stylo et le traitement de textes (le cerveau étant sous-entendu). Le contrôle est effectué par le professeur, dont les idées sont utilisées sans être modifiées. La figure 111.2b représente l'actigramme des différentes étapes de la rédaction. On remarquera que les noeuds qui représentent les différentes activités sont libellés par des verbes. Les arcs symbolisent d'une part le flux des données qui sont modifiées par chaque ac- tivité et d'autre part les mécanismes et les contrôles. On notera également la numérotation des boîtes et celle des arcs reliés à l'environnement exté- rieur. L'arc idées meilleures et l'arc modifications illustrent la facilité de représenter le retour en arrière. Il est bien entendu possible de détailler chacune des boîtes du diagramme dans d'autres actigrammes.

Le modèle SADT a permis, tout au long du développement du système MELANIE, d'améliorer la compréhension entre les différents participants. Il a également aidé chacun individuellement à la mise en place de ses idées, grâce, notamment, au concept top-down inhérent au modèle de par la décomposition des noeuds de haut niveau en diagrammes subordonnés. La séparation pour chaque noeud entre entrées, sorties, contrôles et mécanis- mes est également un des atouts du modèle SADT.

L'un des principaux avantages de la méthode SADT réside toutefois dans la facilité qu'elle offre pour expliquer un concept à une tierce personne.

C'est aussi pour cela qu'elle sera utilisée, afin d'illustrer la structure de MELANIE dans la suite de ce travail.

(35)

18 CHAPITRE III. MELANIE -PRÉSENTATION GÉNÉRALE

idées--- - papier - - - M

Rédiger une thèse

'

s Mo traite Ment de texte

1 - - - 4 thèse

NODE: THESE/A0 (Partiel) ITITLE: Travail de doctorat (extrait)

cl: professeur

Uahorer

~~.us:..:._ _ _ _ -M le plan

Ml: stylo M2: tl'aiteMent de texte NODE: THESE/A2 TITLE: Rédi er une thèse

Figure III.2: Schémas SADT de la rédaction d'une thèse (contexte extérieur et principales étapes)

(36)

Architecture du système MELANIE 19

111.2 Architecture du système MELANIE

Nous décrivons ci-dessous la structure générale du système MELANIE, dans l'état où il se trouve au printemps 1986. Notons que la description détaillée exposée dans les chapitres suivants se référe également à cette période.

Le système MELANIE est d'une part un système d'acquisition et de traite- ment d'images, d'autre part un système d'aide à l'analyse et à l'interpréta- tion de ces images. L'interprétation fait intervenir une phase de diagnostic, ainsi qu'une phase d'apprentissage et met en oeuvre certaines méthodes de l'intelligence artificielle.

Le système MELANIE a pour but de poser un diagnostic à partir d'ana- lyses provenant d'un laboratoire de biochimie. Ces analyses sont obtenues par procédé d'électrophorèse bidimensionnelle (voir chapitre IV). MELA- NIE considère l'image d'un gel d'électrophorèse bidimensionnelle, obtenu après analyse d'un échantillon d'une certaine nature (sérum, cellules, urine, etc ... ) prélevé sur un patient et sépare les taches qui représentent cha- cune une protéine, avant de détecter celles qui lui semblent anormales, afin de découvrir une relation avec une ou plusieurs maladies. Dans l'optique d'obtenir un système d'aide au diagnostic de plus en plus performant, il a été doté d'un mécanisme d'auto-apprentissage qui lui permet d'améliorer et d'augmenter ses connaissances.

MELANIE est constitué de cinq parties qui assurent chacune une fonction particulière. Ces cinq parties sont intégrées de façon à ce que l'usager ne perçoive pas de différence autre que fonctionnelle, ce qui nécessite la réalisation d'une interface unique, cohérente et efficace entre l'usager et le système. La communication entre les différentes parties s'effectue par échange ou par partage d'informations. Les diagrammes SADT de la figure 111.3 montrent le contexte, respectivement les cinq phases qui forment le système MELANIE et leurs interconnexions.

On décrira brièvement ces cinq phases :

1. MELANIA. L'acquisition de l'image est effectuée au moyen d'une caméra de digitalisation de haute précision qui transforme l'image

(37)

20 CHAPITRE III. MELANIE - PRÉSENTATION GÉNÉRALE

paraMêtres connaissances

''"J"

gels

- - - ---11

inforMat~i_on~s _ _ _ ..,.

MUicales

Construire un systêMe d'analyse d' Uectl'ophorêses LidiMensionne Iles

fOl'Mat international d' 1ichange

fi chi el'

f - - - - --4 d' 1!change

f - -- - --4 iMages ,__ _ _ _ _. diagnostics

MELANIA HELANID MELANIL

~

MELANIE

HODE: MELAN!E/A-0

HELANIX MELANIS

1 TITLE: Anal use d' E2D (CONTEXTE)

trai tel' les iMa es

c : ol'Ma 10 el'na • c :connaissances M~ ,

deManclÎ oo~vel es

lnfOS

10 os coh1il'entes

MELANIA MELAN IX HODE: ME ANIE/A0

Figure IIl.3: Schéma SADT de MELANIE (contexte et principales étapes)

(38)

Architecture du système MELANIE 21 analogique en une représentation interne digitale. L'image est prise directement du gel éclairé en transparence. Cette partie du système effectue également l'acquisition des informations non graphiques et permet de rassembler les connaissances (informations symboliques) liées à une image ou à un patient.

2. MELANIX. L'image du gel d'électrophorèse bidimensionnelle pré- sente des bruits parasites considérables, tels que bruit de fond, trai- nées, artefacts, etc ( voir fig. III.4). Le système de traitement gra- phique élimine les différentes informations parasites, puis détecte et sépare les taches (protéines). Il calcule leur densité, leur surface, leur poids moléculaire, leur point isoélectrique et d'autres informations nécessaires à l'interprétation de l'image.

3. MELANID. Les informations ainsi obtenues sont ajoutées à une base de données, puis comparées avec les informations des gels pré- cédemment acquis, ainsi qu'avec un gel master et un gel normal. Ces gels sont fictifs et contiennent toutes les protéines rencontrées lors des analyses antérieures (gel master), ainsi que les protéines devant être présentes dans le gel d'un patient en bonne santé (gel normal).

L'architecture de la base de données est de type relationnel.

4. MELANIS. Les résultats de la phase 3. sont analysés par un systè- me expert, afin de détecter d'une part les protéines anormales du gel et d'autre part un ensemble de gels présentant des caractéristiques semblables. Le système expert interprète alors ces données pour ar- river à proposer un diagnostic.

5. MELANIL. Cette phase du système MELANIE est celle qui lui permet d'augmenter sa connaissance et ainsi d'améli9rer ses performances, en concevant de nouvelles règles à partir d'un ensemble de gels de patients malades.

(39)

22 CHAPITRE III. MELANIE - PRÉSENTATION GÉNÉRALE

..

Figure III.4: Gel avec artefacts (a), trainées (b) et bruit de fond (c)

(40)

Ressources 23

111.3 Ressources

On présente dans ce paragraphe les ressources matérielles et logicielles, ainsi que les collaborations dont l'équipe MELANIE a disposé. On se limite ici à décrire les ressources informatiques. Les moyens biochimiques et médicaux mis en oeuvre seront brièvement décrits dans le chapitre suivant (chap. IV).

Le programme de traitement d'images d'électrophorèse bidimension- nelle ELSIE développé par M. Miller est à l'origine des développements réalisés sur ce sujet au Centre Universitaire d'Informatique (CUI). ELSIE permet de détecter les taches sur l'image d'un gel. Ce système, implanté au NIH sur un ordinateur VAX-11/750, a été porté au CUI sur un VAX- 11/7802, sous système d'exploitation Unix 4. 2Bsd3 [BR82). Il a été adapté aux contraintes matérielles auxquelles le CUI était soumis, à savoir que l'équipement graphique dont il disposait était incompatible avec le système ELSIE. Cet équipement, un Ramtek 9400, permet d'afficher une image ma- tricielle de 1024 x 1024 pixels, avec 16 couleurs ( 4 bits de profondeur). ELSIE a ensuite été modifié et augmenté, afin de mieux correspondre aux besoins du projet et obtenir une meilleure détection des protéines (voir chapitre VII).

Faute d'équipement de digitalisation, l'acquisition des images se faisait, dans un premier temps, grâce à la caméra de digitalisation du CERN que le Dr. Werner Kriecher mit gracieusement à la disposition du CUI.

Les phases suivantes du système furent construites au moyen du gestion- naire de bases de données TROLL [KW82] et de l'outil de développement de systèmes experts MRS [GS82).

Certaines de ces composantes s'étant avérées trop restrictives, il a été décidé de changer d'environnement de travail. Tous les logiciels développés au CUI purent être conservés et portés sur un ordinateur Sun-2/ 160, poste de travail muni d'un écran de 1152 x 960 pixels, pouvant afficher 256 couleurs simultanément. Cet ordinateur est en outre équipé d'une mémoire

2VAX est une marque déposée de Digital Equipment Corp.

3Unix est une marque déposée de Bell Laboratories

(41)

24 CHAPITRE III. MELANIE - PRÉSENTATION GÉNÉRALE

contrôleur

0.1-'.SM)/tsf•

1152x960 pixels

caméra

,' ',

, '

, '

, '

, '

~ D D

LJ

table lumineuse

Figure IIl.5: Schéma de la configuration MELANIE

vive de 4 Méga-octets, alors que la mémoire de masse est constituée d'un disque de 400 Méga-octets et d'un lecteur de cassettes 1 / 4 pouce. Il est également muni d'un accélérateur de calculs flottants du type Sky. Le système actuel d'acquisition de l'image est la caméra HIDID développée à l'Ecole Polytechnique Fédérale de Zurich (Prof. Anliker). Elle offre la pos- sibilité de digitaliser une image en 2048 x 3000 pixels, avec 4096 niveaux d'intensité (figure III.5). La nouvelle base de données a été développée à l'aide du gestionnaire EMPRESS/32 de Rhodnius Inc., alors que pour le système expert on a adopté le noyau YAPS (Yet Another Production System) de l'Université de Maryland.

En août 1986, le système a été porté sur un ordinateur Sun-3/160 doté d'un processeur plus puissant que celui du Sun-2.

Le projet MELANIE est le résultat d'une collaboration entre médecins et informaticiens. Il regroupe d'une part le Dr. Denis Hochstrasser, Chef de clinique à !'Hôpital Cantonal de Genève, responsable du développement des parties médicales et biochimiques de MELANIE sous la direction du Prof.

Alex F. Müller, Chef du département de Médecine à !'Hôpital Cantonal de Genève, et d'autre part Ron Appel ainsi que de l'auteur, assistants au Centre Universitaire d'Informatique de Genève, qui se sont partagé les

(42)

Ressources 25

développements informatiques sous la <.füection du Prof. Christian Pelle- grini, Directeur du Département d'Informatique de la Faculté des Sciences à l'Université de Genève.

Le projet bénéficie encore de la collaboration de l'équipe du Professeur Dieter Vonderschmitt qui travaille sur la technique de fabrication des gels d'électrophorèse bidimensionnelle, ainsi que de celle du Dr. Mark Miller du National Institute ofHealth de Bethesda (Washington D.C.), qui développa un premier système informatique de traitement des images de gels d'élec- trophorèses à deux dimensions ( voir chap. VII). Enfin, les expériences acquises dans nos laboratoires sont échangées avec celles des groupes de P. Tarroux (Ecole Normale Supérieure, Paris) et de G. Garderet (LETI- CEA, Grenoble). Les travaux de ces différentes équipes sont décrites dans [WOV85], [MOT83], [VRT*86] et [MTVG86].

(43)

Chapitre IV

La technique de l'électrophorèse bidimensionnelle

A la base du système MELANIE se trouve le gel d'électrophorèse bidi- mensionnelle, dont l'image sera digitalisée puis analysée. Bien que le procédé biochimique de l'électrophorèse bidimensionnelle soit totalement indépendant du système informatique d'analyse et d'interprétation qui fait l'objet de ce texte, on en donnera ci-dessous la description pour mieux il- lustrer les problèmes liés à l'analyse d'images obtenues par cette méthode et afin de décrire le projet MELANIE dans son ensemble.

IV.1 Procédé biochimique original

L'électrophorèse bidimensionnelle est une méthode biochimique décrite pour la première fois en 1975 par O'Farrell [0Fa75]. Elle permet de séparer en une fois des centaines de protéines, selon leur point isoélectrique et leur poids moléculaire. Depuis, Anderson [AA77] et Tracy [TCY82] ont ap- porté des modifications importantes à cette technique, permettant ainsi d'obtenir la carte de protéines d'un échantillon complexe avec une très grande résolution et une excellente reproductibilité.

26

(44)

Nouvelle technique 27

Dans un premier temps, on prépare un gel capillaire d'acrylamide coulé dans un tube de verre et polymérisé; on incorpore dans le gel des am- pholytes, c'est-à-dire des polymères de synthèse à charges multiples. Lors- que le gel se trouve dans un champ électrique, celui-ci produit un gradient de pH entre l'anode et la cathode; ce gradient résulte de la migration des ampholytes jusqu'à leur point d'équilibre, qui dépend de la charge électrique globale. On dépose alors l'échantillon contenant les protéines à séparer au- dessus du gel et on applique un champ électrique. Pour chaque protéine, il existe une valeur de l'acidité du milieu (le point isoélectrique), pour laquelle la somme des charges positives est égale à la somme des charges négatives, c'est-à-dire où la charge globale est nulle. Dans le champ électrique, les protéines migrent vers l'anode, mais se stabilisent à l'endroit où son pH isoélectrique est égal à l'acidité du milieu. Cette première phase s'appelle l'électrofocalisation (figure IV.la).

Dans une seconde étape, on équilibre le gel dans une solution contenant du ou des détergents dont les molécules se fixent sur les protéines et leur donnent une charge négative égale par unité de protéine. On place alors le gel sur la tranche d'une plaque d 'acrylamide polymérisé. On applique un champ électrique perpendiculaire à l'axe du gel (figure IV.lb). Les protéines migrent alors vers l'anode. Leur vitesse de migration dépend de leur taille, les petites protéines migrant plus vite que les grosses, plus freinées. On sépare ainsi les protéines en fonction de leur taille, proportionnellement au logarithme de leur masse moléculaire. A la fin de l'électrophorèse, on visualise les protéines au moyen de colorants.

IV.2 Nouvelle technique

S'appuyant sur les mises au points apportées à la méthode d'électrophorèse bidimensionnelle par Anderson [AA77], Tracy [TCY82] ainsi que Blangarin et Madjar [BM86], un laboratoire a été mis sur pied à !'Hôpital Cantonal Universitaire de Genève pour produire des gels d'électrophorèse bidimen- sionnelle dans le cadre du projet MELANIE. Depuis, la technique a été per- fectionnée dans ce laboratoire et les gels obtenus aujourd'hui présentent une résolution, une qualité et une reproductibilité de très haut niveau

(45)

28 CHAPITRE IV. L'ELECTROPHORESE BIDIMENSIONNELLE

Figure IV.1: Le procédé de l'électrophorèse bidimensionnelle

(46)

Nouvelle technique 29 [HFA *86,HRD*86]. On décrit ici la technique exacte, telle qu'elle est ap- pliquée actuellement dans le laboratoire du projet MELANIE par le docteur Denis Hochstrasser et Mademoiselle Valérie Augsburger.

IV .2.1 Préparation de l'échantillon

Les trois principaux types d'échantillons utilisés dans notre laboratoire sont:

1. du sérum. Le sérum est dénaturé dans une solution de dodécylsulfate de sodium (SDS) et de dithioerythritol (DTE), chauffé à 95°C pen- dant 5 minutes, puis dilué avec une solution contenant du ( ( cholami- dopropyl)-dimethyl-ammonio )-propanesulfonate (CHAPS) et de l'u- rée. Des fractions de la solution finale ont été chargées sur le gel de la première dimension (électrofocalisation), ce qui équivaut, selon les expériences, de 0.1µ1 à 4µ1 de sérum au départ.

2. des lymphocytes et des monocytes extraits du sang circulant.

Un échantillon de sang veineux hépariné est séparé par centrifugation, puis par gradient de ficoll hypaque. Les cellules mononucléees recueil- lies à l'interface de ficoll sont lavées dans un milieu physiologique.

Ainsi obtenues, elles sont suspendues dans un milieu approprié, appelé milieu d'élutriation et sont séparées en fonction de leur taille et de leur poids dans une centrifugeuse équipée d'un rotor d'élutriation. Par coloration de May-Grünwald-Giemsa et de peroxydase, les premières fractions contiennent environ 98% de lymphocytes, les dernières en- viron 85% de monocytes, moins de 5% de polymorphonucléaires et moins de 10% de lymphocytes. Les échantillons contenant en général de l'ordre de 600'000 cellules sont traitées de la même façon que le sérum ci-dessus [HRD*86].

3. des biopsies hépatiques de foies de rats. Pour les coupes de tissu, l'organe est congelé. Des coupes de lem x 1.5cm x 20µ sont obtenues à l'aide d'un cryotome et dénaturées selon la même méthode que ci-dessus (1.) [HRD*86].

(47)

30 CHAPITRE IV.L'ELECTROPHORESE BIDIMENSIONNELLE

IV.2.2 Gels bidimensionnels

Electrofocalisation

Les gels capillaires sont obtenus par polymérisation d'une solution con- tenant un mélange approprié d'acrylamide/bisacrylamide, d'urée d'ampho- lites, de CHAPS et de Nonidet P40, le TEMED et le persulfate d'ammo- nium jouant le rôle de catalyste. Les échantillons sont appliqués du côté basique. L'électrofocalisation, avec comme anolyte 5mM de H3P04 et comme catholyte lOmM de NaOH, dure en général, selon le type d'échan- tillon, 18 heures, avec une tension de 3'000 volts [HRD*86].

Seconde dimension

Quatorze gels rectangulaires (17 x 22cm) d'une épaisseur de 1.5mm sont préparés dans un moule home made. Ils sont composés d'un mélange précis comprenant de l'eau distillée, du Tris 7-9, de l'acrylamide/bisacrylamide, du TEMED et de la solution de persulfate d'amonium. Les douze meilleurs gels sont sélectionnés après 24 heures de polymérisation.

Les gels expulsés de leurs capillaires de verre sont immédiatement posés sur la tranche des gels rectangulaires, fixés avec une solution contenant de l'Agarose. Aucune équilibration n'est effectuée entre la première et la seconde dimension.

Le tampon pour la séparation en seconde dimension est composé de SDS, de TRIS, de glycine et d'eau distillée. Les 12 gels sont soumis à un courant constant de 40mA/gel durant 5 heures. Pendant la migration, la température du tampon est maintenue constante par un système de re- froidissement développé dans notre laboratoire. La tension monte progres- sivement jusqu'à 600V environ [HRD*86].

Références

Documents relatifs

Nous sommes même en pleine contradiction puisque l'économie productiviste en dégageant une part toujours plus grande de ressources pour les loisirs contribue par la manière dont

L’histoire de la zone euro est l’histoire des tentatives de gérer et contenir les risques financiers qui découlent de ces déséquilibres afin de garantir un

Cependant, il doit surtout être admis par notre société et par notre système de santé que les patients souffrant d’obésité, cette maladie chronique, doivent pouvoir être

Analyse d'efficacité et d'efficience par matière scolaire : interprétation et mesure des outputs..

Dans deux ouvrages récents (Reboul &amp; Moeschler 1998a et b), nous nous sommes élevés contre cette hypothèse du DIS- COURS 1 comme une unité linguistique à part

Disclaimer: layout of this document may differ from the published version. 1

RoNALD DwoRKIN qui présente l'interprétation de la loi par les juges comme comparable au jeu qui consiste à écrire un roman à la chaîne, tout l'art du jeu étant de poursuivre,

Ressorts de l'universitarisation des sciences de l'éducation à Genève, 1890-1930.. HOFSTETTER, Rita,