• Aucun résultat trouvé

Non-linear statistical models for shape analysis : application to brain imaging

N/A
N/A
Protected

Academic year: 2021

Partager "Non-linear statistical models for shape analysis : application to brain imaging"

Copied!
167
0
0

Texte intégral

(1)

HAL Id: tel-00789793

https://tel.archives-ouvertes.fr/tel-00789793

Submitted on 18 Feb 2013

HAL is a multi-disciplinary open access archive for the deposit and dissemination of sci-entific research documents, whether they are pub-lished or not. The documents may come from teaching and research institutions in France or abroad, or from public or private research centers.

L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau recherche, publiés ou non, émanant des établissements d’enseignement et de recherche français ou étrangers, des laboratoires publics ou privés.

application to brain imaging

Giorgos Sfikas

To cite this version:

(2)

UNIVERSITÉ DE STRASBOURG

ÉCOLE DOCTORALE MATHÉMATIQUES, SCIENCES DE L'INFORMATION ET DE

L'INGÉNIEUR

Laboratoire des Sciences de l'Image, de l'Informatique et de la Télédétection

no. d'ordre: 1541

THÈSE

présentée par :

Giorgos SFIKAS

soutenue le : 7 septembre 2012

pour obtenir le grade de : Docteur de l’université de Strasbourg

Discipline/ Spécialité

: Traitement du signal et des images

Modèles statistiques non linéaires pour

l'analyse de formes. Application à

l'imagerie cérébrale.

THÈSE dirigée par :

M. Christian HEINRICH Professeur des Universités, Université de Strasbourg M. Christophoros NIKOU Professeur Assistant, Université de Ioannina

RAPPORTEURS :

M. Jean-Philippe RANJEVA Professeur des Universités, Aix-Marseille Université M. Frédéric RICHARD Professeur des Universités, Aix-Marseille Université

AUTRES MEMBRES DU JURY :

M. Jack FOUCHER Maître de conférences, praticien hospitalier, HUS M. Frédéric BLANC Maître de conférences, praticien hospitalier, HUS M. Aristidis LIKAS Professeur Associé, Université de Ioannina M. Pierre CHARBONNIER Directeur de recherche, LRPC, Strasbourg

(3)
(4)

Note

(5)
(6)

Acknowledgements

The following manuscript stands for the representative output of a process that has begun almost four years ago, when I started pursuing my PhD title. While it is the fruit of personal work, ideas be it that they are original or unoriginal, scientic or unscientic do not form on one's mind by themselves. I believe, however cliché that may sound for some, that on the one hand ideas, and in general the imaginary, stands in a rm, two-ways, dialectical relation with the objective reality of one's time (a reality that is indeed, in every aspect, changing very rapidly lately all around the world). On the other hand, one's ideas are born, shaped or challenged when in contact where contact may mean anything from a mundane discussion to a university lecture with other people, carriers of like or dierent thoughts and ideas. As such, from another point of view, the present work is the product of many (only I get the credit though !). And it is those people, living factors, that have contributed directly or indirectly, towards its completion, that I feel obliged to thank here.

My thesis advisors, Christian Heinrich and Christophoros Nikou. I thank them both for their guidance and support, all through the time I spent working on my thesis. Christian Heinrich for proposing me an interesting PhD subject, and also importantly, nding me nancial support. From the very rst moment my thesis started in France, Christian Heinrich has been a steady, patient and endurant source of aid of scientic, as well as more mundane, nature. Christophoros Nikou for his hard-to-nd availability and helpfulness in his supervision, despite the long distance that separates Alsace and Epirus.

My heartfelt gratitude to the late Dr. N.P.Galatsanos, who supervised my research mostly prior to the beginning of my PhD. An outstanding scientist, teacher and researcher, he has been a true source of inspiration to all that surrounded him. Especially personally I feel that I owe him very much, within as well as far beyond the context of this thesis.

Jean-Philippe Ranjeva, Frédéric Richard, who have undertaken the task of judging this manuscript ; medical doctors Frédéric Blanc, Nathalie Philippi and Jack Foucher, with whom we have been or are on an ongoing collaboration ; Aristidis Likas for accepting to be member of the jury, despite his busy work schedule in Ioannina.

My collegues and friends in LSIIT, IPB and elsewhere, who I have frequented more or less on a xed basis. Félix Renard, Slim Karkar, Ahmed Mumtaz, Hanna Eriksson, Erhan Ap-toula, Swati Sharma, Shine On, Georges Moustaki, Benjamin Perret, Fatma Abdelmoullah, Akram Belghith, Farouk Nouizi, Abdelqader Lakhsassi, René Albino Perez. All the, admit-tedly small, greek community of Strasbourg. Especially Evangelos Gintersos, Frans Declerq, Théodoros Théo Chiou, Angelina Greka, Anargyros Skaltsas, Billy Gavrakos Grec and Paul Kitromèlidès for all the memorables soirées grecques we organised in and out of Café des Anges, and our eorts in spreading 9/8 in Alsace.

(7)
(8)

Table of contents

1. Introduction 1

1. General context . . . 1

1.1 Shape and neuroimaging . . . 1

1.2 Statistical shape analysis . . . 2

2. Contributions . . . 3

3. Collaborations . . . 4

4. Thesis outline . . . 5

I Compact shape representation 7 2. Shape description 11 1. Models for shape representation . . . 11

1.1 Point cloud . . . 11

1.2 Spherical harmonics (SPHARM) . . . 12

1.3 Medial axis representations . . . 13

1.3.1 Medial axis and medial axis transform . . . 13

1.3.2 Medial representations (m-reps) . . . 13

1.4 Distance transforms . . . 13

1.5 Landmark-based representation . . . 14

1.6 Deformation vector elds with respect to a template . . . 14

2. Feature vector space as a model basis . . . 14

3. Conclusion . . . 15

3. Compact representation with manifold learning 17 1. Manifold hypothesis . . . 18

2. Manifold learning . . . 19

2.1 Learning the manifold with Isomap . . . 20

2.2 Distance metrics . . . 21

3. Conclusion . . . 22

II Discriminative and generative shape models 23

4. Discriminative shape models using SVDD 27

(9)

2. Related models . . . 29

2.1 Support vector machines . . . 29

2.2 One-class support vector machines . . . 31

3. SVDD in shape analysis . . . 31

4. Conclusion . . . 31

5. Discriminative trajectory 33 1. Estimating discriminative dierence with SVDD . . . 33

1.1 SVDD projection . . . 33

1.2 Discriminative trajectory . . . 35

2. Related work in support vector machines . . . 36

2.1 Discriminative direction . . . 36

2.2 Regularized discriminative direction . . . 37

2.3 Discriminative pattern . . . 38

3. Conclusion . . . 38

6. Proposed model 39 1. Combining SVDD and the manifold hypothesis . . . 39

1.1 Generating new shape with multivariate regression . . . 41

2. Illustration with synthetic datasets . . . 42

2.1 Data sets considered . . . 42

2.2 Tests on synthetic datasets . . . 42

3. Conclusion . . . 52

III Case study: hippocampus neurodegeneration in Alzheimer's disease 55 7. Brain anatomical degeneration in Alzheimer's Disease 59 1. Elements of brain anatomy . . . 59

1.1 The hippocampus . . . 60

1.2 The amygdala . . . 61

2. Alzheimer's disease . . . 61

2.1 Disease general characteristics . . . 61

2.1.1 Mild cognitive impairment and AD . . . 62

2.2 Biomarkers and Alzheimer's disease . . . 62

2.2.1 Blood and CSF biomarkers . . . 63

2.2.2 Structural degeneration as a biomarker . . . 63

3. Clinical assessment scores . . . 64

4. State of the art computational models and approaches for the study of AD . . . 64

5. Conclusion . . . 65

(10)

vii

1.1 OASIS datasets . . . 68

1.2 University Hospital of Strasbourg datasets . . . 69

1.3 Estimating the embedding dimensionality . . . 70

2. Hippocampus discriminative trajectories and p-value signicance maps . . . 73

3. Using the proposed model for hippocampus and amygdala classication . . . . 75

4. Conclusion . . . 77

Conclusion and perspective 81 IV Appendix 83 A. Bayesian models for medical, natural and polarimetric image processing 85 1. Introduction . . . 85

2. MR brain tissue classication using an edge-preserving spatially variant mixture model . . . 86

2.1 Introduction . . . 86

2.2 Model description and solution . . . 88

2.3 Experimental results . . . 91

2.4 Conclusion . . . 92

3. Edge-preserving spatially varying models for image segmentation . . . 92

3.1 Model description and solution . . . 93

3.2 Experimental results . . . 98

3.3 Conclusion . . . 99

4. Automatic number of components determination . . . 101

4.1 Model description and solution . . . 102

4.2 Experimental results . . . 108

4.3 Conclusion . . . 111

5. Recovery and segmentation of polarimetric images . . . 111

5.1 Model description and solution . . . 112

5.2 Experimental results . . . 116

5.3 Conclusion . . . 117

V References 119

Author publications 121

(11)
(12)

List of abbreviations

AD Alzheimer's Disease

ADAS Alzheimer's Disease Assessment Scale BDE Boundary Displacement Error

CA Cornus Ammonis

CDR Clinical Dementia Rating CSF Cerebrospinal Fluid

DBM Deformation-Based Morphometry DRS Dementia Rating Scale

DT-MRI Diusion Tensor Magnetic Resonance Imaging EM Expectation-Maximization

FMM Finite Mixture Model

fMRI Functional Magnetic Resonance Imaging GCE Global Consistency Error

GDS Global Deterioration Stage

GM Gray Matter

GMM Gaussian Mixture Model

HRSD Hamilton Rating Scale for Depression ISNR Improvement over Signal-to-Noise Ratio

LDDMM Large Deformation Dieomorphic Metric Mapping m-reps Medial Representations

MAP Maximum A Posteriori MCI Mild Cognitive Impairment MCMC Markov Chain Monte Carlo MDS MultiDimensional Scaling

ML Maximum Likelihood

MM Majorization-Minimization MMSE Mini-Mental State Exam

MRF Markov Random Field

MRI Magnetic Resonance Imaging ncuts Normalized Cuts

OCSVM One-Class Support Vector Machine PCA Principal Component Analysis PET Positron Emission Tomography PSA Polarization State Analyzer pdf Probability Distribution Function ROI Region Of Interest

RI Rand Index

RVM Relevance Vector Machine RBF Radial Basis Function

(13)

SPHARM Spherical Harmonics SNR Signal-to-Noise Ratio

SVDD Support Vector Data Description

SVGMM Spatially-Varying Gaussian Mixture Model

St-SVGMM Student's-t Spatially Varying Gaussian Mixture Model

SVM Support Vector Machine

TBM Tensor-Based Morphometry

WM White Matter

VOI Variation Of Information

(14)

Abstract

This thesis addresses statistical shape analysis, in the context of medical imaging. In the eld of medical imaging, shape analysis is used to describe the morphological variability of various organs and tissues, such as the heart, the brain, or particular structures and tissues in the brain. Pathologies, whose development is characterized by structural change in brain tissue, include Alzheimer's disease, which is the pathology of interest in this thesis, multiple sclerosis and schizophrenia. Structural change in these diseases reects the evolution of neu-ronal degeneration and brain atrophy. The qualitative and quantitative characteristics of such structural degeneration can help us assess the development of the pathology, and eventually plan a disease-slowing or symptom prevention treatment.

Our focus in this thesis is on the construction of a generative and discriminative, compact and non-linear model, suitable to the representation of shapes. This model is evaluated in the context of the study of a population of Alzheimer's disease patients and a population of healthy controls. The discriminative component of the model is based on the Support Vector Data Description (SVDD) framework. The SVDD is closely related to the one-class Support Vector Machine (SVM). Our principal interest here is using the discriminative model to discover morphological dierences that are the most characteristic and discriminate best between a given shape class and forms not belonging in that class.

An important aspect of the proposed model is the hypothesis that the data (the shapes) lie on, or suciently near, a low-dimensional, non-linear manifold. In this work we originally parametrize shape as a deformation eld with respect to a given reference image, a representa-tion which gives a high quality, detailed descriprepresenta-tion, but also a descriprepresenta-tion space of very high dimensionality, in the order of millions of dimensions. After dimensionality reduction, the shape can be represented as a point of a space comprising typically no more than ten dimensions.

The theoretical innovation of our work lies in two principal points : rst, we propose a tool to extract discriminative dierence in the context of SVDD models ; second, all generated reconstructions are anatomically correct, due to the non-linear and compact character of the model. The application of our model on real medical data shows results coherent with well-known ndings in related research. We conrm that particular tissue regions and subelds are damaged the most, like the head and the tail of the hippocampus. We also use the model as a classier, discriminating healthy from pathological subjects on the basis of structural information.

(15)
(16)

Résumé

Cette thèse a pour objet l'analyse statistique de formes, dans le contexte de l'imagerie médi-cale. Dans le champ de l'imagerie médicale, l'analyse de formes est utilisée pour décrire la vari-abilité morphologique de divers organes et tissus, tels que le c÷ur, le cerveau, ou des structures et tissus particuliers dans le cerveau. Les pathologies d'intérêt, dont le développement est mar-qué par des changements structurels dans les tissus cérébraux, incluent la maladie d'Alzheimer, qui est la pathologie d'intérêt de cette thèse, la sclérose en plaques et la schizophrénie. Le changement structurel dans le contexte de ces maladies reète l'évolution de la dégénération neuronale ou de l'atrophie du cerveau. Les caractéristiques qualitatives et quantitatives de ces dégénérations structurelles peuvent nous aider à évaluer le développement de la pathologie, et de planier éventuellement un traitement pour ralentir l'évolution de la maladie.

Nous nous focalisons dans cette thèse sur la construction d'un modèle génératif et discrimi-natif, compact et non-linéaire, adapté à la représentation de formes. Ce modèle est évalué dans le contexte de l'étude d'une population de patients atteints de la maladie d'Alzheimer et d'une population de sujets contrôles sains. La composante discriminative du modèle est fondée sur le cadre Support Vector Data Description (SVDD). Le SVDD est étroitement lié au one-class Support Vector Machine (SVM). Notre intérêt principal ici est l'utilisation du modèle discrim-inatif pour découvrir les diérences morphologiques les plus discriminatives entre une classe de formes donnée et des formes n'appartenant pas à cette classe.

Un aspect important du modèle proposé est l'hypothèse que les données (les formes) se trouvent sur ou non loin d'une variété non-linéaire de dimension faible. La forme, dans ce travail, est paramétrée originellement comme un champ de déformation par rapport à une image de référence, ce qui donne une description très ne et de haute qualité, mais aussi un espace de description de très haute dimensionalité, de l'ordre de millions de dimensions. Après réduction de dimension, la forme peut se décrire comme un point d'un espace de moins de dix dimensions. L'innovation théorique apportée par notre modèle réside en deux points principaux : pre-mièrement, nous proposons un outil pour extraire la diérence discriminative dans le contexte des modèles SVDD ; deuxièmement, toutes les reconstructions générées sont anatomiquement correctes, ce qui est dû au caractère non-linéaire et compact du modèle. Une application de notre modèle à des données médicales réelles montre des résultats cohérents avec les connais-sances médicales. Nous mettons en évidence des points signicatifs autour de la tête et de la queue des hippocampes gauche et droit. Nous utilisons également le modèle comme classieur, permettant de discriminer les sujets sains des sujets pathologiques à partir toujours de données structurelles des régions d'intérêt du cerveau.

(17)
(18)
(19)
(20)

Résumé étendu

Introduction

Analyse de formes en imagerie médicale

Le but de l'analyse statistique de formes est la construction de modèles capables de décrire des formes et leur variabilité. Dans le champ de l'imagerie médicale, l'analyse de formes est utilisée pour comprendre la variabilité morphologique de divers organes et tissus, tels que le c÷ur, le cerveau, ou des structures et tissus particuliers dans le cerveau. L'étude de telles don-nées nous permet de mieux comprendre la fonction du corps et du cerveau, d'étudier l'évolution anatomique, de diagnostiquer certaines pathologies, d'étudier leur développement et de plan-ier un traitement pour ralentir l'évolution de la maladie. Des diérences anatomiques entre groupes peuvent être étudiées, où groupe peut signier similitude d'âge, de condition clinique ou diagnostique. Un facteur important pour l'analyse de formes a été l'introduction de l'imagerie haute résolution et de l'Imagerie par Résonance Magnétique (IRM) en particulier, ce qui a per-mis des études in vivo. L'étude morphologique dans le contexte de l'imagerie cérébrale a été à son origine réduite à de simples mesures d'aire et volume. Aujourd'hui, nous pouvons quantier des formes avec une résolution et une précision sans cesse meilleures. Les pathologies d'intérêt, dont le développement est marqué par des changements structurels dans les tissus cérébraux, incluent la maladie d'Alzheimer, qui est la pathologie d'intérêt de cette thèse, la sclérose en plaques et la schizophrénie. Le changement structurel dans le contexte de ces maladies reète l'évolution de la dégénération neuronale ou de l'atrophie du cerveau. Les caractéristiques quali-tatives et quantiquali-tatives de ces dégénérations structurelles jouent le rôle de biomarqueurs. Dans la mesure où un modèle peut capter et décrire précisément la variabilité anatomique, l'intérêt de la variabilité en tant que biomarqueur est important. La variabilité anatomique présente un intérêt pour les études intra-population. Elle est tout aussi importante pour l'étude de la diérenciation anatomique entre un groupe de patients et un groupe de sujets sains (contrôles).

Problématique et contributions de la thèse

Nous nous focalisons dans cette thèse sur la construction d'un modèle compact, non-linéaire, adapté à la représentation de formes. Ce modèle est évalué dans le contexte de l'étude d'une pop-ulation de patients atteints de la maladie d'Alzheimer et d'une poppop-ulation de sujets contrôles. Le modèle proposé fonctionne à la fois comme un modèle discriminatif et comme un modèle génératif. La composante discriminative du modèle est fondée sur le cadre Support Vector Data Description (SVDD). Dans la bibliographie, le SVDD est utilisé pour l'estimation de support, la classication, la détection de points aberrants et le débruitage. Le SVDD est étroitement lié au one-class Support Vector Machine (SVM). Notre intérêt principal ici est l'utilisation du modèle discriminatif pour mettre en évidence les diérences morphologiques les plus discrimi-natives entre une classe de formes donnée et des formes n'appartenant pas à cette classe. Un outil similaire (la direction discriminative) a été proposé [Golland 2000] dans le cadre SVM. Notre approche, basée sur le SVDD et que nous appelons trajectoire discriminative, génère un

(21)

processus d'instances de formes, à partir d'une forme donnée vers le support de classe estimé. Toutes les instances de ce processus sont des projections sur un support estimé, pour diérentes valeurs de paramètres du modèle.

Un aspect important du modèle proposé est l'hypothèse que les données (les formes) se trouvent sur ou non loin d'une variété non-linéaire de dimension faible. Cette hypothèse a été largement utilisée dans la bibliographie depuis l'introduction de méthodes telles que l'I-somap [Tenenbaum et al. 2000]. La pertinence de l'hypothèse a été conrmée depuis lors dans plusieurs domaines applicatifs. En pratique, elle nous permet de construire un modèle compact de représentation de formes. Dans notre travail, les formes sont paramétrées par un champ de déformation par rapport à une image de référence (template), ce qui donne une description très ne et de haute qualité, mais aussi un espace de description de très haute dimensionalité, de l'ordre de millions de dimensions. Après réduction de dimension, la forme peut se décrire comme un point d'un espace de moins de dix dimensions.

En ce qui concerne la trajectoire discriminative introduite dans cette thèse, l'hypothèse d'existence de la variété de formes nous sert à contraindre la trajectoire à correspondre à des formes anatomiquement correctes, dans la mesure où la structure intrinsèque des données est captée avec précision. La génération de formes incorrectes constitue un problème connu qui touche des modèles, comme par exemple la direction discriminative originale, qui négligent la non-linéarité de la structure des données.

L'innovation théorique apportée par notre modèle se reète dans deux nouveautés principales de la trajectoire discriminative : premièrement, cette dernière constitue un outil pour extraire la diérence discriminative dans le contexte des modèles SVDD ; deuxièmement, elle ne permet que des reconstructions anatomiquement correctes. D'un autre côté, an de décrire succinctement les diérences de groupe entre sujets sains et sujets non sains, nous visualisons les diérences avec une carte de p-valeurs, superposée à une forme de référence. Les p-valeurs sont calculées voxel par voxel, comme une fonction de grandeurs calculées d'après le modèle appris. Cette carte sert à indiquer les zones de diérences de formes signicatives entre classe et non-classe. Une application de notre modèle à des données médicales réelles montre des résultats cohérents avec les connaissances médicales. Nous utilisons également le modèle comme classieur, permettant de discriminer les sujets sains des sujets pathologiques à partir toujours de formes cérébrales. Pour toutes les applications, la non-linéarité et la compacité du modèle proposé se révèlent très utiles.

Contexte de la thèse et collaborations

Ce travail a été eectué dans le cadre d'une collaboration entre l'équipe  Modèles, Images et Vision  du Laboratoire des Sciences de l'Image, de l'Informatique et de la Télédétection (Université de Strasbourg, UMR CNRS  UDS 7005) et le Information Processing and Analysis Group (département d'informatique, Université de Ioannina, Grèce).

D'un point de vue méthodologique, cette thèse est liée aux travaux de Félix Renard [Renard 2011], avec lequel l'auteur a collaboré pendant son séjour au LSIIT. Elle est aussi liée aux travaux de Torbjørn Vik [Vik 2004] sur des modèles probabilistes, linéaires et non-gaussiens et également à ceux de Matthieu Brucher [Brucher 2008] sur l'analyse de formes à l'aide de modèles non-linéaires.

(22)

ix

Plan de la thèse

Le mémoire est organisé en trois parties. La première partie introduit des méthodes pour décrire les formes. La deuxième partie présente les composantes discriminative et générative de notre modèle. La troisième partie constitue une application du modèle à notre étude de cas, à savoir des populations d'hippocampes dans le contexte de la maladie d'Alzheimer.

La première et la deuxième partie présentent le modèle proposé dans un contexte général d'analyse de formes plutôt abstrait. Nous présentons d'abord l'état de l'art pour décrire la forme. Nous constatons qu'une représentation de formes n'est pas forcément compacte. Ensuite nous appliquons les techniques d'apprentissage de variétés tel que l'Isomap, an de construire un descripteur de forme compact.

La deuxième partie présente les diérentes composantes du modèle proposé. Nous intro-duisons d'abord le SVDD, le modèle discriminatif de base dans cette thèse. Ensuite nous utilisons le SVDD pour extraire de l'information à propos de caractéristiques de formes qui discriminent le mieux entre des objets dans la classe et des objets hors de la classe. Nous présentons la trajectoire discriminative en termes de projections SVDD, une opération initialement proposée dans le contexte du débruitage de données. Ensuite nous connectons toutes les composantes présentées, tout en créant une chaîne de traitement cohérente. Le modèle est complété avec la mise en place d'une composante de régression multidimensionnelle, qui permet de passer de l'espace réduit vers l'espace de description original, en générant eectivement de nouvelles formes.

La troisième partie présente une application sur des données médicales réelles. Nous intro-duisons brièvement des aspects-clefs de l'anatomie du cerveau et de la maladie d'Alzheimer. Nous parlons ici surtout de la corrélation entre l'évolution structurelle de certains tissus de cerveau et l'évolution de la maladie d'Alzheimer. Ensuite nous appliquons notre modèle à des données réelles.

Nous notons que nous avons réservé un appendice, an de présenter une partie du travail de l'auteur qui s'est eectuée comme suite de travaux de recherche commencés avant le début de la thèse. La thématique de ces travaux n'est pas directement liée à l'axe principal de la thèse, que nous venons de discuter ici. Les travaux présentés dans l'appendice se focalisent sur des modèles bayesiens et sur l'inférence bayesienne appliquée principalement à la segmentation d'images. Nous présentons une application à la segmentation d'images naturelles, la segmentation d'IRM cérébrales en trois types de tissus (matière grise, matière blanche, liquide céphalo-rachidien), et une application à la segmentation et restoration d'images polarimétriques.

Représentations compactes de formes

(23)

Représentation de formes

Dans la bibliographie il existe un grand nombre de méthodes de description de formes, comme par exemple les nuages de points, les transformées en distance (distance transforms) [Golland 2000], les m-reps [Pizer et al. 2003], les harmoniques sphériques [Chung et al. 2010], les représentations par amers et les champs de déformations à partir d'une image de référence [Cootes et al. 2008,Rueckert et al. 2003].

Voyons brièvement les plus importantes de ces méthodes.

Un nuage de points traite la forme comme un ensemble de voxels. Une telle représentation peut être obtenue facilement à partir d'une image d'entrée (e.g. une IRM tri-dimensionnelle), et il existe des scanners qui captent et fournissent la forme directement en tant que nuage de points. Cette modalité est souvent utilisée comme une étape de base dans le but de construire une représentation plus élaborée.

Les harmoniques sphériques (spherical harmonics, SPHARM) sont un modèle populaire, basé sur la représentation de la surface de la forme. La forme est vue comme une fonction qu'il faut exprimer au moyen d'un nombre de termes d'un jeu de fonctions de base. En ce sens, elle est conceptuellement liée à la représentation de fonctions et signaux en série de Fourier. La première étape est la construction d'une carte de correspondance entre la surface de la forme d'entrée et la surface d'une sphère. Ensuite, la fonction de correspondance est analysée en fonction de bases pertinentes. Les paramètres de cette analyse constituent le descripteur de la forme. L'inclusion d'un nombre ni de termes de la série innie, ou, ce qui est équivalent, l'exclusion de termes de hautes fréquences, a pour conséquence le lissage automatique de la forme.

La représentation par m-reps (medial representations) est fondée sur l'idée de l'axe médian de la forme et de la transformée de l'axe médian (medial axis transform, MAT). L'axe médian est déni comme l'ensemble des points de la forme qui ont plus d'un point plus proche à la surface de la forme. La transformée de l'axe médian est dénie comme l'axe médian complété par l'information concernant les sphères inscrites centrées sur les points de l'axe médian. Une représentation m-rep est constituée d'une collection des points échantillonnés à partir de l'axe médian, qui sont appelés atomes médians (medial atoms). Chaque atome médian comprend de l'information concernant les frontières les plus proches, permettant ainsi de reconstruire la forme à partir de la grille des atomes.

Un champ de déformation peut jouer le rôle de descripteur de forme. Après avoir recalé de manière non rigide la forme d'entrée vers une image cible ou template, le champ de déforma-tion qui en résulte et l'image cible peuvent être utilisés pour reconstruire la forme originale et peuvent ainsi représenter la forme. Si nous voulons construire des représentations pour un jeu de formes, nous prenons soin d'avoir la même image de référence pour toutes les mises en corre-spondance, an que toutes les représentations se trouvent dans le même cadre de référence. Une caractéristique souhaitable du recalage est de produire des champs qui soient diéomorphiques. En pratique, ceci signie que nous ne permettons ni déchirement ni pliage pendant le recalage, un déchirement ou un pliage n'étant pas réaliste ici.

Dans ce travail, nous choisissons d'utiliser des champs de déformation en tant que méthode de représentation de base. Chaque champ de déformation est vu comme un champ de vecteurs en 3D. L'ensemble des composantes de chaque vecteur, pour chaque voxel, constitue le descripteur de la forme donnée. Notons bien aussi que, du point de vue méthodologique, la chaîne de traitement proposée ici resterait intacte si nous utilisions une méthode pour décrire la forme autre que le champ de déformation.

(24)

xi l'apprentissage de variété an de construire une représentation plus pertinente.

Représentation compacte par apprentissage de variétés

Alors que nous augmentons le nombre de paramètres d'un type de représentation de formes, en général nous pouvons avoir une représentation plus ne et exacte. A titre d'exemple, une grille de 2563 voxels fournit plus de détails qu'une grille de 1283 voxels. Pourtant, la variabilité

des données restera toujours équivalente au nombre de degrés de liberté, typiquement très faible. Par exemple, un ensemble d'objets géométriques qui dièrent seulement par leur taille aurait exactement un degré de liberté. Un jeu de données d'IRM cérébrales présenterait le même type de problème. Un modèle générique de description de formes échouerait également à capter la structure intrinsèque d'une image de cerveau, dont un élément serait à titre d'exemple que les voxels extérieurs correspondent aux voxels du crâne, ou que le cerveau est quasi-symétrique et que les deux hémisphères sont joints au moyen du corps calleux. En termes de modèle, une représentation présentant une grande disparité entre le nombre de ses paramètres et le nombre de degrés de liberté est une représentation non-compacte.

Une représentation non-compacte peut se révéler problématique pour diverses raisons. Tout d'abord, un modèle compact serait par dénition plus expansif que nécessaire. D'autre part, les modèles de grande dimensionalité sont caractérisés par ce qui est connu dans la littérature comme la malédiction de la dimension. La malédiction de la dimension exprime le fait que, an de construire un modèle statistique sur un espace donné, un nombre de points d'apprentissage en relation exponentielle avec le nombre de dimensions est nécessaire [Bellman 1961]. Sinon, tout modèle construit sur cet espace est susceptible de disposer de propriétés d'induction très faibles.

Par conséquent, il serait souhaitable d'incorporer au modèle un moyen d'obtenir un espace de dimension réduite. Nous utilisons à ce propos l'apprentissage de variété, et plus particulièrement l'Isomap [Tenenbaum et al. 2000]. Dans les méthodes d'apprentissage de variété, le principe de base est que l'espace de formes possibles constitue une variété de dimensionalité faible, qui occupe un volume qui ne constitue qu'une faible fraction de l'espace englobant. Autrement dit, les données sont supposées faire partie (ou être assez proches) d'une variété.

Les détails de la chaîne de traitement qui permet de déterminer la variété à partir des données d'entrée sont spéciques à chaque méthode d'apprentissage de variété. Dans le cas de l'Isomap, qui est la méthode retenue pour ce travail, l'entrée de l'algorithme est constituée par les distances entre les formes du jeu d'apprentissage. Après une étape convertissant ces distances en distances géodésiques, l'algorithme cherche des points d'un espace de faible dimension correspondant aux formes d'entrée, tels que les distances entre les points soient préservées. En pratique, cette opération est répétée pour plusieurs dimensionalités de l'espace cible, et la dimension est choisie au moyen d'une règle heuristique. Les nouveaux points générés constituent la représentation compacte. Idéalement, chaque point de ce nouvel espace correspond à une observation possible et en ce sens valide, en tant qu'élément de la variété considérée.

Construction du modèle

Nous examinons maintenant les composantes discriminative et générative du modèle, qui sont bâties sur la couche de représentation compacte de formes que nous venons de discuter.

(25)

en formant une hyperboule autour des points normaux d'entrée. Le rayon et la position de cette hyperboule, qui joue le rôle du support de la distribution des formes normales, sont déterminés en tant que compromis entre deux buts antagonistes. Ces buts sont de minimiser le volume du support et d'englober autant de formes normales d'entrée que possible. Dans le contexte de l'analyse de formes, une forme nouvelle serait identiée comme normale si elle tombait dans le support, et anormale sinon.

Notons ici que la forme d'hyperboule peut se généraliser, en employant une application

φ de l'espace original vers un espace auxiliaire, dit espace de caractéristiques, où le support

prend la forme d'une hyperboule. Comme la correspondance entre l'espace original et l'espace de caractéristiques est en général non-linéaire, la forme de l'antécédent de l'hyperboule dépend nalement de la exibilité de la fonction de correspondance utilisée.

La classication d'un nouvel arrivant est considérée comme l'utilisation  par défaut  d'un modèle discriminatif. Une utilisation autre que la classication d'un nouvel arrivant est l'es-timation du type de diérence de formes le plus marquant entre les formes normales et les formes anormales. Dans ce travail, nous sommes plutôt intéressés à cette dernière question. Dans le contexte médical, la question est particulièrement importante, puisque la classe peut faire référence au diagnostic ou à l'état clinique du sujet associé. Chercher la diérence discriminative de formes peut, dans ce cas-ci, mettre en évidence des détails importants du développement de la pathologie d'intérêt.

Cette diérence entre objets dans la classe et objets hors de la classe, ou diérence criminative, a été abordée dans la bibliographie au moyen d'outils tels que la direction dis-criminative [Golland 2000, Zhou et al. 2008] et la structure disdis-criminative (disdis-criminative pattern) [Koutsouleris et al. 2009], tous fondés sur le Support Vector Machine (SVM) en tant que machine discriminative.

La direction discriminative [Golland 2000] donne la direction d'un point donné vers la frontière du SVM. En faisant évoluer le point le long de cette direction, la forme change gradu-ellement vers un objet de l'autre classe. Pourtant, la direction discriminative ne peut pas garan-tir la validité des formes ainsi générées. Dans [Zhou et al. 2008], une version de la direction discriminative est proposée, comprenant un terme de régularisation dans la fonction objectif.

L'outil proposé ici dans ce contexte, la trajectoire discriminative, est posé en tant que partie d'un modèle SVDD, au lieu du SVM des autres approches. La trajectoire est dénie au moyen de la notion de projection SVDD, qui est le point du support le plus proche de l'objet d'intérêt. Nous écrivons ici pR(x) pour la projection du point x sur le support SVDD de taille

optimisée R. La diérence entre le point donné x et le point projeté pR(x) est ici interprétée

comme l'élimination de la diérence de forme qui est non-caractéristique de la classe normale. La trajectoire discriminative est dénie comme un ensemble de projections SVDD. Chaque instance de l'ensemble correspond à un paramètre spécique du modèle SVDD. Les instances du processus correspondent à toute la gamme de taille d'hyperboules SVDD, de la plus petite et optimale, à la plus grande, où la projection s'identie au point initial. Formellement, la trajectoire discriminative δ(u) serait dénie comme

δ(u) = pR0(x), avec R0 = (1− u)Rmax+ uR, (0.1)

où u ∈ [0, 1], et Rmaxdésigne une taille de l'hyperboule SVDD telle que pRmax(x) = x,

c'est-à-dire que le rayon est maximum.

D'autre part, tous les points de la trajectoire discriminative sont anatomiquement corrects. Dans la mesure où l'étape d'apprentissage de la variété explique correctement la structure non-linéaire des données, tous les points générés seront valides, et une correction de la trajectoire discriminative n'est pas nécessaire.

(26)

xiii an de construire des fonctions de base de régression. Chaque nouvelle forme apparaît comme un nouveau champ de déformation, qui se calcule en tant que somme pondérée de fonctions de base centrées sur les formes du jeu d'apprentissage. Formellement, la forme reconstruite y est liée au point de l'espace réduit x par la relation

y = g(x) +  = WTβ(x) + ,

où W est une matrice de poids pour les fonctions de base β. Les poids correspondant aux fonctions de base sont obtenus simplement par une solution d'un problème de moindres carrés. A titre de résumé, rappelons que les données provenant du jeu d'apprentissage sont représen-tées de trois façons (voir g. 0.1) : en tant que points de l'espace des champs de déformation ; en tant que points de l'espace réduit, cet espace étant obtenu au moyen de l'étape d'apprentissage de la variété ; en tant que points de l'espace des caractéristiques, espace où le support SVDD forme une hyperboule autour des données. Nous appelons ces espaces respectivement espace original, espace réduit, et espace de caractéristiques. La chaîne de traitement peut se décrire ainsi en tant qu'interaction entre ces trois espaces : les formes d'apprentissage de l'espace origi-nal se transforment en points de l'espace réduit, et leur image dans l'espace des caractéristiques aide à déterminer le modèle discriminatif. De nouveaux points et trajectoires de l'espace réduit se transforment en formes et processus de formes dans l'espace original.

(a) (b) (c)

Figure 0.1  Illustration des notions d'espace ambiant, d'espace réduit et d'espace de carac-téristiques. Les cercles verts représentent des données normales, les croix rouges représentent des données anormales. (a) Espace ambiant. Cet espace est très peu densément rempli de données. La structure ayant une allure de feuille la variété est un espace de dimensionalité plus faible que celle de l'espace ambiant. Les données font partie de la variété. En utilisant des techniques d'apprentissage de variété, nous pouvons représenter la variété comme un espace réduit (b). Cet espace n'est pas observé, mais il est dense, au sens où ses points correspondent en principe tous à des observations valides. Nous nous servons de l'espace de caractéristiques (c) pour estimer la distribution des points normaux (support). Sur chacun des graphes, pR(x) correspond à la

projection de la donnée x sur le support normal (projection SVDD). La trajectoire discrimina-tive δ, représentée en pointillés noirs, est le chemin joignant les points x et pR(x), inclus dans

la variété.

(27)

signicatifs sont marqués d'une p-valeur faible, alors que les points non signicatifs sont marqués d'une p-valeur grande.

Les formes de synthèse sont délibérément construites an de constituer une structure non-linéaire de l'espace des champs de déformations (espace ambiant). Ceci est réalisé en appliquant divers types de déformations pour créer des données pathologiques. Nous montrons que notre modèle peut capter et reproduire tout type de déformation, grâce à sa composante de réduction de dimension. Nous démontrons également qu'au contraire, un modèle qui ne respecterait pas la structure non-linéaire intrinsèque des données échouerait à capter correctement la diérence discriminative.

Étude de cas : dégéneration de l'hippocampe dans le contexte de

la maladie d'Alzheimer

La dernière partie de la thèse présente une application du modèle proposé à des données médicales réelles. L'étude de cas est la maladie d'Alzheimer. La progression de la maladie d'Alzheimer, comme celle de nombre d'autres pathologies, est fortement liée à l'évolution struc-turelle de certaines régions d'intérêt dans le cerveau. Ces régions incluent les hippocampes, les amygdales et les ventricules latéraux. La dégéneration de ces organes cause également la dégénération de leur fonction, causant une décience cognitive liée au progrès de la maladie.

L'anatomie du cerveau, le développement de plaques amyloïdes et d'autres symptômes de la maladie peuvent être considérés comme des indicateurs de la gravité de la maladie. Ces indicateurs sont connus comme étant des biomarqueurs de la progression de la maladie. Idéale-ment, un biomarqueur doit être corrélé aux diérentes étapes de la maladie, et pouvoir aider à prévoir l'évolution clinique du patient. La recherche en prévention et ralentissement de la maladie pourrait donc bénécier d'une information portée par le biomarqueur.

Dans le contexte de la production d'un biomarqueur structurel, aussi informatif que possible, l'étude de la structure de l'évolution anatomique du cerveau ou d'un tissu particulier du cerveau avec autant de précision que possible reste un dé important. Ceci est l'objet de nombreuses études en anatomie numérique, et c'est en particulier l'objet de la partie applicative du présent travail.

Expériences sur données médicales réelles

Nous appliquons la chaîne de traitement que nous avons mise en place ici sur des données réelles. Nous nous servons de deux jeux de données IRM, comprenant des hippocampes et amygdales qui proviennent d'une part de sujets atteints de la maladie d'Alzheimer et d'autre part de sujets sains.

Le premier jeu de données est constitué par la base de données libre OASIS. Nous répar-tissons les données disponibles en deux sous-ensembles, qui contiennent respectivement des hippocampes gauches et des hippocampes droits, provenant de patients âgés de plus de 60 ans. Nous avons 198 structures pour chaque sous-ensemble. Nous étiquetons les données suivant l'information clinique disponible en trois classes : sujets sains, sujets malades, et sujets d'état intermédiaire.

(28)

xv classes suivant leur état, malade ou sain.

Nous appliquons nos outils d'estimation de la diérence discriminative entre classes trajectoir-es discriminativtrajectoir-es (voir g. 0.2) et carttrajectoir-es de signicativité au premier jeu de donnétrajectoir-es OASIS. Nous découvrons des points signicatifs autour de régions de la tête et de la queue et de grandes parties de la région CA1 des deux hippocampes. La tête et la queue de l'hippocampe sont con-nus pour être des régions importantes pour l'évolution de la maladie d'Alzheimer [Morra et al. 2010]. L'atrophie de CA1 est également connue pour être associée en général à la diminution de la capacité de récupération de mémoire et de consolidation, et elle est associée à l'apparition de la maladie d'Alzheimer [West et al. 2000]. Ce résultat est donc en adéquation avec les résultats des études antérieures.

Figure 0.2  Échantillons le long d'une trajectoire discriminative. De gauche à droite, les formes évoluent graduellement d'une forme extrême de la pathologie vers une anatomie saine et non-atrophiée.

Nous utilisons le deuxième jeu de données pour évaluer la capacité du modèle à la classica-tion en groupe de caractéristiques pathologiques homogènes, à partir de données structurelles. Les résultats montrent une performance numérique proche de celle de l'état de l'art de la bib-liographie. Il est montré également que la composante de réduction de dimension du modèle a également un eet bénéque sur les performances du modèle en tant que classieur.

Conclusion et perspective

En conclusion, nous avons présenté dans ce travail une modélisation non-linéaire compacte et une chaîne de traitement permettant l'étude de formes. Etant donné un jeu de formes d'ap-prentissage, nous estimons d'abord la distribution de ces formes dans un espace de description, en utilisant la théorie SVDD. Nous nous servons ensuite du support estimé an de discriminer les points normaux des points anormaux. Posé dans le contexte de l'imagerie médicale, ceci se transpose en la discrimination entre tissus sains et tissus pathologiques. A partir de ce modèle discriminatif, nous introduisons la trajectoire discriminative, comme outil pour estimer la dif-férence discriminative. La distribution des données sous-jacente, modélisée comme une variété non-linéaire, est partie intégrante de la chaîne de traitement.

Dans la mesure où l'apprentissage de la variété explique correctement la structure de don-nées sous-jacente, le modèle est compact, ce qui nous mène à une description de dondon-nées plus dèle à la réalité. D'un côté, les nouvelles formes générées grâce au modèle sont anatomique-ment correctes, puisqu'elles sont contraintes à appartenir à la variété. D'un autre côté, tous les éléments de la trajectoire discriminative sont également contraints à faire partie de la variété, ce qui nous sert à fournir une estimation précise de la diérence discriminative. Nous illustrons ce point en appliquant le modèle à des jeux de données géométriques et à des jeux de données anatomiques de synthèse. L'application du modèle à des données réelles donne des résultats qui nous mènent à des conclusions cohérentes avec les résultats des recherches antérieures.

(29)
(30)

Chapter 1

Introduction

1. General context . . . 1

1.1 Shape and neuroimaging . . . 1

1.2 Statistical shape analysis . . . 2

2. Contributions . . . 3

3. Collaborations . . . 4

4. Thesis outline . . . 5

In this introduction, we shall present the work realized in the context of this thesis. We shall discuss the core theoretical notions, application context, and contributions of our work, as well as the related collaborations and projects.

1. General context

1.1 Shape and neuroimaging

In this thesis, we are interested in statistical shape analysis, applied in a medical, neuroimag-ing context. Statistical shape analysis refers to constructneuroimag-ing models capable of describneuroimag-ing shape and variability of shape. In medical imaging, shape analysis is used to model the morphological variability of various body organs and tissues, such as the heart, the brain or specic brain tissues. In turn, study of such data allows us to better understand body and brain function, study anatomical evolution, diagnose certain pathologies, identify their time of onset and study their development, realize the planning of therapeutical treatment, and monitor its impact. Group anatomical dierences can be studied, where group dierence can refer to a partition by age-group, pathological vs control or gender anatomical dierence.

Paramount to medical shape analysis has been the introduction of high resolution 3D imag-ing such as Magnetic Resonance Imagimag-ing (MRI), which has allowed in vivo study of medical shape. Various MRI modalities exist today. To name a few, these include structural MRI, which is suitable to describe anatomical structure, functional MRI, which associates function and activation to brain structure, and diusion MRI, which measures water molecule diusion in biological tissue. For the purpose of tissue shape analysis, structural MRI is the most suitable. Morphological study in neuroimaging was originally based on simple measurements of area and volume. Such measurements provide a crude, elementary measure of morphological variation, and as such can only capture shape complexity in a limited degree.

Pathologies of interest, whose development induces structural change in brain tissue, include multiple sclerosis, schizophrenia and Alzheimer's disease (AD), the latter being the case study of

(31)

this thesis. Structural change in these diseases reects the progress of neuronal degeneration, or brain atrophy. The qualitative and quantitative characteristics of the progress of this structural degeneration play the role of the so-called disease biomarker. A biomarker is in general dened as a biological or biologically derived indicator of a process, event, or condition such as disease (or other conditions such as aging, or exposure to a toxic substance) [Medical Dictionary 2012]. To the extent that a model can describe anatomical variability as precisely as possible, its value as a biomarker of disease progression is more important. Anatomical variability is of interest as intra-population variability, as well as the study of anatomical dierence between a group of patients and a group of healthy controls.

1.2 Statistical shape analysis

Quantitative shape analysis is generally admitted to date originally back to the work of D'Arcy Thompson [Thompson 1917]. The context of Thompson's works is the study of the relation between form and function. A group of biological forms is put into anatomical corre-spondence, by dening points of interest in a template shape and their corresponding points in a second shape. These points dene a grid of lines (see g. 1.1) which is accordingly deformed to create a dense correspondence between shape points (method of coordinates). This approach presents several practical diculties, such as dening the interpolation allowing the passage from point correspondence to straight line correspondence, or the denition of the position of the landmark points. These problems were left unanswered originally [Heinrich 2008]. The milestone work of Thompson includes, albeit in a premature form, some aspects and problems of statistical shape analysis recurrent in models and methods of today. In a modern, computa-tional context, description of a set of shapes is performed by dening a correspondence between shape data, either explicitly or implicitly. Numerous shape description methods exist, which in general permit to map each shape-object to a mathematical object, playing the role of a shape descriptor. Landmark descriptors, spherical harmonics and deformation elds are some of the most important shape descriptors (see chapter 2).

A model, in shape analysis or elsewhere, seeks to describe observed data as manifestations of some underlying pattern, as exactly and yet as simply as possible [Davies et al. 2010]. Given a nite training set of shape data, generative or discriminative models can be constructed. The goal of a generative model is to generate shape instances that are in some sense similar to the training shapes. This necessarily presupposes the estimation of the shape distribution in a shape description space. A discriminative model supposes the partition of the data into a nite set of classes (for example, pathological and non-pathological class), and its goal is to decide the class of new, unseen data. Regardless of its exact utility and type, a good statistical shape model should have, according to [Davies et al. 2008, Davies et al. 2010], a set of traits that can be summarized to (1) generalization ability, so that the model can represent any possible shape instance (2) specicity, so that it can only represent valid instances of the modelled class of object (3) compactness, so that the model can be represented with few parameters. We might add here that all of these traits are correlated to one another. For example, a non-compact model will in all likelihood also be non-specic, and vice versa. In this work we are interested in building compact shape representations, and dense -in the sense of highly specic- shape spaces. Manifold learning is a tool that will aid us in this direction (see chapter 3).

(32)

2. Contributions 3 goal of the current thesis, and main axis of the presented work, is the creation of a statistical shape model that relaxes the aforementioned hypotheses and describes shape in a compact and precise manner.

Figure 1.1  Putting shapes into correspondence with the method of coordinates. Figure reproduced from [Thompson 1917].

2. Contributions

The material presented in this thesis centers around the construction of a compact, non-linear model suitable to represent shape. This model is evaluated in the context of a population study of Alzheimer's disease patients and controls. The proposed model acts both as a discrim-inative and a generative model.

(33)

An important aspect of the proposed model is that we use the hypothesis that shape data lie on (or suciently near) a non-linear manifold of low dimension. This manifold hypothesis has been extensively used in the literature since the introduction of milestone non-linear manifold learning techniques such as isomap [Tenenbaum et al. 2000]. The usefulness of the manifold hypothesis has been conrmed in various domains (see chapter 3). In practice, it allows to construct a compact model of shape representation. With respect to the proposed discriminative trajectory, the manifold hypothesis constraints trajectory shape instances to correspond only to anatomically correct shapes, to the extent that the intrinsic data structure is captured faithfully. Conversely, models that neglect this non-linear structure, such as the discriminative direction [Golland 2000], cannot guarantee anatomical correctness. (see [Zhou et al. 2008] for a related discussion).

Methodologically, the contribution of this thesis is reected in two aspects of the proposed discriminative trajectory. First, it is a tool for extracting discriminative shape dierence in the context of SVDD models. Second, it allows only for anatomically correct reconstructions. To the end of describing group dierence between healthy and pathological subjects, we visualize as a p-value map on residuals associated to each shape voxel. This map indicates the locus of signicant dierence between class and non-class. The application of our model on real anatomical data, shows results consistent with related literature ndings. The non-linear, compact character of the model is shown to have overall a benecial impact in any aspect or type of application.

3. Collaborations

This thesis has been realized in the context of a partnership between two research groups : the Modèles, Images et Vision (MIV) group, part of the Laboratoire des Sciences de l'Image, de l'Informatique et de la Télédetection (LSIIT, UMR 7005, Université de Strasbourg - CNRS), and the Information Processing and Analysis (IPAN) group, part of the Department of Computer Science (University of Ioannina, Greece).

This thesis is part of a line of research projects of the MIV group of LSIIT, under the general topic of Traitement d'Images Médicales (Medical image processing). The thesis is also part of research work conducted by the federation Imagerie et Robotique Médicale et Chirurgicale (IRMC). More generally, this research topic is supported by the pôle of competitivity Innovation thérapeutiques and is part of pôle image Région Alsace. This thesis was funded by the Région Alsace.

From a methodological point of view, this thesis is closely related to the work of Félix Renard [Renard 2011], with which the author of the thesis has collaborated. It is also related to the work of Torbjørn Vik [Vik 2004] in probabilistic linear, non-Gaussian models and that of Matthieu Brucher [Brucher 2008] in shape analysis with non-linear models.

We have used two main sources of real neuroimaging data. The rst source is the free-access OASIS database [Marcus et al. 2007]. The other is a study conducted at the University Hos-pital of Strasbourg through the service of Neurology and the Neuropsychology unit, [Philippi et al. 2012], courtesy of Frédéric Blanc and Nathalie Philippi of the same unit. A collaboration with the latter group, aiming at exploring correlations of memory and cognitive markers with structural deformation is currently in progress.

(34)

4. Thesis outline 5

4. Thesis outline

We present the proposed statistical shape analysis model in three parts.

The rst and second part presents the proposed model in an abstract, general shape analysis context. Chapter 2 and chapter 3 constitute part I, and discuss shape description. In chapter 2, we discuss state-of-the-art shape methods for shape description. We observe that these do not necessarily lead to a compact representation. In the next chapter (chapter 3), we use the technique of manifold learning to create a compact shape descriptor.

The second part presents the discriminative and generative component of the model. In chapter 4, we introduce elements of SVDD theory. In chapter 5, we use SVDD to extract information about shape characteristics that best discriminate objects of a given class from objects not in the class. This is encoded in the notion of the discriminative trajectory. We present the latter in terms of the SVDD projection, an operation originally proposed for data denoising, and discuss the relation of the proposed discriminative trajectory to the SVM-based discriminative direction. In chapter 6, we connect the manifold learning component with the SVDD component of the model, creating a coherent processing pipeline. We express the model in terms of three description spaces  the ambient space, the reduced space, and the feature space  and the relation of each one to the other. Finally we apply our model to geometrical and synthetic anatomical shape, in order to assess the validity of our claims. We show that the proposed discriminative trajectory, as part of the present model, reveals discriminative dierence in detail that a non-compact model would not achieve.

The third part of the thesis presents an application of the proposed model to real neu-roimaging data. In chapter 7, we discuss the correlation of structural evolution to the progress of Alzheimer's disease, and the related notion of a disease biomarker. In chapter 8, we use our model on a group of patients, intermediate condition subjects and controls, and create discrim-inative trajectories for the left and right hippocampi. We also illustrate the use of our model as a classier, deciding over the likelihood of a hippocampus or amygdala originating o a healthy subject or not, based always on structural data.

(35)
(36)

Part I

Compact shape representation

(37)
(38)

Introduction

The entry point of any statistical shape analysis framework is a nite training set of shapes, represented in a way suitable to allow for a subsequent elaboration of a model built on this data. In a way, a model is a superstructure constructed on the basis of the way shape is represented ; hence the quality of the representation is organically related to the quality of the model.

In the rst part of this thesis we discuss how to describe shape. First we present a brief state of the art of shape description. It is in the interest of the model as a whole to use a descriptor that can accurately describe any possible shape in the application of interest, as well as to ease the construction of an accurate, exible generative or discriminative model. Next we discuss how to process such a shape descriptor with manifold learning in order to obtain a compact shape representation. As we shall see, compactness is a trait that can lead to more useful and stronger models of shape.

(39)
(40)

Chapter 2

Shape description

1. Models for shape representation . . . 11

1.1 Point cloud . . . 11

1.2 Spherical harmonics (SPHARM) . . . 12

1.3 Medial axis representations . . . 13

1.4 Distance transforms . . . 13

1.5 Landmark-based representation . . . 14

1.6 Deformation vector elds with respect to a template . . . 14

2. Feature vector space as a model basis . . . 14

3. Conclusion . . . 15

Encoding the shapes of the input training set in some computationally usable, numeric form, is a basic rst step in any statistical shape analysis pipeline. There exist plenty of ways in the related literature to represent shape, like distance transforms [Golland 2000], m-reps [Pizer et al. 2003], spherical harmonics [Chung et al. 2010], landmark-based representations deformation vector elds with respect to a template [Cootes et al. 2008,Rueckert et al. 2003]. In this chapter we shall review some of the most widely used models for shape representation. We bear in mind that we shall be eventually specically interested in training sets in the context of medical imaging. Most of the models that follow have been widely used in related applications of the same area. We shall imply a three-dimensional shape, unless otherwise stated. In most cases that we examine, passage from the formulation of a 2D planar shape descriptor to its corresponding version in 3D or vice versa is straightforward.

1. Models for shape representation

1.1 Point cloud

The most straightforward way to describe a shape, given a three-dimensional voxel intensity map (such as the T 1-weighted intensity information of an MRI), is the intensity map itself, or a thresholding/segmentation over the input intensities producing a binary map. In this map, true-valued voxels correspond to voxels that are part of the shape, and false-valued voxels corre-spond to background. This is what is called a point cloud. Point clouds are the default output of 3D scanners, and can be further processed to build three-dimensional surfaces meshes. Besides medical imaging, point clouds have been employed in a wide spectrum of applications, includ-ing computer-aided design, computer generated-imagery (CGI) visualization and animation, archaeology and antiquities preservation [Allen et al. 2004].

(41)

1.2 Spherical harmonics (SPHARM)

The spherical harmonics model (SPHARM) [Brechbühler et al. 1995,Schönefeld 2005] is a popular, surface-based representation method. It views shape as a function which is to be expressed in terms of a suitable set of basis functions, as is the case for example for the Fourier or the Legendre series in 1D. The rst requirement in a spherical harmonics representation is to build a proper parametrization of the shape to be represented. This means dening a continuous, one-to-one mapping from the surface of the original shape to a two-coordinate space with spherical topology. Mapping our object to a sphere immediately implies that the modelled object is necessarily a single, simply connected object.

The parametrization is formulated as a constrained optimization problem. The variables of the optimization problem are the coordinates of all vertices, i.e. the positions on the unit sphere to which the vertices are mapped. The parametrization is constrained, so that any object surface region maps to a region of proportional area on the sphere. The objective is to miminimize the distortion of the surface net in the mapping. To fulll this goal perfectly, a target object facet should map to a spherical square.

The previous step produces a one-to-one mapping where each pair of spherical coordinates (θ, φ)is connected to a point x ∈ R3in Cartesian coordinates, which corresponds to a position on the surface of the object to be represented. Coordinates (θ, φ) are dened over a range of (0, π) and (0, 2π) respectively. The decomposition of the function x(θ, φ) with spherical harmonics is dened as a series of the form

x(θ, φ) = X l=0 l X m=−l cml Ylm(θ, φ), (2.1) where Ym

l denotes a basis function of degree l and order m [Brechbühler et al. 1995] and

cml is a tri-variate complex vector representing the expansion coecient of the same degree and

order. Basis functions Ym

l form an orthonormal set and are dened as

Ylm(θ, φ) = s 2l + 1 4 (l− m)! (l + m)!P m l (cosθ)eimφ, Yl−m(θ, φ) = (−1) mYm∗ l (θ, φ), (2.2) where Plm(x) = (−1)m(1− x2)m/2 d m dxmPl(x), Pl(x) = 1 2ll! dl dxl(x 2− 1)l. (2.3) The coecients cm

l are formally dened as

cml = Z π 0 Z 0 x(θ, φ)Ylm(θ, φ)dφ sin θdθ. (2.4)

In practice, an approximation of eq. (2.4) is used to calculate the expansion coecients [Brechbühler et al. 1995]. The higher the degree of an expansion set and its coecients, the ner the structural information they describe. Low-degree terms carry coarse structural information. In practical applications, only a limited number of the lowest degree coecients are used, and any further analysis is performed over them. Using a limited number of coecients naturally serves as an implicit form of mesh smoothing [Chung et al. 2010].

(42)

1. Models for shape representation 13

1.3 Medial axis representations

1.3.1 Medial axis and medial axis transform

[Blum 1967, Blum & Nagel 1978] introduced the medial axis transform as a shape descriptor, originally for a biological application context. The medial axis transform is based on the notion of a shape medial axis. Formally, the medial axis, or topological skeleton, of a shape is dened as the set of points with more than one closest point to the shape boundary. It turns out that the medial axis forms a tree-like hierarchical structure, intuitively similar to a sort of an object backbone. The medial axis transform (MAT) is dened as the medial axis plus information about the largest inscribing spheres to any of its points. Most of the algorithms for computing the MAT typically require a binary segmentation of the object as input [Golland et al. 2000,Leymarie & Levine 1992].

1.3.2 Medial representations (m-reps)

M-rep is a representation based on the medial axis and the medial axis transform. M-reps come to amend weaknesses of the medial axis transform representation. Namely, the medial axis is dicult to manipulate in its continuous version, and is not robust to noise, in the sense that small surface perturbations can cause changes in the medial axis [Fletcher et al. 2001]. The m-rep is dened as a structure made up of so-called medial atoms. Medial atoms are objects sampled over the shape medial axis, from which the entire medial axis (and the original shape itself) can be reconstructed. Each medial atom thus encapsulates information about the medial axis in its immediate neighborhood. The mesh of the medial atoms forms a structure referred to as a medial surface. With the exception of atoms on the medial surface edge and branch positions, each medial atom denes two equal length vectors, named the port vector and starboard vector. These vectors are incident and normal to the shape surface at their ends.

A medial atom is dened as a four-tuple

m ={x, R, F, θ},

where x ∈ R is a position on the medial axis, R is the radius of the inscribing sphere, θ is one half of the angle between the port and the starboard vector. F is a three-dimensional frame with origin at x and tted to the geometry of the medial axis. The frame F is a rotation of the standard Euclidean basis ; the rst basis vector is dened as the bisector of the port and the starboard vector, the second is perpendicular to the rst, so that together they span the plane tangent to the medial surface on x. The remaining frame vector is the normal at the same point

x.

Simple enough shapes can be described using a single medial atom mesh. If needed, hinge atoms can be added to the main medial atom mesh, so as to represent protrusions or intrusions on the original shape (g. ??). In this manner, complex objects can be represented as a collection of connected sub-objects.

1.4 Distance transforms

Références

Documents relatifs

The developed model of the stator teeth that takes into consideration the airgap flux density and the slot tangential leakage flux (section II-C) is computed

Determining the expected “mean shape” of a group of objects. That mean's: smallest distance in the average to all shapes in

we firstly present an approach that we proposed in [7, 8] and finally, we discuss some results obtained when applying these methods to the separation of a simulated non-negative

We also want to high- light the fact that the performance of the proposed Algorithm 1 and Algorithm 2 from [7] is significantly degraded (but our algorithm still has better

(2014) play down the functional significance of the hydraulic safety margin in the vulnerability of forests to drought, pointing out the important role played by additional

130 retain the "hat" that is subsequently removed in a pure water ultrasound bath.. Silicon pyramids of different sizes retain a similar geometry. Manufacturing parameters:

In order to communicate with the services (here the client, the clerks and the service P ), a mediator has to satisfy a sequence of constraints expressing that (i) each message

Figure 20: Cholangiographie rétrograde endoscopique montrant la présence du matériel hydatique dans la voie biliaire principale ;. Figure 21 : Cholangiographie rétrograde