• Aucun résultat trouvé

Nous proposons de montrer l'intérêt de la méthode AdaCOS à travers deux exemples d'applications : une sur la base de données Diabète, l'autre sur l'apprentissage statistique du projet TOCATA (voir l'annexe III).

6.5.1 Base de données Diabète

On considère la problématique ctive suivante : pour maîtriser les coûts du contrôle de l'évolution du diabète, le prix maximal autorisé sera xé et ne devra pas excéder une valeur donnée. On cherche donc un modèle précis et parcimonieux qui respecte cette contrainte de coût. Chaque descripteur aura donc un prix qui sera assigné arbitrairement : αAGE = 0, αSEX = 0, αBP = 30, αBM I = 30, αS1= 100,

αS2= 100, αS3= 100, αS4= 100, αS5= 100 et αS6= 100.

Le prix maximal pour réaliser un test est donc égal à 660e, si tous les descripteurs sont utilisés dans le modèle. On dénit par A, le sous ensemble de descripteurs utilisés dans le modèle et par PAle

prix du test associé à ce sous ensemble (PA=Pj∈Aαj). On impose la contrainte suivante PA< 200e

et on utilise une régression linéaire LAR AdaCOS.

6.5.2 Résultats pour la base de données Diabète

Utiliser un modèle basé sur AdaCOS impose l'utilisation d'un second paramètre en plus de λ : γ. Ce paramètre contrôle l'inuence de la fonction de coût à minimiser et il faut le déterminer automati- quement.

Pour mesurer la performance du classieur et pour trouver les meilleurs valeurs pour λ et γ, on utilise une méthode de validation 2-D classique : la validation croisée K-fold [221]. Les individus sont divisés en K groupes de taille identique. L'apprentissage est réalisé sur K − 1 groupes et ce modèle est validé sur le groupe écarté. Ce processus est répété K fois an que chaque groupe serve d'ensemble de validation. On en déduit l'erreur quadratique moyenne (EQM) et son écart type (STD). Pour cette étude, K = 10 et l'erreur quadratique est normalisée : (rTr)/(yTy). La gure 6.4(a) présente

les résultats associés à cette validation croisée 2-D. On constate que l'erreur quadratique moyenne a tendance à augmenter lorsque γ augmente ce qui est conforme à nos attentes, puisque l'on biaise l'estimateur pour optimiser le prix global du test.

La gure 6.4(c) illustre l'écart type de l'EQM, qui ne semble pas être corrélé avec le paramètre γ. La grandeur qui nous intéresse plus particulièrement, le prix, est illustrée dans la gure 6.4(b). On observe l'eet recherché initialement, le prix global d'un test diminue lorsque γ augmente.

Pour γ = 0, on obtient exactement le chemin de régularisation de la régression LAR et on observe un phénomène intéressant : la régression LAR AdaCOS permet de prendre en compte le prix des descripteurs et propose, dans ce cas précis, un meilleur estimateur que la régression LAR puisque l'erreur quadratique passe de 0,519 à 0,499 soit un gain de 3,7%.

Lorsque l'on impose une contrainte de prix : PA< 200e, (illustré par la gure 6.4(d) où la partie

blanche de l'image ne respecte pas la contrainte de temps) alors ce gain est encore plus important et passe de 0,613 à 0,567 (gain de 7,5%). Le tableau6.1résume les paramètres sélectionnés et montre les descripteurs retenus. Pour cette base de données, il est possible de faire une recherche exhaustive du meilleur sous-ensemble de descripteurs. Avec 10 descripteurs (p = 10), on compte 1023 sous-ensembles

6.6 Bilan et perspectives

Tableau 6.1  Résultats pour la base de données Diabète avec une validation croisée 10-fold (EQM, l'erreur quadratique moyenne, STD écart type de l'EQM, PAprix global du test, γ et s les paramètres

du modèle AdaCOS LAR).

Méthode EQM STD PA γ s Descripteurs

LAR AdaCOS (PA< 200) 0,567 0,111 160 20 0,37 AGE SEX BMI BP S5

LAR (PA< 200) 0,613 0,068 160 0 0,25 AGE BMI BP S5

Exhaustive (PA< 200) 0,520 0,088 160 - - AGE SEX BMI BP S5

LAR AdaCOS 0,499 0,087 660 28 0,80 AGE SEX BMI BP S1 S2 S3 S4 S5 S6

LAR 0,519 0,092 660 0 0,88 AGE SEX BMI BP S1 S2 S3 S4 S5 S6

Exhaustive 0,499 0,102 460 - - SEX BMI BP S1 S2 S4 S5

distincts et sur chacun d'entre eux, une régression linéaire non pénalisée est calculée. On intègre ces résultats aux précédents (tableau 6.1). On note que les résultats de la méthode exhaustive, bien que meilleurs, ne sont pas très éloignés de ceux des modèles LAR AdaCOS. Néanmoins, la recherche exhaustive du meilleur sous ensemble n'est possible que lorsque p < 20, rendant nécessaire les méthodes basées sur AdaCOS.

Un exemple concret d'utilisation de la méthode AdaCOS est donnée dans l'annexeIIIdans le cadre du projet TOCATA.

6.6 Bilan et perspectives

Nous avons introduit dans ce chapitre, une pénalisation diérente pour répondre à de nouveaux types de problèmes : obtenir un modèle précis qui minimise en même temps une fonction de coût. Il s'agit donc de faire un compromis entre le biais introduit par les pénalisations adaptatives et la minimisation de la fonction de coût.

La régression AdaCOS pénalise diéremment chaque descripteur et généralise par conséquent la régression Ridge, grâce au paramètre γ. Ce paramètre permet de changer d'une manière continue l'inuence de la fonction de coût (un compromis est à trouver entre cette fonction et la précision de la régression).

La méthode AdaCOS prend tout son sens lorsque l'on construit des modèles parcimonieux. Ainsi, une sélection de variables peut être réalisée et le coût global d'un modèle peut être réduit. On propose un algorithme glouton pour étendre la fonction forward stagewise puis on développe une méthodologie pour utiliser tous les modèles existants avec la méthode AdaCOS. Les temps de calcul sont donc fortement réduits par rapport à une approche gloutonne, puisque les chemins de régularisation sont calculés analytiquement avec l'algorithme LARS. On pourra donc aussi calculer des régressions logistiques parcimonieuses AdaCOS.

On présente les résultats (annexe III) pour le classement pixel à pixel de défauts de surface et on montre qu'un modèle AdaCOS permet de réduire l'erreur quadratique moyenne.

Comme travail futur, nous souhaitons faire une étude spécique sur l'inuence du bruit dans un modèle AdaCOS. La preuve d'un bon rapport signal sur bruit facilitera l'adoption de cette méthode par la communauté statistique. De plus, nous travaillons sur une méthode axée sur la méthodologie AdaCOS pour obtenir un modèle parcimonieux par groupe [139] qui prend en compte une fonction de coût.

(a) Erreur quadratique normalisée. Le cercle représente

la solution retenue par validation croisée 10-fold. (b) Coût du test

(c) Ecart type de l'erreur quadratique normalisée (d) Erreur quadratique normalisée corrigée par la contrainte de coût PA < 200e. Le cercle représente la

solution retenue par validation croisée 10-fold.

Figure 6.4  Résultats de la validation croisée 10-fold pour l'étude diabète. (a) L'erreur quadratique moyenne normalisée, (b) le coût du test en fonction des descripteurs sélectionnés dans le modèle, (c) l'écart type de l'erreur quadratique normalisée et (d) l'erreur quadratique normalisée avec la contrainte PA < 200e. Les pénalisations utilisées sont αAGE = 0, αSEX = 0, αBP = 30, αBM I = 30, αS1= 100,

Deuxième partie

CHAPITRE

7

Projet TOCATA : Extraction automatique des défauts de surface de pièces

métalliques par traitement d'images et analyse statistique

Chapitre confident

iel

CHAPITRE

8

Projet L'Oréal : Caractérisation 3-D in vivo du milieu breux du derme de la peau

humaine par traitement d'images

La microscopie multiphoton permet d'obtenir des images en trois dimensions (3-D) particulièrement adaptées à l'analyse de la peau humaine. Les acquisitions sont réalisées in vivo pour quantier les structures de la peau sans avoir besoin de faire une biopsie (prélèvement d'un échantillon de peau du patient). Il s'agit donc de faire un contrôle non invasif et non destructif. Les images obtenues ont une résolution spatiale d'une centaine de micromètres permettant de visualiser l'épiderme ainsi que la partie supérieure du derme avec les bres de collagène et d'élastine. Ces réseaux de bres procurent le tonus et l'élasticité à la peau et comprendre leur évolution dans le temps est un élément essentiel dans un contexte médical et cosmétique.

Dans ce chapitre, on propose diérents descripteurs morphologiques pour caractériser la forme, l'organisation et la distribution de tailles des réseaux de bres de la partie supérieure du derme de la peau. Les outils de détections des éléments ns développés dans ce document sont utilisés dans cette application pour mieux comprendre leur évolution avec le temps.

Une analyse statistique complète cette étude an de dénir quels sont les descripteurs les plus pertinents pour faire la distinction entre une peau jeune et une peau âgée. Á notre connaissance, cette étude est la première pour la caractérisation en trois dimension du réseau de bres de la partie supérieure du derme de la peau humaine.

Ce projet est réalisé en partenariat entre le CMM et le groupe industriel français de produits cosmétiques L'Oréal1.

Mots clés : Caractérisation de la peau, traitement d'images 3-D, morphologie mathématique, ima- gerie multiphoton, caractérisation des bres du derme, analyse statistique, test d'hypothèses.

Plusieurs publications, communications et brevets ont été réalisés pour présenter et protéger les résultats obtenus dans le cadre du partenariat entre L'Oréal et le Centre de Morphologie Mathématique.

1. Dans Morard et al. [154], quelques descripteurs pour caractériser le réseaux de bres sont présentés à la conférence nationale de stéréologie ISS France, puis au workshop international 3DMM [153].

V. Morard, E. Decencière, P. Dokládal, Méthodes géodésiques pour la caractéri- sation des milieux breux, 34ème journée ISS France, Paris, France, 2011

V. Morard, E. Decencière, P. Dokládal, Characterization of 3-D brous media with geodesic methods, 3-D Microstructure Meeting (3DMM), Saarbrücken, Germany, 2011

2. Des résultats plus généraux ont été présentés dans Baldeweck et al. [12] à la conférence internationale Photonics West puis dans [11].

T. Baldeweck, E. Tancrède-Bohin, P. Dokládal, S. Koudoro, V. Morard, F. Meyer, E. Decencière, A.M. Pena, In vivo multiphoton microscopy associated to 3-D image processing for humain skin characterization, Multiphoton Microscopy in the Biomedical Sciences, Photonics West, San Francisco, USA, 2012

T. Baldeweck, E. Tancrède-Bohin, P. Dokládal, S. Koudoro, V. Morard, F. Meyer, E. Decencière, A.M. Pena, Imagerie multiphoton de la peau humaine in vivo, Diagnostic et imagerie optique en médecine (OPTDIAG), Paris, France, 2012

3. Enn, un brevet a été déposé dans le cadre de cette collaboration [9] :

T. Baldeweck, A.M. Pena, E. Tancrède-Bohin, E. Decencière, P. Dokládal, S. Koudoro, V. Morard, F. Meyer, Procédé pour caractériser l'épiderme et le derme à partir d'images muliphoton tridimensionnelles in vivo de la peau, numéro 1161616, 14 décembre 2011