• Aucun résultat trouvé

2.7 Utilisation de la structure communautaire

2.7.6 Conclusion

Nous avons développé une approche originale pour l’analyse de données transcriptomiques présentant de nombreux avantages par rapport à celles existantes. À partir d’une estimation de la co-expression entre les gènes, couramment effectuée par le calcul d’un coefficient de corrélation (Pearson ou Spearman), nous proposons d’analyser les structures d’une collection exhaustive de graphes de λ-voisinage construits par seuillage des coefficients de la matrice de co-expression. Ce procédé nous permet d’identifier des ensembles de gènes, appelés des noyaux, qui restent préférentiellement connectés sur la collection de graphe. Ainsi, nous contournons la problématique de l’estimation d’un unique graphe pour modéliser le réseau de co-expression de gènes tout en intégrant de l’information sur la structure du réseau pour l’identification des communautés. Contrairement aux autres approches, qui nécessitent de fixer un certain nombre de paramètres pour l’estimation d’un unique graphe et pour l’identification des communautés sur le graphe, avec notre approche, un seul paramètre doit être choisi, celui de la taille minimale des noyaux.

L’identification de communautés de gènes co-exprimés favorise les interprétations biologiques car les communautés ont en général un rôle fonctionnel dans la cellule pouvant être déterminé par des analyses d’enrichissement en annotations GO ou KEGG. Il est également possible de résumer l’information contenue dans les données transcriptomiques en sélectionnant les hubs dans les communautés, c’est à dire les gènes qui ont une position centrale sur le réseau de co- expression.

Nous proposons également d’étudier les relations de causalité pouvant exister entre les dif- férents hubs, de façon à explorer les mécanismes cellulaires impliquant les différentes fonctions biologiques portées par les communautés. L’analyse des relations de causalité peut aussi porter sur les gènes qui composent une communauté de façon à caractériser les co-régulations entre les gènes à l’intérieur de la communauté.

En application sur des données réelles, nous allons montrer dans le chapitre suivant que notre approche permet d’obtenir des résultats convaincants sur le plan biologique, et plus complets et robustes que ceux obtenus avec les méthodes d’apprentissage classiques présentées dans le premier chapitre.

Chapitre 3

Application : obésité, diabète et

fibrose hépatique

3.1

Introduction

Le nombre de personnes souffrant d’obésité dans le monde est en augmentation perpétuelle à tel point que l’organisation mondiale de la santé (OMS) considère l’obésité comme l’épidémie du siècle. En 2014, plus de 600 millions d’adultes sont obèses, soit environ 13% de la population adulte mondiale. La cause principale de cette épidémie est liée à un mode de vie sédentaire, et à la consommation d’aliments qui sont peu nutritifs (teneur en nutriments faible devant le nombre de calories) trop riches en gras, en sel et en sucre.

Le diabète de type 2 est l’une des conséquences très fréquente de l’obésité. L’insuline, une hormone sécrétée par le pancréas, permet l’entrée du sucre dans les cellules pour qu’il soit utilisé comme carburant, particulièrement dans les muscles et le foie. Chez les diabétiques de type 2 (insulino-résistants), les cellules et les tissus deviennent moins sensibles à l’insuline et le taux de glucose dans le sang (glycémie) n’est plus contrôlé comme à la normale, ce qui provoque une hyperglycémie chronique, soit un taux trop élevé de glucose dans le sang. L’OMS prévoit qu’en 2030, le diabète de type 2 sera la septième cause de décès dans le monde. Le risque de décès chez les diabétiques est au moins deux fois plus élevé que chez les non diabétiques, et en 2014, plus de 300 millions de personnes sont diabétiques dans le monde.

Les maladies cardio-vasculaires sont les premières causes de décès chez les diabétiques et les autres complications liées au diabète peuvent être très handicapantes : amputation, cécité, insuffisance rénale...

Les atteintes hépatiques ou NAFLD (pour non-alcoholic fatty liver disease) constituent un autre facteur majeur de morbidité chez les diabétiques. La plus répandue étant la stéato- hépatique non alcoolique, caractérisée par une accumulation de graisse (stéatose) au niveau du foie accompagnée de lésions cellulaires inflammatoires (hépatites). L’évolution de la maladie peut conduire dans un faible nombre de cas à un processus de cicatrisation exagéré qui à la base est déclenché pour remplacer les cellules hépatiques endommagées. Cette formation de cicatrices fibreuses étendues sur le foie caractérise la fibrose hépatique et au stade le plus avancé de la maladie (stade de la cirrhose), quand les cicatrices sont trop nombreuses, le foie ne remplit plus ses fonctions et les risques de cancers sont accrus.

parce que ces maladies restent silencieuses (asymptomatiques) tout au long de leur évolution et avant d’atteindre un stade très avancé. Les causes de la maladies ne sont pas uniques mais l’obésité et la résistance à l’insuline (diabète de type 2) sont des facteurs de risques bien connus. Ainsi, la forte augmentation du nombre de personnes souffrant d’obésité et de diabète de type 2 laisse présager une hausse sensible du nombre de personnes atteintes de maladies chroniques du foie.

La fibrose peut dans certains rares cas être réversible si les lésions ne sont pas trop sévères et que la cause est traitée. Il est important de pouvoir diagnostiquer le degré de fibrose et de pouvoir suivre l’évolution de la maladie pour en assurer le traitement approprié. Les solutions proposées pour le diagnostic de la maladie reste à ce jour insuffisantes et de nombreuses équipes de recherche travaillent à l’identification de biomarqueurs non invasifs (sans prélèvement d’une partie du foie) ayant de bonnes performances prédictives.

3.2

Le projet « Florinash »