• Aucun résultat trouvé

3. Discussion

3.3. Validation biologique du réseau

Les différents liens mis en évidence par une inférence de réseau constituent un ensemble d’hypothèses qui doivent être validées. Plusieurs types de données permettent de valider un lien entre deux éléments du réseau : (1) les annotations des gènes (fonction, localisation cellulaire, processus biologique), (2) le contexte bibliographique des gènes, (3) des données provenant d’autres expérimentations préexistantes, (4) de nouvelles expérimentations. Certains liens du réseau produit sont en cours de validation. Par exemple, pour les liens issus

Figure 18 : Liens les plus retrouvés à partir du nœud de PtaZFP2. Lien les plus retrouvés à partir du LASSO échantillonné. Le gène Potri.011G112400 apparaît trois fois, avec trois sondes différentes.

du nœud correspondant au facteur de transcription PtaZFP2 un lien significatif a été retrouvé avec le gène Potri.011G112400 (Figure 18). Ce gène code une 9-cis epoxycarotenoid dioxygenase (NCED). Chez Arabidopsis, il a été montré que cette protéine est une enzyme clé de la voie de biosynthèse de l’acide abscissique (ABA), hormone végétale connue pour être impliquée dans la réponse à des stress environnementaux (Iuchi et al., 2001) tels que le stress hydrique ou le stress salin chez de nombreuses espèces (Endo et al., 2008). Jusqu’à présent, aucun lien direct n’a été montré entre PtaZFP2 et NCED ou leurs homologues. Cependant, chez Arabidopsis, des facteurs de transcription de la famille des Zinc Finger (famille de PtaZFP2) semblent impliqués dans la régulation de la voie de biosynthèse de l’ABA (Lindemose et al., 2013). Il est donc possible que PtaZFP2 régule lui aussi la voie de biosynthèse de l’ABA. L’équipe MECA a récemment analysé le transcriptome de peupliers transgéniques sur-exprimant le facteur de transcription PtaZFP2 à l’aide de puces ADN

Affymetrix 61K poplar. Ces peupliers présentent une diminution de l’expression du gène

NCED3. L’ensemble de ces informations tendent à valider l’interaction observée dans notre réseau de gènes entre NCED3 et PtaZFP2. Cette interaction sera confirmée en réalisant de nouvelles expérimentations biologiques.

Bibliographie

Auliac, C., Frouin, V., Gidrol, X., d'Alché-Buc, F. (2008). Evolutionary approaches for the reverse-engineering of gene regulatory networks: a study on a biologically realistic dataset. BMC Bioinformatics 9, 91-105.

Baluska, F., Samaj, J., Wojtaszek, P., Volkmann, D., Menzel, D. (2003). Cytoskeleton-plasma membrane-cell wall continuum in plants. Emerging links revisited. Plant Physiol 133, 482-491.

Coutand, C., Dupraz, C., Jaouen, G., Ploquin, S., Adam, B. (2008). Mechanical stimuli regulate the allocation of biomass in trees: demonstration with young Prunus avium trees. Ann Bot. 101,1421-1432.

Coutand, C., Martin, L., Leblanc-Fournier, N., Decourteix, M., Julien, J. L., Moulia, B. (2009). Strain mechanosensing quantitatively controls diameter growth and PtaZFP2 gene expression in poplar. Plant Physiol 151, 223-232.

D'haeseleer, P., Wen, X., Fuhrman, S., Somogyi, R. (1999). Linear modeling of mRNA expression levels during CNS development and injury. Pac Symp Biocomput, 41-52.

De Jaegher, G., Boyer, N. (1987). Specific Inhibition of Lignification in Bryonia dioica : Effects on Thigmomorphogenesis. Plant Physiol 84, 10-11.

Endo, A., Sawada, Y., Takahashi, H., Okamoto, M., Ikegami, K., Koiwai, H., Seo, M., Toyomasu, T., Mitsuhashi, W., Shinozaki, K., Nakazono, M., Kamiya, Y., Koshiba, T., Nambara, E. (2008). Drought induction of Arabidopsis 9-cis-epoxycarotenoid dioxygenase occurs in vascular parenchyma cells. Plant Physiol 147, 1984-1993.

Hamming, R. (1950). Error-detecting and error-correcting codes. Bell System Technical Journal 29,147-160.

Haswell ES., Phillips, R., Rees, D. C. (2011). Mechanosensitive channels : what can they do and how do they do it? Structure 19, 1356-1369.

Hecker, M., Lambeck, S., Toepfer, S., van Someren, E., Guthke, R. (2009). Gene regulatory network inference: data integration in dynamic models-a review. Biosystems 96, 86-103. Heinrich, R., Schuster, S. (1996). The regulation of cellular systems. Chapman and hall., 155Fith avenue New York., 10003.

Iuchi, S., Kobayashi, M., Taji, T., Naramoto, M., Seki, M., Kato, T., Tabata, S., Kakubari, Y., Yamaguchi-Shinozaki, K., Shinozaki, K. (2001). Regulation of drought tolerance by gene manipulation of 9-cis-epoxycarotenoid dioxygenase., a key enzyme in abscisic acid biosynthesis in Arabidopsis. Plant J. 27, 325-333.

Jaffe, M. J. (1973). Thigmomorphogenesis: The response of plant growth and development to mechanical stimulation. Planta 114, 143-157.

Jaffe, M. J., Forbes, S. (1993). Thigmomorphogenesis : the effect of mechanical perturbation on plants. Plant Growth Regul 12, 313-324.

Knepper, C., Savory, E. A., Day, B. (2011). Arabidopsis NDR1 is an integrin-like protein with a role in fluid loss and plasma membrane-cell wall adhesion. Plant Physiol 156, 286-300. Knight, M. R., Smith, S. M., Trewavas, A.J. (1992).Wind-induced plant motion immediately increases cytosolic calcium. Proc Natl Acad Sci USA. 89, 4967-4971.

Lee, D., Polisensky, D.H., Braam, J. (2005). Genome-wide identification of touch- and darkness-regulated Arabidopsis genes: a focus on calmodulin-like and XTH genes. New Phytologist 165, 429-444.

Lindemose, S., O'Shea, C., Jensen, M. K., Skriver, K. (2013). Structure., function and networks of transcription factors involved in abiotic stress responses. Int J Mol Sci 14, 5842-5878.

Madan Babu, M., Teichmann, S. A. (2003). Evolution of transcription factors and the gene regulatory network in Escherichia coli. Nucleic Acids Res. 31, 1234-1244.

Martin, L., Leblanc-Fournier, N., Azri, W., Lenne, C., Henry, C., Coutand, C., Julien, J. L. (2009). Characterization and expression analysis under bending and other abiotic factors of PtaZFP2, a poplar gene encoding a Cys2/His2 zinc finger protein. Tree Physiol 29, 125-136. Martin, L., Leblanc-Fournier, N., Julien, J. L., Moulia, B., Coutand, C. (2010). Acclimation kinetics of physiological and molecular responses of plants to multiple mechanical loadings. J Exp Bot 61, 2403-2412.

Mejia-Guerra, M. K., Pomeranz, M., Morohashi, K., Grotewold, E. (2012). From plant gene regulatory grids to network dynamics. Biochim Biophys Acta 1819, 454-465.

Mori, I. C., Schroeder, J. I. (2004). Reactive oxygen species activation of plant Ca2+ channels : a signaling mechanism in polar growth., hormone transduction., stress signaling., and hypothetically mechanotransduction. Plant Physiol 135, 702–708.

Moulia B. et Combes, D. (2004). Les régulations mécanoperceptives de la croissance : mécanismes écophysiologiques et importance en conditions agronomiques. Séminaire de l’UMR Grandes Cultures INRA Grignon.

Nakagawa, Y., Katagiri, T., Shinozaki, K., Qi, Z., Tatsumi, H., Furuichi, T., Kishigami, A., Sokabe, M., Kojima, I., Sato, S., Kato, T., Tabata, S., Iida, K., Terashima, A., Nakano, M., Ikeda, M., Yamanaka, T., Iida, H. (2007). Arabidopsis plasma membrane protein crucial for Ca2+ influx and touch sensing in roots. Proc Natl Acad Sci USA 104, 3639-3644.

Perrin, C., Michel, C., Andréassian, V. (2003). Improvement of a parsimonious model for streamflow simulation. Journal of Hydrology 279, 275-289.

Reddy, A. S., Ali, G. S., Celesnik, H., Day, I. S. (2011). Coping with stresses: roles of calcium- and calcium/calmodulin-regulated gene expression. Plant Cell 23, 2010-2032.

Spieth, C., Hassis, N., Streichert, F. (2006). Comparing mathematical models on the problem of network inference. Proceeding of the 8th Annual Conference on Genetic and evolutionary computation (GECCO 2006). Washington., USA., 279-285.

Telewski, F. W. (2006). A unified hypothesis of mechanoperception in plants. Am J Bot 93, 1466-76.

Tuskan, G. A., Difazio, S., Jansson, S., Bohlmann, J., Grigoriev, I., Hellsten, U., Putnam, N., Ralph, S., Rombauts, S., Salamov, A., Schein, J., Sterck, L., Aerts, A., Bhalerao, R. R., Bhalerao, R. P., Blaudez, D., Boerjan, W., Brun, A., Brunner, A., Busov, V., Campbell, M., Carlson, J., Chalot, M., Chapman, J., Chen, G. L., Cooper, D., Coutinho, P. M., Couturier, J., Covert, S., Cronk, Q., Cunningham, R., Davis, J., Degroeve, S., Déjardin, A., Depamphilis, C., Detter, J., Dirks, B., Dubchak, I., Duplessis, S., Ehlting, J., Ellis, B., Gendler, K., Goodstein, D., Gribskov, M., Grimwood, J., Groover, A., Gunter, L., Hamberger, B., Heinze, B., Helariutta, Y., Henrissat, B., Holligan, D., Holt, R., Huang, W., Islam-Faridi, N., Jones, S., Jones-Rhoades, M., Jorgensen, R., Joshi, C., Kangasjärvi, J., Karlsson, J., Kelleher, C., Kirkpatrick, R., Kirst, M., Kohler, A., Kalluri, U., Larimer, F., Leebens-Mack, J., Leplé JC., Locascio, P., Lou, Y., Lucas, S., Martin, F., Montanini, B., Napoli, C., Nelson, D. R., Nelson, C., Nieminen, K., Nilsson, O., Pereda, V., Peter, G., Philippe, R., Pilate, G., Poliakov, A., Razumovskaya, J., Richardson, P., Rinaldi, C., Ritland, K., Rouzé P., Ryaboy, D., Schmutz, J., Schrader, J., Segerman, B., Shin, H., Siddiqui, A., Sterky, F., Terry, A., Tsai, C. J., Uberbacher, E., Unneberg, P., Vahala, J., Wall, K., Wessler, S., Yang, G., Yin, T., Douglas, C., Marra, M., Sandberg, G., Van de Peer, Y., Rokhsar D.(2006). The genome of black cottonwood., Populus trichocarpa (Torr. & Gray). Science 313, 1596-1604.

van Someren E. P., Wessels, L., Reinders, M., Backervan, E. (2002). Regularization and noise injection for improving genetic network models. Computational and Statistical Approaches to Genomics. World Scientific Publishing Co., 211-226.

Yamanaka, T., Nakagawa, Y., Mori, K., Nakano, M., Imamura, T., Kataoka, H., Terashima, A., Iida, K., Kojima, I., Katagiri, T., Shinozaki, K., Iida, H. (2010). MCA1 and MCA2 that mediate Ca2+ uptake have distinct and overlapping roles in Arabidopsis. Plant Physiol 152, 1284-96.

Zhao, W., Serpedin, E., Dougherty, E. R. (2009). Spectral preprocessing for clustering time-series gene expressions. EURASIP J Bioinform Syst Biol, 713248.

Tables des sigles et des abréviations

ABA : ABscisic Acid ouAcide Abscissique BH : test de Bonferroni

C2H2 : famille protéique des Cys2/His2 Ca2+ : ion calcium

CaM : calmodulines

CPMCW : Cytosqueleton - Plasma Membrane - Cell Wall

CV : Cross Validation ou validation croisée DF : Degree of Freedom ou degré de liberté

ENCODE : Encyclopedia of DNA Elements H2O2 : peroxyde d’hydrogène

KRR : Kernel Ridge Regression ou régression noyau

LASSO : Last Absolute Shrinkage and Selection Operator

LOO : Leave One Out

MCA : canaux calciques mécanosensibles ou mid1-complementing activity

MECA : équipe contraintes MECAniques et activité des zones en croissance

MSE : Mean Square Error ou erreur quadratique moyenne

MSL : Mecano sensitive channel of Small conductance Like

NCED : protéine 9-cis-epoxycarotenoid dioxygenase

PIAF : Unité Mixte de Recherche Physique et Physiologie Intégratives de l’Arbre Fruitier et Forestier

ROS : Reactive Oxygen Species TCH : gènes TOUCH

WAK : Wall Associated Kinases

ZFP : Zinc Finger Protein, protéine à doigt de Zinc

Glossaire

Cluster : groupe d’éléments issus d’un partitionnement. Les éléments d’un cluster

possèdent les mêmes caractéristiques. Dans notre cas, les clusters sont des sous-groupes de gènes avec des niveaux d’expression similaires.

Clustering : méthode de partitionnement de données.

Cycle circadien : cycle biologique d’une durée de 24 h. Il est présent chez les animaux

et les plantes. Par exemple, pour les plantes les pétales et les feuilles s’ouvrent et se redressent plus ou moins selon l’heure de la journée.

Gene Ontology : projet bioinformatique visant à fournir une nomenclature commune

aux gènes et à leurs produits pour décrire leurs fonctions biologiques, les processus moléculaires dans lesquels ils sont impliqués et la localisation cellulaire de leur activité.

Graphes orientés : ensemble d’éléments (les nœuds) dont certains sont reliés par un lien

(les arcs) avec un sens. L’élément j est relié à l’élément i par un lien. Le lien peut aller de i vers j ou de j vers i. Le sens du lien est représenté par une flèche.

K-means : algorithme de partitionnement des données (ou clustering). Le but de cette méthode est de diviser les données en k-partitions. Chaque observation est placée dans le groupe avec la moyenne la plus proche.

Knock-out : inactivation totale d’un gène.

Matrice : tableau de nombres, défini par son nombre de colonnes ( ) et son nombre de

lignes (𝑛). Chaque élément ( ) de la matrice est défini par le numéro de sa ligne et celui de sa colonne : 2 [ ] 𝑛 [ ]

Matrice carrée : matrice dont le nombre de lignes est égale au nombre de colonnes. La matrice sera de degré𝑛 (nombre de lignes ou de colonnes)

[ 2

] Matrice carrée de degré 3

Matrice diagonale : matrice carrée dont tous les éléments en dehors de la diagonale sont

égaux à 0. La diagonale d’une matrice est composée des éléments :

𝐷 [

] 𝑖 𝐷 { }

Matrice identité : matrice diagonale dont la diagonale est composée exclusivement de 1.

[

] Matrice identité de degré 3

miRNA : ou micro ARN. Ce sont des petits ARN simple brin d’une vingtaine de bases.

Ils sont impliqués dans les mécanismes de régulation de l’expression des gènes au niveau post-transcriptionnel.

PCR quantitative : méthode de biologie moléculaire permettant de connaître la quantité

d’ADN ou d’ARN d’un échantillon de départ ou de mesurer des variations d’accumulation entre deux échantillons.

Test de Bonferroni : test statistique utilisé pour déterminer des différences significatives entre la moyenne de groupes. Le test de Bonferroni convient bien lorsque l’on est en présence d’un grand nombre de groupes. Il permet alors de diminuer le risque dû au hasard.

Text mining : ou fouille de texte en français. C’est une sous-catégorie de la fouille de données (ou data mining). Les outils de text mining en biologie permettent par exemple d’extraire les informations sur un gène des bases de données bibliographiques, telles que le nom des gènes avec lesquels il est le plus souvent cité.

Variance empirique : mesure statistique permettant d’évaluer la diversité d’un échantillon. Soit un échantillon de 𝑛 éléments 𝑖. La variance de X est donnée par :

∑ 𝑖 ̅

̅ : moyenne de l’échantillon

𝑖 : un élément de l’échantillon

𝑛 : nombre d’éléments dans l’échantillon

La variance empirique est donnée par :

∑ 𝑖 ̅

̅ : moyenne de l’échantillon

𝑖 : un élément de l’échantillon

𝑛 : nombre d’éléments dans l’échantillon

Valeurs propres : est une valeur propre de la matrice carrée si n’est pas injectif ( étant une matrice identité de même degré que ).

Exemple : On recherche les variables pour lesquelles 𝑖

( 2) [( 2) ( )] [( 2) ( )] [( 2 )] 2

Deux solutions possibles -2 et -5, les valeurs propres de A sont donc -2 et -5.

Vecteurs propres : est un vecteur propre de la valeur propre de la matrice carrée , si

Exemple : ( 2) valeurs propre de A : l1=-2 et l2=-5

Transposée (de matrice ou de vecteur) : Soit une matrice de dimension et

sa matrice transposée de dimension :

[

] [

]

Un vecteur peut être considéré comme une matrice d’une ligne, il est donc possible d’écrire :

Documents relatifs