• Aucun résultat trouvé

B. Analyse protéomique

6. Analyse des profils protéiques

Pour comparer les trois stades du développement in vitro et mieux comprendre les profils protéiques obtenus, une analyse complémentaire a été réalisée à l'aide de logiciels d’analyse et de description de listes de protéines.

6. 1. AnalyseGene Ontology (GO) via PANTHER

Toutes les protéines identifiées pour chaque groupe ont été soumises au système de classification de PANTHER version 8.1 (protein annotation through evolutionary relationship) – http://www.pantherbd.org). PANTHER est un logiciel accessible gratuitement sur internet qui permet d’analyser des données obtenues avec des approches de protéomique ou de séquençage génomique. Avec ce logiciel on peut obtenir une classification des protéines par rapport à leur fonction moléculaire, leur localisation cellulaire et les processus biologiques dans lesquels elles sont impliquées. Il permet également l'utilisation d'outils statistiques pour réaliser des études comparatives entre plusieurs groupes de données et/ou le génome de l’espèce étudiée.

Pour compléter l’étude du protéome de chacun de mes groupes d’étude, une classification par classe de protéines et processus biologiques a été réalisée pour chaque liste de protéines obtenues. De plus j’ai réalisé une étude comparative de mes données avec le génome de Mus musculus pour mettre en évidence des fonctions biologiques qui seraient sur ou sous exprimées dans mes données.

6. 2. Quantification label-free

La quantification label-free est une méthode d'analyse des données de spectrométrie de masse qui vise à déterminer la quantité relative des protéines entre plusieurs échantillons. Contrairement à d’autres méthodes de quantification, elle n’utilise pas un isotope stable composé d’un élément chimique qui se lie aux

protéines mais se base sur l’intensité du signal détecté pour les peptides lors de l’analyse MS. Elle nécessite la réalisation de plusieurs réplicats techniques et permet de comparer l’intensité du signal d’un même peptide entre plusieurs échantillons biologiques.

Pour ma thèse une quantification label-free a été effectuée sur les données obtenues avec l’analyse 1D LC-MS/MS uniquement, à l'aide du logiciel Progenesis LC-MS version 4.1.4832.42146 (Nonlinear Dynamics, Newcastle, Royaume Uni). Pour un échantillon donné, les données 1D LC-MS/MS sont représentées par une image dont l'axe horizontal représente la masse sur charge (m/z) des peptides et l'axe vertical le temps de rétention chromatographique (min). Les peptides apparaissent alors sous forme de spots plus ou moins foncés en fonction de leur abondance (Fig. 36). Les images de tous les échantillons (3 réplicats techniques par groupe) ont d'abord été alignées entre elles en combinant la fonction d'alignement automatique du logiciel et un alignement manuel. La détection et la quantification automatique des peptides étaient faites selon les critères suivants : un seuil d’intensité absolu des peptides de 100 000 (UA, unité arbitraire), des peptides avec une charge maximale de 3 et des temps de rétention compris entre 25 et 100 minutes. Pour chaque peptide, seuls les 5 spectres MS/MS les plus intenses ont été retenus pour l'identification par le logiciel Mascot version 2.2.07 (Matrix Science, Londres, Royaume Uni) utilisant la base de données SwissProt/Trembl Mus

musculus du mois de mai 2013 (50807 protéines). Les paramètres pour

l’identification étaient les suivants : enzyme = trypsine ; possibilité d'un seul clivage manqué ; carbamidométhylation des cystéines ; oxydation des méthionines ; tolérance d’erreur de masse MS et MS/MS de 0,5 Da et un score Mascot > 33. Les résultats obtenus avec Mascot ont été ensuite réinsérés dans le logiciel Progenesis pour permettre la connexion entre les peptides identifiés et leur abondance respective.

La quantification des protéines a été réalisée avec un minimum de 2 peptides non conflictuels, c'est-à-dire ne pouvant appartenir qu’à une seule protéine, présentant une variation entre les groupes statistiquement significative (ANOVA q-value < 0,05) et un ratio différentiel  2. Finalement, seules les protéines ayant une différence significative entre les différents stades (ANOVA p-value < 0,05) et un ratio  2 ont été retenues.

6. 3. Ingenuity Pathway Analysis (IPA)

IPA est un logiciel qui sélectionne des protéines "noyaux" pour la construction de réseaux biologiques. Les protéines "noyaux" sont des protéines présentes dans les échantillons et qui sont connues dans l’IPKB (Ingenuity Pathways Knowledge Base) et pour lesquelles des interactions avec d’autres protéines sont décrites. Ayant pour base ces interactions le logiciel IPA construit des réseaux avec un maximum de 35 protéines. Cette information est complétée avec la fonction Path Designer qui permet la construction de graphiques et images résumant les réseaux sélectionnés.

Pour chaque réseau ou voie canonique, une p-value est calculée avec un test de Fisher en fonction des protéines identifiées, et un score est attribué indiquant la probabilité que les protéines identifiées dans un même réseau ne se retrouvent pas là simplement par le fait du hasard.

Ainsi dans ma thèse une p-value ≤ 0,05 et un score ≥ 2 ont été choisis, indiquant qu’à 99 % le réseau n’a pas été généré au hasard

6. 3. Pathway Studio

Pathway Studio (Elsevier, BV, New York, USA) est un outil d’aide à la décision biologique permettant au chercheur d’analyser ses données expérimentales, de comprendre leur contexte biologique et de visualiser interactions et mécanismes de maladie.

Ce logiciel utilise des moteurs de recherche bibliographiques automatisés pour extraire les informations de la littérature. Les listes de protéines ont été soumises à «9.0 ResNet Mammal», la base de données qu’Elsevier a élaborée en collaboration avec des revues de haute qualité, traitant interactions biologiques, ontologies et voies. Les informations sélectionnées sont appliquées aux listes de protéines pour faire apparaître leurs interactions. Les processus cellulaires trouvés sont classés par leur degré de similitude (score p), calculé comme le rapport du nombre de protéines en commun entre la liste à analyser et le nombre total de protéines impliquées dans le processus cellulaire.