• Aucun résultat trouvé

La première partie de ce manuscrit est une introduction bibliographique présentant les états de l’art de l’analyse protéomique et du domaine des anticorps monoclonaux. La seconde partie du manuscrit décrit les principaux résultats obtenus, pour le développement et l’optimisation d’approches MS, et pour la quantification des HCP dans des échantillons d’anticorps monoclonaux.

37

Tout d’abord, j’ai été responsable d’un couplage de dernière génération microLC-Triple TOF 6600, pour lequel j’ai optimisé une méthode DDA pour des analyses de type « shotgun », permettant à la fois d’identifier des protéines et de les quantifier par l’extraction des courants d’ions.

Nous avons également comparé les performances de différentes configurations d’analyse protéomique ciblée afin de nous guider dans notre choix instrumental lorsque de telles approches sont envisagées. Nous avons montré que des systèmes microLC étaient aussi performants que des systèmes nanoLC, si la quantité d’échantillons disponible est suffisante. De plus, la SRM et la PRM ou la MRM HR ont montré des sensibilité, justesse et précision équivalentes. Donc le choix de l’approche à utiliser pour des analyses de protéomique ciblée doit plutôt se faire sur des critères de (i) quantité d’échantillon, en préférant le mode microLC par rapport au nanoLC lorsque c’est possible car il offre une meilleure robustesse, (ii) instrument disponible, sachant que les instruments de type triple quadripôle sont souvent dédiés aux analyses SRM alors que les instruments HR/AM peuvent réaliser d’autres types d’approches, i.e. « shotgun » ou DIA, (iii) le développement de méthode est facilité si l’approche ciblée est réalisée sur le même instrument que l’approche globale.

Nous avons également optimisé le workflow complet DIA, incluant la partie préparation d’échantillons, acquisition des données et analyse des données. L’analyse des données est aujourd’hui le goulot d’étranglement de cette technique, c’est pourquoi nous l’avons profondément optimisé. Le workflow optimisé DIA nous a permis d’atteindre des recouvrements de protéome bien meilleurs que l’analyse « shotgun » classique DDA, et des sensibilité, spécificité et reproductibilité équivalentes à celles des approches ciblées. En conclusion, l’approche DIA semble tenir ses promesses, et les futures avancées instrumentales en terme de vitesse, sensibilité et résolution, ainsi que les améliorations de l’analyse des données DIA, feront sans doute de cette méthode la référence pour l’analyse protéomique dans les années à venir.

Enfin, j’ai produit une large gamme d’échantillons de mAb provenant de différentes étapes et conditions du procédé de production d’un mAb, et ai développé une approche DIA innovante, appelée Top 3-ID-DIA, permettant à la fois un profilage complet de la population des HCP et une quantification absolue d’HCP clés. Nous avons pu quantifier les HCP avec une gamme dynamique de 5 ordres de magnitude, avec une sensibilité inférieure à 1 ppm. Cette méthode a été comparée aux méthode de référence ELISA pour la quantification des HCP, et SRM pour la quantification absolue par spectrométrie de masse. L’approche Top 3-ID-DIA nous a permis d’atteindre des sensibilité, justesse et précisions comparables à la SRM, tout en permettant une quantification non biaisée et plus complète comparé à l’ELISA.

38

Cette méthode peut être transférée en industrie, et peut être appliquée après seulement deux mois de développement, là où il faudrait plus d’un an pour développer un test ELISA. Bien que cette méthode soit en apparence plus chère qu’un ELISA (un couplage LC-MS vaut  600 k€, et le développement d’un ELISA  200 k€), il ne faut pas oublier qu’un nouveau test ELISA doit être développé lorsqu’il n’y a plus de réactif disponible, et les résultats entre le nouveau et l’ancien kit ELISA sont rarement concordants. De plus, la qualité et la quantité des informations obtenues en MS sont nettement supérieures à ce qui est obtenu en ELISA : par exemple, nous avons quantifié plus de 3 000 HCP en MS, alors qu’on estime que l’ELISA quantifie  1 000 HCP. La MS nous donne également une quantification individuelle des HCP, alors que l’ELISA ne fournit qu’une quantité totale d’HCP, sans information concernant le nombre ou l’identité des HCP détectées.

En conclusion, l’approche Top 3-ID-DIA pourrait offrir un support important pour le développement de procédé de production de mAb et la vérification de la pureté des mAbs, permettant au final la production de biomédicaments plus purs et plus sûrs. A court terme, la méthode Top 3-ID-DIA pourrait fournir des résultats complémentaires à ceux obtenus en ELISA, et à long terme le remplacer totalement.

41

General introduction

Proteins constitute a key class of biomolecules, which perform a range of essential functions involved in various biological processes like biochemical reactions, cell structure maintenance, intracellular trafficking or cell signalling, protein regulation or signalisation. The protein composition in amino acids is coded by the genome, and post translational maturations lead to their active three-dimensional conformation. The total number of proteins per cell is estimated at 3-4 million for the bacteria Escherichia coli, 100-150 million for the yeast Saccharomyces cerevisiae, and 10 billion for a mammalian cell1. Contrary to the genome, which is constant within an organism, the proteome is a dynamic entity evolving according to time, external stimuli or cell type. For instance, mouse fibroblasts express about 10 000 different proteins, covering a dynamic range of seven orders of magnitude (from one to ten million copies per cell) following a bell-shape distribution (Figure 6).

Figure 6 : Distribution of protein abundances in NIH3T3 mouse fibroblasts (adapted from 2).

The “dark corner” of the proteome is the most challenging part for detection and represents about 1 000 proteins.

Moreover, like alternative splicing adds a level of complexity from the genome to the transcriptome, post translational modifications add a supplemental level of complexity from the transcriptome to the proteome. Different versions of a protein are called proteoforms61. In human cells, it is estimated that 90% of the  20 000 genes undergo alternative splicing62, and approximately 100 000 proteoforms can be expressed63. The total protein content of a cell at a given time is called the proteome.

Proteomics is the large scale and comprehensive study of the proteome: it aims to identify, quantify and characterise all the proteins of a proteome3-4. The expansion of proteomics was driven by technological advances in separation techniques, mass spectrometry (MS) and bioinformatics5. In the

42

past two decades, improvements of the sensitivity, resolution, mass accuracy and scan rate of mass spectrometers, as well as the growth of curated and annotated protein sequence databases have made MS the most important and popular tool for high throughput and large scale proteomics6. Today, proteomics plays an essential role in major research areas, including systems biology and biomarker discovery, and strongly contributes to the understanding of biological processes7-8.

My doctoral work was intended to improve proteome analysis by MS by setting up and evaluating a new method using Data Independent Acquisition (DIA), and to demonstrate the major interest and potential of MS methodologies for the study of host cell protein impurities in monoclonal antibody solutions.

The Part I of this manuscript is a bibliographic introduction. The Chapter I summarises the state of the art of proteomics, including shotgun analyses, targeted approaches and the very recent and promising data independent acquisition mode. The Chapter II presents the field of monoclonal antibodies and a state of the art of host cell protein impurities detection methods.

The Part II of this manuscript presents the main analytical and methodological developments and evaluations that were realised during this PhD, and their application to the study of host cell protein impurities in monoclonal antibody samples. The Chapter I presents the key parameters of a data dependent acquisition method and their optimisation to improve the proteome coverage of shotgun proteomics analyses. The Chapter II describes a benchmarking of four targeted proteomics platforms, including the gold standard triple quadrupole for selected reaction monitoring (SRM) and new generation mass spectrometers performing high resolution SRM-like experiments. The Chapter III focuses on the optimisation of the data independent acquisition workflow, from the sample preparation to data acquisition and analysis. The Chapter IV presents the application of these analytical developments to the study of host cell proteins.

45

Documents relatifs