• Aucun résultat trouvé

Généralités sur la FT-ICR 2D

II. Récents développements en 2D-FT-ICR

4. Le débruitage des données

Les groupes de Marshall et de Ross ont observés que le signal est composé de grande quantité de bruit de scintillation (comme en l'astronomie [22], ou au bruit t1 en spectroscopie RMN [23]). Ce bruit conduit à des stries verticales dans les spectres 2D aux fréquences de ω2 des pics les plus intenses. Le bruit de scintillation découle de fluctuations de l'amplitude ou de la fréquence d'un signal et ne peut pas être réduite en accumulant plusieurs scan, car il est proportionnel au signal. Une expérience FT-ICR 2D MS utilise un nouveau paquet d’ions pour chaque incrément de temps dans la première dimension. Donc, en 2D FTICR MS, la cause la plus probable du bruit de scintillation est la fluctuation du nombre d'ions créés dans la source d'ions, ce qui explique pourquoi la terminologie astronomique semble appropriée.

Les stries verticales causée par la fluctuation du nombre d'ions dans la cellule ICR peuvent masquer les signaux de faible intensité et provoquer des erreurs dans les données interprétation (figure 8, observation de stries verticale sur le spectre 2D). Le bruit de scintillation s’avère être un problème important dans les spectres FT-ICR 2D parce que ces pics parasites peuvent conduire à des erreurs dans la détermination de la fragmentation.

Pour supprimer le bruit de scintillation de la 2D, un algorithme développé et basé sur la valeur de décomposition singulière a été appliqué en 1987 par Cadzow et Wu [24]. Cet algorithme est basé sur le postulat selon lequel les signaux peuvent être décomposés en sommes de sinusoïdes exponentiellement amorties, ce qui est la base de toute l'analyse de Fourier, de sorte qu'après un certain nombre de points, le point suivant peut être prédit. Aucune hypothèse au sujet de la nature du bruit n’est nécessaire. Les données sont disposées dans une matrice de Toeplitz (une matrice dont les coefficients sur une diagonale descendant de gauche à droite sont les mêmes) qui est décomposée en vecteurs propres qui peuvent être disposés dans un ordre décroissant de leur valeurs propres en fonction d'une estimation du niveau de bruit, seuls les vecteurs propres avec les valeurs propres les plus élevés sont conservés et les données peuvent être reconstruites. Cet algorithme peut être transposé de la spectroscopie RMN, où il a souvent été appliqué avec succès [25]. Elle peut être

Généralités sur la FT-ICR 2D appliquée à chaque section verticale (parallèle à l'axe 1) des spectres FT-ICR 2D MS (figure 9) [26].

Figure 9 : Spectre de masse 2D FT de la bradykinine avec fragmentation IRMPD (a) sans application de l'algorithme Cadzow et (b) avec l'application de l'algorithme Cadzow en utilisant 30 lignes, 10 itérations et un ordre de 500. Les fréquences cyclotron sont représentées horizontalement tt les fréquences de corrélation sont représentées verticalement. (de Van Agthoven et al. [26]).

L'algorithme Cadzow nous a permis de diminuer le bruit des spectres 2D de masse car elle ne présuppose pas de propriété particulière à la nature du bruit. Cependant, comme les causes exactes du bruit de scintillation ne sont pas encore connues, l'application de l’algorithme de Cadzow n’est pas entièrement satisfaisant car nous ne pouvons pas définir le nombre de vecteurs propres qui doivent être conservés et combien peuvent être mis au rebut. La recherche scientifique moderne produit des ensembles de données de taille et de complexité croissantes qui nécessitent des méthodes numériques dédiées au traitement. Dans de nombreux cas, l'analyse des données spectroscopiques implique le débruitage des données brutes avant tout traitement ultérieur. Les algorithmes de débruitage actuels exigent la décomposition en valeurs singulières d'une matrice avec une taille qui évolue comme le carré de la longueur des données, ce qui empêche leur utilisation sur de très grands ensembles de données. Profitant des progrès récents sur la projection aléatoire et algorithmes probabilistes, Chiron et al [27] ont développés une méthode simple et efficace pour le débruitage de très grands ensembles de données. Sur la base de la décomposition QR d'une matrice échantillonnés au hasard à partir des données, cette approche permet un gain de près de trois ordres de grandeur dans le temps de traitement par rapport aux

Généralités sur la FT-ICR 2D (uncoiled random QR denoising), réduit fortement l'encombrement de la mémoire de l'ordinateur et permet à l'algorithme de débruitage à appliquer à la taille des données quasi-illimitée (figure 10).

Figure 10 : Comparaison de l’algorithme de débruitage rQRd (rond), urQRd (losange) et SVD (croix). Sur le graphique de gauche, l’algorithme urQRd a un temps de processing plus rapide. L’efficacité de débruitage, exprimée comme le gain SNR généré par la méthode de valorisation; rQRd et urQRd sont presque indiscernables sur le graphique de droite (d’après Chiron et al [27])

Cette étude a montré que le débruitage urQRd est meilleur que les débruitage de type SVD et rQRd, qui sont limité par la mémoire de l’ordinateur, et s’arrête pour des données de 32 000 et 64 000 points. Cette algorithme a été appliqué sur une 2D-FT ICR 2k x 128 ponts de TAG extrait de plasma humain et a permis de diminue le bruit de scintillation et d’observer les massifs isotopiques des triacylglycérols.

Toutes ces améliorations ont permis d’analyser des échantillons de plus en plus complexes et de développer le potentiel de la technologie de 2D-FT-ICR. En 2015, Van Agthoven et al [28] a mis en œuvre la photo-ionisation à pression atmosphérique avec la 2D-FT pour l’étude de la fragmentation du cholestérol. Il a été montré que le motif de fragmentation du radical et de l’espèce protonnée du cholestérol est différent. L’utilisation de la ligne des fragments, des précurseurs et des pertes de neutres dans le spectre de 2D permet de déterminer le mécanisme de fragmentation de molécules connues et d’obtenir des informations sur des espèces ioniques inconnues dans le spectre. Van Agthoven et al [29] ont réalisé l’analyse 2D-FT-ICR d’une digestion de cytochrome C en utilisant la fragmentation ECD et IRMPD. Cette même technique a aussi été utilisé pour analyser une digestion de collagène et pour la comparer à une analyse simple de 1D MS/MS [30].

Généralités sur la FT-ICR 2D