• Aucun résultat trouvé

Profils en acides gras des tissus et métabolisme concerté des lipides dans l’organisme du porc en croissance

N/A
N/A
Protected

Academic year: 2021

Partager "Profils en acides gras des tissus et métabolisme concerté des lipides dans l’organisme du porc en croissance"

Copied!
47
0
0

Texte intégral

(1)

HAL Id: hal-01211040

https://hal.archives-ouvertes.fr/hal-01211040

Submitted on 5 Jun 2020

HAL is a multi-disciplinary open access archive for the deposit and dissemination of sci- entific research documents, whether they are pub- lished or not. The documents may come from teaching and research institutions in France or abroad, or from public or private research centers.

L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau recherche, publiés ou non, émanant des établissements d’enseignement et de recherche français ou étrangers, des laboratoires publics ou privés.

Profils en acides gras des tissus et métabolisme concerté des lipides dans l’organisme du porc en croissance

Aldja Aguersif

To cite this version:

Aldja Aguersif. Profils en acides gras des tissus et métabolisme concerté des lipides dans l’organisme du porc en croissance. 2015, 27 p. �hal-01211040�

(2)

Rapport de stage

Étudiant Aldja AGUERSIF

Courriel : Aldja.Aguersif@rennes.inra.fr Entreprise d’accueil

INRA UMR1348 PEGASE

Domaine de la Prise, 35590 Saint-Gilles France Maîtres de stage Florence GONDRET, Directrice de Recherches

Courriel: Florence.Gondret@rennes.inra.fr David CAUSEUR, Enseignant Chercheur Courriel: david.causeur@agrocompus.fr

www.rennes.inra.fr/pegase

Tuteur à l’université Salim LARDJANE Maître de Conférences en Statistique Courriel : lardjane@univ-ubs.fr

www.univ-ubs.fr

Date de la soutenance 25 juin 2015

Année 2014-2015

Master 2 Professionnel

Mathématiques-Informatique-Statistique

MASTER 2

MODÉLISATION STATISTIQUE ET APPLICATIONS

DÉCISIONNELLES

UFR SSI Département MIS

Profils en acides gras des tissus et métabolisme concerté des lipides dans l’organisme du porc en

croissance

Université de Bretagne-Sud – UFR Sciences et Sciences de l’ingénieur

(3)

Remerciements

Je remercie Mr Jaap VAN MILGEN, Directeur de l’UMR Pegase de l'INRA, pour m'avoir acceptée en tant que stagiaire au sein de son unité.

Je tiens tout particulièrement à remercier mon maître de stage, Madame Florence GONDRET, chercheur au sein de l’équipe de recherche CROISSANCE de l’UMR Pegase, de m’avoir fait confiance pour le stage, pour m’avoir fait partager son expérience et ses compétences, et pour le

temps qu’elle m’a consacré tout au long de cette période de stage,

Je remercie également Mr David CAUSEUR, Professeur à l’Agrocampus-ouest, pour sa gentillesse, ses conseils, son soutien et son aide.

Je vous remercie également Salim LARDJANE et Ion GRAMA pour avoir acceptés d’être rapporteurs de ce travail.

Enfin j’exprime toute ma sympathie aux autres membres de l’équipe de recherche qui m’accueillie.

Université de Bretagne-Sud – UFR Sciences et Sciences de l’ingénieur

Département Mathématique, Informatique, Statistique Rue Yves Mainguy 56000 Vannes France

www.univ-ubs.fr

(4)

Résumé

Les différents types d’acides gras sont des éléments importants pour la qualité technologique et diététique des produits animaux. Cette étude avait pour objectifs de décrire et prédire la variation du profil en acides gras dans différents tissus chez le porc. Des analyses statistiques descriptives (ACP) et intégratives entre tissus (AFM) ont permis de montrer une large similitude dans la variation des acides gras à chaîne moyenne (inférieurs à 14 atomes de carbone) et des acides palmitique et stéarique (C16 :0, C18 :0) d’une part, et les acides gras polyinsaturés de la famille oméga-6 d’autre part entre tous les tissus en réponse au régime de l’animal. A l’inverse, il existe une spécificité tissulaire dans la variabilité des acides gras de la famille oméga-3. Des analyses prédictives de type PLS2 ont montré que l’expression de nombreux gènes impliqués dans le métabolisme glucidique et la synthèse des acides gras, mais aussi l’oxydation des acides gras expliquent une part de la variabilité des proportions d’acides gras au sein de chaque tissu. Cependant, le profil global en acides gras tissulaire n’est qu’imparfaitement prédit. Une analyse de type LASSO a permis d’établir un petit nombre de prédicteurs moléculaires pertinents pour la variation de l’acide gras palmitique C16 :0 et des acides gras de la famille oméga-6.

Mots clés

:

Acides gras, Analyse Factorielle Multiple, Muscle, Porc, Régression PLS2, Régression LASSO, Tissu adipeux, Transcriptomique.

Abstarct

The different types of fatty acids are important for technological and dietary quality traits of animal products. This study aimed to describe and predict the variation of the fatty acid profile in different tissues in pigs. Descriptive (PCA) and integrative (AFM) statistical analyzes between tissues have shown a great similarity in the variation of medium chain fatty acids (less than 14 carbon atoms) and palmitic and stearic acids (C16 :0,C18 :0) on one hand, and polyunsaturated fatty acids of the omega-6 family on the other hand in all the tissues in response to diet. Tissue specificity was shown for variation of omega-3 family of fatty acids. Predictive PLS2 analyses revealed that the expression of many genes involved in carbohydrate metabolism and the synthesis of fatty acids, but also in fatty acid oxidation explained a large part of the variability of fatty acid proportions within each tissue. However, the overall profile in tissue fatty acid profile is poorly predicted. A LASSO type of analysis allowed establishing a small number of relevant molecular predictors for changes in the specific fatty acids such as palmitic C16: 0 and omega-6 family.

Keywords

:

Adipose Tissue, Fatty acids, Factorial Analysis Multiple, Muscle, Pig, Regression PLS2, Regression LASSO, Transcriptomics.

(5)

Sommaire

LISTE DES ABRÉVIATIONS...1 LISTE DES FIGURES...2 FIGURE 1 : STRUCTURE CHIMIQUE ET NOMENCLATURE DES FAMILLES D’ACIDES GRAS. 5....2 FIGURE 2 : PLAN FACTORIEL À DEUX DIMENSIONS DES INDIVIDUS ET CERCLE DE

CORRÉLATION DES VARIABLES. 20...2 FIGURE 3 : REPRÉSENTATION GRAPHIQUE DES INDIVIDUS (CERCLE DE CORRÉLATION) ET DES VARIABLES (PLAN FACTORIEL) OBTENUE PAR ANALYSE FACTORIELLE MULTIPLE (AFM).

21...2 FIGURE 4 : REPRÉSENTATION GRAPHIQUE DES INDIVIDUS ET LES VARIABLES ENTRE TOUS LES TISSUS ET LE SANG PAR AFM HIÉRARCHIQUE (AXE 1 ET AXE 3) DE L’AFM 24...2 FIGURE 5 : REPRÉSENTATION GRAPHIQUE DU CRITÈRE DE SÉLECTION DES COEFFICIENTS DU MODÈLE POUR L’ACIDE GRAS C16 :0 DANS LES TISSUS ADIPEUX, LE FOIE ET LE MUSCLE LD. 31...2 LISTE DES TABLEAUX...2 TABLEAU 1: STATISTIQUES DESCRIPTIVES DES TENEURS EN ACIDES GRAS DANS LES QUATRE TISSUS ET LE SANG. 12...2 TABLEAU 2 : PROBABILITÉS DE SIGNIFIANCE POUR LES PROPORTIONS RELATIVES DES ACIDES GRAS DANS LES TISSUS OU LE SANG POUR LES EFFETS RÉGIME ET LIGNÉE. 17...2 TABLEAU 3 : CORRÉLATION ET P. VALUE DES VARIABLES MESURÉES DANS LES TISSUS AVEC LES TROIS PREMIÈRES DIMENSIONS DE L’AFM. 23...2 TABLEAU 4: IMPORTANCE DES VARIABLES DANS LE MODÈLE PLS2 ET PRINCIPAUX

PROCESSUS BIOLOGIQUES REPRÉSENTÉS DANS LES DEUX TISSUS ADIPEUX, LE MUSCLE LD ET LE FOIE. 29...2 TABLEAU 5 : COEFFICIENTS PARTIELS DE MODÈLE DE RÉGRESSION PLS2 SUR LES TISSUS

(6)

TABLEAU 6 : RÉSULTATS DE LA MÉTHODE LASSO DANS LES TISSUS ADIPEUX ET

MUSCULAIRE ET DANS LE FOIE. 32...3

TABLEAU 7 : COEFFICIENTS DE RÉGRESSION (DONNÉES CENTRÉES-RÉDUITES) OBTENUS AVEC LA MÉTHODE LASSO POUR L’ACIDE GRAS C16 :0 DANS LE TISSU ADIPEUX SOUS CUTANÉ (TASC). 34...3

INTRODUCTION ...4

I. CONTEXTE ET OBJECTIFS DU STAGE...5

I.1. PRÉSENTATION DE L’UNITÉ D’ACCUEIL...5

I.2. PROBLÉMATIQUE ET OBJECTIFS DU STAGE...5

II. PRÉSENTATION DES DONNÉES ET DES MÉTHODOLOGIES D’ANALYSES...9

II.1. DONNÉES BIOLOGIQUES...9

II.2. MÉTHODOLOGIES STATISTIQUES...13

III. RÉSULTATS...16

III.1. EFFETS RESPECTIFS DU RÉGIME ALIMENTAIRE ET DE LA LIGNÉE GÉNÉTIQUE SUR LES PROPORTIONS RELATIVES DES ACIDES GRAS TISSULAIRES OU DU SANG...16

III.2. IDENTIFICATION DES SIMILITUDES OU SPÉCIFICITÉS DANS LES VARIATIONS DES PROFILS EN ACIDES GRAS SELON LES TISSUS...18

III.3. BILAN DES ANALYSES DESCRIPTIVES...26

III.4. ANALYSES PRÉDICTIVES PAR PLS2...27

III.5. RÉGRESSION LASSO...31

III.6. BILANS DES ANALYSES PRÉDICTIVES...34

LESPRINCIPAUXOBJECTIFSDECETRAVAILÉTAIENTDEDÉCRIRELEFONCTIONNEMENTCONCERTÉDESTISSUSDANSLA DÉFINITIONDUPROFILENACIDESGRASETLIMPORTANCEDEMÉTABOLISMEINTRINSÈQUEDESTISSUSDANSLAVARIATIONDE CESACIDESGRASCHEZLEPORCENCROISSANCE. POURAPPORTERDESRÉPONSES, DESMÉTHODESSTATISTIQUES DESCRIPTIVESETPRÉDICTIVESONTÉTÉMISESENŒUVRE. LES RÉSULTATSGRAPHIQUESNOUSONTPERMISDEMETTREEN AVANTCERTAINESSIMILITUDESENTRETISSUSDANSLAVARIATIONDESACIDESGRASÀCHAÎNEMOYENNEETDESACIDESGRAS PALMITIQUEETSTÉARIQUEETDELAFAMILLEDESOMÉGA-6. CELANOUSAPERMISAUSSIDEVISUALISERRAPIDEMENTUNE DISCRIMINATIONDESPORCSSELONLEURRÉGIMEALIMENTAIRE, ETDONCDEPOUVOIRSTATUERQUANTAUSENSDEVARIATION DECESMÊMESACIDESGRASDANSLESDIFFÉRENTSTISSUS ...36

(7)

LECHOIXDELAMÉTHODEDEPRÉDICTIONPARANALYSEDEMOINDRESCARRÉSPARTIELS (PLS2) POURRELIERLES

QUANTITÉS DES ARNMDESGÈNESIMPLIQUÉSDANSLEMÉTABOLISMEDESACIDESAUSEINDECHAQUETISSUÉTAITUNBON CHOIX, CARCESTUNEMÉTHODEQUIPERMETDERAISONNERSURLEPROFILENACIDESGRASSANSSATTACHERAPRIORIÀ CHAQUEACIDEGRAS. ONCONSTATECEPENDANTQUELAVALEURDELAPRÉDICTIONDUPROFILGLOBALENACIDESGRAS

RESTEINSUFFISANTE (R² AUMIEUXÉGALÀ 0,40). ILVAUTDONCMIEUXANALYSERLESACIDESGRASINDIVIDUELLEMENT. ON

PEUTATTEINDRECETOBJECTIFDESÉLECTIONAVECUNPETITNOMBREDEPRÉDICTEURAVECLARÉGRESSION LASSO, ET CECICETTEFOISAVECDETRÈSBONNESVALEURSPRÉDICTIVES (R² DELORDREDE 0,90). PLUSGÉNÉRALEMENT, CES ANALYSESSTATISTIQUESNOUSONTPERMISDECONCLUREQUELESGÈNESQUI INFLUENCENTLAVARIATIONDESACIDESGRAS APPARTIENNENTÀDIFFÉRENTSPROCESSUSBIOLOGIQUESRELIÉSAUMÉTABOLISMELIPIDIQUEETQUEDESPROCESSUSJUSQUE-

SUPPOSÉSANTAGONISME (SYNTHÈSEOUOXYDATION) PARTICIPENTÀPARTÉGALEAUCONTRÔLEDELAPROPORTION RELATIVEDECESACIDESGRAS. ...36 BIBLIOGRAPHIE...37 ANNEXES...38

(8)

LISTE DES ABRÉVIATIONS

ACP Analyse en composantes principales ADN Acide désoxyribonucléique

AFM Analyse factorielle multiple ANOVA Analyse de variance

ARNm Acide ribonucléique messager

CMJR Consommation moyenne journalière résiduelle CPG Chromatographie en phase gazeuse

DAVID Database for Annotation, Visualization and Integrated Discovery HF Régime riche en lipides et en fibres

Ld Muscle longissimus

MSE

Erreur moyenne quadratique

INRA Institut national de la recherche agronomique LASSO Least absolute shrinkage and selection operator LF Régime pauvre en lipides

Panne Tissu adipeux périrénal

PC Composantes principales

PEGASE Unité de recherches sur la Physiologie, Elevage et Génétique pour l’Animal et les Systèmes d’Elevage

PLS Régression des moindres carrés partiels Tasc Tissu adipeux sous-cutané dorsal UMR Unité Mixte de Recherche

VIP Variable Importance in the Projection

(9)

LISTE DES FIGURES

FIGURE 1 : STRUCTURE CHIMIQUE ET NOMENCLATURE DES FAMILLES D’ACIDES GRAS...6 FIGURE 2 : PLAN FACTORIEL À DEUX DIMENSIONS DES INDIVIDUS ET CERCLE DE

CORRÉLATION DES VARIABLES...21 FIGURE 3 : REPRÉSENTATION GRAPHIQUE DES INDIVIDUS (CERCLE DE CORRÉLATION) ET DES VARIABLES (PLAN FACTORIEL) OBTENUE PAR ANALYSE FACTORIELLE MULTIPLE (AFM).

...22 FIGURE 4 : REPRÉSENTATION GRAPHIQUE DES INDIVIDUS ET LES VARIABLES ENTRE TOUS LES TISSUS ET LE SANG PAR AFM HIÉRARCHIQUE (AXE 1 ET AXE 3) DE L’AFM...25 FIGURE 5 : REPRÉSENTATION GRAPHIQUE DU CRITÈRE DE SÉLECTION DES COEFFICIENTS DU MODÈLE POUR L’ACIDE GRAS C16 :0 DANS LES TISSUS ADIPEUX, LE FOIE ET LE MUSCLE LD...32

LISTE DES TABLEAUX

TABLEAU 1: STATISTIQUES DESCRIPTIVES DES TENEURS EN ACIDES GRAS DANS LES QUATRE TISSUS ET LE SANG...12 TABLEAU 2 : PROBABILITÉS DE SIGNIFIANCE POUR LES PROPORTIONS RELATIVES DES ACIDES GRAS DANS LES TISSUS OU LE SANG POUR LES EFFETS RÉGIME ET LIGNÉE...17 TABLEAU 3 : CORRÉLATION ET P. VALUE DES VARIABLES MESURÉES DANS LES TISSUS AVEC LES TROIS PREMIÈRES DIMENSIONS DE L’AFM...23 TABLEAU 4: IMPORTANCE DES VARIABLES DANS LE MODÈLE PLS2 ET PRINCIPAUX

PROCESSUS BIOLOGIQUES REPRÉSENTÉS DANS LES DEUX TISSUS ADIPEUX, LE MUSCLE LD ET LE FOIE...29 TABLEAU 5 : COEFFICIENTS PARTIELS DE MODÈLE DE RÉGRESSION PLS2 SUR LES TISSUS ADIPEUX, MUSCULAIRE ET LE FOIE...30

(10)

TABLEAU 6 : RÉSULTATS DE LA MÉTHODE LASSO DANS LES TISSUS ADIPEUX ET

MUSCULAIRE ET DANS LE FOIE...32 TABLEAU 7 : COEFFICIENTS DE RÉGRESSION (DONNÉES CENTRÉES-RÉDUITES) OBTENUS AVEC LA MÉTHODE LASSO POUR L’ACIDE GRAS C16 :0 DANS LE TISSU ADIPEUX SOUS CUTANÉ (TASC). ...34

(11)

Introduction

La viande de porc représente une grande part de la consommation des produits carnés dans de nombreux pays, et elle est classé numéro 1 dans l’assiette des Français avec 34 kg consommés par an et par personne. La qualité de la viande est primordiale pour de nombreux consommateurs. Son appréciation regroupe plusieurs critères physico-chimiques permettant d’apprécier la valeur d’usage et sa valeur nutritionnelle et l’appréciation sensorielle.

Parmi les différentes viandes, la viande du porc est le second fournisseur des lipides dans l’alimentation humaine. Les lipides contenus dans les tissus porcins ne doivent donc pas être sous-estimés. C’est pourquoi, les recherches liées aux caractéristiques des lipides des produits animaux sont d’actualités. Celles-ci ont trait à l’identification des facteurs déterminant la composition en acides gras des lipides de la viande. Le projet FatInteger (ANR 2012-2015) été mis en place pour clarifier le rôle de la génétique, de l’alimentation et de leurs interactions dans le dépôt des acides gras tissulaire de l’animal au cours de la croissance. En particulier, il s’agit de déterminer les gènes les plus impliqués dans la variation du profil en acides gras dans les tissus du porc.

Pour atteindre ces objectifs, des données ont été acquises quant aux proportions des acides gras dans différents tissus et à l’expression de nombreux gènes de ces tissus. Des analyses exploratoires descriptives peuvent apporter des réponses numériques et/ ou graphiques relatives à la variabilité des acide gras entre les tissus, tandis que des analyses prédictives établiront les gènes les plus impliqués dans le profil en acides gras au sein de chaque tissu.

Ce travail débute par la présentation de l’entreprise et l’objectif du stage. Par la suite, les différentes méthodes statistiques mises en œuvre sont présentées. Puis une partie est dédiée aux résultats des analyses réalisées, avant de conclure.

(12)

I. Contexte et objectifs du stage I.1. Présentation de l’unité d’accueil

L’Unité Mixte de Recherche (UMR) 1348 « Physiologie, Elevage et Génétique pour l’Animal et les Systèmes d’Elevage » (PEGASE) est un établissement public de recherche en agronomie sous tutelle de l’INRA et de l’Agrocampus-Ouest et localisé à Saint-Gilles près de Rennes (Ille-et-Vilaine). L’UMR Pegase mène des travaux de recherches fondamentale sur la physiologie et la génétique d’espèces domestiques élevées pour la production de viande (porcs), de lait (ruminants) ou d’œufs (poules), et contribue à l’évaluation des conditions d’élevage et au développement des systèmes de production durable pour ces espèces. Les questions de recherche adressées par l'UMR PEGASE concernent à la fois des enjeux scientifiques pour une meilleure compréhension des grandes fonctions biologiques du règne animal, et des enjeux socio-économiques liés au bien-être des animaux domestiques, à la compétitivité et à l'impact environnemental des productions animales et à la qualité des produits animaux. Elle est structurée en 7 équipes de recherches s’intéressant, respectivement, aux ressources (alimentaires et génétiques), aux fonctions animales (croissance, lactation et adaptation), et aux systèmes d’élevage.

Mon stage a été réalisé au sein de l’une des équipes de recherches de l’UMR Pegase.

L’équipe « Physiologie et Métabolismes de la Croissance » (CROISSANCE) est composée de 7 chercheurs ou ingénieurs spécialisés en physiologie animale, développement cellulaire et génomique fonctionnelle. Ils mènent des travaux de recherches visant à caractériser les mécanismes de construction de tissus clés pour la production de viande de porc. Les travaux se focalisent notamment sur la plasticité des muscles squelettiques et des tissus adipeux qui sont les constituants principaux de la carcasse commerciale et des produits frais ou transformés que nous consommons. L’objectif à terme est de proposer des outils diagnostiques et des itinéraires techniques permettant d’optimiser l’efficience de la production de viande de porc. En particulier, cette équipe cherche à déterminer les facteurs de variations génétiques ou alimentaires des caractéristiques de ces tissus et à identifier les mécanismes moléculaires sous-jacents. Une des caractéristiques tissulaires importantes à la fois pour la physiologie de l’animal en croissance et pour les qualités technologiques, sensorielles ou diététiques des produits carnés est la composition en acides gras des lipides présents dans les différents tissus de l’animal. Mon travail a consisté à développer des approches statistiques descriptives ou prédictives de la variabilité du profil en acides gras tissulaires chez le porc.

I.2. Problématique et objectifs du stage

(13)

Les acides gras sont des molécules composées d'une chaîne hydrocarbonée linéaire de longueur variable mais toujours composée d’un nombre pair d’atomes de carbone (le plus souvent compris entre 4 et 28), et comportant à chaque extrémité, respectivement un groupement carboxyle (COOH) et un groupement méthyle (CH3). La nomenclature des acides gras a coutume de distinguer trois grandes familles d’acides gras selon le nombre de double- liaison carbone-carbone de leur chaîne carbonée : acides gras saturés si la chaîne carbonée ne comporte aucune double liaison, acides gras mono-insaturés lorsque la chaine carbonée présente une double liaison, et acides gras polyinsaturés lorsque la chaîne carbonée comporte de 2 jusqu’à 6 doubles liaisons (Figure 1)

Figure 1 : Structure chimique et nomenclature des familles d’acides gras.

En biochimie, les différents acides gras sont individuellement désignés par des numéros de la forme C: D dans laquelle C représente le nombre d'atomes de carbone et D le nombre de doubles liaisons. Par exemple, C14 :0 désigne un acide gras saturé (zéro double liaison) à 14 atomes de carbone. Pour les acides gras mono ou polyinsaturés, cette désignation est souvent complétée par une mention de la forme ω-x dans laquelle x symbolise la position de la première double liaison vis-à-vis de l'extrémité – CH3 de la molécule. Parmi les acides gras polyinsaturés, on distingue ceux de la famille des ω-6 et ceux de la famille des ω-3 en fonction de la position des doubles liaisons dans la chaîne carbonée. Ainsi, on notera par exemple,

(14)

C18 :2 ω-6 pour l’acide gras linoléique, composé de 18 atomes de carbones reliés par une chaine comportant de 2 double-liaisons, dont la première est située sur le 6ème atome de carbone en partant de l’extrémité méthyle.

Par leurs propriétés métaboliques et physiques, les acides gras présents dans les cellules conditionnent la qualité technologique et diététique des produits dérivés des tissus animaux. Ainsi, le type d’acides gras présents dans les lipides tissulaires influence le comportement des graisses animales à température ambiante ou lors de la conservation : les gras sont plus mous et plus sensibles au rancissement quand il y a beaucoup d’acides gras polyinsaturés, ce qui modifie la qualité des jambons secs par exemple. La proportion relative des différents acides gras modifie également la valeur nutritionnelle des viandes et des produits transformés : les risques d’athérosclérose, de maladies métaboliques ou d’obésité sont moindres lorsque l’on consomme des lipides plus riches en acides gras polyinsaturés de la famille des oméga-3, mais les acides gras ω-6 ont un effet globalement inverse. Les acides gras saturés ont plutôt pour effet d’augmenter le cholestérol et c’est pourquoi on recommande de ne pas absorber plus de 11 % de ses besoins énergétiques sous forme d'acides gras saturés. On voit donc l’importance de s’intéresser aux facteurs de variation du profil en acides gras dans les tissus animaux.

Les acides gras sont des molécules fondamentales pour la physiologie animale (stock d’énergie cellulaire, précurseurs d’hormones, signaux cellulaires, etc.) et leur métabolisme est complexe. Ils proviennent pour partie des lipides ingérés par l’animal (présents dans les matières premières de son régime), puis déposés après digestion dans les différents tissus.

Certains des acides gras comme le C18 :2ω-6 et le C18 :3 ω-3 sont d’ailleurs qualifiés de

« strictement essentiels » car l’organisme animal ne sait pas les synthétiser et ils doivent donc être impérativement apportés par l’alimentation (les huiles végétales en contenant de grande quantité). Les autres acides gras peuvent être synthétisés par l’organisme animal à partir des glucides alimentaires lorsque l’alimentation n’apporte pas assez de lipides: on parle de synthèse de novo ou lipogenèse d’acides gras à partir du glucose. Quelle que soit leur origine (alimentaire ou endogène) et leur type (essentiels ou non), les acides gras peuvent aussi subir différentes modifications au sein des cellules : allongement de la chaine carbonée, raccourcissement ou désaturation (suppression d’une double liaison). En cas de déficit énergétique transitoire (intervalle entre repas par exemple) ou prolongé, ils peuvent être aussi dégradés en métabolites élémentaires pour produire de l’énergie au sein de ces tissus : on parle d’oxydation des acides gras. Des transferts d’acides gras sont possibles entre tissus, notamment entre le foie (via la sécrétion de lipoprotéines riches en triglycérides dans le sang), les tissus adipeux (via la libération d’acides gras à partir du catabolisme des esters d’acides gras communément appelés triglycérides), et les muscles squelettiques. De multiples facteurs

(15)

extrinsèques (composition en acides gras et en glucides du régime alimentaire) et intrinsèques (métabolismes propres de chaque tissu dépendant de leur équipement enzymatique notamment) peuvent donc modifier la composition en acides gras des tissus musculaires et

adipeux, et par suite la qualité des produits carnés.

Le but du projet auquel j’ai participé était donc de décrire le fonctionnement concerté entre tissus et de quantifier l’importance du métabolisme intrinsèque de ces tissus vis-à-vis de la variation de la composition en acides gras chez le Porc en croissance.

Les données à analyser avaient été générées lors d’un programme expérimental sur le porc en croissance (ANR FatInteger, 2012-2015) au sein de l’équipe d’accueil. Les facteurs considérés comme présumés induire une variation de la composition en acides gras tissulaires étaient le patrimoine génétique de l’animal (comparaison de deux lignées divergentes), le régime reçu pendant 10 semaines au cours de la croissance (deux régimes contrastés quant à la teneur en lipides), et leurs interactions éventuelles.

Les données à expliquer étaient les quantités relatives d’une trentaine d’acides gras mesurées dans 4 tissus (tissu adipeux sous-cutané, tissu adipeux périrénal, foie, et muscle long dorsal),

ainsi que

dans le sang, un fluide qui résume la physiologie tissulaire.

Pour mieux comprendre le comportement des acides gras dans chaque tissu et entre les tissus, nous avons cherché à répondre aux questions suivantes :

a) comment représenter et résumer les similitudes et les différences entre les tissus dans la variation des différents acides gras face aux leviers expérimentaux étudiés ?

b) peut-on expliquer le profil en acides gras de chaque tissu par la physiologie propre à ce tissu, celle-ci étant estimée par les niveaux d’expression d’une centaine de gènes relatifs au métabolisme des lipides ?

c) peut-on établir un petit nombre de prédicteurs moléculaires de la variation des acides essentiels (familles omégas 3 et omégas 6) au sein de chaque tissu ?

Ces trois objectifs feront l’objet d’une présentation détaillée des données, des méthodologies et des résultats de manière successive dans ce rapport. Nous avons notamment mis en œuvre des méthodes statistiques exploratoires descriptives et des approches statistiques prédictives pour répondre aux questions posées.

(16)

II. Présentation des données et des méthodologies d’analyses II.1. Données biologiques

II.1.1 Proportion relative des différents types d’acides gras dans les tissus du porc en croissance

Nous disposons des proportions relatives de différents acides gras mesurées dans quatre tissus de l’organisme : le foie, le muscle longissimus (Ld : muscle situé sur les vertèbres lombaires communément appelé filet ou longe chez le porc), le tissu adipeux sous- cutané dorsal (Tasc communément appelé lard dorsal), et tissu adipeux périrénal (panne ; un exemple de tissu viscéral intra-abdominal, qui permet de fabriquer le saindoux), et dans le sang de porcs de deux lignées génétiques et abattus après 10 semaines d’alimentation expérimentale. Les tissus choisis sont des éléments importants dans la composition corporelle de l’animal (respectivement, gras pour les tissus adipeux, ou maigre pour le muscle) et sont impliqués dans le maintien de l’homéostasie énergétique de l’animal. Les acides gras ont été mesurés après extraction des lipides de chaque tissu ou du sang, puis séparation par chromatographie en phase gazeuse (CPG).

Le jeu de données se présente à l’origine ainsi pour chaque tissu: en ligne, les 48 individus (porcs) considérés, et en colonne, les variables à expliquer qui sont 30 acides gras différents identifiés par leur longueur de chaine, leur degré d’instauration et la position de la(les) doubles liaisons éventuelles sur la chaîne carbonée. Chaque acide gras a une quantité, exprimée en pourcentage relatif des acides gras totaux (g/100). On adjoint dans ce tableau deux variables descriptives concernant les facteurs majeurs supposés explicatifs de la variabilité des données (lignée génétique – 2 niveaux et type d’aliment reçu – 2 niveaux), ainsi qu’une variable « groupe » qui est une combinaison entre les variables lignée et régime.

Les deux facteurs considérés comme sources principales de variabilité du pourcentage relatif d’acides gras dans les tissus ou le sang sont décrits ci-dessous.

Effet lignée (patrimoine génétique) : On compare deux lignées divergentes, que sont les CMJR- : porcs sélectionnés pour présenter une bonne efficacité de conversion de l’aliment en gain de poids ; et les CMJR+ : porcs sélectionnés pour présenter une faible efficacité de conversion de l’aliment en gain de poids.

Effet régime : Deux régimes alimentaires à même teneur en protéine et en énergie métabolique, mais contrastés quant à la source de cette énergie sont comparés.

(17)

• Le régime « HF » est riche en fibres et en lipides et contient entre autres 31% d’amidon (glucide complexe) et 7% de matière grasse (huiles végétales).

• Le régime « LF » est riche en céréales et en glucides et contient 43% d’amidon et 2%

de matière grasse.

De façon à réduire le nombre de données initiales, certains acides gras ont été regroupés selon leur typologie fonctionnelle :

• La première famille ainsi établie est composée de la somme des acides gras saturés à chaîne courte et moyenne (C10:0, C12:0, C14:0). Elle sera notée C<14:0

• La seconde famille est composée des acides gras polyinsaturés de la famille oméga 6 et est obtenue en faisant la somme des acides gras C18:2 ω-6trans, C18:2 ω-6cis, C18:3 ω- 6, C20:3 -6, C20:4 ω-6, C22:4 ω-6 et C22:5 ω-6. Elle sera notée Csn-6.

• La troisième famille est composée des acides gras polyinsaturés de la famille oméga 3 en faisant la somme des acides gras C18:3 ω-3, C20:3 ω-3, C20:4 ω-3, C20:5 ω-3, C22:5 ω- 3, C22:6 ω-3, C18:3 ω-3, et C18:4 ω-3. Elle sera notée Csn-3

• La quatrième famille est composée des acides gras mono-insaturés à très longue chaine : somme des acides gras C22:1 ω-11 et C22:1 ω-9. Elle sera notée C22 :1.

• Tous les autres acides gras sont conservés de manière individuelle.

Cela permet de réduire le jeu de données initiales à 14 entités différentes. (Le tableau 1) résume la répartition moyenne des acides dans les quatre tissus et le sang.

II.1.2 Données moléculaires

Dans chaque tissu, des données moléculaires ont été obtenues par analyse transcriptomique mesurant la quantité d’ARNm de milliers de gènes par la technologie des puces à ADN. Un répertoire spécifique du porc comportant 60 000 sondes constituées de petites séquences d’ADN complémentaires et correspondant à environ 15 000 gènes uniques a été utilisé.

L'ARN messager ou « acide ribonucléique messager » (ARNm) est une copie des régions codantes d'un brin d'ADN (molécule présente dans toutes les cellules vivantes et renfermant les informations nécessaires au développement et au fonctionnement d’un organisme), créé lors de la transcription. L'ARNm est utilisé comme intermédiaire par les cellules pour la synthèse des protéines. Son niveau d’expression dans la cellule est

(18)

élevé, plus le gène est considéré comme exprimé et permettant en théorie la synthèse d’une quantité importante de la protéine fonctionnelle correspondante.

Une extraction des données transcriptomiques initiales a été réalisée en sélectionnant a priori les gènes connus dans la littérature scientifique pour participer au métabolisme des acides gras. Cela a été réalisé en recherchant les gènes identifiés dans les processus biologiques (GO_term ; http://amigo.geneontology.org/amigo/term/) représentant les fonctions suivantes : synthèse de novo des lipides à partir des glucides, élongation des chaines carbonées des acides gras, désaturation, oxydation (dégradation des acides gras en ATP), lipolyse (catabolisme des lipides), et régulation de l’expression des gènes. Nous avons ainsi retenus 140 gènes uniques. Ces gènes peuvent être représentés par une ou plusieurs sondes d’ADN complémentaires dans l’analyse transcriptomique et dont l’expression peut être cohérente ou non. Certains gènes peuvent ne pas être exprimés selon le tissu que l’on considère ou parce qu’ils ne sont pas été correctement annotés sur le répertoire d’ADN complémentaire. De ce fait, nous avons à notre disposition jusqu’à 200 mesures d’expressions géniques par tissu.

(19)

Tableau 1 : Statistiques descriptives des teneurs en acides gras dans les quatre

tissus et le sang.

Tissus Acides gras

Tasc Panne Ld Foie Sang

C14:0

Moyenne

1.13 1.4 1.06 0 0.36

Ecart-type

0.2 0.22 0.24 0 0.16

C14:1

Moyenne

0.03 0.06 0 0.01 0.31

Ecart-type

0.02 0.02 0 0.03 0.23

C15:0

Moyenne

0.07 0.07 0.06 0.14 0.17

Ecart-type

0.01 0.01 0.04 0.06 0.05

C16:0

Moyenne

21.4 23.84 20.76 12.48 14.81

Ecart-type

3.98 4.37 2.5 2.15 3.1

C16:1

Moyenne

1.64 1.53 2.48 0.77 1.03

Ecart-type

0.29 0.43 0.52 0.15 0.3

C18:0

Moyenne

13.55 15.9 12.12 26.4 12.56

Ecart-type

4.04 4.25 3.08 2.59 2.19

C18:1

Moyenne

38.05 31.55 37.28 15.64 27.12

Ecart-type

1.78 1.55 5.26 1.78 2.14

n-6

Moyenne

17.26 16.89 19.05 23.2 33.41

Ecart-type

7.54 8.73 6.36 3.44 4.93

n-3

Moyenne

3.28 3.11 4 .46 6.41 5.93

Ecart-type

1.14 1.86 3.91 1.49 1.95

C20:0

Moyenne

0.47 0.44 0.32 0.04 0.15

Ecart-type

0.52 0.3 0.83 0.28 0.24

C20:1

Moyenne

1.31 0.49 0.77 0.3 0.34

Ecart-type

0.25 0.17 1.01 0.72 0.33

C20:2

Moyenne

1.18 1.05 1.38 1.24 0.84

Ecart-type

0.66 0.45 0.32 1.09 0.75

C22:0

Moyenne

0.54 0.39 0.17 0.19 1.37

Ecart-type

0.28 0.47 0.19 0.4 0.94

C22:1

Moyenne

0.09 0.2 0.07 0.18 1.42

Ecart-type

0.16 0.27 3.88 0.38 0.8

(20)

II.2. Méthodologies statistiques

Des analyses statistiques spécifiques ont été réalisées pour répondre aux trois objectifs fixés et décrits dans l’introduction du rapport. Toutes les analyses ont été réalisées à l’aide du logiciel R.

a) Statistiques descriptives relatives au profil en acides gras tissulaires

Pour identifier les similitudes et les différences de comportements des acides gras selon les tissus, une première phase de description des données est réalisée par ANOVA. Un modèle a été généré avec pour effets principaux les deux facteurs expérimentaux considérés (génotype, régime) et la proportion relative d’un acide gras comme variable à expliquer, ceci pour chaque tissu et pour le sang Le modèle doit donc être itéré autant de fois qu’il y a de variables à expliquer (14 dans notre cas) et pour chaque compartiment (5 dans notre cas). La mise en œuvre de ce modèle a été réalisée en utilisant la fonction (aov) de R, qui se charge d’effectuer la régression et de bâtir un résumé d’analyse de variance. Ensuite, des analyses descriptives multivariées sont mises en œuvre (analyse en composante principale et analyse factorielle multiple).

L'analyse en composantes principales (ACP) est une méthode descriptive qui consiste à remplacer une famille de variables par de nouvelles variables de variance maximale et qui sont des combinaisons linéaires des variables d’origine . Ces nouvelles variables, appelées composantes principales (PC), définissent des plans factoriels qui servent de base à une représentation graphique des variables initiales. L’ACP est donc une méthode qui permet d’explorer la liaison entre les individus et les variables dans un espace de deux dimensions faciles à interpréter. La liaison entre deux variables est mesurée avec le coefficient de corrélation et entre deux individus i et j, leur ressemblance est évaluée à l’aide de la distance :

d (i,j)=

(1)

Cette corrélation est graphiquement appréciable dans le cercle des corrélations pour des variables projetées proches du bord du cercle (donc sans distorsion importante) : deux variables proches l’une de l’autre dans l’espace du cercle de corrélation sont corrélées positivement tandis que deux variables situées à l’opposée pour une même composante sont corrélées négativement.

Nous avons ainsi réalisé une ACP en prenant en compte les mesures des proportions relatives d’acides gras (regroupées par famille biologique, soit 14 variables différentes) dans

(21)

les 4 tissus (Tasc, panne, foie et muscle ld). Pour cela, une interface graphique existe pour réaliser la plupart des opérations courantes: l’interface R Commander ; les éléments nécessaires pour réaliser des analyses en composante principale sont fournis dans le package FactoMineR . Il fournit en sortie les valeurs propres, les cordonnées des vecteurs propres, et les corrélations des composantes principales avec les anciennes variable, ainsi qu’une représentation du cercle de corrélation et du plan principal.

Cette analyse descriptive par ACP a été complétée par une analyse factorielle multiple (AFM). L’AFM est une méthode plus récente (développée notamment à partir des années 80) que l’ACP, et qui permet de traiter de manière plus pragmatique des données issues de tableaux différents en pondérant les jeux de données initiaux. Elle réalise donc d’abord une ACP dans chaque jeu de données puis une super-ACP combinant ces ACP initiales. La pondération utilisée pour chaque jeu de données consiste à diviser le poids initial affecté à chaque variable (ce poids est le même pour toutes les variables) du groupe j par (en notant l’inertie projetée sur le premier axe de l’analyse séparée du groupe j) et la distance entre les individus selon la formule suivante :

L’AFM permet ainsi de mettre en évidence les facteurs communs entre les tissus en considérant comme nouvelles variables des dimensions synthétiques propres à chaque tissu.

Elle est souvent très pertinente lorsque les dimensions de tableaux initiaux sont très différentes. Nous avons ainsi réalisé une AFM en prenant en compte les mesures des proportions relatives d’acides gras (regroupées par famille biologique, soit 14 variables différentes) dans les 4 tissus (Tasc, panne, foie et muscle ld). Nous avons également réalisé une AFM hiérarchique en couplant l’AFM des tissus d’une part, avec le jeu de données des acides gras mesurés dans le sang, d’autre part. Toutes ces AFM ont été réalisées à l’aide de package FactoMineR sous R.

b) Statistiques prédictives du profil global en acides gras au sein de chaque tissue

Pour décrire et déterminer avec quelle précision il est possible de prédire la variation du profil global en acides gras (variation multidimensionnelle) dans un tissu à l’aide de données moléculaires mesurées dans ce tissu, nous avons proposé d’utiliser une régression des moindres carrés partiels de type PLS2 (« Partial Last squares regression »). Cette méthode proposée à l’origine par Wold et al a pour objectif de prédire un ensemble de q variables

(22)

quantitatives par un ensemble de p variables explicatives. Si l’on note Y, la matrice des variable à expliquer de dimension q*n centrées réduites, et X, la matrice des variables explicatives de dimension p*m centrées réduites, la régression PLS2 va maximiser la variance des prédicteurs et la corrélation entre X et la variable à expliquer =Y. Le principe est donc de rechercher un modèle de régression linéaire sur un ensemble de composantes orthogonales construit à partir de combinaisons linéaires des p variables explicatives centrées.

La validation croisée permet de déterminer le nombre de composantes « » suffisamment grand pour expliquer l’essentiel de la variance des . L’influence relative de chaque variable explicative dans le modèle peut être exprimée comme l’importance de la variable dans la projection : ce sont les Variable Importance in the Projection ou VIP. Les variables ayant un fort VIP (>0.8) sont considérées comme les plus importantes dans la construction de Y.

Nous avons privilégié cette analyse par régression PLS2 à une régression linéaire multiple de manière à expliquer la modification du profil global en acides gras mais sans s’attacher de manière spécifique à un type d’acides gras particulier. Cela permet aussi de s’affranchir du problème posé par le fait que le nombre d’observations dans un tissu (14 acides gras par individu) était inférieur au nombre de variables explicatives (jusqu’à 200 mesures transcriptomiques par individu) dans ce tissu.

Des analyses de type PLS2 ont donc été successivement réalisées pour le, tasc, la panne, pour le muscle ld et pour le foie. Pour cela, nous avons utilisé le package « plsr » qui permet de construire des composantes qui expliquent le maximum de variance des prédicteurs X tout en tenant comptes des variables réponses Y.

Pour chaque tissu, nous avons ensuite identifié les processus biologiques les représentés au sein des variables (ARNm) présentant un VIP > 0,8. Pour cela, nous avons utilisé un outil en ligne qui adjoint à chaque gène un (des) termes d’ontologies (GOBP_term) caractérisant les processus biologiques dans lesquels il est impliqué et regroupant ensuite automatiquement les processus biologiques les plus partagés entre les gènes de la liste. Cette étape est réalisée de manière quasi-automatique à l’aide de l’outil web DAVID (The Database for Annotation, Visualization and Integrated Discovery, v6.7 ; http://david.abcc.ncifcrf.gov/) en sélectionnant l’onglet BP_Fat (biological process).

c) Identification d’un petit nombre de prédicteurs des acides gras majoritaires

(23)

Pour compléter les analyses PLS, nous avons cherché à identifier un petit nombre de prédicteurs moléculaires de certains acides gras majoritaires dans les tissus. En effet, la méthode PLS2 prédit généralement avec de bonnes performances, la variation globale des données ; mais elle ne permet pas simplement d’identifier les meilleurs prédicteurs d’un acide gras donné. La méthode appelée Least Absolute Shrinkage and Selection Operator (LASSO) a été proposée par Tibshirani et al comme une technique pour l'estimation et la sélection de modèles en régression linéaire. C’est une régression pénalisée, c’est à dire qu’elle minimise la somme des carrés des écarts (comme une régression classique) tout en contrôlant la valeur globale des paramètres (on contraint l’estimation à ne pas proposer de gros coefficients ce qui entraine l’élimination de certaines variables. Si on considère ,

, ……, un ensemble de prédicteurs et Y la variable réponse, la méthode LASSO estime alors un modèle

(1)

Comme la solution du problème

(2)

Sous la contrainte

(3)

Où et est un paramètre de réglage. est la solution.

Nous avons appliqué cette méthode pour définir des prédicteurs moléculaires de 4 types d’acides gras spécifiques: le C16:0, le C18 :1, le C18 :2, la famille Csn-6 et la famille Csn-3, au sein de chacun des quatre tissus. Pour cette méthode, il faut donc définir au préalable le paramètre de réglage pour chaque acide gras et chaque tissu. Nous avons utilisé le package

« glmnet » pour optimiser cette définition en minimisant l’erreur (mean square error ou MSE) ; pour obtenir le paramètre de réglage lambda, on utilise la méthode de Cross-validation sous R à l’aide de package cv.glmnet. Un graphique permet de représenter les valeurs possibles de ce paramètre afin de définir un compromis acceptable entre biais et variance.

III. Résultats

III.1. Effets respectifs du régime alimentaire et de la lignée

génétique sur les proportions relatives des acides gras tissulaires

ou du sang

(24)

Nous disposons des données (pourcentage relatif de chaque acide gras) pour 48 porcs classés en fonction de leur régime et de leur lignée (n = 12 individus par lignée et par régime).

Les proportions relatives (en % des acides gras totaux identifiés) de chaque acide gras (ou de son regroupement familial) dans chaque tissu et dans le sang s’avèrent majoritairement influencées par le régime alimentaire reçu pendant les 10 semaines précédant le prélèvement des tissus de l’animal (Tableau 2)

Un tableau de ce type, bien que complet, ne permet pas de déduire rapidement des similitudes ou des différences de comportement des acides gras face au régime alimentaire notamment, selon les différents compartiments où ils ont été mesurés (tissus ou sang). C’est pourquoi nous nous sommes tournés vers une analyse descriptive multivariée associée à une représentation graphique.

Tableau 2 : Probabilités de signifiance pour les proportions relatives des acides gras

dans les tissus ou le sang pour les effets régime et lignée

.

Tissus Acides gras

p-value Tasc

p-value Panne

p-value Ld

p-value Foie

p-value Sang C<=14:0 :

Effet lignée 0.0058 0.534 0.63709 0.946 0.9277

(25)

Effet régime 1.13E-14 1.44E-11 0.000149 2.61E-06 0.0719 C14:1 :

Effet lignée 0.292 0.123 NA 0.967 0.976

Effet régime 0.773 0.155 NA 0.264 0.793

C15:0 :

Effet lignée 0.0209 0.102 0.16 0.19666 0.507

Effet régime 0.0334 0.148 0.353 0.00811 1.57E-08

C16:0 :

Effet lignée 0.173 0.6644 0.936669 2.55E-05 0.5414

Effet régime <2e-16 <2e-16 0.000131 2.23E-08 0.0197

C16:1 :

Effet lignée 0.048 0.466 0.4139 0.891 0.681

Effet régime 0.0033 1.58E-10 6.96E-08 2.47E-05 1.93E-09

C18:0 :

Effet lignée 0.195 0.58 0.912 7.92E-01 0.6775

Effet régime <2e-16 <2e-16 4.31E-05 1.96E-02 0.0012

C18:1 :

Effet lignée 0.007 0.737 0.7314 0.4667 0.0329

Effet régime 0.0777 0.0202 0.00225 8.68E-01 0.0119

Csn-6 :

Effet lignée 0.984 0.64 0.838 0.319 0.424261

Effet régime <2e-16 <2e-16 1.71E-13 2.10E-11 0.000514

Csn-3 :

Effet lignée 0.361 2.18E-07 0.534 0.512 0.191

Effet régime 6.84E-10 0.209 0.59 0.907 0.163

C20:0 :

Effet lignée 0.723 0.66838 0.6712 0.323 0.413

Effet régime 0.922 0.00696 5.16E-01 3.23E-01 0.772

C20:1 :

Effet lignée 0.6836 0.0471 0.533 4.79E-01 0.7786

Effet régime 0.0168 0.1758 0.218 0.695 0.0428

C20:2 :

Effet lignée 0.90738 0.730069 0.5318 0.3099 0.96

Effet régime 0.00102 0.000144 0.0287 0.0179 0.537

C22:0 :

Effet lignée 0.912 0.5744 0.6639 0.7242 0.862

Effet régime 0.678 0.0978 0.0461 0.0248 0.123

C22:1 :

Effet lignée 0.0996 0.4265 0.241 0.266 0.434

Effet régime 0.5009 0.0777 0.414 0.687 0.778

P-value : valeur de la probabilité du test de Fisher pour les effets principaux du régime, de la lignée génétique ou de leur interaction.

.

III.2. Identification des similitudes ou spécificités dans les variations des profils en acides gras selon les tissus

Une première analyse en composante principale (ACP) est réalisée en considérant les acides gras dans les quatre tissus « Tasc, panne, ld, foie» où ils ont été mesurés, et ceci pour

(26)

les 48 individus, de manière à mettre en évidence des groupes de variables et à visualiser les relations qui peuvent exister entre ces variables (Figure 2).

Les deux premiers axes de l’ACP représentent 36,92 % de la variabilité globale (respectivement, 27,89 % pour l’axe1 et: 9,03 % pour l’axe2).Le troisième axe représente 7,3%

de la variabilité globale (données non présentées).

Le premier axe oppose les individus en fonction de leur régime alimentaire : à gauche, les porcs qui ont reçu un régime riche en lipides (HF) et à droite, les porcs ayant reçu un régime riche en glucides et pauvre en lipides (LF). Il n’y a pas de discrimination claire selon le génotype animal sur ces deux axes (Figure 2) ni sur l’axe 3 (données non présentées). Cette analyse confirme donc que la source principale de variation des profils en acides gras dans les tissus du porc en croissance est la composition de leurs régimes alimentaires.

Sur le premier axe du cercle de corrélation, les acides gras polyinsaturés de la famille oméga-6 dans la panne, le tasc, le muscle ld ou le foie sont fortement et négativement corrélés avec le premier facteur (coefficient de corrélation supérieur à 0. 83 en valeur absolue). Cela signifie qu’il existe une réponse similaire des acides gras de la famille oméga-6 dans ces 4 tissus, et que leur proportion est globalement supérieure en régime HF comparativement au régime LF. Les acides gras saturés (C<14 :0, C16:0 et C18:0) et mono-insaturés (C16:1) sont fortement et positivement corrélés à la première composante dans les tissus adipeux (tasc et panne). Ils sont donc présents en plus forte proportion dans les tissus adipeux des porcs ayant reçu le régime riche en céréales (LF). Ces mêmes acides gras répondent de manière globalement similaire aux régimes dans le muscle et dans le foie, même si le C18 :0 semble se comporter de manière plus spécifique dans le muscle. Les acides gras C18 :1 dans les différents tissus participeraient de manière moins prépondérante à la variation alimentaire du profil global en acides gras; cependant, ils sont relativement mal représentés dans cette projection à l’exception du C18 :1 dans le muscle. On n’identifie pas de similitude entre tissus quant à la variation des acides gras polyinsaturés de la famille oméga-3 : dans le Tasc, la proportion des acides gras oméga-3 est plus élevée en régime HF, mais cette proportion dans les autres tissus (panne, foie et muscle) ne contribue pas significativement à la variation globale en réponse aux régimes. Pour le muscle, la proportion des acides gras de la famille oméga-3 est bien représentée sur l’axe 2 (coefficient de correction égale à 0.81 en valeur absolue), ce qui signifie qu’elle est globalement peu corrélée à la proportion des autres acides gras dans ce tissu.

Sur l’axe 3, seuls les acides gras C15 :0 dans le foie et le muscle longissimus sont fortement corrélés (données non présentées).

(27)

Pour compléter cette analyse, nous avons également réalisé une analyse factorielle multiple (AFM). Cette analyse présente l’avantage théorique de prendre en compte (pondérer) les différents tableaux de variables avant de réaliser une super ACP.

Les données relatives aux proportions d’acides gras mesurés dans quatre tissus (Tasc et panne : tissus adipeux, foie et muscle longissimus) ont été considérés. L’AFM projet les dimensions synthétiques de chaque tissu dans une même nouvelle représentation graphique.

L’AFM sur les quatre tissus confirme la forte discrimination entre individus selon le régime alimentaire, avec à droite les porcs qui ont reçu le régime « LF » et à gauche les individus qui ont reçu un régime « HF » (Figure 3). Le graphe des axes partiels représente la relation entre les facteurs de l'AFM et les facteurs des ACP réalisées au sein de chaque tissu. On constate que le premier facteur de l’AFM est très lié à la première dimension de chaque tissu, ce qui signifie que ces dimensions sont fortement corrélées entre elles et participent de façon importante et conjointes à la discrimination entre régimes. Afin d’analyser plus finement ces relations, il est nécessaire d’examiner les variables qui contribuent significativement à la composante 1 de l’AFM (Tableau 3).

(28)

Figure 2 : Plan factoriel à deux dimensions des individus et cercle de corrélation des variables.

Les individus sont représentés selon un code rapportant leur régime (LF : riche en glucides et pauvre en lipides ou HF : riche en lipides et pauvre en glucides) et leur lignée génétique (CMJR- : efficace dans la conversion alimentaire en gain de poids ; CMJR+ : peu efficace).

Les variables sont les proportions relatives des acides gras dans les tissus identifiés par une lettre (l : muscle ld; p : panne ; t : Tasc, f : foie).

Master 2 MSAD Aldja AGUERSIF

(29)

Figure 3 : Représentation graphique des individus (cercle de corrélation) et des variables (plan factoriel) obtenue par analyse factorielle

multiple (AFM).

Les individus sont représentés selon un code rapportant leur régime (LF : riche en céréales et pauvre en lipides ou HF : riche en lipides et pauvre en céréales) et leur lignée génétique (CMJR- : efficace dans la conversion alimentaire en gain de poids ; CMJR+: peu efficace). Les axe 1 et axe 2 de l’AFM sont présentées.

(30)

Le Tableau 3 indique que cette première composante est une combinaison linéaire des acides gras C16 :0, C16 :1, C18 :0, et C<14 :0 de tous les tissus d’une part (coefficient supérieur à 0.60) et des acides gras de la famille n-6 de ces mêmes tissus (coefficient de corrélation entre -0,83 et -0,95) plus des acides gras oméga-3 dans le Tasc uniquement. Cette analyse confirme donc très largement les conclusions que l’on tirait d’une ACP réalisée sans pondération préalable des tableaux d’origine. Les acides gras de type C18 :1 dans tous les tissus contribuent cependant plus fortement à la dimension 2 de l’AFM (à l’exception du C18 :1 dans le muscle qui présente une forte corrélation aussi à l’axe 1), indiquant peu ou pas de relations entre ces acides gras et les acides gras C18 :0, C16 :0 ou C16 :1.

Tableau 3 : Corrélation et p. value des variables mesurées dans les tissus avec les

trois premières dimensions de l’AFM

.

Les préfixes t, p, f et l’indiquent le tableau d’origine de chaque variable, respectivement Tasc, panne, foie et muscle longissimus

Pour tous les tissus les acides gras le p.value<0.001.

Dimension 1 Dimension 2 Dimension 3

corrél

ation corrélation corrélation

tC16.0 0.948 lC18.1 0.712 fC15.0 0.640

tC16.1 0.947 lC16.0 0.633 lC15.0 0.629

pC16.0 0.941 lC15.0 0.520 pC20.1 0.553

pC18.0 0.933 fC18.1 0.519 pC20.0 0.467

tC18.0 0.932 tC18.1 0.485 pC14.1 0.459

p<C14.0 0.865 tC20.0 0.408 lC20.1.n.9 0.419

t<C14.0 0.842 lC16.1 0.401 lC22.1 0.404

pC16.1 0.772 pC18.1 0.377 fC20.1.n.9 0.318

lC16.1 0.769 t<C14.0 -0.356 fC16.1 0.303

f<C14.0 0.742 tC15.0 -0.365 tC15.0 0.296

fC16.0 0.689 tC20.1 -0.366 pC16.1 -0.327

fC16.1 0.658 fC20.2 -0.389 fsn.3 -0.332

l<C14.0 0.656 lC18.0 -0.765 fC16.0 -0.340

lC16.0 0.654 lsn.3 -0.881 tC14.1 -0.352

lC18.1 0.530 psn.3 -0.357

tsn.3 -0.747 pC18.1 -0.388

fsn.6 -0.830 fC22.1 -0.453

lsn.6 -0.863 tC18.1 -0.463

tsn.6 -0.951 lC20.0 -0.580

psn.6 -0.954

(31)

Pour finir, nous avons réalisé une AFM hiérarchique considérant les tissus d’une part et le sang d’autre part, afin de déterminer si la proportion des acides gras dans le sang était en relation avec la proportion des acides gras dans les tissus ou plus reliés à un tissu particulier. Les résultats sont présentés en Figure 4.

D’après le plan factoriel constitué de l’axe 1 (24,32% de la variabilité globale)et de l’axe 3 (6.03% de la variabilité), on constate que la première composante des tissus et la première composante du sang sont fortement associées, alors que les autres composantes ne sont pas corrélées entre tissus et sang (acides gras de la famille oméga 6 et acides gras C16 :0, C16 :1, C18 :0 et C<14 :0).

(32)

Figure 4 : Représentation graphique des individus et les variables entre tous les tissus et le sang par AFM hiérarchique (axe 1 et axe 3) de l’AFM

Master 2 MSAD Aldja AGUERSIF

(33)

III.3. Bilan des analyses descriptives

Les analyses ACP et AFM apportent globalement des informations similaires et interprétables graphiquement. Dans notre cas, l’AFM apporte donc peu de bénéfices par rapport à une analyse classique de type ACP, vraisemblablement parce que les tableaux d’origine des données sont de même taille (48 individus x 14 acides gras), ce qui n’est pas le cas lorsque des données hétérogènes, dont certaines sont potentiellement manquantes, sont présentes dans les tableaux d’origine. Ces analyses descriptives par ACP et par AFM nous permettent de mettre en évidence de fortes similitudes dans la réponse tissulaire pour les acides gras polyinsaturés de la famille oméga-6 (plus élevés en régime HF) et pour les acides gras saturés et mono-insaturés (plus élevés en régime LF), à l’exception de l’acide gras saturé C15 :0 dont la proportion est peu variable et de l’acide gras C18 :1 qui varie surtout dans le muscle. Elles permettent aussi de dégager une forte spécificité des acides gras oméga-3 relativement aux autres acides gras et selon les tissus.

Biologiquement, l’acide gras C16 :0 est le premier acide gras néo-synthétisé à partir des glucides lorsque l’animal ne trouve pas assez de lipides dans son alimentation pour ses besoins; il peut ensuite être dé-saturé en C16 :1 ou allongé en C18 : 0. Il est donc logique de trouver une forte corrélation dans les variations des proportions des acides gras C16 :0, C16 :1 et C18 :0 dans les différents tissus, et une proportion plus élevée de ces acides gras lorsque les porcs sont nourris avec le régime LF riche en glucides. Les résultats sont plus étonnants pour ce qui concerne la spécificité du C18 :1 qui dérive habituellement d’une désaturation de l’acide gras C18 :0. On aurait donc pu s’attendre à une variation corrélée de ces deux acides gras, mais ceux-ci contribuent ici à deux dimensions orthogonales dans l’AFM. A l’inverse, les acides gras C18 :3 (famille des oméga-3) et C18 :2 (famille des oméga-6) sont des acides gras dits essentiels, c’est-à-dire que l’organisme animal ne sait pas les synthétiser et doit donc les trouver dans son alimentation. Il est alors logique de trouver une proportion supérieure des acides gras de la famille des oméga-6 dans tous les tissus des porcs ayant reçu un régime riche en lipides, car les huiles utilisées dans la formule de ce régime (soja et colza) étaient elles-mêmes riches en C18 :2 et C18 :3. En revanche, le comportement des C18 :3 ne peut être expliqué de manière triviale et laisse supposer de fortes spécificités métaboliques dans les différents tissus.

Enfin, le sang est un bon reflet des proportions tissulaires pour les acides gras C<14 :0, C16 :0, C16 :1, C18 :0 et acides gras de la famille n-6. Nous interprétons cette situation par le fait que le sang résume les informations des acides gras ayant des comportements similaires dans tous les tissus face aux leviers expérimentaux (ici le régime), soit parce qu’ils sont libérés

(34)

être libérés des tissus pour servir d’autres tissus (cas des acides gras C16 :0 et C18 :0). Le sang pourrait donc constituer un compartiment peu invasif (possibilité de le prélever par prise de sang sans abattre l’animal) pour estimer le profil de ces acides gras dans les tissus. A l’inverse, la proportion des acides gras oméga-3 dans le sang est largement indépendante de celle présente dans les tissus, ce qui limite son utilisation par rapport à cette famille d’acides gras essentiels et renforce l’hypothèse de spécificités dans les tissus quant à leur métabolisme.

C’est pourquoi nous avons ensuite effectué des analyses permettant de déterminer si les relations entre caractéristiques métaboliques tissulaires et profil en acides gras.

III.4. Analyses prédictives par PLS2

Choix de nombre de composante et le degré d’explication des variables dans les tissus et le muscle adipeux

L’intérêt principal de cette méthode réside dans sa capacité à prendre en compte des données de grande dimension avec un nombre de variables (plusieurs centaines de sondes moléculaires dans notre cas) largement supérieur au nombre d’individus dont le profil tissulaire est à prédire. La PLS2 en version régression cherche ainsi à modéliser un ensemble de q variables par un ensemble de p variables explicatives quantitatives .

Successivement pour chaque tissu, nous avons réalisé une analyse PLS2 avec en variables prédictives les quantités d’ARNm des gènes connus a priori pour coder des protéines impliquées dans le métabolisme des acides gras (terme d’ontologie génique : lipide métabolisme) et en variable à prédire le profil en acides gras exprimé par la proportion relative des 14 acides gras ou familles d’acides gras.

o Choix de nombre de composantes

Le critère à optimiser est la somme des carrés des covariances entre une composante et chacune des variables réponses. Pour choisir le nombre de composantes à retenir pour prédire le profil en acides gras de chaque tissu, nous avons donc considéré la racine carrée de l’écart quadratique moyen de prédiction (RMSEP = ); nous retenons les composantes pour lesquelles le RMSEP est le minimum pour la plupart des variables.

Références

Documents relatifs

Via acyl CoA synthétase dans la membrane externe des mitochondries qui capte les acides gras et les lie aux CoA après activation de l’acide gras par l’ATP.. Les acides gras

 Les corps cétoniques sont des composés hydrosolubles à potentiel énergétique, produits de façon normale lors du catabolisme des acides gras et certains acides aminés dans

En revanche, le changement du type de céréales associé à la graine de lin ne semble pas avoir eu d’effet majeur sur la composition en acides gras du muscle, notamment sur les teneurs

Pour le dactyle, l’hydrogénation des acides linoléique et linolénique a été plus forte avec l’herbe verte et l’ensilage qu’avec le foin (P&lt;0,01).. Pour le

Les acides gras polyin- saturés jouent donc un rôle important non seulement dans la mise en place des processus inflammatoires, dans une première phase, mais également dans leur

À la suite de la lecture de ces documents quel aliment estimez vous souhaitable de rajouter sur votre « liste de courses » pour la semaine prochaine.. Il semble que

Pour les prélèvements du matin la concentration en acides gras libres est plus élevée surtout avec les vaches normales et elle varie plus, d’une semaine de lactation

un régime carencé en lipides, leur production laitière, leur taux butyreux et leur sécrétion journalière de matières grasses sont significativement inférieurs à