• Aucun résultat trouvé

PARTIE I : Méthodologies statistiques pour l'analyse de la performance

CHAPITRE 5 : META-ANALYSE DE LA PERFORMANCE

2.2 Variables intra-étude

2.2.1

Description des variables

L’âge, le sexe, le niveau d’expérience en analyse sensorielle et le niveau d’éducation sont quatre variables qui caractérisent le panéliste et dont nous souhaitons mesurer l’impact sur les niveaux de performances. Les informations sur le niveau d’expérience en analyse sensorielle et le niveau d’éducation ont été renseignées par moins d’un tiers des fournisseurs et représentent seulement 15% des études (tableau 5-1). Bien que l’âge et le sexe soient des variables que les fournisseurs doivent obligatoirement renseigner, quelques études ne comportant pas ces informations ont exceptionnellement été acceptées dans la SensoBase. La variable "type de descripteur" a également été incluse dans les analyses, bien qu’elle ne soit pas panéliste dépendante.

Tableau 5-1 : Nombre de jeux de données et de fournisseurs selon la variable analysée

2.2.1.1 Unité expérimentale

L’objectif de ce travail est d’apporter de la connaissance sur les variables qui pourraient avoir un impact sur le niveau de performance des panélistes. Par conséquent, l’unité expérimentale devrait être le panéliste. Cependant, certains sujets ont participé à plusieurs études sensorielles, donc leur âge et leur niveau d’expérience peut évoluer entre les études. L’unité expérimentale correspond alors au panéliste à un temps de mesure (i.e. une étude sensorielle). Cela signifie qu’une personne contribuera à un nombre de degrés de liberté égal à son nombre de participations à une étude sensorielle. Cette définition de l’unité expérimentale a également été retenue parce que les conditions d’entraînement et la variabilité des produits changent d’une étude à l’autre. Il est donc préférable de ne pas moyenner des indices de performances issus de différentes études pour un panéliste donné. Par conséquent, cette unité expérimentale sera également considérée lors de l’analyse de l’effet du sexe et du niveau d’éducation, bien que leur niveau ne varie pas entre les études pour chaque sujet. La variable "type de descripteur" occupe un statut particulier puisque son niveau (apparence, texture, saveur…) n’est pas le même pour tous les descripteurs d’un profil sensoriel. Dans ces conditions, l’unité expérimentale est le panéliste dans une étude pour chaque type de descripteur. Par rapport aux autres variables analysées dans ce chapitre, ce changement revient à multiplier le nombre de degrés de liberté par le nombre moyen de catégories de descripteurs.

2.2.1.2 Age

L’âge des panélistes varie entre 16 et 81 ans. La distribution des niveaux de cette variable, présentée dans la figure 5-2 montre que la majorité des personnes ont un âge compris entre 35 et 55 ans. Les personnes âgées de 20 à 25 ans sont cependant très représentées. Ce phénomène s’explique par le fait que certaines études ont été réalisées avec une majorité d’étudiants. L’analyse de l’effet de l’âge est réalisée en constituant trois groupes de panélistes : les sujets de moins de 30 ans (30-), les sujets entre 30 et 45 ans (30-45) et les sujets de plus de 45 ans (45+). Les effectifs de chaque classe sont respectivement 586, 1202 et 1886.

Figure 5-2 : Distribution des panélistes en fonction de l’âge

2.2.1.3 Sexe

Les hommes et les femmes ne sont pas représentés de manière équilibrée dans les données. Seulement 23,3% des panélistes sont des hommes. La distribution du pourcentage d’hommes dans chaque étude est présentée dans la figure 5-3. Elle met en évidence un nombre important d’études (plus de 100) dans lesquelles les panélistes sont uniquement des femmes (première barre de la distribution = 0% d’homme). Lors de l’analyse de l’effet du sexe, ces études ne seront pas prises en compte parce qu’elles n’apportent aucune information sur la comparaison entre les hommes et les femmes. Les sujets féminins seront codés F et les sujets masculins M dans les analyses.

2.2.1.4 Niveau d’expérience

Le niveau d’expérience est codé en trois catégories: “EXP 0” pour les panélistes qui participent à la réalisation d’un profil sensoriel pour la première fois, “EXP 1-3” pour les panélistes ayant entre 1 et 3 ans d’expérience et “EXP 3+“ pour les personnes plus expérimentées. Ces catégories, regroupant respectivement 278, 180 et 228 sujets, ont été déterminées ainsi afin d’obtenir des effectifs suffisamment importants et relativement équilibrés selon les classes.

2.2.1.5 Niveau d’éducation

Le niveau d’éducation est directement codé par les fournisseurs de données selon trois catégories: éducation primaire (avant le collège), éducation secondaire (collège et lycée) et éducation supérieur (après le baccalauréat). Puisque la première catégorie ne concerne que 9 panélistes de la SensoBase, les données correspondantes sont exclues de l’analyse. La seconde catégorie, appelée “Bac-”, représente 123 individus et la troisième catégorie, appelée "Bac+”, rassemble 284 panélistes.

2.2.1.6 Type de descripteur

Les descripteurs sont classés en cinq catégories : apparence (couleur, forme…), texture (croquant, granuleux…), saveur (sucré, salé, acide, amer), odeur (fraise, caramel…) et arôme (lorsque le produit est mis en bouche). La figure 5-4 montre que les descripteurs visuels sont moins représentés que les autres, donc moins utilisés dans les données. Il est important de noter que chaque catégorie n’est pas représentée dans chaque étude. Certains profils peuvent avoir été réalisés avec deux catégories de descripteurs seulement. Cet aspect peut avoir un impact lors de la comparaison des types de descripteurs.

Figure 5-4 : Distribution des types de descripteurs

2.2.2

Indices de performance

En analyse sensorielle, la notion de performance est généralement scindée en trois aspects : la répétabilité, la discrimination et l’accord (ISO, 1993). Un indice de performance, calculé pour

chaque sujet et chaque descripteur, a donc été choisi pour chaque aspect de la performance. Deux de ces indices sont basés sur un modèle d’ANOVA au niveau individuel, réalisé pour chaque descripteur :

erreur

produit

Score= +

(13)

- L’indice de répétabilité, noté ETres, est la racine carrée de la variance de l’erreur issue du modèle (13). Cela représente l’écart-type moyen entre les répétitions pour chaque produit. Un indice faible indique que les notes des répétitions d’un produit étaient très proches, donc que le niveau de répétabilité est élevé. Afin d’obtenir des valeurs comparables d’une étude sensorielle à l’autre, toutes les notes sont transposées sur des échelles bornées entre 0 et 10.

- L’indice de discrimination, rCMprod, correspond au rapport du carré moyen de l’effet produit sur la somme des carrés moyens de l’erreur et de l’effet produit (Fisher, 1946):

erreur prod prod CMprod

CM

CM

CM

r

+

=

(14)

Comparé à la statistique de Fisher de l’effet produit, Fprod, égale au rapport CMprod/CMerreur, l’indice rCMprod n’est pas sensible aux très faibles valeurs du carré moyen de l’erreur. En effet, la valeur de Fprod peut être très élevée dès lors que CMerreur est très faible. Dans le cas particulier où CMerreur=0, la statistique de Fisher de l’effet produit ne peut pas être calculée alors que l’indice proposé atteint la valeur maximale de 1.

- L’indice d’accord est le coefficient de corrélation de Pearson, entre les notes des produits d’un sujet et la moyenne des notes des produits des autres panélistes. Une valeur élevée de cet indice indique que le panéliste est en accord avec le groupe.

La performance de chaque sujet est donc caractérisée par un indice de répétabilité, un indice de discrimination et un indice d’accord pour chaque descripteur de chaque profil. Etant donné que l’unité expérimentale est le panéliste au sein d’un profil, les données analysées correspondent à la moyenne des indices de performance sur l’ensemble des descripteurs. Lorsque l’analyse porte sur le type de descripteur, les indices sont moyennés par type de descripteur.

2.2.3

Modèle d’analyse

Avant d’analyser l’effet de chaque variable, les niveaux moyens des trois indices de performance sont calculés afin d’obtenir des niveaux généraux de référence. Le même type d’analyse est ensuite exécuté pour chacun des trois indices et pour chaque variable (âge, sexe, niveau d’expérience, niveau d’éducation et type de descripteur). Le modèle d’ANOVA utilisé est:

Où "profil" (effet aléatoire) représente le niveau moyen propre à chaque profil sensoriel, "variable" le niveau moyen de chaque catégorie de la variable d’intérêt, et "profil*variable" l’interaction entre les deux effets principaux.

Il est important de noter que le nombre de panélistes n’est pas obligatoirement équilibré entre les catégories d’une variable dans chaque profil sensoriel. Par exemple, un panel peut être constitué de 11 femmes et d’un seul homme. Dans ces conditions, l’estimation de l’effet de la variable (sexe, dans le cas présent) peut être biaisée. En effet, lorsque la catégorie faiblement représentée dans une étude atteint un niveau inhabituel (élevé ou faible) par rapport aux autres études incluses dans les calculs, l’écart entre les catégories est anormalement élevé pour l’ensemble des panélistes du groupe (i.e. les 12 sujets). Afin d’éviter ce problème, la répartition des effectifs selon les catégories est prise en compte en affectant la pondération suivante à chaque unité expérimentale :

catégorie

par

moyen

effectif

catégorie

une

dans

observé

nimum

mi

effectif

w

i

=

(16)

Un exemple de calcul des poids, wi, est présenté dans la figure 5-5:

Figure 5-5 : Exemple de calcul des poids affectés aux panélistes d’une étude

Le poids affecté à chaque panéliste d’un profil est égal à 1 lorsque le nombre de sujets de cette étude est parfaitement équilibré entre les catégories (profil 1, figure 5-5). Le poids total de ce profil est alors égal au nombre de panélistes de l’étude. Au contraire, lorsqu’une catégorie est faiblement représentée, le poids affecté à chaque sujet est diminué (profils 2 et 3). Le poids total du profil est alors égal au nombre de panélistes présents dans la catégorie peu représentée multipliée par le nombre de catégories. Si une catégorie n’est représentée par aucun sujet, les calculs sont effectués en considérant que le nombre de catégories est moins élevé pour cette étude (profil 4 de la figure 5-5). Lorsqu’une seule catégorie est représentée, le profil est exclu de l’analyse.

L’analyse de chaque variable se termine par un test de comparaison multiple entre les moyennes des catégories afin de mettre en évidence les différences entre les niveaux.

Les effets des variables âge, sexe, niveau d’éducation et niveau d’entraînement sont également testés en fonction du type de descripteur en utilisant le modèle suivant :

Indice de performance = Profil + Variable + TypeDescr + (17)

Profil*Variable + Profil *TypeDescr +Variable*TypeDescr

L’unité expérimentale est alors le panéliste pour chaque type de descripteur lors d’un profil sensoriel. “Variable” représente l’effet d’une des quatre variables individuelles (âge, sexe…), “Profil”, l’effet lié à chaque étude et "TypeDescr", l’effet du type de descripteur. Lorsque l’interaction "Variable*TypeDescr" est significative, cela signifie que l’effet de la variable est différent d’un type de descripteur à l’autre. Dans ce cas, l’analyse de cette variable sera également effectuée par type de descripteur.

Les analyses ont donné lieu à la création d’un programme SAS® permettant d’automatiser les calculs pour chaque variable. Les calculs reposent essentiellement sur l’utilisation de la procédure GLM avec l’ordre WEIGHT.