• Aucun résultat trouvé

Modèle mixte : choix de la structure de corrélation

PARTIE I : Méthodologies statistiques pour l'analyse de la performance

CHAPITRE 4 : EVOLUTION DE LA PERFORMANCE AU COURS DU TEMPS

3.2 Seconde étude

3.2.1 Modèle mixte : choix de la structure de corrélation

Pour chaque descripteur, les modèles mixtes correspondants aux quatre structures de covariances (ID, CS, RCL, RCQ) sont calculés. Le choix de la structure de covariance est effectué, soit en fonction des résultats des tests de modèles emboîtés(à l’aide de l’arbre de décision de la figure 4-3), soit en fonction du critère AIC. Les résultats complets sont disponibles en annexe 6. Une synthèse est présentée dans le tableau 4-7.

Tableau 4-7 : Synthèse du choix des structures de covariance selon les tests de modèles emboîtés et le critère AIC

Ce tableau révèle tout d’abord que la structure ID n’est sélectionnée pour aucun descripteur. Les structures plus complexes (CS, RCL et RCQ) sont toujours nettement mieux ajustées aux données que la structure ID au regard des probabilités obtenues à chaque test de modèles emboîtés (<0.001). L’effet sujet est donc indiscutable dans cet ensemble de données, quel que soit le descripteur. Le choix de la nature de cet effet sujet est en revanche moins évident. Les structures de covariances CS, RCL et RCQ sont respectivement retenues pour 14, 4 et 6 des 24 descripteurs avec les tests de modèles emboîtés. Cela indique qu’un effet sujet constant (CS) serait mieux adapté aux données qu’un effet linéaire (RCL) ou quadratique (RCQ) pour la majorité des descripteurs. La structure de covariance ne semble en outre pas liée au type de descripteur, contrairement aux résultats de la première étude. D’après le critère AIC (dernière colonne du tableau 4-7), les structures de corrélations

retenues sont plus complexes que les structures retenues à l’aide des tests de modèles emboîtés pour cinq descripteurs. Ce résultat avait déjà été observé lors de la première étude. Les structures CS, RCL et RCQ sont alors respectivement sélectionnées pour 9, 8 et 7 descripteurs. Aucune structure ne semble donc faire l’unanimité selon l’indice AIC. Cependant, le graphique de la figure 4-13 montre que la diminution de la valeur de l’AIC (i.e. le gain d’ajustement du modèle aux données) est plus importante lors du passage de la structure ID à la structure CS que lors des évolutions suivantes de la structure de covariance. La structure CS est donc relativement bien adaptée aux données pour tous les descripteurs, bien qu’elle ne soit pas toujours la solution optimale. De plus, conformément aux remarques effectuées lors de l’analyse de la première étude, la sélection d’une seule structure pour tous les descripteurs est plus satisfaisant au niveau de l’interprétation sensorielle. Nous choisissons donc de sélectionner la structure CS pour tous les descripteurs afin de faciliter l’interprétation globale du comportement des panélistes sur l’ensemble des descripteurs. Il aurait néanmoins été possible de retenir une structure par descripteur afin d’analyser plus finement le comportement des panélistes dans chaque cas.

Figure 4-13 : Evolution de l’AIC de chaque descripteur selon la structure de corrélation

3.2.2

Modèle mixte : choix de la partie fixe

Pour chaque descripteur, la partie fixe du modèle est sélectionnée en utilisant l’équation 4-7. Cette partie du modèle permet de détecter la présence d’une évolution linéaire et/ou quadratique de la performance du groupe. Le meilleur modèle est sélectionné en fonction des résultats des tests de Fisher conditionnels. Les résultats complets sont disponibles en annexe 6 et une synthèse est proposée dans le tableau 4-8. Ce dernier classe les descripteurs en fonction de la significativité de leurs paramètres de pente et de courbure ainsi que du signe de ces deux paramètres. Dix-huit des 24

descripteurs présentent une évolution linéaire significative de la répétabilité et l’estimation de la pente est positive pour toutes ces variables. La répétabilité du groupe augmente donc au fil des évaluations pour la majeure partie des descripteurs. Le paramètre de courbure est significativement différent de zéro pour 19 descripteurs et son estimation est négative dans 18 situations, indiquant que la performance du groupe atteint (ou tend vers) un maximum. L’association d’une pente positive et d’une courbure convexe tend à montrer que le profil d’évolution le plus répandu (15 descripteurs sur 24) se caractérise par une amélioration du niveau de répétabilité au début de l’étude qui tend à ralentir puis à stagner ou à décroître au cours du temps. Une illustration de cette interprétation est présentée et commentée ultérieurement au cours de ce chapitre dans le paragraphe 3.2.4 (figure 4-14 et figure 4-15). La performance du panel reste stable au fil des évaluations pour deux descripteurs seulement (pente et courbure non significatives).

Tableau 4-8 : Résumé de la significativité et des signes des paramètres de l’effet fixe temps pour l’ensemble des descripteurs selon le modèle mixte retenu

courbure

significative non significative

positive négative positive

0 15 3 18

significative négative

0 0 0 0 18

pente

non significative

1 3 2 6

1 18

19 5 24

NB : Chaque valeur représente le nombre de descripteurs correspondant à la situation

3.2.3

Modèle mixte : paramètres individuels

En fonction du modèle mixte sélectionné pour chaque descripteur, les paramètres individuels correspondants sont estimés. Puisque la structure CS a été retenue pour tous les descripteurs, seul l’ordonnée à l’origine de chaque panéliste est calculée. Une valeur positive indique que le niveau de répétabilité global d’un juge est supérieur à la moyenne du groupe sur l’ensemble des données de l’étude. Au contraire, si l’ordonnée à l’origine est négative pour un panéliste, le niveau de répétabilité de ce sujet est globalement moins élevé que le niveau du groupe. La significativité des paramètres individuels est mesurée en utilisant des tests de Student (équation 4-8). Le tableau 4-9 propose un récapitulatif des signes de ces paramètres pour chaque descripteur et chaque juge.

Tableau 4-9 : bilan de l’estimation des paramètres individuels descripteur 45 36 5 220 50 203 32 73 4 219 2 37 1 ap_brown ++ ++ - - - + ++ - + - - -- -- ap_filmlayer + + - + + -- - -- ++ - - -- ++ ap_red ++ + ++ -- - + + + + - -- -- + ap_transparant + ++ ++ - - + - - ++ - - - -- ap_yellow + ++ ++ + - ++ + -- ++ - -- -- -- m_astringent ++ ++ + + - ++ ++ - -- - -- -- - m_prickling ++ ++ + + + -- + + -- + - -- - m_saliva_stimul ++ ++ + + + + -- - -- + - -- -- o_alcohol ++ + + + - + + - - - - + -- o_animal + + ++ + + + - - + - - + -- o_cheese ++ + + + - - - + + - + + -- o_fermen_fruit ++ ++ ++ - - - + + + - + - -- o_liquorice ++ ++ + + ++ + + -- - -- -- + -- o_medecin ++ ++ + ++ -- - + - -- -- + + -- o_mushroom ++ ++ ++ - ++ - -- - - - - ++ -- o_roastpork + ++ ++ ++ + - - - - + - -- - o_ryebread ++ + ++ + + + + -- - - - - -- o_treacle ++ + ++ + + - + - - - -- - -- t_burnt ++ ++ + ++ + ++ + - - -- -- -- -- t_salt ++ ++ - + - ++ + - - -- - -- - t_sour ++ ++ - - - ++ ++ - -- - -- - + t_sweet ++ ++ - + - ++ + + - - -- - - ta_bitter ++ ++ + ++ + + - - - -- - -- - ta_lavas ++ ++ ++ ++ + + - - - - -- -- - ++ 19 17 10 5 2 6 3 3 1 1 + 5 7 9 13 10 10 12 5 5 3 3 5 2 - 5 5 11 6 7 15 11 16 12 6 7 -- 1 1 2 2 4 5 5 9 12 14 ++: estimation positive significative, +: estimation positive non significative --: estimation négative significative, -: estimation négative non significative

Pour chaque descripteur, ce tableau donne une information sur le niveau de répétabilité de chaque juge par rapport au groupe. Le diagnostic "+" indique que l’estimation du paramètre (ordonnée à l’origine) est positive pour un sujet. Dans le cas contraire, le diagnostic est "-". Lorsque le test du paramètre est significatif, le symbole du diagnostic est doublé ("++" ou "--"). Ces deux derniers diagnostics sont respectivement surlignés en vert et en rouge. Les panélistes sont triés en fonction du nombre de "--" (ordre croissant) puis du nombre de "++" (ordre décroissant). Cela permet de mettre en évidence les moins bons panélistes (à droite) et les meilleurs panélistes (à gauche) sur l’ensemble des descripteurs et des temps de mesure. Les juges 45, 36 et 5 sont plus répétables que le groupe pour un grand nombre de descripteurs, tandis que les panélistes 1, 37 et 2 obtiennent souvent un niveau de répétabilité significativement moins élevé que le panel sur l’ensemble de la durée de l’étude. Ce tableau permet également de mettre en évidence des comportements particuliers. Par exemple, le juge 1, dont le niveau de répétabilité est très souvent inférieur à celui du panel (14 diagnostics "--" et 7 diagnostics "-" sur 24 descripteurs), se situe parmi les dégustateurs les plus répétables concernant le descripteur ap_filmlayer.

3.2.4

Cartes de contrôle

Les paramètres utilisés pour construire les cartes de contrôle sont calculés en fonction du modèle mixte sélectionné pour chaque descripteur. Les résultats concernant un seul attribut sensoriel (ap_red) seront présentés. La partie fixe correspond à un effet quadratique et la structure de covariance est CS. La carte de contrôle au niveau du groupe montre l’évolution quadratique de la

performance (figure 4-14). Le niveau de répétabilité s’améliore lors des premières évaluations puis semble stagner à la fin de l’étude. Cette carte de contrôle permet également de faire apparaître les temps de mesure auxquels le niveau de performance du groupe est significativement différent de l’évolution modélisée par le modèle mixte. Pour le descripteur ap_red, le niveau de répétabilité du panel observé est significativement plus élevée que l’évolution modélisée à quatre temps de mesure (t=4, 29, 30 et 32) et significativement mois élevé à trois reprises (t=13, 18 et 34). Cependant, cette représentation ne réalise qu’une description de l’évolution de la performance. Les causes potentielles des variations de niveaux ne sont pas prises en considération. Une chute brutale du niveau de performance pourrait par exemple s’expliquer par la variabilité de l’espace produit ou par le changement des conditions expérimentales.

Figure 4-14 : carte de contrôle de l’évolution de la répétabilité du panel pour le descripteur ap_red (structure de covariance CS, effet temps quadratique)

La carte de contrôle des panélistes (figure 4-15) met en évidence les temps de mesure auxquels le niveau de répétabilité d’un ou plusieurs sujets est significativement différent de l’évolution du panel. L’intervalle de confiance à 95% dessiné sur la carte est relativement large (il s’étend de -0,4 à -2,3 à t=0). Cela signifie que les variations du niveau de répétabilité des panélistes sont importantes au fil des évaluations.

Figure 4-15 : carte de contrôle de l’évolution des panélistes pour le descripteur ap_red (structure de covariance CS; effet temps quadratique significatif)

Afin de réaliser une synthèse des alertes générées par les cartes de contrôle, le tableau 4-10 indique, pour chaque panéliste et chaque temps de mesure, le nombre de descripteurs pour lesquels le niveau de performance était significativement plus faible que celui du groupe.

Le nombre de détection est très élevé pour certains panélistes (en particulier pour les sujets 1 et 37) et très réduit pour d’autres (panélistes 45, 36, 50 et 5). Le classement des juges effectué dans cette table est proche de celui du tableau 4-9. Par conséquent, les panélistes dont le niveau de performance général est inférieur à celui du groupe, correspondent aux sujets souvent considérés comme ponctuellement moins performants. Ce tableau permet également de détecter certains phénomènes particuliers. Par exemple, le sujet 32 est déclaré significativement moins répétable que le groupe pour 6 descripteurs au temps 41, alors que son nombre moyen d’alerte est de 0,62 descripteurs par temps de mesure. Le même phénomène se reproduit pour le sujet 2 au temps t=12. Cette information peut permettre à l’animateur de focaliser son attention sur ces données afin, éventuellement, d’expliquer ce résultat. Le nombre de détections à chaque temps de mesure varie entre 1 et 17 mais aucune structure spécifique ne se dégage. Cependant, on peut se demander si le nombre de détections, et de manière plus générale, si l’évolution de la répétabilité n’est pas lié à d’autres facteurs dépendants des produits ou des conditions de l’expérimentation à chaque temps de mesure. Par exemple, les manuels d’analyse sensorielle conseillent de présenter un nombre d’échantillons relativement réduit à chaque séance afin de ne pas altérer la concentration des panélistes (Amerine, Pangborn et al., 1965; AFNOR, 1999). Le nombre d’échantillons dégustés à

chaque séance est donc une source de variabilité potentielle, susceptible d’influencer le niveau de performance du panel. Bien que d’autres sources de variabilité puissent moduler le niveau de répétabilité, nous nous limiterons à l’étude de ce facteur dans le paragraphe suivant.

Tableau 4-10 : Résumé des alertes de chaque panéliste en fonction des temps de mesure (performance significativement moins élevée que celle du groupe)

temps 45 36 5 220 32 50 73 203 2 4 37 219 1 Somme Moyenne

1 2 3 2 4 11 0,92 2 1 4 5 0,45 3 1 1 3 5 2 12 1,09 4 1 1 1 2 1 1 1 2 10 0,91 5 1 1 1 1 1 1 1 1 3 11 1,00 6 1 1 1 2 2 7 0,70 7 1 1 1 2 2 7 0,64 8 1 1 1 2 2 7 0,64 9 1 2 1 1 1 2 4 5 17 1,42 10 1 1 1 2 1 4 10 0,91 11 1 1 1 1 1 6 1 3 2 17 1,42 12 2 1 4 7 0,88 13 2 1 1 1 2 1 8 1,00 14 1 3 1 5 0,71 15 1 2 3 2 4 12 1,33 16 2 2 4 4 12 1,71 17 1 1 4 5 11 1,57 18 1 3 4 0,50 19 2 2 2 6 0,60 20 1 1 3 1 3 9 0,82 21 2 2 1 2 1 8 0,80 22 1 2 3 0,30 23 1 5 1 3 10 1,00 24 1 2 3 0,30 25 1 1 1 2 5 3 13 1,30 26 1 1 1 3 0,30 27 1 3 2 4 10 1,25 28 1 1 3 5 0,56 29 2 1 2 1 6 0,67 30 1 2 3 0,38 31 1 2 3 0,38 32 1 2 1 2 1 5 2 14 1,56 33 3 4 7 1 1 16 2,29 34 1 2 2 3 8 0,89 35 1 1 1 2 2 4 11 1,22 36 1 5 4 10 1,11 37 1 1 1 3 2 8 0,89 38 2 2 0,20 39 1 1 0,14 40 1 1 2 0,20 41 6 2 2 1 2 13 1,30 42 1 1 1 1 1 7 12 1,20 43 3 3 0,30 Somme 1 5 6 14 21 5 17 26 37 36 61 33 93 Moyenne 0,03 0,13 0,15 0,58 0,62 0,63 0,65 0,84 0,90 1,16 1,61 1,74 2,38

Chaque cellule contient le nombre de descripteurs pour lesquels le niveau de répétabilité d’un panéliste était significativement inférieur à celui du groupe. Les cellules grisées indiquent les temps de mesures auxquels les panélistes étaient absents.