Copyright © Génistat Conseils Inc., 2004, Montréal, Canada
a) casd’un facteurquantitatif A variantdansl’intervalle(a,b) a = min (A) et b = max(A)
XA variable de codage associée à A XA = (A–c) / d
où c = ( a + b) 2 : pointmilieu del’intervalle(a,b) d = (b–a )/2 :demilongueurdel’intervalle(a,b) l’intervalledevariation dela variableXA est ( -1, +1)
Le choix de d pour définir le diviseur est arbitraire mais commode. Il serait possible de faire un autre choix mais il est important que toutes les variables codées varient dans un intervalle identique. Le choix de a est commode car le « centre » du nouvel espace expérimental de la variable codée est 0. L’estimation del’effetgénéraldanslemodèle (0) est la moyenne de toutes les observations.
Cas particuliers
Si facteur prend seulement les valeurs a et b, alors XA prend les valeurs -1 et +1.
Si le facteur prend seulement les valeurs a, c, b, alors XA prend les valeurs, -1, 0, +1 b) casd’un facteurqualitatif A variant à 2 modalités : m1 et m2
XA variable de codage associée à A XA = -1 si A = m1 XA = +1 si A = m2 L’association proposéeestarbitraire.
c) casd’un facteurqualitatif A variant à 3 modalités et plus:m1 ,m2,…,mk L’opération decodagesefaitparl’introduction dek variablesbinaires(0 - 1) BÉNÉFICES
1. Lesgrandeursdescoefficientsdel’équation deprédiction sontcomparablescarles variables codées varient entre -1 et +1 sur une échelle identique qui ne tient pas en compte les unités spécifiques à chacune des variables originelles. Il est alors possible de comparer la contribution relative de leur impact sur la variable de réponse. Cela n’est pas le cas lorsque les variables ne sont pas codées.
2. L’intercepte0 (effet général) peut s’interpréter comme la valeur de la réponse au centredel’espace expérimental.
3. Les colinéarités sont amoindries et, dans certains cas, elles sont éliminées. En particulierlorsdel’ajustementdepolynômedu second degré.
4. Lesinexactitudesdanslescalculsattribuablesaux erreursd’arrondiessontamoindries. Les modélisations de la réponse avec les variables codées ou avec les variables non codées sont équivalentes car elles donnent lieu :
au mêmetableau d’analysedela variance(ANOVA);
au même coefficient de détermination R2;
aux mêmes valeurs prédites ;
à la même analyse de résidus
La seule différence concerne les coefficients de régression : ils ne sont pas les mêmes dans le modèle avec les variables originelles et dans le modèle avec les variables codées.De plus, les tests de signification (test–t) ne sont pas identiques à cause des échelles.