M. M AURIN E. T OUBOUL
Codage optimal et sur-optimal sur un tableau invariant
Mathématiques et sciences humaines, tome 85 (1984), p. 19-55
<http://www.numdam.org/item?id=MSH_1984__85__19_0>
© Centre d’analyse et de mathématiques sociales de l’EHESS, 1984, tous droits réservés.
L’accès aux archives de la revue « Mathématiques et sciences humaines » (http://
msh.revues.org/) implique l’accord avec les conditions générales d’utilisation (http://www.
numdam.org/conditions). Toute utilisation commerciale ou impression systématique est consti- tutive d’une infraction pénale. Toute copie ou impression de ce fichier doit conte- nir la présente mention de copyright.
Article numérisé dans le cadre du programme Numérisation de documents anciens mathématiques
http://www.numdam.org/
CODAGE OPTIMAL ET SUR-OPTIMAL SUR UN TABLEAU INVARIANT
M.
MAURIN *,
E.TOUBOUL**
INTRODUCTION
On soumet un ensemble de ~ individus à différents stimuli
physiques
~ ,stimuli
définis par une unitéphysique
connue(on
lessuppose ordonnés en fonction de leur
rang i ).
Ces individus"répondent"
aux stimuli en choisissant un niveau de
réponse Rj) 3: 4.- - IT
dansune échelle de niveaux
ordonnés,
échelleposée
selon uneprocédure de
saisie définie. Soit le nombre desujets exposés
à~L. qui
ont
répondu ki (tableau
decontingence
du typestimulus-réponse).
Tableau 1 : tableau de
contingence
et ses margesu Institut de Recherche des Transports, Centre d’Evaluation et de Recherches des Nuisances et de
l’Energie,
109 AvenueAllende,
69672 BRON Cedex.* 0 Etudiant
Analyse Numérique,
Université deSaint-Etienne,
23 Rue du DocteurMichelon,
42023 SAINT-ETIENNE .Les
techniques
ducodage optimal
ont pourobjet
le"passage
de l’ordinal aucardinal" à l’aide d’une
application X
telle que lesX ( Xi
sont
supposées prendre
leurs valeurs sur une échelle d’intervalle(continuum subjectif
collectifsous-jacent),
valeurs surlesquelles
on peut ensuitelégitimement
calculer lesstatistiques
habituelles(moyenne, écart-type).
Dans le
chapitre 2,on rappelle
latechnique
habituelle ducodage optimal (optimal scaling)
pourexpliciter
lesXj
,technique
fondéesur une
hypothèse d’optimum (réf.2,5,11).
Il faut noter à ce niveau l’exis-tence de
rapprochements
avec d’autrestechniques
commel’Analyse
factorielle descorrespondances,
les moyennesréciproques,
la corrélation maximale(ré-f . 13,17),l’analyse canonique (réf . 13,14,17) .
Dans un ordre d’idée différent et
voisin 1 la
méthode decodage
par in- tervalles successifs suppose que lesréponses
à divers stimuli ne sont pas concentrées sur des niveaux discretsgj
, maisréparties
au sein d’inter-valles dont on cherche à coder les bornes
(réf. 1,5,10,15,18).
A la lueur desconcepts introduits dans cet autre
cadreyon s’aperçoit
que le tableaudes X-
du
codage optimal
est la combinaison de deux naturesd’informations ;
1 uneque l’on
qualifie
d’invariante nedépend
que du schéma destimulus-réponse
envisagé
tandis que l’autre ne réflète que desconjonctures
liées àchaque expérience (composante
ditelocale).
LesXi
solutions subissent l’influ-ence de cette
conjoncture
et ne sontguère
de faitcompatibles
avec larecherche d’un
codage
des échelonsgi
nedépendant
que duprocessus.
Ci-après
nousprésentons
deux méthodes pour se débarrasser de cette influencequand
on le désire. Lapremière
est unesimple adaptation
ducodage optimal (chapitre 3) ;
la seconde est lapoursuite
de l’idée ducodage optimal,
avecla recherche du "meilleur"
codage optimal
sur l’ensemble décrit par la com-posante locale. C’est cette solution que l’on
appelle
lecodage sur-optimal,
la
question mathématique
ainsi soulevée est traitée auchapitre
4. La dis-cussion de cette solution et des
exemples
sontprésentés
auchapitre 5,
lesannexes
précisent
certainscompléments.
1 - Notations
On
note P
le tableau matriciel(1, ¡)
desfréquences F’j =
,w
etui 7
les vecteursrespectifs
de~ J:
avecles coordonnées
égales
à1, l’apostrophe désigne
latransposition matricielle ;
avec des matrices à deux dimensions l’indice de
ligne
esti
, l’indice decolonne d
. On suppose que letableau F
ne contient aucuneligne
nicolonne de
zéros,
etqu’il n’y
a aucuncouple
delignes proportionnelles.
Pour le
codage optimal
on définit :i)
les distributionsmarginales :
sachant que
ii)
les matricesdiagonales
et d’élémentsrespectifs
et
1:.j
. Elles vérifient les relations :iii)
les tableaux des distributions conditionnelles:d’élément
d’élément
~: les
vecteurslignes
dequi appartiennent
ausimplexe
unité ded’où les relations :
2 - Le
codage optimal
2.1. Les niveaux de
réponse ij
étant situés sur une échelleordinale,
les
techniques
ducodage optimal
usuel ont pourobjet
d’affecter àchaque Ri
une valeur
Xi
sur une échelle d’intervalle(réf. 2,5,11).
i)
si l’on suppose l’existence desXi
on peut calculer lesquantités
sui-vantes :
valeur moyenne des
réponses
valeurs moyennes par stimulus
variance des
réponses
variances par stimulus
ii)
on a les identitésstatistiques
suivantes :donc la moyenne des niveaux de
réponse
sur lapopulation
totale est aussila i -moyenne des niveaux moyens par stimulus
(i-moyenne
avec la distribu-tion
Et aussi :
donc la variance totale est la i-variance des niveaux moyens par stimulus
augmentée
de lai-moyenne
des variances par stimulus. Laquantité 2 ~. r;s
est la variance intra-stimuli
variance entre les différents stimuli
2.2. Ces calculs formels sont insuffisants pour déterminer Il faut leur
adjoindre
des conditionssupplémentaires ;
on utilise ici la conditionqui
consiste à dire que l’échelle d’intervalle cherchée est cellequi
maximise la part de la variance entre stimuli dans la variance totale(ou
le rapport de corrélationP :
réf.2,5,11,18).
2.2.1. La solution de ce
problème d’optimum
nécessite une discussionplus
détaillée
qu’il
n’est coutume de le faire.On met les variances
précédentes
sous les formes matricielles ci-contre:où est le vecteur des a,
Ces trois variances sont invariantes pour toute translation
)(+ e W3,
(vérification immédiate).
Parconséquent
en suivant Guttman(réf.2,11)
onpeut se limiter à la recherche des solutions
X centrées,
c’est-à-direqui
, -
vérifient la relation linéaire
Fy X = O
. De la sortequand X
est solution
centrée,
toutX
est solutiongénérale. (+)
Le vecteur
tu
annule la varianceCT (vérification immédiate)
donc aussi
ué
et9-- «"’
. On démontre quelorsque
aucun des6i
n’est
nul,
c’est le seul vecteur différent de zéroqui annule
(cf 4.2).
(*)
X étant centré par rapport àF:r ’
on considère quetout ?
x0
constitue la même solution.
2.2.2.
Lorsque
est différent dezéro, le
maximum deQ t.(x.)
estatteint pour
c"B’ ~x~ :
o . On démontrequ’il
existe des solutionsX
qui
annulent sans annuler si et seulement si ilexiste deux
partitions i-1) - - )-T ,
et3",, - -).7m
des ensembles d’indices telles que le tableau F peut être mis sous la forme d’unediagonale
de blocsF
non nuls :(figure 1)
( cf.
4.2 etAnnexe
olt1).
Figure
1 :Décomposition
deF.
Les
x
solutions sont du type ; ils sontcentrés ssi
(Annéxel).
2.3. Résolution
2.3.1.
v1 Oc)
étant strictementpositive,
leproblème posé
revient àchercher le maximum de
e
sous les deux liaisons ,F§ $ >
0 ; c’est unproblème classique d’optimum
lié :maximiser
sous les liaisons
Le
Lagrangien
donne le
système
des conditions nécessaires pourl’optimum (CNO) :
i)
Onprémultiplie
par1
ii)
Onprémultiplie
en vertu des relations d’Euler on adonc le
multiplicateur ~
est(à l’optimum) égal
au carré du rapport de corrélation.Dans le
système
CNO lesinconnues >
etX
sont les éléments propres(valeurs
etvecteurs)
de la matricepuisque l’optimum
vérifieaprès simplification :
Réciproquement,
tout vecteurz
propre deD-4F 1 D’ F (solution
dusystème
CNO)
vérifie la relation(1 - ) F-9
X =0,
pourqu’il
soit solution du pro- blème de maximum étudié il suffitqu’il
vérifieFé
X = 0. Parailleurs,
àl’optimum
la fonction~1
estégale à À
le maximumcorrespond
doncà la
plus grande
valeurpropre ~B
pourlaquelle
il existe un(des) vecteur(s)
propre(s)
Xcentré(s)
par rapport àF~ .
i)
On observe que~,_,~
e~( ~
est solution évidente. Elleest
cependant inacceptable
icipuisque FT w~ : a ~
0 et que~uT
annule 9-«%- et
(i"’"~ 1...
.ii)
Si la valeur propre~ ~
~ estunique
la valeurpropres
immédia-tement inférieure est solution
acceptable,
ses vecteurs propres étant= 0
iii)
Si la valeur propre~ ~ -r
est valeur propremultiple~les
autres vec-teurs propres que
w T
sont des solutionsacceptables
à conditionqu’ils
vérifient , ce
qui
esttoujours possible
pour~ N
On
note $
la solution duproblème
et~(
le vecteur ducodage optimal.
2.3.2. On a les
points complémentaires
suivants:N ~"
_
i)
La solutionoptimale
décentrée telle que~(A : ~ ~ ~J :
T estplus
"parlante"
que la solutionoptimale
centrée.ii)
Lesystème classique
ducodage optimal possède
une solution dès que~2,
En revanche on n’a pas l’unicité de la solution centrée. Cette ab-
sence d’unicité peut se
présenter :
’
-
- soit
quand
lasolution $ é 4
est valeur propremultiple
d’ordre ~
2 ;
- soit
quand
la valeurpropre
1 estmultiple
avec unordre à
3.De telles éventualités
(qui dépendent
du tableau recueilliF)
sontassez rares,
cependant
la discussion estincomplète quand
on nesignale
pas cettepossibilité.
iii)
La recherche des éléments propres d’une matrice se faitaujourd’hui
avecdes moyens
informatiques.
Sur leplan algorithmique
il estplus simple
de rechercher les éléments propres des matrices
symétriques.
Les solu-- -
solutions ~ X cherchées sont aussi les solutions de
où est
symétrique.
iv)
Comme cela a étéremarqué (rêf . 2) S
et sontles matrices que l’on
manipule
habituellement enanalyse
factorielle des,
-
correspondances, A.F.C, (réf. 7). x
n’est autre que lepremier
facteur
fA
, c’est-à-dire que lesxi*
sont les coordonnées des 7*points-réponses
dansR:£
sur lepremier
axe factorielL’Y 4 multipliées
parÎ7
.Zr 4 _
Le vecteur des moyennes par stimuli
X
établit uneapplication numérique
entre le continuuml’y 1
desréponses
et le conti-nuum
physique
desstimuli ;
il estégal
à1B-’" F ’f-f :. If ’f.. ,
c’est levecteur des coordonnées des
points
stimuli dansfl"
sur lepremier
axefactoriel u.-. ,
(pour
les notations(À .4
1~A ~’ r ’~k 4
voir la réf. 7chap. II) .
On saitégalement
que la trace de F’ F ,égale
à~!~ ~ ,1~
est l’inertie du nuage des
points U,. pondérés
parF,,.
par rapport à sonbarycentre Ff , lorsque
l’onprend
lamétrique
euclidienne ditedu 2
centrée sur
FT (réf. 7).
Cette rencontre n’a d’ailleurs pas lieu de
surprendre
une fois que l’on a fait lerapprochement qui s’impose
entre lecodage optimal, l’A.F.C.,
les moyennes
réciproques
etl’analyse canonique (réf. 14,17).
v)
Lesalgorithmes rappelés
ci-dessus conduisent aussi au même résultat que la recherche de la corrélation maximaled’Hirschfeld
et de Renvi pour le tableau F(réf.13,14;
annexe2).
A
l’optimum
le rapport de corrélation .f:.
est doncégal
aucoefficient de corrélation maximal
P
attaché au tableau F(corrélation
de
Bravais-Pearson),
avecl’interprétation
du coefficient deLagrange:
(réf.3
tome2).
vi)
Les modalités deréponse Rj
vérifient par construction un ordre totaldonné,
en même temps que les stimuli£&-
sont leplus
souventnaturellement ordonnés en fonction d’une
grandeur physique. Cependant
-
rien ne
garantit
apriori
que l’ordre suivi par lesX.
duscaling
optimal
soit le même que celui desRi
, et de mêmepour 1.
et1; .
.Cette difficulté ordinale
peut-être
abordée de différentesfaçons (réf.11).On
a uneréponse élégante
sous la forme d’une condition suffisante.En
effet,
si avec desmodalités
et1,’
naturellementordonnées,
lesdifférentes distributions conditionnelles de et vérifient
respectivement
les relations d’ordre latéral entredistributions, (on
dit que les tableaux et sont latéralementcroissants),
les pre- miersfacteurs
sur lesRi
etf4
sur lesl;
sont enaccord avec les ordres
respectifs
des modalités(réf.2,
3 tome 1chap.B8).
vii)
Sur un autreplan,
on doit remarquer que les calculsprécédents
sont duressort des conditions nécessaires. Si un tel continuum d’intervalle
existe,
ce sont bien lesXi
ci-contrequi
réalisentl’optimum
de lavariance
inter-stimuli ;
mais on n’a pas démontré l’existence effective de cettesolution,ni
le bien fondé de la conditiond’optimum.
Cettequestion dépasse
naturellement lescompétences
du seulanalyste
desdonnées. Dans des circonstances
analogues
on peutsignaler
que "both Guttman et Mosteller havesu~gested
that thisprocedure gives
scoreson an interval scale"
(ref.
18 page344);
cf.également
la remarque en 5.1.2.3 - Tableau S.R. invariant
Il est bien évident que le
codage optimal dépend
de la distributionmarginale d’exposition
aux stimuliFi
, remarquedéjà
faite parTorgerson
dans descirconstances
analogues (réf.18 p.344).
Les effectifsqui
définissent cettedistribution sont souvent le résultat de circonstances
conjoncturelles
malmaîtrisées
(expériences ratées,
nonréponses
dans desenquêtes...) ;
à tout le moins cette distribution maîtrisée ou non,peut dans certains
cas être
préjudiciable
àl’acquisition
d’unprocédé
de mesureindépendant
d’une
application
ou d’uneexpérimentation particulière.
3.1. Ce
particulier
estreprésenté
parFT
. Pour connaître avecprécision
son mode d’intervention il est commode aupréalable
dedécomposer
le tableau des
fréquences
F, et de faire la part entre deux sources d’infor- mation.La distribution
Fi
décrit larépartition
dessujets expérimentés
en fonction des différents stimuli
(1 employés ;
c’est une distributionqui dépend
dechaque expérience particulière,
et peut varier de l’une àl’autre,
nous dirons que c’est une distribution "locale".A l’opposé,
les distributions conditionnellesF.4’ / F,". indiquent
la
façon
dont serépartissent
lesréponses
dessujets
pour chacun des stimulifixé,
sur l’ensemble desréponses
ordonnéeslj qui
sont offertes par lesconditions de
l’expérience.
On peut raisonnablement supposer que ces distri- butions conditionnelles sont des "invariants" du processus destimulus-réponse, qu’elles
nedépendent
pas de telle ou telleexpérimentation particulière,
maisqu’elles
décrivent la sensibilité collective d’unepopulation
définie de su-jets
dans leurensemble,
compte tenu du niveau du stimulus et desrègles pré-
cises de
l’expérimentation (échelle Ri
, déroulement del’expérimentation) qui
sont communes à touteexpérience Bréf.9).
Nous dirons estle tableau invariant du processus
étudié,
compte tenu desfi
et de l’échelle desRi*
.Par
conséquent,
le tableau F desfréquences
est la combinaison de deux composantesindépendantes,
l’une invariantereprésentée
par le tableauf¡/I
et l’autre localereprésentée
par le vecteurF~
. Cette compo- sition est entièrement traduite par leproduit
matriciel :La notion des distributions invariantes
qui
composent , estcelle des
"frequency
distribution(s)
on thepsychological
continuum of dis-crimal processes associated with the stimuli" que Thurstone utilise dans la formulation de son modèle des
jugements comparatifs (réf.l8, chapitre
8 à10).
Ce sont
précisément
ces distributions que l’on utilise dans les diversestechniques
des intervalles successifs(réf. 1,10,15,18).
(*)pour
êtreprécis,
ces distributions invariantes sont calculées surchaque
ensemble
desujets expérimentés, puis
affectées par inférence à lapopula-
tion
plus
vaste dont on peut considérer quechaque
lot desujets
est issu defaçon représentative.
Il arrive que larépétition
desexpériences
soit faitesoit en
multipliant
lessujets,
soit en refaisantplusieurs expériences
pourun
petit
nombre.Nous supposons que ces distributions de
réponse
sont connues ; nous n’envisa-geons pas ici les
problèmes d’échantillonnage,
dereprésentativité
et d’esti-mation,
comme cela estsupposé
dans les intervalles successifs.3.2. On peut donc
légitimement
désirer éliminer cette influence locale intem-pestive.
Pour ce faire nousprésentons
deux manières deprocéder.
Lapremière
est laplus simple,
il suffit de se donner unVé
fixé à l’avancede manière conventionnelle et déclarée. Cette solution est immédiate à mettre en oeuvre ; elle conduit à
l’algorithme d’optimisation précédent
avec letableau de
fréquence
. Le choix d’unF.xJC particulier
peut donner matière à
discussion ; parmi
les candidatspossibles
onsignale
le local
équipondéré w.I / 1:. qui
affecte le mêmepoids -41 -r
à toutstimulus i. C’est de fait la solution
qui
estimplicitement
retenue dans lecontexte des méthodes des intervalles successifs.
Un autre
FL* possible
est la distribution apriori
dessujets
face au sti-mulus.
Cependant
cette distribution peut être mal connue, ou mieux ne pas exis-ter. Dans le cas des
exemples
5.2.1. et 5.2.2. l’IRT-CERNE s’est efforcé d’éta- blir la distribution de lapopulation
résidente en fonction du bruit de circu-lation en
façade, (pour
les niveaux élevésessentiellement),
cette distribu-tion n’est connue
qu’approximativement;
dans le cas del’exemple
5.2.4. extraitde la référence 18, le stimulus
auquel
lessujets
doiventrépondre
est une mas-se de
quelques
dizaines de grammesqui
estposée
dans leurmain,
il est douteuxqu’il
existe une telle distribution apriori;
de même que pourl’exemple
5.2.3.La deuxième
réponse
se situedavantage
dans leprolongement logique
du
codage optimal.
La solutionclassique
cherche le maximum de(X) ;
pour
supprimer
l’influence deFr
il suffit de chercher le maximum deFt
considéré comme une fonction de deux variables X eR.~
Ê simplexe
unitéde a .
La solution ainsi obtenue nedépend
doncplus
que de l’invariant
~ ~~ I
et peut à ce titre être une solution ducodage
débarassééde toute influence locale. Au
chapitre
suivant nous étudions leproblème mathématique
ainsiposé,
lecodage qui
en résulte est ditcodage
"sur-optimal".
4 - Le
codage sur-optimal
4.1. Préambule
On introduit de nouvelles
notations ; t;
etej
sont les vecteurs debase
canonique
des espaces vectorielsR I
etR T ,
, f est le tableau in-f ,
variant
F.,. 1 1:
avec les vecteurslignes
txqui appartiennent
ausimple
unité$ T
de~~
, I est l’ensemble des indices i variant de 1 à I(le
contexte permet certainement d’éviter la confusion entre l’ensembleI et la valeur maximale de l’indice i
qui
ledécrit),
J l’ensemble des indicesj
de 1 à J,(même
remarque surJ), J~
le sous-ensembledes j
tels que(À,’zf..,
> 0 de sorte que toutU~’
aucunecoordonnée nulle.
On
désigne
parA 1
tout vecteur de coordonnéeslorsque
sont les coordonnées de A.
On en déduit les identités suivantes :
La condition de centrage s’écrit les
variances
vZ
et
v e après
centrage prennent les formes sui-vantes :
les
premières
montrent ladépendance quadratique
en X, la seconde ladépen-
dance linéaire en
F, .
Leproblème posé
consiste à chercher le maximum deavec différent de
PROPRIETE 1. Dans et sa
métrique canonique, la
variancePr)
est l’inertie du nuage des
9- à* pondérés
9portée
par la direc-tion X.
En effet
puis :
inertieportée
, %
Par
conséquent
X annule G si et seulement si X estorthogonal
au nuage de
points ( ~j
1~ ) ’
Dans la suite il est commode d’introduire le sous-ensemble des
points U qui
constituent lespoints
extrémaux de l’ensemble borné despoints Ll;
dusimplexe 5 ’ (réf. 12) ;
on pose r le sous-ensemble de-~
~
r- e-
1
des indicescorrespondants
L . La recherche del’optimum X fi
peutêtre
simplifiée (en
théorie tout aumoins)
par lapropriété
suivante :-
PROPRIETE 2.
Quand l’optimum
existe il existe au moins unFT qui
appar-tient au
simplexe Sic. S l’
.i)
En effet on peut écrireavec
d’où
en posant de somme 1.
des
paramètres positifs
ou nulsSoit
Fi
lepoint
de coordonnéesf Z .
dans lesimplexe
unité
8 Z
. Par constructionl’application qui
a9n
faitcorrespondre
Çç
conserveFT ,
la matricebj
et la variance .ii)
En revanche soiton a
d’où
d’après l’inégalité
deCauchy-Schwarz :
et
Par
conséquent U""e, 1.
et sont non décroissantes dansl’ap- plication qui
fait passer deFr
à d’où laprésence
nécessaire deF=
sur le
simplexe SI..
Remarque :
Cettepropriété
limite lechamp
de recherche desFx
, ellepeut
cependant
se révéler de peu d’intérêtpratique puisqu’elle
nécessite enamont la recherche des
~~ .
En outre elle peutcompliquer
l’étude de l’u-nicité de
l’optimum.
Ci-dessous l’on commence par étudier les deux
problèmes plus simples
- recherche de la solution
optimale X
àfixé
- recherche de la solution
optimale F.t à X
fixé .4.2. Le
problème
àFi
fixé4.2.1. C’est a
priori
unproblème
decodage optimal classique, compliqué
ce-pendant
par le fait que la matriceclassique Dr
peut êtresingulière.
PROPRIETE 3. Les matrices carrés
symétriques Dy appartiennent
simultanément au cône des matrices carrées
symétriques
réduites à un blocdiagonal
nonnul
~l’
(on note CMCSIl ), avec 1 1
un sous-ensemble de J.En effet et
Si on a nécéssairement ,donc
Réciproquement
si on a nécessairement(par l’absurde)
d’ou lapropriété.
On pose n’est pas nul
le sous-ensemble des
indices j
tels queP.i
Corrolaires - Pour
tout F-,:.,D7
etappartiennent
au côneCMCS
JI: 1r. ;
-
Quand
la condLtion de centrage estrespectée
C" TL-
Quand
la condition de centrage estrespectée V) U-e’L
et sont invariants par toute translation de
D’après
la PROPRIETE1,
X annule si et seulement si X appar- tient àR. J’- JI.
, ou est colinéaire à’-V:fr. (directions orthogonales
au nuage
~/j~j ) ’
Leproblème
en X est donc indéterminé pour toute trans-lation
de ; · onpose i:lx et J‘-
lesprojections
deJ’
et X sur
fl £
,j)~
la matrice carrée est uneforme
quadratique
nondégénérée
dans .En
conclusion l la
recherche en X à~L
fixé se déroule en deux temps;- réduction de l’indétermination en se limitant à
~ 1r
, avec la condition de centrageîr x
= 0 et les variances(~)
Il existe des X différentsde LJy qui
annulentCI ’1-
ssi sensstrict,
cf.également
Annexe 1.- résolution
classique
duproblème
ainsiréduit,
où seultO
annule G~’ . .
On a donc à ce niveau la non unicité du
problème classique (liée
à l’ordre demultiplicité de > ), à laquelle s’ajoute
l’indétermination par~
pour la solution en X.4.2.2. Le cas où
ir
est combinaison linéaire de et~B
est im-portant dans la
suite,
On note pour
simplifier,
etUt
les vecteursU ¡ correspondants, Il
le tableau f réduit à ces deuxlignes, DI t la
matrice
diagonale correspondante, 1 ~ : -T .4 L) T2..
.Après
réduction parla solution
prend
une formesimple:
PROPRIETE 4. La solution du
codage optimal
est donnée par ;En effet ; -,
La maximisation de
Cr *1-
revient ici àoptimiser
la forme li-néaire sous la liaison non
dégénérée
; on a ladirection
optimale
évidente ,unique
par cons-truction,
centrée par rapport àÈi)
D’autre part dans lesimplexe S 1
l’inertie des 2points Us
etU 1
pour toutemétrique
euclidienne(donc
lamétrique
duX2
centrée surV,t, )
est entièrementprise
en compte par la direction94U.
, cequi signifie
que l’on n’aqu’une
seule valeur propre nonnulle,
hormiscelle
qui
estidentique
à 1. On endéduit :
sachant que
M.,
etUij’
ne sont pas simultanémentnuls.
Î
Remarque : Le cas du tableau à 2
lignes
est résolu parSaporta,
avecégalement
unetechnique simplifiée
4.2.3. De
façon plus précise
onpose j
et ,L
les indicesqui
annulentrespectivement L4,
etU~~ (indices qui appartiennent
à des sous-ensem-bles
disjoints
parconstruction),
d’oùl’expression
détaillée de~.?(o~ ~
C’est une fonction définie continue
positive
sur à dérivéeseconde
négative
ou nulle :On a aux bornes
Ces limites sont nulles si et seulement si ni
Ù4
niu L
n’ont decoordonnées nulles.
Conséquence :
_
La variation de
~~1..(-)
sur0 4 1
permet l’étude du maximum de~ lorsque Fv
varie sur toute arêteouverte è»4 et
.PROPRIETE 5.
Quand 1
varie sur toute arêteouverte i-4 e1
le rapportC= O-e/o- ( C )
atteint un maximumunique
à l’intérieur del’arête,
outend vers un maximum à l’une des
bornes,
sans l’atteindre.Ceci résulte immédiatement des variations de
> -t" ~~ ~
concave oulinéaire
qui
a l’une des 2 types de variationssuivantes: (figure 2)
Figure
2: les deux variationspossibles
de4.3. Le
problème
àX
fixé.4.3.1. On définit
14 x
l’intersection dusimplexe unité
avecl’hyperplan d’équation F~ J )( ~ 0 ;
Nv
l’intersection de-S
avecl’hyperplan F§ Q’ x ~
= o ;x 0
l’intersection de avecl’hyperplan
O ,c’est aussi l’intersection de
t-~
avecl’hyperplan
F:,: i XI.: 0
,Fr X::
0 .On
désigne
par "arête" deÉ
les segments de droite pour toutPROPRIETE 6.
Dans
R K,
l’intersection dusimplexe unité S K
et de touthyperplan
1A
?0 est un ensemble convexepolyédrique
borné dont lespoints
extré-maux
(si
l’intersection est nonvide)
sont situés sur les arêtes deS K .
En effet l’intersection de 2 convexes est un convexe, borné
puisque
S
estborné, polyédrique puisque S K
et sont délimitéspar des
hyperplans.
En
dernier,
lespoints
extrémauxpossèdent
au moinsK- 1
contraintes du typee, =
0 saturées(réf. 12 chap.12
et 14-1)..On en déduit
que Hx
est un sous-ensemble convexe de5 1.
dont lespoints
extrémaux sont sur les arêtes deS:t ,
~ peut éventuellementê t re vide. _
4.3.2. On définit le sous-ensemble
de j
tel que les coordonnéesde
sont nonnulles ; ~x
est nonvide pour tout
X ¥ 0 .
Comme toutes les coordonnées de sontposi-
tives ou
nulles l’h yp er p lan d’équation Fi
n’est autre que, et l’intersection