Sur des aspects alg´ ebriques et combinatoires de l’Analyse Relationnelle
Applications en classification automatique, en th´eorie du choix social et en th´eorie des tresses
Julien Ah-Pine
Thales Communications/CeNTAI - UPMC/LSTA 26 Octobre 2007
Julien Ah-Pine (Thales Com. & LSTA) 26 Octobre 2007 1 / 57
Motivations du travail de recherche pr´esent´e
L’Analyse Relationnelle (AR) est une th´eorie qui s’int´eresse aux relations binaires selon une approche particuli`ere d´efinie intialement par J.F.
Marcotorchino et P. Michaud.
La notion alg´ebrique de relations binaires est pr´esente dans beaucoup de branches math´ematiques aussi diverses les unes que les autres. L’Analyse Relationnelle pr´esente dans ce contexte des caract´eristiques qui lui permettent de couvrir de nombreux domaines.
Elle permet des r´esultats d’unification, desmod´elisations originales de probl`emes divers en s’appuyant sur une approche pluri-disciplinaire.
Nous avons cherch´e `a participer `a l’effort de d´eveloppement de cette th´eorie en apportant denouveaux outils tels que l’alg`ebre des relations binaires, ce qui nous a permis d’une part, de contribuer `a des axes de recherche existants de l’AR tels que la classification automatique ; d’autres part, d’´elargir ses champs d’applicationstelle que la th´eorie des tresses.
Julien Ah-Pine (Thales Com. & LSTA) 26 Octobre 2007 2 / 57
Sommaire
1 Rappels
2 R´esultats d’unification
... sur certains indices de similarit´e ... sur certains crit`eres d’association ... entre diff´erentes structures
3 Sur des aspects combinatoires de l’AR
... dans le cadre de l’agr´egation de relations ... dans le cadre de la th´eorie du choix social
4 Sur des probl`emes d’optimisation dans des structures alg´ebriques en exploitant l’AR
...le probl`eme de classification automatique
...le probl`eme de la tresse minimale en th´eorie des tresses
5 Perspectives de recherche
Julien Ah-Pine (Thales Com. & LSTA) 26 Octobre 2007 3 / 57
Sommaire
1 Rappels
2 R´esultats d’unification
... sur certains indices de similarit´e ... sur certains crit`eres d’association ... entre diff´erentes structures
3 Sur des aspects combinatoires de l’AR
... dans le cadre de l’agr´egation de relations ... dans le cadre de la th´eorie du choix social
4 Sur des probl`emes d’optimisation dans des structures alg´ebriques en exploitant l’AR
...le probl`eme de classification automatique
...le probl`eme de la tresse minimale en th´eorie des tresses
5 Perspectives de recherche
Julien Ah-Pine (Thales Com. & LSTA) 26 Octobre 2007 4 / 57
L’Analyse Relationnelle (AR)
Etude des relations binairesen g´en´eral : de leur agr´egation, de leurs mesures d’association, de leur r´esum´e...
L’approche pr´esent´ee ici est celle d´evelopp´ee initialement par J.F.
Marcotorchino et P. Michaud Particularit´es de l’approche :
I s’inspire des travaux deCondorcet
I approche pluri-disciplinaire(th´eorie des graphes, logique, statistiques, optimisation)
I repr´esentation des relations binaires sous forme dematrices binaires de comparaisons par paires
I recherche de consensus par optimisation enprogrammation lin´eaireen nombres bivalents 0/1
Principaux domaines d’application :
I Analyse de donn´ees, classification automatique, crit`eres d’association...
I Aide multicrit`ere `a la d´ecision, th´eorie des votes...
Julien Ah-Pine (Thales Com. & LSTA) 26 Octobre 2007 5 / 57
Matrices binaires relationnelles de comparaisons par paires
Unerelation binaireRsur un ensemble d’objetsOest le sous ensemble des couples de O×Otel queOi est en relation avecOi0 ce qui s’´ecritOiROi0. Une matrice relationnelleC repr´esentative deRest telle que :
Cii0 =
1 siOiROi0 0 sinon
Nous avons par exemple les diff´erents cas suivants :
relation d’´equivalence relation d’ordre {O1≡O2};{O3 ≡O4} O1 ≤O2 ≤O4≤O3
C =
O1 O2 O3 O4
O1 1 1 0 0
O2 1 1 0 0
O3 0 0 1 1
O4 0 0 1 1
C =
O1 O2 O3 O4
O1 1 1 1 1
O2 0 1 1 1
O3 0 0 1 0
O4 0 0 1 1
Julien Ah-Pine (Thales Com. & LSTA) 26 Octobre 2007 6 / 57
Agr´egation de relations et Crit`ere de Condorcet
M relations binairesRk;k= 1, . . . ,M du mˆeme type (´equivalence ou ordre) → une relation consensuelle ?En AR le proc´ed´e consiste `a :
1 Pour chaque relation Rk, calculer sa matrice relationnelle Ck
2 Agr´egation des relations par sommation de leurs matrices relationnelles → matrices relationnelles collectives :
C=PM
k=1Ck etC=PM
k=1Ck o`u Ckii0 = 1−Ciik0 3 Maximiser enX le crit`ere de Condorcet suivant :
Condorcet(C,X) =
N
X
i,i0=1
Cii0Xii0
| {z }
Accords positifs
+
N
X
i,i0=1
Cii0Xii0
| {z }
Accords n´egatifs
Propri´et´e du codage relationnel :
le crit`ere de Condorcet est lin´eaire en X
propri´et´es relationnelles = contraintes lin´eaires en X
Julien Ah-Pine (Thales Com. & LSTA) 26 Octobre 2007 7 / 57
Mod`eles de programmation lin´eaire en nombres bivalents
→ la relation consensuelleX peut ˆetre obtenue par programmation lin´eaire en nombres bivalents !
maxX Condorcet(C,X) sous les contraintes:
SiX est une relation d’´equivalence:
Xii0 ∈ {0,1} (binarit´e) Xii = 1 ∀i = 1, . . . ,N (r´eflexivit´e) Xi0i =Xii0 ∀i,i0= 1, . . . ,N (sym´etrie) Xii0+Xi0i00−Xii00 ≤1 ∀i,i0,i00= 1, . . . ,N (transitivit´e) SiX est une relation d’ordre strict:
Xii0 ∈ {0,1} (binarit´e) Xii0+Xi0i ≤1 ∀i,i0= 1, . . . ,N :i 6=i0 (asym´etrie) Xii0+Xi0i ≥1 ∀i,i0= 1, . . . ,N :i 6=i0 (totalit´e) Xii0+Xi0i00−Xii00 ≤1 ∀i,i0,i00= 1, . . . ,N (transitivit´e)
Julien Ah-Pine (Thales Com. & LSTA) 26 Octobre 2007 8 / 57
Sommaire
1 Rappels
2 R´esultats d’unification
... sur certains indices de similarit´e ... sur certains crit`eres d’association ... entre diff´erentes structures
3 Sur des aspects combinatoires de l’AR
... dans le cadre de l’agr´egation de relations ... dans le cadre de la th´eorie du choix social
4 Sur des probl`emes d’optimisation dans des structures alg´ebriques en exploitant l’AR
...le probl`eme de classification automatique
...le probl`eme de la tresse minimale en th´eorie des tresses
5 Perspectives de recherche
Julien Ah-Pine (Thales Com. & LSTA) 26 Octobre 2007 9 / 57
Indices de similarit´e entre vecteurs binaires Exemple de deux vecteurs binaires :
( O~i = 11011001 O~i0 = 10111000 Quelques indices de similarit´e entre vecteurs binaires :
Dice(O~i, ~Oi0) = 11ii0
11ii0+12(10ii0+01ii0)
Jaccard(O~i, ~Oi0) = 11 11ii0
ii0+10ii0+01ii0
Ochiai(O~i, ~Oi0) = √ 11ii0
(11ii0+10ii0)(11ii0+01ii0)
Kulczynski(O~i, ~Oi0) =12 11
ii0
11ii0+10ii0 +1111ii0
ii0+01ii0
D´efinition “logique” de ces indices qui utilisent les quantit´es suivantes : 11ii0 est le nb de 1 en commun entre les deux vecteurs (accords positifs)
00ii0 est le nb de 0 en commun entre les deux vecteurs (accords n´egatifs)
10ii0+ 01ii0 est le nb de d´esaccords entre les deux vecteurs
Julien Ah-Pine (Thales Com. & LSTA) 26 Octobre 2007 10 / 57
Interpr´etations g´eom´etriques et extensions (1/3)
Existe t-il une interpr´etation g´eom´etrique de ces indices “logiques” ? Acc./d´esacc. Produit scalaire Interpr´etation
11ii0 = hO~i, ~Oi0i Produit scalaire euclidien 10ii0 = hO~i, ~Oi −O~i0i Dist. relative de O~i `aO~i0 01ii0 = hO~i0, ~Oi0 −O~ii Dist. relative de O~i0 `aO~i 10ii0+ 01ii0 = ||O~i−O~i0||2 Dist. euclidienne 10ii0+ 11ii0 = ||O~i||2 Norme au carr´e de O~i 11ii0+ 01ii0 = ||O~i0||2 Norme au carr´e de O~i0 D´efinition (Indice de similarit´e d’ordre t >0)
Stii0 = hO~i, ~Oi0i Mt(||O~i||2,||O~i0||2) o`uMt(a,b) = 12(at+bt)1t
Julien Ah-Pine (Thales Com. & LSTA) 26 Octobre 2007 11 / 57
Interpr´etations g´eom´etriques et extensions (2/3) Propri´et´es :
Dice(O~i, ~Oi0) =S1ii0 (t= 1⇒ Mt =Moyenne arithm´etique) Ochiai(O~i, ~Oi0) = limt→0Stii0 (t→0⇒ Mt=Moyenne g´eom´etrique)
Kulczynski(O~i, ~Oi0) =S−1ii0 (t =−1⇒ Mt =Moyenne harmonique)
Interpr´etation g´eom´etrique en terme de cosinus et de rapport des normes
→ extension `a des vecteurs non binaires
Propri´et´e (D´efinition en fonction du cosinus et des rapports des normes) Stii0 = θii0
Mt(γii0, γii0) o`uθii0 = cos(O\~iO~i0),γii0 = ||O~i
0||
||O~i|| et γii0 = ||O~i||
||O~i0||
Julien Ah-Pine (Thales Com. & LSTA) 26 Octobre 2007 12 / 57
Interpr´etations g´eom´etriques et extensions (3/3)
Interpr´etation g´eom´etrique en terme de coefficients de colin´earit´e Propri´et´e (D´efinition en fonction des coefficients de colin´earit´e)
Stii0 =M−t(PO~i0(O~i),PO~i(O~i0)) o`u PO~i0(O~i) = hO~i,~Oi
0i
hO~i0,~Oi0i et PO~i(O~i0) = hO~i,~Oi
0i
hO~i,~Oii (rappel et pr´ecision)
Julien Ah-Pine (Thales Com. & LSTA) 26 Octobre 2007 13 / 57
Mesures d’association entre relations d’´equivalence ou partitions Exemples de deux partitions :
8
>>
<
>>
:
Vk =
„ O1 O2 O3 O4
marron marron bleu bleu
«
Vl =
„O1 O2 O3 O4
brun brun brun blond
«
Quelques mesures d’association entre partitions : Belson(Vk,Vl) =P
u,v nuv −nu.Nn.v2
Rand(Vk,Vl) = 2
P
u,vn2uv−P
un2u.−P
vn2.v+N2 N2
JV(Vk,Vl) = pkpl
P
u,vn2uv−pkP
un2u.−plP
vn2.v+N2 q
(pk(pk−2)P
un2u.+N2)(pl(pl−2)P
vn2.v+N2) χ2T(Vk,Vl) =
P
u,v 1
nu.n.v(nuv−nu.n.v
N )2
√
(pk−1)(pl−1)
Tableau contingentiel entre Vk etVl :
nuv = nb d’objets ayant la modalit´e u deVk et la modalit´e v de Vl nu.=P
vnuv = nb total d’objets ayant la modalit´e u deVk pk = nb de modalit´es de la variable Vk
N =n..= nb total d’objets
Julien Ah-Pine (Thales Com. & LSTA) 26 Octobre 2007 14 / 57
Formules de passage contingentiel / relationnel
Quelles sont les diff´erences majeures entre ces diff´erentes mesures d’association ?
Formule de passage entre codage contingentiel et codage relationnel [Kendall(1970)] et [Marcotorchino(1984)] :
Contingence ↔ Relationnel Ppk
u=1
Ppl
v=1(nkluv)2 = PN i=1
PN
i0=1Ciik0Ciil0
P
u(nklu.)2 = P
i,i0Ciik0
P
v(nkl.v)2 = P
i,i0Ciil0
P
u,v (nkluv)2
nklu.nkl.v = P
i,i0 Ciik0Ciil0
Cik.Ci.l
P
u,vnkluvnklu.nkl.v = P
i,i0 Ci.k+C.ik0
2 Ciil0
Permiers r´esultats d’unification obtenus par [Marcotorchino(1984)] et [Idrissi(2000)]. Notre contribution : repr´esentation synth´etique, davantage g´eom´etrique et ajout des coefficients de Jordan et de Belson dans ce formalisme.
Julien Ah-Pine (Thales Com. & LSTA) 26 Octobre 2007 15 / 57
Unification d’un certain nombres de mesures d’association
L’expression relationnelle de certains crit`eres d’association permet de les unifier sous le formalisme suivant :
Propri´et´e (Unification d’un certain nombres de mesures d’association)
∆(Ck,Cl,f, µk, µl) =
P
i,i0 f(Ciik0)−µk
f(Ciil0)−µl q
P
i,i0 f(Ciik0)−µk2P
i,i0 f(Ciil0)−µl2
Les diff´erences majeures entre plusieurs crit`eres d’association s’expriment selon 3 param`etres (f, µk, µl)
Julien Ah-Pine (Thales Com. & LSTA) 26 Octobre 2007 16 / 57
Tableau synth´etique des r´esultats d’unifications
f(Cii0) µk µl Crit`ere apparent´e Relation avec le crit`ere apparent´e f(Cii0) = 0 0 Crit`ere de Belson Le crit`ere de Belson Cii0−Ci.+CN.i0 +CN..2 correspond au num´era-
(Transformation -teur du coefficient
de Torgerson)
f(Cii0) =Cii0 1/2 1/2 Crit`ere de Rand 2Rand(Ck,Cl)−1 f(Cii0) =Cii0 1/pk 1/pl Crit`ere de Janson JV(Ck,Cl)
et Vegelius
f(Cii0) =Cii0 C..k/N2 C..l/N2 Crit`ere de Lerman, Tetra(Ck,Cl) Crit`ere d’´ecart
carr´e `a l’ind´epen- -dance, et coeffi- -cient t´etrachorique
f(Cii0) =Cii0/Ci. 1/N 1/N Crit`ere du Chi-deux χ2T(Ck,Cl) Tchuprow
f(Cii0) =Cii0 Ci.k/N Ci.l/N Crit`ere de Jordan Le crit`ere de Jordan correspond au num´era-
-teur du coefficient
`
a un facteur pr`es
Julien Ah-Pine (Thales Com. & LSTA) 26 Octobre 2007 17 / 57
Exemples de cas particuliers
Formulation g´en´erale :
∆(Ck,Cl,f,µk, µl) =
P
i,i0(f(Ciik0)−µk)(f(Ciil0)−µl)
q P
i,i0(f(Ciik0)−µk)2Pi,i0(f(Ciil0)−µl)2
Cas particuliers :
∆(Ck,Cl,Id,1/2,1/2) =
P
i,i0(Ciik0−1/2)(Ciil0−1/2)
q P
i,i0(Ciik0−1/2)2Pi,i0(Ciil0−1/2)2
= 2Rand(Ck,Cl)−1
∆(Ck,Cl,Id,Ci.k/N,Ci.l/N) =
P
i,i0(Ciik0−Ci.k/N)(Ciil0−Ci.l/N)
q P
i,i0(Ciik0−Ci.k/N)2Pi,i0(Ciil0−Ci.l/N)2
= Jordan(Ck,Cl)
Julien Ah-Pine (Thales Com. & LSTA) 26 Octobre 2007 18 / 57
Exemples de cas particuliers
Formulation g´en´erale :
∆(Ck,Cl,f,µk, µl) =
P
i,i0(f(Ciik0)−µk)(f(Ciil0)−µl)
q P
i,i0(f(Ciik0)−µk)2Pi,i0(f(Ciil0)−µl)2
Cas particuliers :
∆(Ck,Cl,Tor,0,0) =
P
i,i0 Cii0−C ki.+C kN.i0+C k..
N2
!
Cii0−C li.+C lN.i0+C l..
N2
!
v u u tP
i,i0 Ck
ii0−Ci.+C k.i0
N +C k..
N2
!2
P
i,i0 Cii0−C li.+C l.i0
N +C l..
N2
!2
= Belson(Ck,Cl) (num´erateur)
Julien Ah-Pine (Thales Com. & LSTA) 26 Octobre 2007 19 / 57
Mesures d’association entre relations d’ordre ou classements Exemples de deux classements :
8
>>
<
>>
:
Vk =
„O1 O2 O3 O4
1 2 4 3
«
Vl =
„O1 O2 O3 O4
2 1 4 3
«
Quelques mesures d’association entre classements : GK(Vk,Vl) = Conc(VConc(Vkk,V,Vll)−Disc(V)+Disc(Vkk,V,Vll))
Kendall(Vk,Vl) = q Conc(Vk,Vl)−Disc(Vk,Vl)
(N(N−1)2 −Tie(Vk))(N(N−1)2 −Tie(Vl)) Somers(Vk,Vl) = Conc(VN(N−1)k,Vl)−Disc(Vk,Vl)
2 −Tie(Vk)
Kim(Vk,Vl) = Conc(VN(N−1)k,Vl)−Disc(Vk,Vl)
2 −Tie(V k)+Tie(V l)
2
Nb de concordances et de discordances entre Vk etVl : Conc(Vk,Vl) = nb de paires d’objets concordantes Disc(Vk,Vl) = nb de paires d’objets discordantes Tie(Vk) = nb de paires en (ex-aequos) pourVk.
Julien Ah-Pine (Thales Com. & LSTA) 26 Octobre 2007 20 / 57
Nouvelles formules de passage concordance / relationnel
La question de l’´ecriture relationnelle de ces mesures d’association entre classements ?
Premiers r´esultats donn´es par [Ghashghaie(1990)]. Notre contribution : nouvelles formules de passage davantages sym´etriques
interpr´etation du dual d’un ordre strict dans le cadre de l’alg`ebre des relations binaires:converse ˘C (ou transpos´ee) de C o`u ˘Cii0 =Ci0i
Concordance ⇔ Relationnel Conc(Ck,Cl)−Disc(Ck,Cl) = 12PN
i,i0=1
Ciik0−C˘iik0 Ciil0−C˘iil0
Conc(Ck,Cl) +Disc(Ck,Cl) = 12P
i,i0
Ckii0+ ˘Ckii0 Clii0 + ˘Clii0
Tie(Ck) = N(N−1)2 −12P
i,i0
Ciik0−C˘iik0
2
o`u Ckii0 = 1−Ciik0 et C˘iik0 =Cik0i
Julien Ah-Pine (Thales Com. & LSTA) 26 Octobre 2007 21 / 57
Nouvelles ´ecritures relationnelles des mesures d’association
Nouvelles ´ecritures relationnelles : GK(Ck,Cl) =
P
i,i0
(
Ciik0−C˘iik0)(
Ciil0−C˘iil0)
P
i,i0
Ckii0+ ˘C
k ii0
Clii0+ ˘C
l ii0
Kendall(Ck,Cl) =
P
i,i0
(
Ciik0−C˘iik0)(
Ciil0−C˘iil0)
q P
i,i0
(
Ciik0−C˘iik0)
2Pi,i0(
Ciil0−C˘iil0)
2Somers(Ck,Cl) =
P
i,i0
(
Ciik0−C˘iik0)(
Ciil0−C˘iil0)
P
i,i0
(
Ciik0−C˘iik0)
2Kim(Ck,Cl) =
P
i,i0
(
Ciik0−C˘iik0)(
Ciil0−C˘iil0)
1 2
P
i,i0
(
Ciik0−C˘iik0)
2+Pi,i0(
Ciil0−C˘iil0)
2Julien Ah-Pine (Thales Com. & LSTA) 26 Octobre 2007 22 / 57
Ind´ependance statistique versus Ind´etermination [Marcotorchino(1984)]
Vk et Vl deux variables qualitatives :
Ind´ependance statistique→ mod`ele multiplicatif : Vk ⊥S Vl
⇔P
u,v
nkluv −nklu.Nnkl.v2
= 0
⇔P
i,i0Ciik0Ciil0×P
i,i0Ckii0Clii0 =P
i,i0Ciik0Clii0×P
i,i0Ckii0Ciil0
⇔11kl×00kl = 10kl×01kl Ind´etermination→ mod`ele additif :
Vk ⊥L Vl
⇔P
i,i0Ciik0Ciil0+P
i,i0Ckii0Clii0 =P
i,i0Ciik0Clii0+P
i,i0Ckii0Ciil0
⇔11kl +00kl = 10kl +01kl
Julien Ah-Pine (Thales Com. & LSTA) 26 Octobre 2007 23 / 57
Ind´etermination entre relations d’´equivalence et entre relations d’ordre
Dans le formalisme relationnel, le concept d’ind´etermination est commun aux relations d’´equivalence et aux relations d’ordre
Cas des relations d’´equivalence (variables qualitatives) : Vk ⊥L Vl
⇔P
i,i0Ciik0Ciil0+P
i,i0Ckii0Clii0 =P
i,i0Ciik0Clii0+P
i,i0Ckii0Ciil0
Cas des relations d’ordre (variables ordonn´ees) : Vk ⊥L Vl
⇔P
i,i0Ciik0Ciil0+P
i,i0C˘iik0C˘iil0 =P
i,i0Ciik0C˘iil0+P
i,i0C˘iik0Ciil0
Unification permise en consid´erant les points de vue alg´ebriques suivants : Pour des relations d’´equivalence le dual deC est le compl´ementaireC Pour des relations d’ordre, nous prenons comme dual de C,sa converse ˘C (et non son compl´ementaire)
Julien Ah-Pine (Thales Com. & LSTA) 26 Octobre 2007 24 / 57
Crit`eres d’association et indices de similarit´e d’ordre t
Matrices relationnelles = tenseurs dans l’espace de base canonique {ei⊗ei0;i,i0= 1, . . . ,N}
Exemples dans le cas des ordres :
Kendall(Ck,Cl) = Ochiai(C~k −C~˘k, ~Cl −C~˘l)
= hCk−C˘k,Cl−C˘li
Mt→0(hCk−C˘k,Ck−C˘ki,hCl−C˘l,Cl−C˘li)
Kim(Ck,Cl) = Dice(~Ck −C~˘k, ~Cl−C~˘l)
= hCk−C˘k,Cl−C˘li
M1(hCk−C˘k,Ck−C˘ki,hCl−C˘l,Cl−C˘li)
Somers(Ck,Cl) = P
(C~k−~C˘k)(C~l−~C˘l)
= hCk−C˘k,Cl−C˘li
hCk−C˘k,Ck−C˘ki
o`uhCk,Cli=P
i,i0Ciik0Ciil0 =Trace(tCk.Cl) =produit scalaire de Frobenius
Julien Ah-Pine (Thales Com. & LSTA) 26 Octobre 2007 25 / 57
Sommaire
1 Rappels
2 R´esultats d’unification
... sur certains indices de similarit´e ... sur certains crit`eres d’association ... entre diff´erentes structures
3 Sur des aspects combinatoires de l’AR
... dans le cadre de l’agr´egation de relations ... dans le cadre de la th´eorie du choix social
4 Sur des probl`emes d’optimisation dans des structures alg´ebriques en exploitant l’AR
...le probl`eme de classification automatique
...le probl`eme de la tresse minimale en th´eorie des tresses
5 Perspectives de recherche
Julien Ah-Pine (Thales Com. & LSTA) 26 Octobre 2007 26 / 57
Mesure consensuelle `a une majorit´e donn´ee
M matrices relationnelles pour lesquelles :
Ciik0 =µ(OiRkOi0) = mesure comprise entre 0et1
de (l’“intensit´e”) la relation entre Oi etOi0 Quelle est la mesure consensuelle qu’il y aitm (compris entre 0 etM) relations qui supportent la relation entre Oi et Oi0?
Exemple :
Variables Cii10 Cii20 Cii30 Cii40
Probabilit´e 0.9 0.8 0.7 0
Si on suppose que les variables sont mutuellement ind´ependantes, nous avons :
Majorit´e m 4 3 2 1
[EmM]ii0 0.000 0.504 0.902 0.994 EmM est appel´eeenveloppe de Condorcet d’ordrem.
Julien Ah-Pine (Thales Com. & LSTA) 26 Octobre 2007 27 / 57
Expression arithm´etique de l’enveloppe de Condorcet
Enveloppe de Condorcet = combinaison lin´eaire des matrices relationnelles suivantes :
D´efinition (Somme de matrices d’intersection) SkM =P
1≤i1<i2<...<ik≤M Ci1⊗Ci2⊗. . .⊗Cik
∀k = 1, . . . ,M o`u⊗ est un op´erateur de conjonction ou encore “t-norms”.
Par exemple, pour M = 4 et k = 3, nous avons :
S34 =C1⊗C2⊗C3+C1⊗C2⊗C4+C1⊗C3⊗C4+C2⊗C3⊗C4. Par ailleurs :E34 =α3,43 S34−α3,44 S44 =1×S34−2×S44
Propri´et´e (Expression arithm´etique de l’enveloppe de Condorcet) EmM =PM
k=mαm,Mk SkM
Les coefficients de la combinaison lin´eaire sont donn´es par l’inversion du triangle de Pascal.
Julien Ah-Pine (Thales Com. & LSTA) 26 Octobre 2007 28 / 57
Diff´erentes formulations combinatoires des coefficients αkm,M
Propri´et´e (Expression simplifi´ee des coefficients αm,Mk en fonction des coefficients binomiaux (expression donn´ee par Ch. Jordan))
αm,Mk = (−1)k−m km−1−1
∀k =m, . . . ,M
Propri´et´e (Expression en fonction des coefficients binomiaux n´egatifs) αm,Mk = k−m−m
∀k =m, . . . ,M Nous avons donc :
EmM =PM k=m
−m k−m
SkM = PM−m k=0
−m k
Sm+kM Formulation qui rappelle celle du binˆome de Newton : (1 +s)−m= P∞
k=0
−m k
s−(m+k)
Julien Ah-Pine (Thales Com. & LSTA) 26 Octobre 2007 29 / 57
Th´eor`eme d’impossibilit´e d’Arrow
D´efinition (Axiomes d’Arrow)
axiome d’universalit´e (chaque votant a la possibilit´e d’exprimer tout type de pr´ef´erence)
axiome de non dictature
axiome de Pareto par paires (condition d’unanimit´e)
axiome d’ind´ependance (vis `a vis des situations non pertinentes) axiome de transitivit´e (la relation collective doit ˆetre transitive afin d’´eviter les effets Condorcet)
Th´eor`eme (Th´eor`eme d’Arrow (1951))
Si le nombre de votants M est sup´erieur o`u ´egal `a 2 et si le nombre de candidats N est sup´erieur ou ´egal `a 3, alors il n’existe pas de r`egle d’agr´egation dont le r´esultat v´erifie simultan´ement les cinq axiomes pr´esent´es pr´ec´edemment.
Julien Ah-Pine (Thales Com. & LSTA) 26 Octobre 2007 30 / 57
Conditions de restriction de domaines Relaxation de la condition d’universalit´e
Conditions existantes : conditions de Black, d’Inada, de Sen, de Chichilnisky et Heal.
Julien Ah-Pine (Thales Com. & LSTA) 26 Octobre 2007 31 / 57
Matrices relationnelles et dio¨ıde (ZM,max,min)
R`egle majoritaire simple : Oi est pr´ef´er´ee `aOi0 s’il y a plus de voix qui pr´ef`erent Oi `aOi0 que l’inverse.
Nous consid´erons de ce fait la matrice de comparaisons par paires suivante :
Cii0 =
PM
k=1Ciik0−PM
k=1Cik0i ∀i 6=i0 M ∀i =i0
Nous nous pla¸cons dans le cadre d’undio¨ıde dont : les ´el´ements appartiennent aux relatifs
{−M,−M+ 1, . . . ,−1,0,1, . . . ,M−1,M}
l’addition est remplac´ee par l’op´eration max, dans ce cas l’´el´ement neutre relatif estM
la multiplication est remplac´ee par l’op´eration min, dans ce cas l’´el´ement neutre relatif est−M
Julien Ah-Pine (Thales Com. & LSTA) 26 Octobre 2007 32 / 57
Op´erateurs (matriciels) consid´er´es et issus de l’alg`ebres des relations binaires
multiplication relative(multiplication matricielle ne prenant pas en compte tout ´el´ement de la diagonale) :
[C∗C0]ii0 = maxi00:i006=i∨i006=i0 min(Cii00,C0i00i0)
addition relative(similaire `a une multiplication relative mais avec les op´erateurs max et min invers´es) :
[C]∗C0]ii0 = mini00:i006=i∨i006=i0 max(Cii00,C0i00i0) op´erateursTraceassoci´es `a une op´eration max ou min :
Tracemax(C) =maxN
i=1 Cii Tracemin(C) =
N
mini=1 Cii
Permanent(ne prenant pas en compte la permutation neutre donn´ee par la diagonale) :
Perm∗(C) = maxπ∈SN:π6=π minNi=1Ci,π(i)
Julien Ah-Pine (Thales Com. & LSTA) 26 Octobre 2007 33 / 57
Conditions n´ecessaires et suffisantes relatives aux propri´et´es relationnelles
Propri´et´e (CNS relatives `a l’asym´etrie)
Tracemax(C∗C)<0 ⇔ la relation agr´eg´ee est asym´etrique Propri´et´e (CNS relatives `a la totalit´e)
Tracemin(C]∗C)≥0 ⇔ la relation agr´eg´ee est totale Propri´et´e (CNS relatives `a l’acyclicit´e)
Perm∗(C)<0 ⇔ la relation est acyclique
Julien Ah-Pine (Thales Com. & LSTA) 26 Octobre 2007 34 / 57
Conditions n´ecessaires et suffisantes relatives `a la transitivit´e
Propri´et´e (CNS relatives `a la transitivit´e)
min(C∗C,UN)max(C,−UN) ⇔ la relation agr´eg´ee est transitive o`u UN est la matrice carr´ee de dimension N remplie de0,−UN celle remplie de−1 et o`u deux matricesC et C0 sont telles que CC0 si et seulement si [C]ii0 ≤[C0]ii0 ∀i,i0 = 1, . . . ,N.
Julien Ah-Pine (Thales Com. & LSTA) 26 Octobre 2007 35 / 57
Exemple d’application
C =
O1 O2 O3 O4
O1 5 1 1 3
O2 −1 5 −1 1
O3 −1 1 5 1
O4 −3 −1 −1 5
Tracemax(C∗C) =−1<0⇔ Asym´etrie
Tracemin(C]∗C) = 1≥0⇔Totalit´e Perm∗(C) =−1<0⇔ Acyclicit´e (C∗C)⊗UN
⊆[C⊕(−UN)]⇔ Transitivit´e
Julien Ah-Pine (Thales Com. & LSTA) 26 Octobre 2007 36 / 57
Sommaire
1 Rappels
2 R´esultats d’unification
... sur certains indices de similarit´e ... sur certains crit`eres d’association ... entre diff´erentes structures
3 Sur des aspects combinatoires de l’AR
... dans le cadre de l’agr´egation de relations ... dans le cadre de la th´eorie du choix social
4 Sur des probl`emes d’optimisation dans des structures alg´ebriques en exploitant l’AR
...le probl`eme de classification automatique
...le probl`eme de la tresse minimale en th´eorie des tresses
5 Perspectives de recherche
Julien Ah-Pine (Thales Com. & LSTA) 26 Octobre 2007 37 / 57
Insuffisance des op´erations sous-jacentes aux algorithmes k-means
L’algorithme des k-means utilise basiquement des
op´erations de transfert entre objets
qui consistent `a transf´erer un objet dans la classe d’un
autre objet.
Julien Ah-Pine (Thales Com. & LSTA) 26 Octobre 2007 38 / 57