• Aucun résultat trouvé

Partie III. Classification et caractérisation de chirotopes

6.1 Cas uniforme

SoitM un ensemble de chirotopes de même rang (noté r ) définis sur le même ensemble abs- traitE . Pour tout sous-ensemble C de M , nous noterons C le complémentaire de C c’est-à-dire C

C = M \C . Le cardinal d’un ensemble E (i.e. son nombre d’éléments) sera noté par #E. #E

On rappelle que l’on noteB(E ) l’ensemble des plus petits (d +1)-uplets de E dans l’ordre lexi- cographique pour chaque classe de permutation (voir Section 2.1.1 pour plus de détails).

On rappelle que dans le cas uniforme, les chirotopes sont représentés par des points de [−1,1]l où l est le nombre de (d +1)-uplets de B(E ) (voir Section 5.1.2) et que chaque (d +1)-uplet de B(E ) forme une base.

Par abus de langage, on parlera du point moyen d’un sous-ensemble C de M lorsque nous évoquerons le point moyen de l’ensemble des points représentant un chirotope deC .

Bases caractéristiques

Pour pouvoir discriminer une classe, c’est-à-dire trouver des propriétés partagées par tous les chirotopes de la classe de sorte que tout chirotope d’une autre classe ne vérifie pas ces propriétés, il faut commencer par chercher ce qui caractérise cette classe.

Soit B une base deB(E ). On défini le taux de caractérisation de la base B pour la classe C (noté

taux de caractéri- sation θC(B ) ) par θC(B ) = max ½#©χ ∈ C | χ(B) = +ª #M , #©χ ∈ C | χ(B) = −ª #M ¾

On dit qu’une base B est totalement caractéristique pour la classeC si le signe de la base B est le

base to-

talement caractéris- tique

même pour tout chirotope deC . Le taux de caractérisation d’une base totalement caractéristique est donc égal à 1.

Caractérisation faible et bases discriminantes

Afin de trouver des sous-ensembles de bases permettant de discriminer les classes, nous allons généraliser la distance entre chirotopes définie dans la Section 2.3 à un sous-ensemble quelconque de bases. Soient M1et M2deux chirotopes deM et χ1etχ2leur chirotope. Pour tout sous-ensemble D de B(E ), on définit la distance entre M1et M2par rapport àD comme étant le nombre de bases deD dont le signe est différent dans les chirotopes χ1etχ2. Formellement :

dD(M1, M2) = #©B ∈ D | χ1(B ) 6= χ2(B )ª

On définit de même pour un sous-ensembleD de B(E ) et deux points x et y de RB(E )la distance

entre x et y par rapport àD comme étant égale à :

dD(x, y) = P

B ∈D|x(B) − y(B)|

2

qui est égale à la moitié de la distance de Manhattan entre les projetés de ces points surRD. Dans ce qui suivra, nous utiliserons un abus de langage en disant que la distance dD entre deux points est une distance dansRB(E )même quandD 6= B(E ).

Considérons maintenant une partition deM en deux classes M = C ]C , ou plus généralement en k classesM = C1] · · · ] Ck. Une fois qu’une partition en classes est donnée, que ce soit par des

experts ou par une méthode de classification automatique, nous cherchons un critère combinatoire qui soit simple et significatif afin de discriminer les classes.

Nous allons alors construire des classes dépendant de trois paramètres : un ensemble de bases D, un point x de RB(E )et un réel r . On définit alors

ID,x,r

ID,x,r = {χ ∈ M | dD(χ,x) ≤ r }

On peut considérer cet ensemble comme étant l’ensemble des chirotopes contenus dans une boule deRB(E )centrée en x et de rayon r pour la distance dD.

6.1. CAS UNIFORME 113

En pratique, pour discriminer la classe C de son complémentaire C , on cherche un sous- ensembleD de B(E ) le plus petit possible (pour plus de simplicité), un point x de RDà coordonnées dans {−1,1} (pour rester dans le cadre combinatoire) et un entier r tels que ID,x,lsoit égal à la classe C . Donc un chirotope χ appartient à la classe C si et seulement si il existe au plus r bases B de D

telles queχ(B) 6= x(B). On dit alors que ID,x,l est une caractérisation faible du couple (C ,C ) (par caractérisation faible

opposition à la caractérisation forte que nous verrons plus tard). Ainsi,D correspond à un ensemble significatif de bases, x correspond aux valeurs prises par cet ensemble de bases pour la classeC et

r mesure combien de ces valeurs sont satisfaites par un chirotope.

Nous allons illustrer cette notion avec un exemple simple dans lequel on considère queD ne contient qu’une seule base B (i.e.D = {B}). Alors x est donné par un seul signe, celui pour la base

B . Sans perdre de généralité, on peut considérer que x(B ) = +1. Ainsi un chirotope χ appartient à

C si et seulement si χ(B) = +1 et χ appartient à C si et seulement si χ(B) = −1. Dans ce cas, on a

C = I{B },+1,0. On dit alors que B est totalement discriminante entreC et C . Ceci est la discrimination base to-

talement discrimi- nante

d’une classe la plus simple possible. Notons que si la partition deM comporte k classes (i.e. M = C1]· · ·]Ck), et qu’une base B est totalement discriminante entreCietCialors on peut déterminer

uniquement à partir de B si un chirotope appartient àCiou à son complémentaireCi.

Remarque. Les notion de bases totalement discriminantes et de bases totalement caractéristiques sont liées. Plus précisément, si B est une base totalement discriminante entreC et C alors B est totalement caractéristique pour la classeC et B est totalement caractéristique pour la classe C . En effet, pour tout chirotopeχ1deC et pour tout chirotope χ2deC , on a soit χ1(B ) = + et χ2(B ) = − soitχ1(B ) = − et χ2(B ) = +. Ainsi θC(B ) = 1 et θC(B ) = 1. B est donc totalement caractéristique pour la classeC et totalement caractéristique pour la classe C . Pour que la réciproque soit vraie il faut rajouter comme condition que les signes des chirotopes deC soient différents des signes des chirotopes deC .

Le problème pour discriminer la classeC de son complémentaire C est donc de déterminer les

paramètresD, x et r . Pour toute base B de B(E ), on défini le taux de discriminabilité de B entre taux de discrimi- nabilité

C et C (noté τ(B,C ,C )) par τ(B,C ,C ) = ¯¯mC(B ) − mC(B )¯¯/2 où mC et mC sont respectivement le point moyen deC et le point moyen de C . Cette valeur appartient à [0,1]. Plus cette valeur est proche de 1 et plus la base est significative pour discriminerC de C .

Le cas extrême estτ(B,C ,C ) = 1 ce qui implique que mC(B ) = +1 et mC = −1 (ou mC(B ) = −1 et mC = +1). Par définition du point moyen, on a alors que tout chirotope de C (respectivement C ) a comme signe + (resp. −) pour la base B (ou − et + respectivement), ce qui signifie que B est une base totalement discriminante entreC et C .

Au contraire,τ(B,C ,C ) = 0 si la proportion de chirotopes de C ayant comme signe + pour la base B est égale à la proportion de chirotopes deC ayant comme signe + pour la base B. C’est le cas par exemple si la base B à le même signe pour tous les chirotopes deM . Dans ce cas, la base B ne nous servira pas à discriminerC de C .

Pour calculer les paramètresD, x et r , nous allons trier les bases de B(E ) en fonction du taux de discriminabilité. CommeB(E ) peut contenir beaucoup d’éléments (en ne conservant que les bases non-fixes, nous avons près de 2 700 000 bases pour l’application que nous verrons dans la Section 11), il n’est pas possible de générer par un programme tous les sous-ensembles possibles

pourD. Afin de réduire le nombre de sous-ensembles possibles pour D, nous allons nous concen- trer uniquement sur les bases qui ont le plus grand taux de discriminabilité car ce sont elles qui ont le plus de chance d’être significatives pour discriminerC de C . Les bases ayant le plus grand taux de discriminabilité vont donc nous servir à construireD et à déterminer la valeur de r . Pour déterminer x il nous suffit d’avoir les valeurs de x(B ) pour toute base B deD. Ces dernières nous seront données par le signe de mC(B )où mC est le point moyen deC .

La méthode pour déterminer les autres paramètres est expliquée plus en détail dans la Sec- tion 6.5.

Caractérisation forte

Une caractérisation forte du couple (C ,C ) dépend de quatre paramètres : un ensemble de bases

caractérisation

forte D, deux points x et x de RB(E )et un réel r . Cette caractérisation forte consiste à trouver ces quatre

paramètres de sorte queC soit égale à ID,x,r et queC soit égale à ID,x,r. CommeC SC ) = ;, on a nécessairement que r < #D/2.

En pratique, tout comme pour une caractérisation faible, on cherche un sous-ensembleD de B(E ) le plus petit possible (pour plus de simplicité), un point x de RDà coordonnées dans {−1,1} et un entier r < #D/2. Le point x s’obtient en prenant l’opposé de chaque coordonnée de x (c’est- à-dire pour tout B ∈ D, x(B) = −x(B)). Comme pour les caractérisations faibles, pour toute base B deD, la valeur de x(B) est égale au signe de mC(B ).

Lien entre caractérisation forte et caractérisation faible

Bien sûr, si (ID,x,r,ID,x,r) est une caractérisation forte de (C ,C ) (i.e. C = ID,x,r etC = ID,x,r) alorsID,x,rest une caractérisation faible de (C ,C ) et ID,x,r est une caractérisation faible de (C ,C ). Si nous avons k classes telles queM = C1] · · · ] Ckalors il nous faut déterminer les trois para-

mètresD, x et r pour chaque classe Ci. Une fois que nous avons tous les paramètres, nous avons

deux façon de discriminer une classeCi. Cela vient du fait que si M appartient àCi alors on peut

dire directement que M ∈ Ciou dire de façon équivalente que M ∉ Cj pour tout j 6= i . Ainsi pour

discriminerCion peut utiliser la méthode directe provenant des trois paramètres calculés pourCi

ou la méthode indirecte qui provient de la négation des critères discriminantsCjpour j 6= i .