Monotonie et langages d’extension

4.5 Autres propriétés

g′∈G\{g}^Ve′∈g′

V g′∈G\{g} V e′∈g′

BI=|min(SOL(I))| ≥max(max(|min(Sol(g₁))|, . . . ,|min(Sol(gn)|),⌈log₂(|G|⌉)) et

BS=|min(SOL(I))| ≤ |min(min(Sol(g₁)), . . . , min(Sol(gn)))|

Monotonie et langages d’extension

4.5 Autres propriétés

4.5.2 Monotonie et langages d’extension

Formalisation du problème de

caractérisation multiples

(PCM)

Sommaire

4.1 Contexte du PCM . . . . 76

4.2 Définitions et propositions . . . . 78

4.3 Résolution par les fonctions booléennes

partiel-lement définies (pdBfs) . . . . 82

4.4 NP-Complétude et FPT-Hiérarchie . . . . 84

4.5 Autres propriétés . . . . 87

4.5.1 Bornes et satisfiabilité . . . . 87

4.5.2 Monotonie et langages d’extension . . . . 87

4.6 Conclusion . . . . 89

Nous présentons dans ce chapitre la modélisation du PCM qui a évolué

au cours de cette thèse.

4.1 Contexte du PCM

Comme nous l’avons décrit dans le chapitre 1, le problème de

caractérisa-tion multiple consiste à identiﬁer de manière sûre des individus d’un groupe

en fonction de certains de leurs caractères mesurables. Pour cela, nous

pro-posons de construire une formule logique utilisant ces caractères comme

des variables booléennes. Cette formule devra être satisfaite par les

indivi-dus (entités) représentatifs du groupe et falsiﬁée par les entités des autres

groupes. Une telle formule doit être ainsi construite pour chaque groupe.

Pour des raisons de coût et de ﬁabilité, nous avons également vu que le

nombre total de caractères utilisés par ces formules devait être minimal.

Nous illustrons ce problème sur un exemple simple.

Dans la ﬁgure 4.1, nous considérons 5 entités réparties dans 3 groupes.

La description de chaque entité se base sur un ensemble de 3 caractères,

mesurés par une valeur booléenne à (0/1, présence/absence, . . . ). Résoudre

ce problème revient à caractériser chaque groupe. Il faut donc, pour chaque

groupe, trouver une combinaison de variables permettant de construire une

formule vraie pour toutes les entités du groupe et fausse pour les autres

entités des autres groupes. Dans l’exemple de la ﬁgure 4.1, le groupe 1

est caractérisé par la négation simultanée des variables a et b et donc la

formule¬a∧ ¬b. Le groupe 2 est caractérisé par les variablesb etcavec la

formule b∧c. Les souches du groupe 3 ont toutes en commun la négation

de la variable c tout comme l’entité e

du groupe 1. Il faut donc ajouter

une autre variable (b par exemple) pour être sûr de caractériser le groupe

(c’est-à-dire discriminer ses entités par rapport aux autres groupes).

Plus concrètement, par rapport aux notions introduites dans les

cha-pitres précédents, considérons un ensemble d’entités (les souches

bacté-riennes) regroupées en groupes (les pathovars). Chaque entité est déﬁnie

par la présence ou l’absence d’un ensemble de caractères (les gènes). Au

regard de la représentation binaire qui est utilisée, une entité est considérée

comme une interprétation booléenne sur les caractères, qui seront donc les

variables booléennes du problème. Ainsi, pour chaque groupe, l’ensemble

des entités fournit une table de vérité partielle d’une fonction booléenne

vraie pour les interprétations correspondant aux entités du groupe et fausse

pour toutes les autres entités des autres groupes. Une telle fonction sera

appelée caractérisation d’un groupe.

Le problème se base sur une structuration des données précises fournies

par les biologistes :

• Le domaine des données : l’absence ou la présence des caractères nous

amène à déﬁnir un domaine qui soit binaire (booléen). La sémantique

Souches Groupes Caractères

a b c

e

g

0 0 0

e

0 0 1

e

g

1 1 1

e

g

1 1 0

e

0 1 0

Figure 4.1 : Exemple de problème de caractérisation multiple

naturellement retenue est 0 ou faux dénote l’absence d’un caractère

et 1 ou vrai caractérise la présence.

• Les entités : une entité est totalement déﬁnie sur un ensemble de

ca-ractères dont nous ne mettons pas en cause la véracité sur l’expression

de ses caractères.

• Les groupes : un groupe est constitué par un nombre ﬁni d’entités.

formule_¬a∧ ¬b. Le groupe 2 est caractérisé par les variablesb etcavec la

Souches Groupes ^Caractères

Une instance du PCM est déﬁnie par un n-uplet (_X,E,G) où _X est

l’en-semble des variables propositionnelles, _E est l’ensemble des entités déﬁnies

sur_X et l’ensemble des groupes _{G ⊆}2

déﬁnie commee:_{X → {}0,1_}, où 0 et 1 sont respectivement les valeurs

• Pour une formule propositionnelle φ quelconque sur _X, nous notons

e |⁼φ le fait que l’interprétation e∈ E ^{satisfait la formule} φ.

valeurs booléennes (c’est-à-dire, un élément de _{0,1_}

instance (_X,E,G^{) peut être vue comme une matrice booléenne dont}

les n colonnes correspondent aux variables booléennes de _X et les m

lignes aux entités de _E.

correspond à la colonne j ∈ {¹, . . . , n}^{. Chaque}

• Il n’existe pas de colonne dont toutes valeurs sont identiques : ∄_j ∈

{¹, . . . , n},∀i∈ {¹, . . . , m}^, e

• Chaque colonne est unique : ∄_j ∈ {1, . . . , n},∀k ∈ {1, . . . , n} \

∄_i∈ {1, . . . , m},∀l ∈ {1, . . . , m}\{i},∀j ∈ {1, . . . , n},e

au pire des cas en_O(_{|X |}