• Aucun résultat trouvé

Extraction d’information et mesure de similarit´e

5.3 Description d’un codeur sans perte pour STIS

5.3.6 Extraction d’information et mesure de similarit´e

Nous nous r´ef´erons au syst`eme de codage en deux passes pr´esent´e dans la Figure 5.2. Nous avons pr´esent´e les moyens pour combiner les diff´erents modules et obtenir un co- deur sans perte en deux parties efficace. Le codage du pr´edicteur et de l’arbre, repr´esente le mod`ele du signal ou l’information d’importance extraite. D’autre part, le signal d’er- reur constitue la seconde partie du code qui est consid´er´ee comme purement al´eatoire connaissant l’arbre de contexte. En l’occurrence, nous faisons en sorte que chaque bit

5.3. DESCRIPTION D’UN CODEUR SANS PERTE POURSTIS 121 k g l h m i j f e x q(x) c b a d t−1 t temps

|a−c| gradient horizontal |c−b| gradient vertical |b−h| gradient temporel |e−k| gradient diagonal vecteur de contexte |a−c| |c−b| |b−h| |e−k| q(|a−c|) q(|c−b|) q(|b−h|) q(|e−k|) contexte quantifié

FIG. 5.5 –Le contexte d’un pixel, repr´esent´e en noir, est d´efini `a partir des gradients avoisinants. Ces gradients sont quantifi´es pour r´eduire le nombre total de contextes et ´eviter une dissolution de l’information conditionnelle. Dans le cadre de STIS, nous consid´erons les gradients horizontaux, verticaux, diagonaux et temporels pour d´efinir le contexte.

q(|b−h|) q(|c−b|) q(|a−c|)

...

...

{10..14} {15...} {2..5} {0,1} {6..9} états quantifiés chemin de contexte q(|e−k|)

FIG. 5.6 –L’arbre complet correspondant aux contextes{q(| a−c |), q(| c−b |), q(| b−h |), q(| e−k |

)} est repr´esent´e. Chaque vecteur de contexte correspond `a un chemin vers un des 45contextes.

122 5. EXTRACTION D’INFORMATION FONDEE SUR LES COMPLEXIT´ ES´

num´erique transmis contienne un bit d’information. C’est la d´efinition d’un signal pu- rement al´eatoire. Par analogie avec les techniques classiques d’extraction d’information dans les images, nous pouvons consid´erer le pr´edicteur et l’arbre comme primitives du signal cod´e.

Ce sch´ema de codage en deux parties permet de d´efinir la Distance Normalis´ee Suffi- sante de Compression (DNSC) entre deux signaux tridimensionnels x et y. Dans le calcul de cette distance, nous nous int´eressons aux complexit´es conditionnelles C1(x | My) et

C1(y | Mx). Prenons la mesure C1(x | My). Cette quantit´e mesure la quantit´e de bits

n´ecessaire `a coder l’erreur de pr´ediction de x en prenant le pr´edicteur et l’arbre statis- tique contextuel obtenus avec y. L’union de ces deux objets, pr´edicteur et arbre, est par cons´equent not´eMy.

Finalement, notre codeur peut ˆetre utilis´e pour le codage de la STIS vue comme un ensemble de structures spatio-temporelles en se basant sur la m´ethodologie pr´esent´ee au §5.2.1. En effet, en codant ind´ependamment les structures spatio-temporelles, nous r´eduisons les redondances et extrayons l’information intrins`eque `a chaque objet. Dans une seconde ´etape, en exploitant les similarit´es inter-objets, nous r´eduisons les redon- dances qui existent entre les ´ev´enements spatio-temporels. Cette m´ethode permet d’aug- menter la compression de toute la STIS tout en cr´eant un index du contenu information- nel.

Nous terminons par signaler que le codeur pr´esent´e s’applique aux s´eries temporelles monospectrales. N´eanmoins, il est possible de g´en´eraliser notre codeur `a des s´eries tem- porelles multispectrales.

5.4

R´esum´e

Nous avons introduit la Distance Normalis´ee Suffisante de Compression (DNSC) pour comparer deux objets en utilisant l’information structurante des objets. Nous avons d´eduit cette distance de la DCN qui pr´esente de tr`es bons r´esultats pour le clustering de diff´erents types d’objets, tels que le texte, les textures ou l’ADN. La DNSC est pertinente dans le cadre de l’extraction d’information, puisqu’elle int`egre le principe LDM qui vise `a extraire l’information d’int´erˆet.

Ensuite, nous avons pr´esent´e un crit`ere g´en´eral de codage d’un ensemble d’objets en exploitant les redondances inter-objets. Ce principe rentre dans le cadre LDM, o `u l’in- formation est divis´ee en deux parties. D’autre part, nous montrons que la minimisation de la longueur de code s’apparente `a la minimisation d’un couple d´ebit-distorsion. Ce lien conforte le fait qu’une extraction d’information est op´er´ee lors du codage conjoint de l’ensemble d’objet. Dans le cadre de la th´eorie d´ebit-distorsion, nous montrons que le crit`ere de longueur minimale s’apparente au principe IB puisque une troisi`eme va- riable contenant l’information pertinente est introduite. Le crit`ere propos´e dans l’Eq. 5.27 ne peut ˆetre minimis´e directement. Pour surmonter le probl`eme, nous proposons une m´ethode d’optimisation fond´ee sur la DNSC et sur la d´ecomposition de l’information en deux parties par un codeur universel. Cette m´ethode permet de construire un index des mod`eles. D’une part, cet index contient l’information pertinente extraite, d’autre part il est int´egr´e dans le code en deux parties de l’ensemble d’objets.

Dans le but d’appliquer notre m´ethodologie d’extraction aux STIS, nous cr´eons un co- deur sans perte pour les signaux tridimensionnels. Nous exploitons l’exp´erience scien- tifique accumul´ee sur le codage d’image (Weinberger et al., 2000; Wu & Memon, 1997)

5.4. R ´ESUME´ 123

pour construire ce codeur universel. Plus le codage est efficace, plus le mod`ele sous- jacent explique bien les donn´ees cod´ees.

N´eanmoins, la couleur n’est pas prise en consid´eration. En effet le codeur propos´e est d´edi´e aux s´eries monospectrales. Pour inclure l’information de couleur, comme cela est fait au§4.4.4, nous pr´econisons d’utiliser des transform´ees de d´ecrorr´elation spectrales, du type Karhunen-Loeve, comme mod`ele de l’information de couleur (Gueguen et al., 2005).

125

Troisi`eme partie

Exp´erimentation et analyse des

r´esultats

127

Chapitre 6

Validation et analyse des r´esultats

Dans ce chapitre, nous nous attachons `a valider les m´ethodologies que nous avons in- troduites. Pour pouvoir les ´evaluer, nous les appliquons `a des donn´ees que nous synth´eti- sons. Ensuite, nous comparons les diff´erentes m´ethodes `a des m´ethodes d’extraction d’in- formation de r´ef´erence. Enfin, nous discutons des r´esultats d’extraction d’information obtenus sur la STIS ADAM.

6.1

Validation des m´ethodologies fond´ees sur le principe IB

Dans ce chapitre, nous mettons en ´evidence la pertinence des r´esultats obtenus sur des donn´ees synth´etiques. Dans le but de valider les m´ethodologies fond´ees sur le prin- cipe IB et MIB, nous exp´erimentons ces algorithmes sur des donn´ees d´ej`a class´ees. Ainsi, nous pouvons comparer les r´esultats de clustering aux classes existantes. Enfin, nous ap- pliquons les deux m´ethodologies aux STIS et discutons des r´esultats.