• Aucun résultat trouvé

Sélection d’attributs

Les descripteurs introduits dans la section 5.1.1 sont issus de l’étude de travaux du

cha-pitre 2, en particulier de ceux mettant en œuvre l’accéléromètre, le gyroscope et le

micro-phone. Les sources du magnétomètre et du baromètre ne sont pas mentionnées dans ces

travaux, aussi nous avons repris les mêmes descripteurs que pour l’accéléromètre et le

gyro-scope.

Dans la section 2.4.1, nous avons écrit que la sélection d’attributs vise à réduire l’impact

des attributs non-pertinents en mettant en avant ceux qui le sont. Dans notre cas, la

sélec-tion vise aussi à évaluer la pertinence des sources de données. En particulier, cela représente

un moyen d’évaluer la pertinence de l’accéléromètre et du microphone, apparus comme

deux sources incontournables pour les traitements sur le smartphone après l’étude de l’état

de l’art.

5.2.1 La sélection d’attributs par ratio de gain d’information

La sélection par ratio de gain d’information représente une mesure de sélection objective

de descripteurs où l’information d’une scène est mesurée par la différence d’entropie de la

scènea prioriet lorsque l’on connaît une autre variable (un descripteur)

1

. Les descripteurs

sont évalués individuellement et peuvent être classés suivant le gain d’information. Cette

mesure est pertinente pour notre problème où le concept de scène n’est pas bien défini.

Nous avons utilisé l’implémentation du logiciel Weka (Hall et coll.2009) pour la

réalisa-tion. Les valeurs de ratio de gain d’information obtenues varient entre 0,171 pour le

descrip-teurmoyenne pressionet 0,004 pour le descripteurBande 17 Hz pression. Nous présentons

dans un premier temps la répartition des rangs des descripteurs suivant les sources de

don-nées dans la figure 5.3. L’axe des ordondon-nées indique le rang de l’attribut : le rang 1 étant le

plus élevé et donc celui de l’attribut le plus informatif. Pour chaque source, une "boîte"

re-présente l’étendue entre les premier et troisième quartile et un segment horizontal dans la

boîte représente le rang médian. En dehors de la boîte, les attributs sont représentés par des

points.

La première observation à faire sur la figure porte sur les distributions des descripteurs de

pression et de champ magnétique, toutes les deux compactes et concentrés dans les rangs les

plus bas. L’exception est le descripteur de la moyenne de la pression, qui se situe au premier

rang et représente donc le descripteur le plus informatif.

Le gyroscope et l’audio sont les deux sources les plus informatives suivant la figure. Les

rangs médians des deux distributions sont en-dessous de 50 et très proches l’un de l’autre.

La répartition des descripteurs du gyroscope est plus compacte que celle des descripteurs

acoustiques qui s’étend des premiers rangs au-delà du centième. Les descripteurs de

l’ac-céléromètre occupent une position intermédiaire, centrés autour d’un rang médian proche

de 70 et absents des 20 premiers rangs (le premier descripteur d’accélération est la bande

Accel Magn Gyro Press Audio

0

50

100

150

F

IGURE

5.3: Distribution des rangs des attributs suivant les sources de données suite à la

sélection par ratio de gain d’information

d’énergie à 3 Hz, classé 21

ième

).

L’étude plus précise du classement des descripteurs (voir la table 7.2 en annexe) indique

que les coefficients acoustiques de la première moitié de bande (indices 0 à 20) figurent

parmi les 40 premiers rangs. Les coefficients d’indices supérieurs à 30 sont classés autour

du centième rang. La variance de mesure du gyroscope est le coefficient le plus élevé de

cette source (troisième rang). Viennent ensuite les énergies dans les bandes de fréquence de

1 à 10 Hz (rangs 18 à 31). Les descripteurs les mieux classés pour l’accéléromètre sont

éga-lement les bandes d’énergie entre 1 et 10 Hz, ainsi que la variance d’accélération (29

ième

) et

l’énergie (35

ième

). Le premier descripteur du champ magnétique est la moyenne du champ,

classée 73

ième

.

Les résultats de la sélection par corrélation

L’évaluation individuelle précédente ne tient pas compte de la combinaison des

descrip-teurs qui peut parfois ajouter de la redondance ou dégrader la performance. C’est pourquoi

nous employons une méthode de sélection par ensemble d’attributs. Le critère d’évaluation,

appelé "mérite" (défini dans la section 2.4.1.2) calcule le rapport de la pertinence du

sous-ensemble de descripteurs (par la corrélation aux classes) divisé par la redondance

intrin-sèque (exprimée par l’inter-corrélation entre les descripteurs). Ainsi, le critère pénalise les

sous-ensembles peu pertinents ou très redondants. Le critère est combiné avec la méthode

de génération heuristique de sous-ensembles appeléeSequential forward selectionqui

dé-marre avec un ensemble vide et ajoute progressivement le descripteur qui augmente le plus

le mérite du ensemble. L’ensemble de la méthode ne permet d’atteindre qu’un

sous-ensemble optimal mais procède rapidement (voir la section 2.4.1.1).

La figure 5.4 illustre l’évolution du mérite à mesure que les descripteurs sont ajoutés. On

observe une augmentation rapide du mérite, puis un plateau, qui indique la valeur maximale

du mérite et le sous-ensembles optimal. La table 5.2 détaille le classement des descripteurs

jusqu’au plateau.

0 50 100 150

0.24

0.26

0.28

0.3

0.32

0.34

0.36

Taille du sous-ensemble d’attributs

M

ér

it

e

du

so

us-e

n

semble

F

IGURE

5.4: Distribution des scores des sous-ensembles d’attributs sélectionnés suivant

l’al-gorithme CFS et une méthode d’évaluation heuristique progressive

T

ABLE

5.2: Classement des attributs dans le sous-ensemble qui donne le meilleur score

sui-vant la méthode de corrélation

Rang Score Attribut Rang Score Attribut Rang Score Attribut

1 0.243 Moyenne pression 8 0.344 Variance accél. 14 0.355 Bande 23 Hz accél. 2 0.285 Variance gyroscope 9 0.347 Variance magné. - - Bande 1 Hz gyro. 3 0.313 Bande audio #1 10 0.35 Bande audio #0 - - Bande audio #9 4 0.322 Bande 3 Hz accél. 11 0.353 Moyenne accél. - - Bande 2 Hz magn. 5 0.329 Moyenne magné. - 0.353 Bande 3 Hz gyro. 18 0.356 Bande 4 Hz accél. 6 0.335 Bande audio #6 13 0.354 Bande audio #2 - - Bande 24 Hz magné. 7 0.341 Bande 2 Hz gyro.

L’attribut de moyenne de pression est le premier descripteur à être ajouté, c’est donc

celui qui est le plus corrélé aux différentes scènes. La variance du gyroscope est le second

descripteur. Cinq descripteurs acoustiques sont présents dans la table, tous d’indices

infé-rieurs à 10. Quatre descripteurs du gyroscope et cinq descripteurs de l’accéléromètre sont

également présents, représentant la moyenne, variance et les coefficients d’énergie des très

basses bandes de fréquence (1, 2 et 3 Hz), ainsi que l’énergie de la bande à 23 Hz pour

l’accé-léromètre. Les descripteurs magnétiques sont au nombre de 4, avec la moyenne, la variance

et deux coefficients d’énergie de bande.

Bilan de la sélection d’attributs

Les résultats des deux méthodes présentent certains points communs. D’abord, la

moyenne de la pression atmosphérique est un descripteur important. Notre hypothèse est

que les scènes en environnement intérieur sont caractérisées par un lieu en étage, ce qui

correspond à une légère augmentation d’altitude donc à une légère diminution de la

pres-sion atmosphérique, que les baromètres des smartphones peuvent détecter. La variation de

la pression atmosphérique dépend également des conditions météorologiques. Mais dans le

cas de la routine d’un utilisateur et d’une période courte dans l’année, il est possible

d’ima-giner des valeurs assez stables, dont les changements correspondent effectivement à des

transitions d’étages ou de lieux.

Exception faite de la moyenne de la pression, les sources du magnétomètre et du

ba-romètre se montrent d’un usage limité, à part pour des descripteurs statistiques communs

comme la variance et la moyenne. En comparaison, les trois autres sources sont plus

per-tinentes. Les descripteurs acoustiques les plus pertinents sont concentrés dans les filtres

d’indices bas, vraisemblablement entre 0 et 10, ce qui correspond à une bande de fréquence

comprise entre 0 et 1077 Hz. Les descripteurs d’accéléromètre et du gyroscope les plus

perti-nents sont la moyenne, la variance et des coefficients d’énergie dans les bandes de très basse

fréquence (moins de 5 Hz).

Les descripteurs retenus pour la configurationREF_SAsont les suivants :

— accéléromètre et gyroscope : moyenne, variance, énergie et coefficients d’énergie de la

transformée de Fourier de 0 à 5 Hz ;

— baromètre : moyenne ;

— magnétomètre : moyenne et variance ;

— microphone : les 10 premiers coefficients d’énergie (représentant l’énergie dans la

bande de fréquences équivalente de [0;1077H z]