Les descripteurs introduits dans la section 5.1.1 sont issus de l’étude de travaux du
cha-pitre 2, en particulier de ceux mettant en œuvre l’accéléromètre, le gyroscope et le
micro-phone. Les sources du magnétomètre et du baromètre ne sont pas mentionnées dans ces
travaux, aussi nous avons repris les mêmes descripteurs que pour l’accéléromètre et le
gyro-scope.
Dans la section 2.4.1, nous avons écrit que la sélection d’attributs vise à réduire l’impact
des attributs non-pertinents en mettant en avant ceux qui le sont. Dans notre cas, la
sélec-tion vise aussi à évaluer la pertinence des sources de données. En particulier, cela représente
un moyen d’évaluer la pertinence de l’accéléromètre et du microphone, apparus comme
deux sources incontournables pour les traitements sur le smartphone après l’étude de l’état
de l’art.
5.2.1 La sélection d’attributs par ratio de gain d’information
La sélection par ratio de gain d’information représente une mesure de sélection objective
de descripteurs où l’information d’une scène est mesurée par la différence d’entropie de la
scènea prioriet lorsque l’on connaît une autre variable (un descripteur)
1. Les descripteurs
sont évalués individuellement et peuvent être classés suivant le gain d’information. Cette
mesure est pertinente pour notre problème où le concept de scène n’est pas bien défini.
Nous avons utilisé l’implémentation du logiciel Weka (Hall et coll.2009) pour la
réalisa-tion. Les valeurs de ratio de gain d’information obtenues varient entre 0,171 pour le
descrip-teurmoyenne pressionet 0,004 pour le descripteurBande 17 Hz pression. Nous présentons
dans un premier temps la répartition des rangs des descripteurs suivant les sources de
don-nées dans la figure 5.3. L’axe des ordondon-nées indique le rang de l’attribut : le rang 1 étant le
plus élevé et donc celui de l’attribut le plus informatif. Pour chaque source, une "boîte"
re-présente l’étendue entre les premier et troisième quartile et un segment horizontal dans la
boîte représente le rang médian. En dehors de la boîte, les attributs sont représentés par des
points.
La première observation à faire sur la figure porte sur les distributions des descripteurs de
pression et de champ magnétique, toutes les deux compactes et concentrés dans les rangs les
plus bas. L’exception est le descripteur de la moyenne de la pression, qui se situe au premier
rang et représente donc le descripteur le plus informatif.
Le gyroscope et l’audio sont les deux sources les plus informatives suivant la figure. Les
rangs médians des deux distributions sont en-dessous de 50 et très proches l’un de l’autre.
La répartition des descripteurs du gyroscope est plus compacte que celle des descripteurs
acoustiques qui s’étend des premiers rangs au-delà du centième. Les descripteurs de
l’ac-céléromètre occupent une position intermédiaire, centrés autour d’un rang médian proche
de 70 et absents des 20 premiers rangs (le premier descripteur d’accélération est la bande
Accel Magn Gyro Press Audio
0
50
100
150
F
IGURE5.3: Distribution des rangs des attributs suivant les sources de données suite à la
sélection par ratio de gain d’information
d’énergie à 3 Hz, classé 21
ième).
L’étude plus précise du classement des descripteurs (voir la table 7.2 en annexe) indique
que les coefficients acoustiques de la première moitié de bande (indices 0 à 20) figurent
parmi les 40 premiers rangs. Les coefficients d’indices supérieurs à 30 sont classés autour
du centième rang. La variance de mesure du gyroscope est le coefficient le plus élevé de
cette source (troisième rang). Viennent ensuite les énergies dans les bandes de fréquence de
1 à 10 Hz (rangs 18 à 31). Les descripteurs les mieux classés pour l’accéléromètre sont
éga-lement les bandes d’énergie entre 1 et 10 Hz, ainsi que la variance d’accélération (29
ième) et
l’énergie (35
ième). Le premier descripteur du champ magnétique est la moyenne du champ,
classée 73
ième.
Les résultats de la sélection par corrélation
L’évaluation individuelle précédente ne tient pas compte de la combinaison des
descrip-teurs qui peut parfois ajouter de la redondance ou dégrader la performance. C’est pourquoi
nous employons une méthode de sélection par ensemble d’attributs. Le critère d’évaluation,
appelé "mérite" (défini dans la section 2.4.1.2) calcule le rapport de la pertinence du
sous-ensemble de descripteurs (par la corrélation aux classes) divisé par la redondance
intrin-sèque (exprimée par l’inter-corrélation entre les descripteurs). Ainsi, le critère pénalise les
sous-ensembles peu pertinents ou très redondants. Le critère est combiné avec la méthode
de génération heuristique de sous-ensembles appeléeSequential forward selectionqui
dé-marre avec un ensemble vide et ajoute progressivement le descripteur qui augmente le plus
le mérite du ensemble. L’ensemble de la méthode ne permet d’atteindre qu’un
sous-ensemble optimal mais procède rapidement (voir la section 2.4.1.1).
La figure 5.4 illustre l’évolution du mérite à mesure que les descripteurs sont ajoutés. On
observe une augmentation rapide du mérite, puis un plateau, qui indique la valeur maximale
du mérite et le sous-ensembles optimal. La table 5.2 détaille le classement des descripteurs
jusqu’au plateau.
0 50 100 150
0.24
0.26
0.28
0.3
0.32
0.34
0.36
Taille du sous-ensemble d’attributs
M
ér
it
e
du
so
us-e
n
semble
F
IGURE5.4: Distribution des scores des sous-ensembles d’attributs sélectionnés suivant
l’al-gorithme CFS et une méthode d’évaluation heuristique progressive
T
ABLE5.2: Classement des attributs dans le sous-ensemble qui donne le meilleur score
sui-vant la méthode de corrélation
Rang Score Attribut Rang Score Attribut Rang Score Attribut
1 0.243 Moyenne pression 8 0.344 Variance accél. 14 0.355 Bande 23 Hz accél. 2 0.285 Variance gyroscope 9 0.347 Variance magné. - - Bande 1 Hz gyro. 3 0.313 Bande audio #1 10 0.35 Bande audio #0 - - Bande audio #9 4 0.322 Bande 3 Hz accél. 11 0.353 Moyenne accél. - - Bande 2 Hz magn. 5 0.329 Moyenne magné. - 0.353 Bande 3 Hz gyro. 18 0.356 Bande 4 Hz accél. 6 0.335 Bande audio #6 13 0.354 Bande audio #2 - - Bande 24 Hz magné. 7 0.341 Bande 2 Hz gyro.
L’attribut de moyenne de pression est le premier descripteur à être ajouté, c’est donc
celui qui est le plus corrélé aux différentes scènes. La variance du gyroscope est le second
descripteur. Cinq descripteurs acoustiques sont présents dans la table, tous d’indices
infé-rieurs à 10. Quatre descripteurs du gyroscope et cinq descripteurs de l’accéléromètre sont
également présents, représentant la moyenne, variance et les coefficients d’énergie des très
basses bandes de fréquence (1, 2 et 3 Hz), ainsi que l’énergie de la bande à 23 Hz pour
l’accé-léromètre. Les descripteurs magnétiques sont au nombre de 4, avec la moyenne, la variance
et deux coefficients d’énergie de bande.
Bilan de la sélection d’attributs
Les résultats des deux méthodes présentent certains points communs. D’abord, la
moyenne de la pression atmosphérique est un descripteur important. Notre hypothèse est
que les scènes en environnement intérieur sont caractérisées par un lieu en étage, ce qui
correspond à une légère augmentation d’altitude donc à une légère diminution de la
pres-sion atmosphérique, que les baromètres des smartphones peuvent détecter. La variation de
la pression atmosphérique dépend également des conditions météorologiques. Mais dans le
cas de la routine d’un utilisateur et d’une période courte dans l’année, il est possible
d’ima-giner des valeurs assez stables, dont les changements correspondent effectivement à des
transitions d’étages ou de lieux.
Exception faite de la moyenne de la pression, les sources du magnétomètre et du
ba-romètre se montrent d’un usage limité, à part pour des descripteurs statistiques communs
comme la variance et la moyenne. En comparaison, les trois autres sources sont plus
per-tinentes. Les descripteurs acoustiques les plus pertinents sont concentrés dans les filtres
d’indices bas, vraisemblablement entre 0 et 10, ce qui correspond à une bande de fréquence
comprise entre 0 et 1077 Hz. Les descripteurs d’accéléromètre et du gyroscope les plus
perti-nents sont la moyenne, la variance et des coefficients d’énergie dans les bandes de très basse
fréquence (moins de 5 Hz).
Les descripteurs retenus pour la configurationREF_SAsont les suivants :
— accéléromètre et gyroscope : moyenne, variance, énergie et coefficients d’énergie de la
transformée de Fourier de 0 à 5 Hz ;
— baromètre : moyenne ;
— magnétomètre : moyenne et variance ;
— microphone : les 10 premiers coefficients d’énergie (représentant l’énergie dans la
bande de fréquences équivalente de [0;1077H z]
Dans le document
Reconnaissance de scènes multimodale embarquée
(Page 107-110)