• Aucun résultat trouvé

4.2 Détection

4.2.1 Modèle

Les systèmes PAM traitent des séries temporelles numérisées représentant les sons sous-marins captés par des hydrophones. Les données acquises résultent du mélange de signaux de natures différentes. Du point de vue du détecteur, ces signaux peuvent être classés en trois catégories :

- Les cris de mysticètes d’intérêt (signal à détecter quand il est présent dans les données).

- L’interférence, qui désigne tout signal transitoire sans intérêt pour l’application envisagée (e.g. séismes, canons à air, vocalises d’autres espèces, craquement de glace, ...)

2. L’environnement ASM étant très complexe et contenant de nombreux signaux transitoires pré-sentant des caractéristiques très différentes, il semble difficile d’être exhaustif dans l’apprentissage des signaux indésirables.

4.2. DÉTECTION 81

- Le bruit de fond résultant du mélange de nombreuses sources sonores ambiantes non identifiables. Contrairement à ce que l’on appelle les interférences dans ce travail, le bruit de fond n’inclut aucun signal transitoire.

Par conséquent, étant donné une fenêtre d’observation de N échantillons, le vecteur

d’observation y ∈ RN est représenté ici par :

y= µs + ψ + w, (4.1)

où s ∈ RN désigne le signal d’intérêt, ψ ∈ RN est l’interférence et w ∈ RN est le bruit de fond. µ et  sont des variables aléatoires à valeurs dans {0, 1} modélisant la présence ou l’absence éventuelle de s et ψ, respectivement. Le problème de détection consiste donc à décider si µ = 0 ou 1 à partir de l’observation y. L’équation (4.1) modélise la série temporelle enregistrée après la mise en forme du signal. La mise en forme classique inclut la stationnarisation temps-fréquence du bruit de fond et le filtrage passe-bande dans la bande d’intérêt (elle peut inclure également la conversion en bande de base, dans ce cas y est à valeurs complexes).

Modèle de bruit

Dans les cadres des stages de Mathieu Duret et Benjamin Ollivier, nous avons étudié les propriétés du bruit de fond des données issus du réseau OHASISBIO de l’IUEM. Nous avons montré, à l’aide de tests statistiques, qu’une modélisation gaussienne était adaptée et que le bruit pouvait être considéré comme stationnaire temporellement sur des durées de 300 s. Avec Dominique Pastor, nous avons également proposé des méthodes d’estimation robuste de la densité spectrale de puissance du bruit en présence de signaux de distribution et d’occurrence inconnue [Pastor12]. Cette estimation est indispensable pour stationnariser en temps et en fréquence le bruit de fond afin de normaliser les données d’entrée dans le but de rendre les traitements de détection les plus invariant possible à l’environnement ambiant. Après cette étape d’estimation et de stationnarisation, le modèle de bruit devient w ∼ N (0, σ2IN) avec σ2 connu. Modèle de cris de mysticètes

Comme indiqué précédemment et visible sur la figure 4.1, les cris de mysticètes présentent des structures relativement simples. Formellement, ces structures peuvent être prises en compte en considérant que le signal d’intérêt peut être décomposé linéai-rement à l’aide de n ≤ N formes d’ondes, appelées atomes, qui appartiennent à un dictionnaire de fonctions, c.-à-d.,

s ≈ Dθ, (4.2)

où D ∈ RN ×n désigne le dictionnaire. θ représente le vecteur des coordonnées de s

dans un sous-espace linéaire généré par les colonnes de D. Nous avons étudié deux approches de construction de dictionnaires. La première repose sur le choix d’atomes paramétriques dont les expressions analytiques sont choisies pour correspondre à cer-tains motifs temps-fréquence. Nous avons, par exemple, proposé un modèle à base de chirps à fréquence sigmoïdale pour modéliser les Z-calls (Fig. 4.1-(a)) ou considéré

82

CHAPITRE 4. DÉTECTION ET CLASSIFICATION DE CRIS DE MYSTICÈTES

des chirps à phase polynomiale pour modéliser les D-calls (Fig. 4.1-(d)). La seconde approche, moins courante dans le contexte PAM, construit des dictionnaires appris empiriquement, dont les atomes sont automatiquement générés à partir des données réelles [Elad10]. Nous avons appliqué cette approche pour des signaux avec des struc-tures plus complexes comme les cris de baleines bleues pygmées de Madagascar (Fig. 4.1-(b)).

Modèle d’interférence

Aucun modèle paramétrique n’est supposé pour les interférences car elles peuvent être très hétérogènes et sont souvent aléatoires. Cependant, pour différencier ψ de s, certaines hypothèses doivent être émises. Intuitivement, l’interférence est définie comme un signal transitoire n’ayant pas grand-chose en commun avec le signal d’intérêt s. Plus formellement, nous définissons cette interférence comme un signal dont l’énergie se situe principalement à l’extérieur du sous-espace dans lequel s réside. A partir du modèle (4.2), cela s’exprime comme

kPDψk2

kψk2 ≤ τ, (4.3)

où PD = D DTD−1DT désigne la matrice de projection dans le sous-espace généré

par les colonnes de D. On suppose donc que la proportion d’énergie de l’interférence qui réside dans le sous-espace signal est au maximum de τ. Notons que les interfé-rences sont rarement orthogonales aux signaux d’intérêt du fait de certaines similari-tés temps-fréquence, par conséquent τ > 0. En fonction des types de cris considérés et de la base de donnée à traiter, la valeur de τ est généralement fixée entre 15% et 50% [Socheleau15b; Socheleau17]. Contrairement à d’autres approches telles que [Urazghildiiev06; Scharf94; Urazghildiiev09], aucun modèle statistique n’est supposé pour ψ, aucun sous-espace d’interférence particulier n’est considéré et il n’est pas sup-posé que les sons transitoires interférents partagent des caractéristiques communes que le détecteur pourrait apprendre grâce à une base d’apprentissage.

Reformulation du problème de détection

Bien que s et ψ ne soient pas parfaitement connus, leurs propriétés au regard du sous-espace hDi fournissent des informations pertinentes pour construire un détecteur. Plus précisément, définissons z comme

z = µs + ψ. (4.4)

Notre problème consiste à décider si µ = 0 ou 1 à partir de l’observation y = z + w. En supposant que le signal d’intérêt domine sur l’interférence lorsque µ = 1 et  = 1,

autrement dit que kPDzk2 > τ kzk2 dès lors que µ = 1, le problème de détection

revient alors à décider si z appartient ou non au sous-espace cône défini comme CD =

n

x ∈RN : kPDxk2

kxk2 > τo. Les deux hypothèses à tester sont donc :  H0 : z /∈ CD

4.2. DÉTECTION 83