• Aucun résultat trouvé

Système de tatouage multi-porteuses

3.4 Tatouage par modulation multi-porteuses

3.4.2 Système de tatouage multi-porteuses

Les arguments présentés ci-dessus nous permettent de présenter un système de tatouage audio basé sur les modulations multi-porteuses présenté sur la figure 3.9. L’objectif est de minimiser les interférences entre symboles et d’améliorer la robustesse contre l’évanouissement tout en satisfaisant la contrainte d’inaudibilité. Ainsi, on propose d’exploiter les modulations multi-porteuses afin d’améliorer les performances du système de tatouage audio. Nous montrons d’abord comment construire le signal modulé multi-porteuses v(n). Ensuite, nous contrôlons la puissance du signal modulé MP en fonction du seuil de masquage afin d’assurer la contrainte d’inaudibilité. Enfin, nous visons à améliorer la robustesse du système en ajoutant des intervalles de gardes et des codes correcteurs d’erreurs.

3.4.2.1 Modulation et démodulation multi-porteuses

Le principe des modulations multi-porteuses est de convertir une série de bits à haut débit en Nc symboles bas-débit. Chacun des Nc symboles est multiplié par différentes sous-porteuses.

Puisque le débit symbole de chaque sous-porteuse est beaucoup moins faible que le débit de la suite des symboles des données initiales, l’IES diminue considérablement. En raison de la

"La valeur d’un homme tient dans sa capacité à donner et non à recevoir". Albert Einstein

conversion série/parrallèle (S/P), le temps discret pour Ncsymboles est étendue à NcNs, ce qui

constitue un symbole unique MC avec une longueur de Nsym (soit Nsym= NcNs). L’enveloppe

complexe du signal modulé MP s’écrit sous la forme :

vEC(n) = 1

Nc NXc−1

i=0

siexp(j2πfin) 0 ≤ n < Nsym (3.26)

où si sont les Nc symboles parallèles et les signaux complexes {exp(j2πfin)}Ni=0c−1 représentent

les différentes sous-porteuses du signal MP. Afin d’augmenter l’efficacité spectrale du système de tatouage, il faut choisir des signaux orthogonaux. En effet, les Nc fréquences des sous-porteuses

sont localisées à fk = NkFsyme |k={0,...Nc−1} afin d’atteindre l’orthogonalité entre les signaux des Nc

sous-porteuses. Par conséquent, le signal résultant v(n) est appelé signal OFDM16. La spécifi-

cité de la technique OFDM vient du recouvrement mutuel des différentes sous-porteuses, d’une manière dite orthogonale. Cette orthogonalité permet une utilisation optimale des ressources spectrales et facilite l’implantation numérique.

3.4.2.2 Contrôle de puissance

La contrainte la plus importante dans un système de tatouage audio est la contrainte d’in- audibilité. Comme on l’a montré précédemment, un filtre de mise en forme H(f) est conçu selon un modèle psychoacoustique de telle manière que le signal modulé v(n) soit de puissance unité :

σv2= 1 (3.27)

Afin d’exploiter le filtre de mise en forme H(f) dans le système de tatouage multi-porteuses, on doit adapter l’amplitude du signal MP tout en satisfaisant (3.27). Chaque sous-porteuse du symbole MP de durée Nsym, peut être considérée comme un signal de fréquence unique,

multipliée par une fenêtre rectangulaire de longueur Nsym. Le signal modulé v(n) peut être

écrit sous forme d’une somme des Nc sinusoïdes de phase aléatoires [53, 70] avec des points de

constellations positionnés à un espacement angulaire uniforme autour d’un cercle [53],

v(n, ϕ) =

NXc−1

i=0

Acos(2πfin+ ϕ) (3.28)

où A est l’amplitude de chaque signal de fréquence unique et la phase ϕ est une variable aléatoire uniformément distribuée sur l’intervalle [−π, π] avec une densité de probabilité définie par :

p(ϕ) = 1 avec ϕ∈ [−π, π] (3.29)

D’après (3.28) et (3.29), on calcule les moments statistiques de la variable aléatoire v(nk, ϕ) à

un moment donné nk, E[v(nk, ϕ)] = E[v(nk)] = R∞ −∞p(ϕ) PNc−1 i=0 Acos(2πfink+ ϕ)dϕ = 1 PNi=0c−1A Rπ −πcos(2πfink+ ϕ)dϕ = 0 (3.30)

"Celui qui n’est plus ton ami ne l’a jamais été". Aristote 0 5 10 15 20 −90 −80 −70 −60 −50 −40 −30 −20 −10 0 10 20 Fréquence (kHz) DSP (dB) Seuil de masquage

Signal de tatouage à étalement de spectre Signal de tatouage à porteuses multiples

(a) Nombre de sous porteuses : 5

0 5 10 15 20 −90 −80 −70 −60 −50 −40 −30 −20 −10 0 10 20 Fréquence (kHz) DSP (dB) Seuil de masquage

Signal de tatouage à étalement de spectre Signal de tatouage à porteuses multiples

(b) Nombre de sous porteuses : 10

0 5 10 15 20 −90 −80 −70 −60 −50 −40 −30 −20 −10 0 10 20 Fréquence (kHz) DSP (dB) Seuil de masquage

Signal de tatouage à étalement de spectre Signal de tatouage à porteuses multiples

(c) Nombre de sous porteuses : 20

0 5 10 15 20 −90 −80 −70 −60 −50 −40 −30 −20 −10 0 10 20 Fréquence (kHz) DSP (dB) Seuil de masquage

Signal de tatouage à étalement de spectre Signal de tatouage à porteuses multiples

(d) Nombre de sous porteuses : 50

Figure 3.10 – Seuil de masquage et DSP du signal de tatouage à étalement de spectre et multi-porteuses selon le nombre de sous porteuses.

et E[v2(nk, ϕ)] = E[v2(nk)] = Rπ −πp(ϕ) PNc−1 i=0 A2cos2(2πfink+ ϕ)dϕ = NcA 2 2 (3.31)

Ainsi, le signal modulé v(n) est à moyenne nulle avec une variance σ2

v = NcA

2

2 . Afin de

satisfaire la contrainte d’inaudibilité (3.27), on doit choisir A =p2/Nc. Ensuite, le signal modulé

v(n) est passé à travers le filtre de mise en forme H(f) de sorte que le signal de tatouage résultant w(n) ait une DSP Sw(f) la plus proche possible du seuil de masquage Mx(f). La figure 3.10

illustre la DSP du signal de tatouage w(n) exploitant la modulation multi-porteuses et celle à étalement de spectre ainsi que le seuil de masquage. Cette figure montre que le signal de tatouage MP est considéré comme la somme de plusieurs signaux décalés en fréquence. Les différents symboles sont transmis en parallèle et plus on augmente le nombre de sous-porteuses

Nc, plus le signal de tatouage suit l’allure du seuil de masquage.

"Le génie est fait d’un pour cent d’inspiration et de quatre-vingt-dix-neuf pour cent de transpiration". Thomas Edison 5 10 25 50 75 100 0 0.02 0.04 0.06 0.08 0.1 0.12 0.14

Nombre de sous porteuses

TEB

(a) Variation de l’ODG selon le nombre de sous-porteuses.

5 10 25 50 75 100 −1.4 −1.2 −1 −0.8 −0.6 −0.4 −0.2 0

Nombre de sous porteuses

ODG

(b) Variation du TEB selon le nombre de sous-porteuses. Figure 3.11 – Variation des performances du système de tatouage multi-porteuses en termes d’inaudibilité et de fiabilité de détection selon le nombre de sous-porteuses.

plusieurs facteurs : le type du canal (variations rapides, longueur de la réponse impulsionnelle) et de la complexité que l’on veut bien accepter. La figure 3.11 montre l’impact du nombre de sous-porteuses Nc sur les performances du système de tatouage. On remarque que plus on

augmente le nombre de sous-porteuses plus l’ODG diminue. Cependant, le nombre de sous- porteuses n’influe pas sur la fiabilité de détection. On choisit donc 25 sous-porteuses du fait qu’à partir de la 25ème sous-porteuse l’ODG ne diminue pas trop.

3.4.2.3 Intervalle de garde

En prolongeant la durée du symbole Nc fois, l’IES diminue. Cependant, l’évanouissement

reste toujours présent dans le système de tatouage multi-porteuses. Pour améliorer les perfor- mances du système MP, on ajoute un intervalle de garde entre deux symboles consécutifs.

L’intervalle de garde permet une grande amélioration des performances des modulations MP sur des canaux à évanouissement et à BBAG [53]. Par conséquent, l’ajout de l’intervalle de garde pour le système de tatouage MP, peut améliorer les performances. L’intervalle de garde peut être inséré de deux manières différentes. L’une est le remplissage de zéros (ZP17) qui

remplit l’intervalle de garde par des zéros. L’autre est l’extension cyclique du symbole MP (pour une certaine continuité) avec préfixe cyclique (CP18) ou suffixe cyclique (CS19). Le CP étend

le symbole MP en copiant les derniers échantillons du symbole MP avant. Les symboles MP étendus ont une durée de NsymG= Nsym+ NG (NG désigne la longueur de l’intervalle de garde

en terme d’échantillons). Comme la continuité de chaque sous-porteuse a été assurée par le CP, son orthogonalité avec tous les autres sous-porteuses est maintenue sur les Nsym. Notons que le

débit symbole MP de données est réduit de Nsym/NsymG= Nsym/(Nsym+ NGÞ) fois à cause de

l’intervalle de garde.

La figure 3.12 présente les performances du système de tatouage multi-porteuses avec 17. Zero Padding.

18. Cyclic Prefix. 19. Cyclic Suffix.

"L’erreur n’annule pas la valeur de l’effort accompli". Proverbe africain 50 100 150 200 250 300 350 400 450 500 10−3 10−2 10−1 100 Débit (b/s) TEB OFDM

OFDM avec suffixe cyclique OFDM avec préfixe cyclique OFDM avec zero padding

Figure 3.12 – Performances du système de tatouage multi-porteuses selon trois types d’inter- valles de gardes.

l’ajout des intervalles de garde. Tout d’abord, on remarque que la fiabilité de détection est améliorée dans le système multi-porteuses. Ensuite, les différents intervalles de garde produisent des performances équivalentes avec une nette amélioration pour le CS. Ainsi le CS sera utilisé dans les tests suivants pour évaluer les performances du système de tatouage MP.

3.4.2.4 COFDM

Le système de tatouage multi-porteuses est performant en terme de fiabilité de détection. Afin de rendre sa détection plus fiable, on peut ajouter des bits de correction d’erreurs dont les valeurs dépendent de celles des bits du signal qu’ils accompagnent [20, 114]. Les codes correcteurs d’erreurs sont divisés en deux catégories principales : les codes en blocs et les codes convolutifs [53]. Dans le schéma proposé, nous utilisons des codes en blocs linéaires en raison de la facilité de leur mise en oeuvre et leur performance acceptable.

En utilisant les codes en blocs linéaires, la séquence binaire bi est divisée en des blocs de

taille de k1bits. Le nombre de bits dans le message source codé est augmenté en introduisant des

bits de redondances ; ce qui augmente le nombre de bits en blocs à k2. Les k1bits d’informations

ne sont pas modifiés et sont suivis par k2− k1 bits. Le décodage transforme la séquence binaire

bi en des mots de codes binaires plus longs am. En raison des différentes propriétés des codes en

blocs linéaires existants, le codage utilisé fonctionne en codant les bits de tatouage bi avec les

codes cycliques20 avant leur insertion dans le signal audio x(n) [53].

En ajoutant le codage cyclique au système OFDM, le système résultant est appelé COFDM21.

Tout d’abord, ce système est évalué face au BBAG. En effet, les travaux précédents ont considéré l’effet de plusieurs perturbations équivalent à celui d’un BBAG [71]. La figure 3.13 présente

20. Les codes cycliques sont des codes linéaires basés sur des polynômes sur les corps finis. 21. Coded OFDM.

"C’est presque toujours par erreur qu’on apprend". Michel Chevrier −10 −5 0 5 10 15 20 25 30 10−2 10−1 100 RSB (dB) TEB Modulation COFDM Modulation PSK informée Modulation DSSS

Figure 3.13 – Robustesse du système de tatouage COFDM contre le BBAG.

la robustesse du système COFDM contre le bruit blanc gaussien. Le débit d’insertion étant fixé à R = 100b/s, on remarque que le système COFDM est robuste vis-à-vis du BBAG. De plus, il présente une nette amélioration par rapport au système DSSS et au système PSK informé. Dans un tel système, le nombre de bits dans le tatouage est augmenté de manière contrôlée en introduisant des bits de redondance. En effet, si le débit binaire sans codage du canal est de R, le débit après codage de canal devient :

Rc =

k2

k1R (3.32)

L’opération du codage est caractérisée par un coefficient k1

k2, appelé rendement du code, qui

témoigne de la redondance introduite22. Plus k2

k1 est grand, plus il y a de redondance : par

contre, le débit utile (bits d’information et non de redondance) peut alors devenir négligeable par rapport au débit total. Le rendement de notre système COFDM est de 3/5 ; ce qui conduit à une utilisation supplémentaire des échantillons audio pour insérer le tatouage.

En résumé, l’ajout de bits supplémentaires augmente la robustesse du tatouage mais réduit la capacité des informations intégrées pour une longueur de signal audio fixe. Par conséquent, il serait nécessaire d’assurer un compromis entre la robustesse et la capacité d’insertion. Mais ajou- ter de la redondance s’avère inutile si tous les bits redondants sont transmis sur la même porteuse du canal affecté d’un évanouissement ! Afin d’éviter ces inconvénients, les bits redondants sont transmis sur un grand nombres de porteuses. Comme l’affaiblissement du canal dépend de la fréquence, le message redondant peut passer sans déformation au moins sur quelques fréquences.

"La sagesse est fille de l’expérience". Léonard De Vinci 0 5 10 15 20 −80 −60 −40 −20 0 20 40 60 Fréquence (kHz) DSP (dB)

(a) Représentation du signal audio dans le domaine fréquentielle. 0 5 10 15 20 40 50 60 70 80 90 100 110 120 Fréquence (kHz) DSP (dB)

(b) Représentation du signal audio compressé dans le domaine fréquentielle.

Figure 3.14 – Extrait du signal audio "Violin" avant et après l’opération de compression.

3.4.2.5 Robustesse face à la compression

Une des perturbations les plus destructives du tatouage est la compression MPEG. En effet, le codeur MPEG est assimilé à une opération de filtrage qui supprime les composantes fréquentielles du signal audio qui sont généralement moins sensibles à l’oreille humaine [36].

La figure 3.14 illustre la DSP du signal audio avant et après la compression MPEG 96 kb/s. On remarque que les composantes fréquentielles supérieures à 16 kHz sont perdues. En effet, les hautes fréquences du signal audio sont en grande majorité inférieures au seuil de masquage et sont presque inaudibles. La compression peut donc être modélisée par un filtre passe-bas de fréquence de coupure Fc égale à 16 kHz dans notre cas.

Ce phénomène de compression est très similaire à celui d’un canal sélectif en fréquence qui ne se comporte pas identiquement suivant la fréquence du signal. Certaines fréquences peuvent être transmises ou encore atténuées plus que d’autres. Le signal est alors déformé lors de la transmission : les données sont dispersées dans le temps, pouvant mener à des interférences entre symboles [51].

Par conséquent, les performances du système de tatouage se dégradent lorsque le signal tatoué est soumis à la compression MPEG. En effet, pour certaines fréquences, les données sont très atténuées et perdues. Ces fréquences sont celles supérieures à 16 kHz. Ainsi, pour augmenter la robustesse du système COFDM, on insère le tatouage juste dans les fréquences inférieures à 16 kHz. De plus, pour assurer la contrainte d’inaudibilité, on doit éviter la bande de fréquence

[0,6]kHz. Pour cela, la bande de fréquences choisie pour le système COFDM est [6,16]kHz. La

nouvelle modulation est appelée COFDM adaptée.

"Rien n’est plus dangereux que la certitude d’avoir raison". Francois Jacob 128 kb/s 96 kb/s 64 kb/s 0 0.1 0.2 0.3 0.4 0.5 0.6 Compression MPEG TEB

Modulation COFDM adaptée Modulation COFDM Modulation PSK informée Modulation DSSS

Figure 3.15 – Robustesse du système de tatouage COFDM contre la compression.

La figure 3.15 montre le gain apporté par le système COFDM par rapport au système DSSS et le système PSK informé lorsque le signal tatoué est soumis à la compression MPEG. En effet, la compression MPEG quantifie les composantes spectrales de manière non-uniforme à différentes fréquences et élimine les plus élevées afin de préserver un niveau de fidélité perceptuelle [34]. Par conséquent, le système COFDM a été implémenté en choisissant uniquement les basses fréquences des sous-porteuses. Comme prévu, la robustesse du nouveau système est de nouveau améliorée grâce à l’insertion du tatouage dans les composantes basses fréquences du signal audio.