• Aucun résultat trouvé

Sp´ecificit´es des syst`emes pour la synchronisation

10−5 10−4 10−3 10−2 10−1 100 Débit (bits/s) TEB SS non informé SS informé

Figure 3.9 – Performances du syst`eme de tatouage inform´e additif par ´etalement de spectre dans le domaine temporel de Cvejic et Sepp¨anen (extrait de [CS03]).

connaissance d’une impl´ementation de syst`emes de codage inform´e qui r´epondent `a toutes les attentes en mati`ere de robustesse, et notamment aux perturbations d´esynchronisantes. Des tra- vaux th´eoriques sur l’influence de la d´esynchronisation [ZBDre] (mod´elis´ee par l’ajout de retards al´eatoires dans le signal audio) confirment l’efficacit´e des strat´egies substitutives en terme de d´ebit de transmission sur les strat´egies additives ; mais la question de leur mise en œuvre effective reste encore d’actualit´e.

3.3.4 Performances

´

Evaluer les performances des syst`emes avec insertion inform´ee r´ev`ele des difficult´es similaires aux cas des syst`emes non inform´es. Le respect de la contrainte d’inaudibilit´e est une limite majeure : en effet, dans le cas des fonctions d’insertion additives inform´ees, cette contrainte est volontairement n´eglig´ee au profit de la robustesse, conform´ement `a la strat´egie de robustesse constante propos´ee par Miller : l’inaudibilit´e n’est mesur´ee qu’apr`es insertion du tatouage. Dans le cas du codage inform´e, cette contrainte est prise en compte par l’erreur quadratique moyenne entre le signal audio tatou´e et le signal original. Or, ce crit`ere d’EQM est mal adapt´e au contexte du tatouage. La litt´erature ne fait donc pas ´etat de courbes de TEB en fonction du d´ebit `a ”inaudibilit´e constante”. Pour donner un ordre de grandeur des performances de la litt´erature nous ne citerons donc que l’article de Cvejic et Sepp¨anen [CS03] qui propose une impl´ementation de l’ISS de Malvar dans laquelle le tatouage est mis en forme spectralement par un mod`ele psychoacoustique pour garantir son inaudibilit´e. Les performances ´etablies par les auteurs sont donn´ees figure 3.9. Elles mettent en ´evidence le gain en terme de TEB des syst`emes inform´es sur les syst`emes non inform´es, mais ne permettent pas d’´evaluer l’impact de la strat´egie sur l’inaudibilit´e du syst`eme.

3.4

Sp´ecificit´es des syst`emes pour la synchronisation

Parmi l’ensemble des perturbations auxquelles un syst`eme de tatouage se doit d’ˆetre robuste, les op´erations d´esynchronisantes sont sans doute les plus d´egradantes pour la d´etection du

tatouage. Comme nous l’avons ´evoqu´e pr´ec´edemment, cette d´esynchronisation apparaˆıt pour deux types d’applications : le transfert d’information via l’onde acoustique et la radiodiffusion. Les alt´erations produites sur le signal audio peuvent introduire :

• un simple retard entre le signal audio tatou´e `a l’´emission et sa version enregistr´ee `a la r´eception, dans le cas d’op´eration de filtrage par exemple,

• un r´eechantillonnage du signal audio tatou´e suite `a des conversions num´erique-analogique et analogique-num´erique dans le cas d’un transfert du signal audio tatou´e entre 2 PCs via l’onde acoustique,

• une op´eration de dilatation ou de compression du signal audio pour des applications de type radio diffusion.

Si le domaine d’insertion n’est pas invariant par l’op´eration d´esynchronisante, ces pertur- bations entraˆınent la perte de la localisation des symboles voire la perte de la dur´ee Ns des

symboles : ce ph´enom`ene est particuli`erement probl´ematique dans les syst`emes de tatouage par ´etalement de spectre r´ealisant l’addition du tatouage au signal audio dans le domaine temporel. En effet, le d´ecalage d’un seul ´echantillon sur la localisation du symbole ´emis dans le signal re¸cu suffit `a d´egrader significativement les performances du d´emodulateur par corr´elation. Un param`etre de d´erive peut alors ˆetre d´efini pour caract´eriser la diff´erence entre le temps symbole Ns `a l’´emission et `a la r´eception.

Les techniques `a mettre en œuvre pour permettre la resynchronisation de ces syst`emes sont tr`es diff´erentes des strat´egies d’insertion inform´ees, ´etablies pr´ec´edemment pour garantir la ro- bustesse du syst`eme `a l’ajout d’un bruit additif. Elles s’attachent `a la mise en place d’un syst`eme de synchronisation de rythme, qui peut ˆetre dissoci´e de la strat´egie d’insertion.

Dans cette section, nous pr´esentons les diff´erents m´ecanismes de synchronisation, propos´es par la th´eorie des communications analogiques et num´eriques et leurs applications `a la conception de syst`emes de tatouage audio. Ces derni`eres ont ´et´e majoritairement d´evelopp´ees pour des chaˆınes de communication additives dans le domaine temporel.

3.4.1 Mod`ele du sch´ema de tatouage

Nous consid´erons dans cette section un mod`ele simplifi´e de la chaˆıne de tatouage, pr´esent´e figure 3.10. L’information `a ´emettre b est suppos´ee binaire, le tatouage est construit `a l’aide d’un unique vecteur de dictionnaire d de sorte que t = (2b− 1)d. L’insertion est effectu´ee apr`es d´ecoupage du signal audio x(n) en fenˆetre d’analyse de dur´ee Ns appel´ee temps symbole. Sur la

l-i`eme fenˆetre, le signal audio tatou´e est construit en ajoutant le tatouage porteur de b au signal audio original :

y(n) = x(n) + (2b− 1)d[n − lNs], (3.26)

o`u d[i] d´esigne la i-i`eme composante de d. La d´etection est effectu´ee en calculant la corr´elation entre le signal re¸cu ˆy(n) d´ecoup´e en fenˆetre d’analyse de taille Nset le vecteur du dictionnaire. Le

signe de la corr´elation indique le bit re¸cu. Dans la suite du d´eveloppement, nous nous placerons lors de la d´etection et de la synchronisation du l-i`eme symbole d’information, i.e. sur le l-i`eme temps symbole. Elle concerne th´eoriquement la fenˆetre du signal re¸cu allant de l’´echantillon lNs `a l’´echantillon (l + 1)Ns, que nous noterons ˆyNs(lNs) : fenˆetre du signal ˆy(n) d´ebutant `a

3.4. Sp´ecificit´es des syst`emes pour la synchronisation Modulation Canal Synchronisation D´emodulation d x(n) v(n) b y(n) y(n)ˆ ˆb d

Figure 3.10 – Sch´ema simplifi´e du syst`eme de tatouage pour la mise en ´evidence des m´ecanismes de synchronisation.

3.4.2 Synchronisation des chaˆınes de communication analogique

En mati`ere de synchronisation de rythme dans les chaˆınes de communication analogique, les syst`emes les plus couramment utilis´es sont :

• les synchroniseurs de type early-late gate [Pro01] : Pour le l-i`eme temps symbole, trois corr´elations sont effectu´ees, de ˆyNs(lNs+ p) pour p ∈ {−1, 0, 1} avec la forme d’onde du

dictionnaire d. L’´echantillon popt maximisant la corr´elation :

popt= arg max

p yˆNs(lNs+ p)

ts, (3.27)

indique l’instant de d´ebut du bit en cours de d´etection (en avance par rapport `a la localisa- tion th´eorique si la corr´elation est maximale pour ˆyNs[lNs− 1] et en retard si la corr´elation

est maximale pour ˆyNs[lNs+ 1]). Le signe de la corr´elation donne la valeur du bit re¸cu.

Ce type de synchronisation est efficace `a la condition que la dur´ee du temps symbole `a la r´eception soit peu modifi´e par rapport `a l’´emission.

• la m´ethode de la raie spectrale [Bro97] : La construction du signal, par r´ep´etition des vecteurs du dictionnaire tous les temps symbole, introduit un pic `a la fr´equence Fe

Ns

dans le spectre du signal. Cette m´ethode consiste donc `a estimer le temps symbole Ns`a la r´eception

en d´etectant le pic fr´equentiel par une op´eration de filtrage autour de la fr´equence Fe Ns

. Ces m´ecanismes de synchronisation sont efficaces lorsque la d´erive entre l’´emetteur et le r´ecepteur est relativement faible ; d`es que la d´erive devient plus ´elev´ee (i.e. que le temps symbole au r´ecepteur est tr`es diff´erent de celui `a l’´emetteur), le m´ecanisme de synchronisation risque de d´ecrocher.

3.4.3 Synchronisation des chaˆınes de communication num´erique

En mati`ere de synchronisation pour les chaˆınes de communication num´erique, une importante partie de la litt´erature est d´edi´ee aux m´ecanismes de synchronisation pour les syst`emes par ´etalement de spectre [Pro01].

L’impl´ementation des syst`emes par ´etalement de spectre utilise g´en´eralement des horloges tr`es pr´ecises. La fr´equence de r´eception du signal est donc peu diff´erente de la fr´equence d’´emission. Le m´ecanisme de synchronisation est g´en´eralement scind´e en 2 ´etapes : une phase d’acquisition

initiale et une phase de poursuite. L’acquisition initiale a pour but d’estimer le retard `a l’ori- gine entre le signal re¸cu et le signal ´emis. Elle utilise une s´equence d’initialisation, connue du r´ecepteur. Le r´ecepteur exploite une technique de corr´elation par fenˆetre glissante pour d´etecter la s´equence d’initialisation dans le signal re¸cu. D`es que la corr´elation devient sup´erieure `a une valeur seuil, pr´ealablement fix´ee, la s´equence d’initialisation est d´etect´ee. De fait, un bruit de canal peut conduire `a des fausses alarmes de d´etection ; un circuit additionnel peut alors ˆetre uti- lis´e en recours pour d´etecter ces fausses alarmes. Une fois la s´equence d’initialisation d´etect´ee, le r´ecepteur passe en mode de d´etection des donn´ees. Il s’agit de la seconde ´etape, celle de poursuite ou de synchronisation fine. Le but est ici de synchroniser le r´ecepteur sur chaque bit d’informa- tion. Deux techniques sont couramment utilis´ees : la Delay-Locked Loop (DLL) et la Tau-Dither Loop (TDL). Toutes deux sont des adaptations du early-late gate synchronizer, la TDL ´etant plus rapide et moins coˆuteuse en temps de calcul que la DLL. Elles utilisent donc toutes les deux une m´ethode de corr´elation par fenˆetre glissante pour d´etecter la synchronisation.

Les syst`emes de synchronisation propos´es dans la litt´erature se basent donc principalement sur les propri´et´es d’autocorr´elation des formes d’onde utilis´ees pour la transmission. Ils font appel `a des s´equences pseudo-al´eatoires sp´ecifiques, parmi lesquelles on d´enombre notamment les s´equences Gold [McE87], qui garantissent une fonction d’autocorr´elation proche d’un dirac, ou les s´equences CEC22propos´ees pour l’UMTS23[RJ01]. Ces derni`eres, en plus des propri´et´es de

leurs fonctions d’autocorr´elation, offrent l’avantage que la somme de fonctions d’autocorr´elation de deux s´equences est un dirac. Ceci permet la mise en œuvre de m´ecanismes de synchronisation rapides et peu coˆuteux en temps de calcul.

3.4.4 Synchronisation dans les syst`emes de tatouage audio

Quelques m´ecanismes de synchronisation pour les syst`emes de tatouage audio ont ´et´e pr´esent´es dans la litt´erature. Ils peuvent ˆetre class´es en 2 cat´egories, celles des m´ecanismes exploitant les propri´et´es de resynchronisation d’un tatouage ´etal´e spectralement et celles bas´ees sur des points d’int´erˆet.

3.4.4.1 Synchronisation grˆace `a l’´etalement de spectre

Cette premi`ere cat´egorie de m´ecanisme de synchronisation regroupe les syst`emes exploitant les propri´et´es de corr´elation des s´equences pseudo-al´eatoires.

Le principe initial est le suivant : des patterns de synchronisation sont ins´er´ees tout au long du signal de tatouage porteur d’une information binaire [Gom02, Bar02]. Ces patterns r´esultent du tatouage d’une forme d’onde sp´ecifique ´etal´ee spectralement de dur´ee finie Np et connue du

r´ecepteur. La d´etection consiste alors `a localiser ces patterns de synchronisation `a l’aide d’une technique de corr´elation par fenˆetre glissante. En effet, la pattern ´etant ´etal´ee spectralement, la corr´elation n’est maximale que lorsque la fenˆetre d’analyse du signal re¸cu (sur laquelle est calcul´ee cette corr´elation) co¨ıncide avec l’insertion de la pattern de synchronisation. L’inconv´enient d’une telle m´ethode tient au fait que l’insertion des patterns diminue fortement le d´ebit de transmission utile. Pour palier `a cet inconv´enient, Gomes [Gom02] propose une variante de ce m´ecanisme dans laquelle l’insertion des patterns de synchronisation est effectu´ee parall`element `a la transmission de l’information binaire. Le signal de tatouage est la somme de deux composantes : la premi`ere

22. Concatenated Extended Complementary 23. Universal Mobile Telecommunication System

3.4. Sp´ecificit´es des syst`emes pour la synchronisation

r´esulte de l’insertion de l’information et la seconde d’un tatouage de synchronisation (insertion des patterns de synchronisation). La d´etection du tatouage de synchronisation localise le d´ebut de chaque symbole d’information, qui peut ensuite ˆetre d´etect´e. La synchronisation est finalement r´ealis´ee grˆace `a l’´etalement de spectre de la pattern. Pour des syst`emes de tatouage o`u l’insertion de l’information s’effectue `a l’aide de vecteurs ´etal´es spectralement et la d´etection est bas´ee sur un d´etecteur par corr´elation, il est donc possible de s’affranchir de l’introduction des patterns. La synchronisation et la d´etection sont effectu´ees conjointement en recherchant par une technique de corr´elation avec fenˆetre glissante le maximum de corr´elation. Cette id´ee sera utilis´ee dans le syst`eme de Kirovski [KM03] d´ecrit par la suite.

Ces premi`eres m´ethodes sont relativement efficaces `a condition que l’op´eration d´esynchro- nisante soit un retard ou une modification de l’´echantillonnage de faible d´erive (inf´erieure `a une dizaine d’´echantillons par seconde). En effet, pour des op´erations d´esynchronisantes plus complexes, telles des dilations ou des compressions de la dur´ee du signal, la dur´ee du temps symbole Nstout comme celle de la pattern de synchronisation Npdans le signal re¸cu est modifi´ee,

ce qui perturbe fortement la technique de corr´elation par fenˆetre glissante.

Deux approches peuvent alors ˆetre envisag´ees. La premi`ere est naturellement de choisir un domaine d’insertion invariant par dilatation temporelle de sorte que l’op´eration de d´esynchro- nisation ne modifie que la localisation des symboles mais pas leur dur´ee. Le domaine envisag´e est souvent le domaine fr´equentiel (MDCT24, DCT25, DWT26) [WHHS05, WHHS04]. La seconde

consiste `a calculer des versions dilat´ees des formes d’onde (pattern et vecteurs du dictionnaire d’´emission) selon diff´erentes valeurs de dilatation et `a mettre en œuvre la technique de corr´elation par fenˆetre glissante pour ces versions dilat´ees [BvdVL04].

Dans ce domaine, Kirovski et Malvar [KM03] proposent sans doute l’un des syst`emes les plus aboutis : leur syst`eme permet de d´etecter des modifications de l’´echelle aussi bien temporelle que fr´equentielle en utilisant une forme d’onde `a deux dimensions (l’une temporelle et l’autre fr´equentielle). Cette forme d’onde joue `a la fois le rˆole de vecteur support de l’information d et de pattern de synchronisation. Elle est ins´er´ee dans le domaine fr´equentiel. La technique de corr´elation par fenˆetre glissante est utilis´ee pour la synchronisation : des valeurs de la corr´elation entre le signal re¸cu (pour diff´erents fenˆetrages dans le temps) et des versions dilat´ees de la forme d’onde (pour diff´erents facteurs de dilatation) sont calcul´ees. La corr´elation maximale permet alors d’estimer le facteur de dilatation temporelle en localisant dans le temps la fenˆetre o`u est ins´er´ee la forme d’onde, le facteur de dilatation fr´equentielle en d´eterminant la version dilat´ee la plus ressemblante `a la forme d’onde re¸cue et le bit re¸cu. Les tests que nous avons r´ealis´es sur ce syst`eme tendent `a montrer que le m´ecanisme de synchronisation est efficace ; il est malheureusement tr`es coˆuteux en temps de calcul, car la recherche des facteurs de dilation est effectu´ee de mani`ere exhaustive (i.e. en analysant tous les d´ecalages possibles dans le temps et toutes les dilatations en fr´equences possibles) sur chaque temps symbole. Ce coˆut empˆeche pour l’instant l’application de cette m´ethode `a des syst`emes temps-r´eel.

3.4.4.2 Synchronisation par points d’int´erˆet

Les syst`emes de synchronisation de la seconde cat´egorie extraient du signal audio diff´erents points d’int´erˆet, qui d´efinissent une cartographie du signal audio tatou´e. Chaque point d’int´erˆet

24. Modulated Discret Cosinus Transform 25. Discrete Cosinus Transform

marque la r´egion du signal audio o`u est ins´er´ee l’information. L’extraction de cette ”carte” `a la r´eception permet d’estimer puis d’inverser l’op´eration d´esynchronisante et de localiser la r´egion du signal audio o`u a ´et´e ins´er´e le tatouage.

Ces points d’int´erˆet peuvent ˆetre relatifs `a l’´energie du signal [HS02], `a l’amplitude en sortie d’un filtrage non lin´eaire [LMBL04] inspir´e du tatouage d’images [Bas00] ou `a la d´etection du tempo [KA03]. Les d´efauts majeurs de ces syst`emes sont sans doute leurs d´ebits variables : les points d’int´erˆets n’´etant pas dispos´es `a intervalles r´eguliers, la quantit´e d’information transmise par seconde est d´ependante du signal audio. Ce d´ebit variable peut ne pas ˆetre compatible aux applications cibles auxquelles se destine le tatouage.

Conclusion

L

e tatouage des signaux audio rel`eve de deux grandes classes applicatives : les applications `

a vocation s´ecuritaire (protection de la propri´et´e intellectuelle par exemple) et les appli- cations de transmission de donn´ees (pour l’augmentation du contenu audio par exemple), auxquels s’attache ce manuscrit.

Dans ce contexte particulier, le syst`eme de tatouage doit satisfaire `a quatre contraintes d´efinissant la performance du syst`eme : l’inaudibilit´e de la transmission, un d´ebit de transmis- sion le plus ´elev´e possible pour une fiabilit´e de transmission la meilleure possible, la robustesse `

a diff´erentes perturbations licites, classiquement appliqu´ees au signal audio, et le coˆut en temps de calcul permettant l’application temps-r´eel.

Ces crit`eres de performances peuvent ˆetre mesur´es par un protocole exp´erimental pr´ecis que nous avons ´etabli. Ce protocole exploite un algorithme objectif de mesure de la diff´erence perceptible, l’algorithme PEAQ [Uni01], entre le signal audio original et sa version tatou´ee pour jauger de la transparence du tatouage ; il propose pour ´evaluer la fiabilit´e de transmission de mesurer du TEB moyen obtenu par tatouage d’un corpus de 20 signaux audio de style divers. Ce TEB sert ´egalement `a ´evaluer la robustesse du syst`eme aux perturbations. Ces perturbations sont choisies pour ˆetre repr´esentatives des op´erations licites pouvant ˆetre effectu´ees sur un signal audio et seront r´ealis´ees en utilisant l’outil Stirmark Audio [Lan]. Il comprend des conversions de format (compression MPEG), des modifications d’´echelle (d’amplitude, mais ´egalement des op´erations de dilation ou de contraction de l’´echelle des temps), des filtrages, etc... Ce protocole propose ´egalement un crit`ere de mesure du coˆut en temps de calcul des syst`emes de tatouage. Il sera repris tout au long de ce manuscrit pour ´evaluer les performances des syst`emes propos´es.

De nombreuses solutions sont propos´ees dans la litt´erature pour r´esoudre le probl`eme du tatouage. Une partie se base sur l’analogie entre chaˆıne de tatouage et chaˆıne de communication pour construire des syst`emes de tatouage relativement efficaces mais dont les performances sont in´evitablement limit´ees par le signal audio. Pour palier `a ce probl`eme, des strat´egies d’insertion inform´ees ont ´et´e introduites. Une insertion est dite inform´ee si la technique de construction du tatouage exploite la connaissance a priori du signal audio `a l’´emetteur. Un tatouage inaudible et de robustesse maximale aux perturbations peut donc th´eoriquement ˆetre construit. L’efficacit´e th´eorique de ces strat´egies inform´ees sur les performances du syst`eme de tatouage a d’ores et d´ej`a ´et´e ´etablie. Elle nous incite de fait `a construire un syst`eme de tatouage exploitant une tech- nique d’insertion inform´ee. Deux grandes familles de strat´egie d’insertion inform´ee se distinguent dans la litt´erature : les techniques de codage inform´e (dont fait notamment parmi la QIM de