Représentation de la
donnée
Représentation de la donnée
• Définition: Une donnée est une description élémentaire d’une réalité.
• Observation
• Mesure
• …
• La donnée est dépourvue de tout raisonnement, supposition, constatation, probabilité,…
• Données brutes: source primaire (non interprétées)
• Données traitées:
• Plusieurs niveaux de traitement
• Extraction d’information
• Chaque traitement engendre un type d’interprétation
La donnée numérique
La donnée numérique
- Quelle que soit la nature des applications informatiques, il est nécessaire de représenter les informations à traiter/
analyser sous forme binaire.
• Texte
• Son
• Image
• Vidéo
• Mesures de capteurs
• …
- Besoin de compression
- Données échantillonnées
• Spatialement
• Temporellement
• Spectralement
Échantillonnage
L’opération d’échantillonnage consiste à prélever sur un signal analogique dont l’évolution est continue dans le temps, des échantillons représentant l’amplitude aux instants de
prélèvement.
Pour des raisons de simplification, les prélèvements sont réalisés régulièrement avec une périodicité constante Te appelée période d’échantillonnage.
Chapitre 3
Echantillonnage, quantification et ´ restitution des signaux
3.1 Echantillonnage des signaux analogiques ´
3.1.1 Echantillonnage id´ ´ eal
Description temporelle
L’op´eration d’´echantillonnage consiste `a pr´elever sur un signal analogique dont l’´evolution est conti- nue dans le temps, des ´echantillons repr´esentant l’amplitude aux instants de pr´el`evement (figure 3.1).
Pour des raisons de simplification, les pr´el`evements sont r´ealis´es r´eguli`erement avec une p´eriodicit´e constante Te appel´ee p´eriode d’´echantillonnage. L’´echantillonnage est qualifi´e d’id´eal d`es lors que l’on peut supposer ou approcher une prise instantan´ee des ´echantillons.
Figure 3.1 – Description de l’´echantillonnage id´eal.
Math´ematiquement, l’´echantillonnage id´eal peut ˆetre mod´elis´e par le produit entre x(t) et une suite p´eriodique d’impulsions id´eales appel´ee peigne de Dirac.
x⇤(t) = Tex(t)
+1
X
k= 1
(t kTe). (3.1)
Le facteur Te permet de normaliser l’´energie du signal ´echantillonn´e x⇤(t).
Spectre du signal ´echantillonn´e
En utilisant la transformation de Fourier appliqu´ee aux signaux ´echantillonn´es, on montre que le spectre du signal x⇤(t) est constitu´e d’une suite de r´epliques du spectre de x(t) d´ecal´ees avec une p´eriodicit´e de fe = 1
Te (figure 2.2).
La transform´ee de Fourier du peigne de Dirac est un peigne de Dirac fr´equentiel : Te
+1
X
k= 1
(t kTe) T.F.!
+1
X
m= 1
(f mfe). (3.2)
Cette propri´et´e appliqu´ee `a la relation (2.1) conduit `a : 11
D´eformation de la bande de base A` fe
2 l’´echantillonnage-blocage engendre une att´enuation de20 log 2
⇡, soit -3,9 dB. Pour compen- ser cette att´enuation, certains convertisseurs analogiques-num´eriques sont dot´es d’un circuit de pr´e- accentuation des hautes fr´equences du spectre utile.
3.2 Echantillonnage 2D ´
L’´echantillonnage bidimensionnel est ´egalement bas´e sur le th`eor`eme de Shannon. Si on consid`ere les images comme des signaux `a support fr´equentiel born´e, le th´eor`eme d’´echantillonnage 2D n’est qu’une simple g´en´eralisation du th´eor`eme d’´echantillonnage 1D.
Figure 3.11 – Image, grilled d’´echantillonnage et image ´echantillonn´ee.
3.2.1 Grilles d’´echantillonnage
La majorit´e des grilles d’´echantillonnage sont des grilles Cart´esiennes (rectangulaires) : les pixels sont `a 4u et 4t les uns des autres. Des grilles carr´ees sont g´en´eralement choisies : 4u = 4t. Il existe
´egalement des grilles hexagonales ou qunconces. ces grilles sont souvent utilis´ees pour ´echantillonner les signaux TV afin d’´economiser un facteur dans le nombre total d’´echantilons.
Figure 3.12 – Exemples de grilles.
16
En 2D
Échantillonnage
Conditions
Figure 3.2 – Composition spectrale d’un signal ´echantillonn´e id´ealement.
X⇤(f) = X(f) ⇤
+1
X
m= 1
(f mfe). (3.3)
Finalement le spectre du signal ´echantillonn´e s’´ecrit : X⇤(f) =
+1
X
m= 1
X(f mfe). (3.4)
Cela revient `a dire que par les valeurs pr´elev´ees, peuvent passer une infinit´e de signaux analogiques.
A titre d’exemple, la figure 3.3 d´ecrit l’´evolution de trois signaux sinuso¨ıdaux du type sin(2⇡` f t) avec f = fe
8 , 9fe
8 , 7fe
8 . L’´echantillonnage de ces trois signaux `a la fr´equence fe conduit `a l’obtention des mˆemes ´echantillons indiqu´es en surimpression sur la figure 3.3.
Figure 3.3 – Une infinit´e de signaux analogiques peuvent co¨ıncider sur les mˆemes ´echantillons.
Th´eor`eme de l’´echantillonnage ou th´eor`eme de Shannon
En consid´erant un spectre initial X(f) born´e sup´erieurement par une limite fsup, on peut esp´erer conserver toute l’information lorsque fe est choisie telle que :
fe > 2fsup. (3.5)
Le non respect de la condition pr´ec´edente conduit `a un sous-´echantillonnage qui engendre le repliement des motifs spectraux (figure 2.4). En d’autres termes, il y a perte ou modification des informations originales.
Les cas qui suivent sont quelques exemples des cons´equences du sous-´echantillonnage de signaux p´eriodiques. Le sous-´echantillonnage `a fe = 101 Hz d’un signal sinuso¨ıdal de 100 Hz fait apparaˆıtre un signal dont la fr´equence apparente est de 1Hz (figure 2.5). En imagerie, les cam´eras num´eriques r´ealisent un double ´echantillonnage :
— un ´echantillonnage dimensionnel des images d´elivr´ees par l’objectif photographique ; 12
Échantillonner au moins deux fois par période
Échantillonnage
Quantification
En 1D on a vu que le signal ´echantillonn´e est obtenu par une p´ eriodisation du signal analogique, de mˆeme en 2D, le signal X
e(f, g) est obtenu par une p´eriodisation de X
a(f, g) dans les deux dimensions selon l’inverse des p´eriodes d’´echantillonnage 1
4 t et 1
4 u . L’´echantillonnage 2D produit donc une suc- cession de spectres secondaires dans les deux directions.
La figure 3.15 montre un exemple de spectre d’un signal continu avec le spectre du signal ´echantillonn´e correspondant.
Figure 3.15 – Spectre d’un signal continu (gauche) et du signal ´echantillonn´e correspondant (droite).
Version 2D du th´ eor` eme d’´ echantillonnage :
Soit un signal analogique 2D x
a(t, u) avec un support fr´equentiel born´e (f
maxet g
max). On ´echan- tillonne x
a`a une fr´equence f
e= 1/T
e. Aucune perte d’information n’est engendr´ee par l’op´eration d’´echantillonnage si 1
4 t 2f
maxet 1
4 u 2 = g
max.
3.3 Quantification des signaux
3.3.1 D´ efinition de la quantification uniforme et du bruit de quantification
La quantification est la seconde ´etape n´ecessaire ` a la num´erisation des signaux. Succ´edant ` a l’´echantillonnage- blocage, elle permet le traitement num´erique ou la m´emorisation du signal (figure 2.11).
Figure 3.16 – Chaˆıne de num´erisation.
Son rˆole est d’a↵ecter une valeur de r´esolution finie ` a un ´echantillon dont l’amplitude est en th´eorie infiniment pr´ecise si l’on fait abstraction du bruit de fond propre au signal.
Quantifier un ´echantillon, c’est arrondir sa valeur ` a celle de l’´echelon le plus proche sur une grille de niveaux (figure 2.13). Lorsque les ´echelons sont ` a pas constant, la quantification est uniforme.
L’´etendue de la grille doit couvrir la gamme dynamique des signaux ` a convertir. Vis-` a-vis des signaux, la quantification peut ˆetre mod´elis´ee par le sch´ema de la figure 2.12 o` u :
— Q(z ) est la transform´ee en z d’un signal al´eatoire "
qappel´e bruit de quantification ;
— X (z ) et X
q(z ) sont respectivement les transform´ees du signal d’entr´ee et du signal quantifi´e.
La quantification est une op´eration non conservatrice car la pr´ecision originale ne peut ˆetre retrouv´ee apr`es arrondi. Elle peut ˆetre vue comme la superposition d’une composante al´eatoire sur l’amplitude de chaque ´echantillon original. Le bruit de quantification repr´esente ainsi l’erreur li´ee ` a l’arrondi.
18
- Affecter une valeur de résolution finie à un échantillon dont l’amplitude est en théorie infiniment précise si l’on fait abstraction du bruit de fond propre au signal.
- Arrondir la valeur à celle de l’échelon le plus proche sur une grille de niveaux.
Codage
- Encodeur … Décodeur - Modèle de source
• Une source d’information émet en général un message non déterministe: signal aléatoire
⇒ une information est un processus stochastique.
• Ce qui rend une information intéressante est son caractère imprédictible. Une information est ainsi d’autant plus riche qu’elle est peu probable.
- Mesurer la quantité d’information
4.2 Mesure de l’information
A partir des remarques suivantes :
— La quantit´e d’information d’un symbole est d’autant plus grande que celui-ci est peu probable.
— La quantit´e d’information de deux symboles successifs est la somme de leurs quantit´es d’infor- mation.
La quantit´e d’information not´ee I est une fonction qui doit ainsi avoir les propri´et´es suivantes : 1. I(.) est une fonction continue de la probabilit´e pi.
2. I(pk) % si pk & ! I(pk) est une fonction d´ecroissante de pk.
3. I(pk et pj) = I(pk) + I(pj).
4. Un symbole certain poss`ede une quantit´e d’information nulle : I(pk = 1) = 0. Une fonction math´ematique remplit les conditions 1, 3 et 4 : log(pk). Pour obtenir la propri´et´e 2, il suffit de prendre log(pk) = log(1/pk).
La quantit´e d’information d’un symbole xk de probabilit´e pk a ainsi ´et´e d´efinie par Shannon comme : I(xk) = log(pk) = log( 1
pk ). (4.1)
Dans la d´efinition de la quantit´e d’information il n’a pas ´et´e pr´ecis´e la base du logarithme utilis´ee et c’est cette base qui d´efinit l’unit´e. Plusieurs syst`emes existent :
— Base 2 : c’est celle historiquement choisie par Shannon qui est `a l’origine de cette d´efinition.
L’unit´e ainsi obtenue est le bit pour binary digit ou binary unit. Cette unit´e a ´et´e rebaptis´ee le shannon en hommage `a son inventeur mais cette appellation reste peu usit´ee. Pour une source binaire de deux symboles ´equiprobables, pk = 1/2 et I(xk) = 1 bit . Le symbole d’une source binaire qui est un bit poss`ede donc une quantit´e d’information de 1 bit, d’o`u l ´equivalence. Par la suite, sauf pr´ecision contraire, c’est l’unit´e que nous utiliserons.
— Base e : utilisation du logarithme N´ep´erien dit encore logarithme naturel. L’unit´e devient alors le nats pour natural units. Sachant que Ln(a) = Ln(2).log2(a) = 0,69315.log2(a) ) 1 nats = 0,69315 bits et 1 bit = 1,44269 nats.
— Autres bases : d’autres bases ont ´et´e propos´ees mais `a priori peu utilis´ees. En conformit´e avec le syst`eme d´ecimal, la base 10 qui donne le dit pour d´ecimal unit. Signalons enfin la base 3 `a l’origine du trit pour trinary unit.
Rappel sur les changements de base :
Soit deux bases de logarithmes : base a et base b. Le passage entre les bases se fait par : logb(p) = logb(a).loga(p).
4.3 Entropie d’une source
L’entropie H(S) d’une source S est la quantit´e d’information moyenne contenue dans l’alphabet X de cette source. Du point de vue math´ematique, cela s’exprime par H(S) = E[I(X)] soit :
H(S) = E[I(X)] = X
k
pkI(xk) = X
k
pk log( 1
pk). (4.2)
H(S) s’exprime en bits/symbole ou Shannon/symbole.
Exemple :
Source binaire avec deux symboles ”0” et ”1” de probabilit´es respectives p et 1 p.
H(S) = p log(1
p) + (1 p) log( 1
1 p). (4.3)
cette entropie est maximale pour p = 0,5 et vaut z´ero pour p = 0 et p = 1. Cet exemple est un cas particulier d’une source ayant un alphabet de K symboles. On d´emontre que son entropie est maximale
26
4.2 Mesure de l’information
A partir des remarques suivantes :
— La quantit´e d’information d’un symbole est d’autant plus grande que celui-ci est peu probable.
— La quantit´e d’information de deux symboles successifs est la somme de leurs quantit´es d’infor- mation.
La quantit´e d’information not´ee I est une fonction qui doit ainsi avoir les propri´et´es suivantes : 1. I(.) est une fonction continue de la probabilit´e pi.
2. I(pk) % si pk & ! I(pk) est une fonction d´ecroissante de pk.
3. I(pk et pj) = I(pk) + I(pj).
4. Un symbole certain poss`ede une quantit´e d’information nulle : I(pk = 1) = 0. Une fonction math´ematique remplit les conditions 1, 3 et 4 : log(pk). Pour obtenir la propri´et´e 2, il suffit de prendre log(pk) = log(1/pk).
La quantit´e d’information d’un symbole xk de probabilit´e pk a ainsi ´et´e d´efinie par Shannon comme : I(xk) = log(pk) = log( 1
pk). (4.1)
Dans la d´efinition de la quantit´e d’information il n’a pas ´et´e pr´ecis´e la base du logarithme utilis´ee et c’est cette base qui d´efinit l’unit´e. Plusieurs syst`emes existent :
— Base 2 : c’est celle historiquement choisie par Shannon qui est `a l’origine de cette d´efinition.
L’unit´e ainsi obtenue est le bit pour binary digit ou binary unit. Cette unit´e a ´et´e rebaptis´ee le shannon en hommage `a son inventeur mais cette appellation reste peu usit´ee. Pour une source binaire de deux symboles ´equiprobables, pk = 1/2 et I(xk) = 1 bit . Le symbole d’une source binaire qui est un bit poss`ede donc une quantit´e d’information de 1 bit, d’o`u l ´equivalence. Par la suite, sauf pr´ecision contraire, c’est l’unit´e que nous utiliserons.
— Base e : utilisation du logarithme N´ep´erien dit encore logarithme naturel. L’unit´e devient alors le nats pour natural units. Sachant que Ln(a) = Ln(2).log2(a) = 0,69315.log2(a) ) 1 nats = 0,69315 bits et 1 bit = 1,44269 nats.
— Autres bases : d’autres bases ont ´et´e propos´ees mais `a priori peu utilis´ees. En conformit´e avec le syst`eme d´ecimal, la base 10 qui donne le dit pour d´ecimal unit. Signalons enfin la base 3 `a l’origine du trit pour trinary unit.
Rappel sur les changements de base :
Soit deux bases de logarithmes : base a et base b. Le passage entre les bases se fait par : logb(p) = logb(a).loga(p).
4.3 Entropie d’une source
L’entropie H(S) d’une source S est la quantit´e d’information moyenne contenue dans l’alphabet X de cette source. Du point de vue math´ematique, cela s’exprime par H(S) = E[I(X)] soit :
H(S) = E[I(X)] = X
k
pkI(xk) = X
k
pk log( 1
pk). (4.2)
H(S) s’exprime en bits/symbole ou Shannon/symbole.
Exemple :
Source binaire avec deux symboles ”0” et ”1” de probabilit´es respectives p et 1 p.
H(S) = plog(1
p) + (1 p) log( 1
1 p). (4.3)
cette entropie est maximale pour p = 0,5 et vaut z´ero pour p = 0 et p = 1. Cet exemple est un cas particulier d’une source ayant un alphabet de K symboles. On d´emontre que son entropie est maximale
26
4.2 Mesure de l’information
A partir des remarques suivantes :
— La quantit´e d’information d’un symbole est d’autant plus grande que celui-ci est peu probable.
— La quantit´e d’information de deux symboles successifs est la somme de leurs quantit´es d’infor- mation.
La quantit´e d’information not´ee I est une fonction qui doit ainsi avoir les propri´et´es suivantes : 1. I(.) est une fonction continue de la probabilit´e pi.
2. I(pk) % si pk & ! I(pk) est une fonction d´ecroissante de pk.
3. I(pk et pj) = I(pk) + I(pj).
4. Un symbole certain poss`ede une quantit´e d’information nulle : I(pk = 1) = 0. Une fonction math´ematique remplit les conditions 1, 3 et 4 : log(pk). Pour obtenir la propri´et´e 2, il suffit de prendre log(pk) = log(1/pk).
La quantit´e d’information d’un symbole xk de probabilit´e pk a ainsi ´et´e d´efinie par Shannon comme : I(xk) = log(pk) = log( 1
pk). (4.1)
Dans la d´efinition de la quantit´e d’information il n’a pas ´et´e pr´ecis´e la base du logarithme utilis´ee et c’est cette base qui d´efinit l’unit´e. Plusieurs syst`emes existent :
— Base 2 : c’est celle historiquement choisie par Shannon qui est `a l’origine de cette d´efinition.
L’unit´e ainsi obtenue est le bit pour binary digit ou binary unit. Cette unit´e a ´et´e rebaptis´ee le shannon en hommage `a son inventeur mais cette appellation reste peu usit´ee. Pour une source binaire de deux symboles ´equiprobables, pk = 1/2 et I(xk) = 1 bit . Le symbole d’une source binaire qui est un bit poss`ede donc une quantit´e d’information de 1 bit, d’o`u l ´equivalence. Par la suite, sauf pr´ecision contraire, c’est l’unit´e que nous utiliserons.
— Base e : utilisation du logarithme N´ep´erien dit encore logarithme naturel. L’unit´e devient alors le nats pour natural units. Sachant que Ln(a) = Ln(2).log2(a) = 0,69315.log2(a) ) 1 nats = 0,69315 bits et 1 bit = 1,44269 nats.
— Autres bases : d’autres bases ont ´et´e propos´ees mais `a priori peu utilis´ees. En conformit´e avec le syst`eme d´ecimal, la base 10 qui donne le dit pour d´ecimal unit. Signalons enfin la base 3 `a l’origine du trit pour trinary unit.
Rappel sur les changements de base :
Soit deux bases de logarithmes : base a et base b. Le passage entre les bases se fait par : logb(p) = logb(a).loga(p).
4.3 Entropie d’une source
L’entropie H(S) d’une source S est la quantit´e d’information moyenne contenue dans l’alphabet X de cette source. Du point de vue math´ematique, cela s’exprime par H(S) = E[I(X)] soit :
H(S) = E[I(X)] = X
k
pkI(xk) = X
k
pk log( 1
pk). (4.2)
H(S) s’exprime en bits/symbole ou Shannon/symbole.
Exemple :
Source binaire avec deux symboles ”0” et ”1” de probabilit´es respectives p et 1 p.
H(S) = plog(1
p) + (1 p) log( 1
1 p). (4.3)
cette entropie est maximale pour p = 0,5 et vaut z´ero pour p = 0 et p = 1. Cet exemple est un cas particulier d’une source ayant un alphabet de K symboles. On d´emontre que son entropie est maximale
26 4.2 Mesure de l’information
A partir des remarques suivantes :
— La quantit´e d’information d’un symbole est d’autant plus grande que celui-ci est peu probable.
— La quantit´e d’information de deux symboles successifs est la somme de leurs quantit´es d’infor- mation.
La quantit´e d’information not´ee I est une fonction qui doit ainsi avoir les propri´et´es suivantes : 1. I(.) est une fonction continue de la probabilit´e pi.
2. I(pk) % si pk & ! I(pk) est une fonction d´ecroissante de pk.
3. I(pk et pj) = I(pk) +I(pj).
4. Un symbole certain poss`ede une quantit´e d’information nulle : I(pk = 1) = 0. Une fonction math´ematique remplit les conditions 1, 3 et 4 : log(pk). Pour obtenir la propri´et´e 2, il suffit de prendre log(pk) = log(1/pk).
La quantit´e d’information d’un symbolexk de probabilit´e pk a ainsi ´et´e d´efinie par Shannon comme : I(xk) = log(pk) = log( 1
pk). (4.1)
Dans la d´efinition de la quantit´e d’information il n’a pas ´et´e pr´ecis´e la base du logarithme utilis´ee et c’est cette base qui d´efinit l’unit´e. Plusieurs syst`emes existent :
— Base 2 : c’est celle historiquement choisie par Shannon qui est `a l’origine de cette d´efinition.
L’unit´e ainsi obtenue est le bit pour binary digit ou binary unit. Cette unit´e a ´et´e rebaptis´ee le shannon en hommage `a son inventeur mais cette appellation reste peu usit´ee. Pour une source binaire de deux symboles ´equiprobables, pk = 1/2 et I(xk) = 1 bit . Le symbole d’une source binaire qui est un bit poss`ede donc une quantit´e d’information de 1 bit, d’o`u l ´equivalence. Par la suite, sauf pr´ecision contraire, c’est l’unit´e que nous utiliserons.
— Base e : utilisation du logarithme N´ep´erien dit encore logarithme naturel. L’unit´e devient alors le nats pour natural units. Sachant que Ln(a) = Ln(2).log2(a) = 0,69315.log2(a) ) 1 nats = 0,69315 bits et 1 bit = 1,44269 nats.
— Autres bases : d’autres bases ont ´et´e propos´ees mais `a priori peu utilis´ees. En conformit´e avec le syst`eme d´ecimal, la base 10 qui donne le dit pour d´ecimal unit. Signalons enfin la base 3 `a l’origine du trit pour trinary unit.
Rappel sur les changements de base :
Soit deux bases de logarithmes : base a et base b. Le passage entre les bases se fait par : logb(p) = logb(a).loga(p).
4.3 Entropie d’une source
L’entropie H(S) d’une source S est la quantit´e d’information moyenne contenue dans l’alphabet X de cette source. Du point de vue math´ematique, cela s’exprime par H(S) = E[I(X)] soit :
H(S) = E[I(X)] = X
k
pkI(xk) = X
k
pklog( 1
pk). (4.2)
H(S) s’exprime en bits/symbole ou Shannon/symbole.
Exemple :
Source binaire avec deux symboles ”0” et ”1” de probabilit´es respectives p et 1 p.
H(S) = plog(1
p) + (1 p) log( 1
1 p). (4.3)
cette entropie est maximale pour p = 0,5 et vaut z´ero pour p = 0 et p = 1. Cet exemple est un cas particulier d’une source ayant un alphabet de K symboles. On d´emontre que son entropie est maximale
26
Codage
Utilisation des données
- Les données peuvent être utilisée sans retraitement: espace original - OU utilisées dans un autre espace: espace transformé
- OU résumées pour en extraire l’essentiel: descripteurs, primitives,…
Primitives
- L’extraction de primitives consiste à mettre en évidence dans l'image un certain nombre d'objets structurels.
Exemples :
régions, contours, textures, formes
- Une sémantique est souvent associée à une primitive.
- Il existe souvent des liens entre les primitives.
Exemple : contours régions
formes
Exemple de donnée: image
Primitives
- Pourquoi détecter des primitives ?
• Pour s’en servir ensuite dans l’analyse d’image - Objectifs applicatifs variés :
• Reconstruction 3D
• Analyse de scènes, interprétation, détection d’objets
- Deux étapes clefs :
1. Détection de la primitive (feature)
2. Description, caractérisation de la primitive
Le contour
- La détection de contour est une étape préliminaire à de nombreuses applications de l'analyse d'images.
- Les contours constituent en effet des indices riches, au même titre que les points d'intérêts, pour toute interprétation ultérieure de l'image.
- Les contours dans une image proviennent des :
• discontinuités de la fonction de réectance (texture, ombre),
• discontinuités de profondeur (bords de l’objet), - Un contour = ensemble de pixels
- Pixel de contour = Pixel situé dans une zone locale de forte discontinuité d'intensité, de couleur ou de texture.
- Rechercher les contours est équivalent à rechercher des régions.
Contour: caractérisation
- Le principe de la détection de contours repose donc sur l'étude des dérivées de la fonction d'intensité dans l'image:
- les extrêma (minima, maxima) locaux du gradient de la fonction d'intensité - les passages par zéro du laplacien.
- Attention à la présence de bruit !
Profils d'intensité Images et gradients
Contour: caractérisation
Origine
Contour: caractérisation
Contour: caractérisation
Dérivation
- Hypothèse : l'image numérique = échantillonnage d'une fonction continue à support borné et continument dérivable.
- Les dérivées dans deux directions de l’espace définissent la courbure de la fonction d’intensité bivariée.
- Constatations:
- Dérivées premières :
- valeur significative (par rapport à 0) au voisinage d'un contour;
- valeur proche de 0 dans des régions homogènes;
- Dérivées secondes :
- passage par 0 à proximité d'un contour.
Contour: caractérisation
Approximation de la dérivée: développement en série de Taylor
I (x
0+ x, y
0+ y) = I (x
0, y
0) + x @ I
@ x (x
0, y
0) + y @ I
@ y (x
0, y
0)
@ I (x, y)
@ x = lim
x !0
I (x + x, y) I (x, y) x
@ I (x, y )
@ y = lim
y !0
I (x, y + y ) I (x, y ) y
I(x, y) I(x + x, y)
I(x, y + y)
y
x
Contour: caractérisation
Le gradient
- Gradient d'une fonction à deux variables (x,y) (d'autres directions peuvent être considérées) - Le gradient :
- Deux informations:
- norme: clarté du contour
- orientation: dirigé selon la direction de plus fort changement d’intensité (perpendiculaire au contour)
rI =
✓@I
@x, @I
@y
◆
G = |r I | =
s✓ @ I
@ x
◆
2+
✓ @ I
@ y
◆
2= arctan 0 B B
@
@ I
@ y
@ I
@ x
1
C C
A
Contour: gradient
f
0(x) = lim
h !0
f (x + h) f (x) h
f
0[i] = f [i + 1] f [i]
- Fonction continue
- Fonction discrète:
- Plus petite valeur de h = 1
Image N/B codée sur 8 bits
Contour: gradient
Niveau de gris
x
Image 1D f(x)
1ère dérivée f'(x)
seuil
|f'(x)|
Pixels contours:
|f'(x)| > Seuil
Contour: gradient
Implémentation par convolution
Détecteur horizontal
102 110 100 99 108 99 105 108 102 56 107 106 102 48 42 120 109 42 50 35 110 35 38 40 41
25 35 39 35 40
0 0 0
-1 1 0
0 0 0
Image
Noyeau
Gradient
Contour: gradient
Implémentation par convolution
Détecteur horizontal
102 110 100 99 108 99 105 108 102 56 107 106 102 48 42 120 109 42 50 35 110 35 38 40 41
25 35 39 35 40
0 0 0
-1 1 0
0 0 0
Image
Noyeau
6
Gradient
Contour: gradient
Implémentation par convolution
Détecteur horizontal
102 110 100 99 108 99 105 108 102 56 107 106 102 48 42 120 109 42 50 35 110 35 38 40 41
25 35 39 35 40
0 0 0
-1 1 0
0 0 0
Image
Noyeau
? ? ? ? ?
? 6 3 6 ?
? -1 -4 -54 ?
? -11 -67 -8 ?
? -75 3 2 ?
? ? ? ? ?
Gradient
Contour: gradient
Implémentation par convolution
Détecteur vertical
102 110 100 99 108 99 105 108 102 56 107 106 102 48 42 120 109 42 50 35 110 35 38 40 41
25 35 39 35 40
0 -1 0
0 1 0
0 0 0
Image
Noyeau
? ? ? ? ?
? -5 8 3 ?
? 1 -6 -54 ?
? 3 -60 2 ?
? -74 -3 -10 ?
? ? ? ? ?
Gradient
Contour: gradient
Contour: gradient
Image Sobel Prewitt
Exploitation des contours
- En général, les détecteurs de contours fournissent des contours ouverts (les exceptions : contours actifs, passage par 0 du Laplacien).
- Or, les traitements en aval (reconnaissance de formes) nécessitent des contours étiquetés.
- Méthodes de fermeture des contours:
- Recherche par graphe
- Morphologie mathématique
- Détection de formes par transformée de Hough
Exploitation des contours
Extraction de droites par transformée de Hough
- Détection de droites (principalement) et de formes paramétrées.
- Une droite: y=ax+b
- Une infinité de droites passent par un point (x0,y0).
- Une seule droite est définie par (a,b)
Exploitation des contours
Extraction de droites par transformée de Hough - Cellules d'accumulation (valeurs discrètes)
- Chaque cellule contient le nombre de points en x-y qui existent sur chaque ligne
Exploitation des contours
Problème : la pente approche l'infinie pour des lignes qui approchent la verticale!
Une droite verticale ne peut pas être représentée (a=∞) Solution : représentation sous forme polaire
x cos θ + y sin θ = ρ
Exploitation des contours
Description
Codage de Freeman
- Permet de coder un contour en ne codant que les déplacements relatifs - P0 : point initial
- Code obtenu : 11007764606544133442
- Une permutation circulaire aboutit au même résultat - Choix : code minimal 00776460654413344211
- Compression du code en comptant les occurrences successives (valable pour les segments longs) : 000000777777777 ) 6097 (6 zéros puis 9 septs)
Description
Descripteurs :
- Périmètre:
- Surface: somme des pixels à l’intérieur du contour.
- Compacité:
- Centre de gravité:
- Moments d’inertie
P = N
p+ N
Ip 2
C = P
2S
x
G= 1 K
X
Ki=1
x
iy
G= 1 K
X
Ki=1
y
ia = 1 S
X
Ki=1
(x
ix
G)
2b = 1 S
X
Ki=1
(y
iy
G)
2La texture
- Donner une définition précise et universelle de la notion de texture est un problème difficile et non résolu.
- Différents domaines - Absence de consensus - Exemples:
- une région d’une image présentant une organisation spatiale homogène des niveaux de luminance;
- reproduction spatiale d’un motif de base dans plusieurs directions;
- une structure spatiale constituée par l’organisation de primitives (ou motifs de base) ayant chacune un aspect aléatoire;
La texture
La texture
De nombreuses significations
- Matériaux : Caractéristique relative à la dimension, la forme, la disposition des grains dans un métal,
- Culinaire : Qualité physique des aliments liée à leur densité, leur viscosité, leur caractère homogène, leur dureté,
- Textile : disposition et mode d’entrecroisement des fils dans un tissage,
- Graphisme par ordinateur : recouvrement d’une surface (généralement par une image) lui conférant son apparence,
- Autres définitions en cristallographie, cosmologie, musique, peinture, etc.
Définitions possibles dans le cadre de la vision
- Zone homogène, constituée de la répétition d’entités élémentaires formant un tout.
- Description des variations d’intensité lumineuse sur une surface, rendant compte de propriétés telles que la rugosité, la douceur, la granularité,
La texture
Notre système visuel a la capacité de grouper des éléments en régions homogènes en quelques centaines de millisecondes
La texture
Caractérisation
- Une texture est une information intéressante à analyser, mais difficile à extraire - Une texture peut être définie
- Comme une région avec des variations d’intensité - Comme une organisation spatiale des pixels
- Une texture peut être périodique (répétition d’un motif de base)
- ou non-périodique (pas de motif de base, plus désordonnée)
Description
block pattern checkerboard striped pattern block pattern checkerboard striped pattern
block pattern
Trois textures différentes avec la même distribution des niveau de grischeckerboard striped pattern
—> problème difficile
Description
But:
f : R
M⇥N! E
I 7 !{ d
1(I ), d
2(I ), . . . , d
n(I ) }
- aussi fidèles à la perception humaine;
- aussi invariants que possible par transformation (géométrique, radiométrique,…).
d
i:
avec
Description
Difficultés:
- Absence de modèle mathématique générique;
- Absence de distance universelle entre textures;
- Dépendance vis à vis de l’échelle
Applications:
- Reconnaissance et classification de matériaux, contrôle de qualité,…
- Reconnaissance d’objets - Segmentation d’images - Synthèse d’images
- Restauration d’images - …
Description
Descripteurs statistiques 1er ordre:
- Moyenne:
- Variance:
- Skewness (asymétrie):
- Kurtosis (aplatissement):
- Energie:
2
= 1 N
X
x
X
y
(I (x, y ) µ)
2µ = 1
N
X
x
X
y
I (x, y )
= 1 N
X
x
X
y
(I (x, y ) µ)
3= 1 N
X
x
X
y
(I (x, y ) µ)
4E = 1 N
X
x
X
y
I (x, y )
2Description
µ = 106, 2 = 74, = 0.34, = 3.66 µ = 128, 2 = 2803, = 0.3, = 2.2
µ = 148, 2 = 2208, = 0.96, = 3.23
Description
Statistiques 1er ordre: limitations
- Toutes ces quantité ne représentent que la vue statistique de l’image et ne dépendent que de son histogramme.
- Ces quantités prennent des valeurs arbitraires sous l’effet d’un changement de contraste par exemple.
Description
Descripteurs statistiques second ordre:
- Co-variance: peut être estimée par (I est supposée périodique)
- Les micro-textures sont généralement bien représentées par leur covariance.
C (x
0, y
0) = 1 N
X
x
X
y
I (x
0, y
0) ⇥ I (x
0+ x, y
0+ y )
Description
Matrices de co-occurences
- L’idée est d’identifier les répétitions de niveaux de gris selon une distance et une direction données.
- Matrice de taille G x G.
* G étant le nombre de niveaux de gris de l’image (256x256)
* On utilise souvent un nombre de niveaux G’ < G: 8x8, 16x16 ou 32x32
- Plusieurs matrices, pour chaque distance et direction.
* Distance : 1, 2, 3 (,4, …)
* Direction : 0°, 45°, 90°, 135°
- Temps de calcul des matrices est assez long (dépend de G).
Description
Image Distance =1;
Orientation = 0°
Matrices de co-occurences
Description
Matrices de co-occurences
Description
Image Distance =1;
Orientation = 0° Distance =1;
Orientation = 45°
Matrices de co-occurences
Description
5 10 15 5
10 15 5 10 15
5 10 15
5 10 15
5 10 15 5 10 15 5 10 15
1500
1000
500
1500
1000
500
1500
1000
500
1500
1000
500
Matrices de co-occurences: exemple
Description
Matrices de co-occurences: descripteurs
- Moyenne:
- Entropie:
- Inertie:
- Energie
µ = X
i
X
j
p(i, j )
E = X
i
X
j
p(i, j ) log
2(p(i, j )
I = X
i
X
j
(i j )
2p(i, j )
En = X
i
X
j
p(i, j )
2p(i, j )
: valeur normalisée de la matricePoints d’intérêt
- On se pose souvent la question de savoir quels sont les endroits de l’image contenant le plus d’informations.
- La détection de points d'intérêts est une étape préliminaire à de nombreux processus de vision par ordinateur.
- Les points d’intérêts correspondent à des doubles discontinuités de la fonction d'intensités.
- Exemples: coins, jonctions en T ou points de fortes variations de texture.
Avantages:
- Sources d'informations plus sable que les contours.
- Robuste aux occultations (totales ou partielles).
- Pas d'opérations de chainage (contrairement aux contours).
- Présents dans une grande majorité d’images.
Détection de points d’intérêts - Mise en correspondance
Détection de points d’intérêts
La détection de points d’intérêts (ou coins) est, au même titre que la détec- tion de contours, une étape préliminaire à de nombreux processus de vision par ordinateur. Les points d’intérêts, dans une image, correspondent à des doubles dis- continuités de la fonction d’intensités. Celles-ci peuvent être provoquées, comme pour les contours, par des discontinuités de la fonction de réflectance ou des dis- continuités de profondeur. Ce sont par exemple : les coins, les jonctions en T ou les points de fortes variations de texture.
Différents types de points d’intérêts :
coins, jonction en T et point de fortes variations de texture.
Avantages des points d’intérêts :
1. Sources d’informations plus fiable que les contours car plus de contraintes sur la fonction d’intensité.
2. Robuste aux occultations (soit occulté complètement, soit visible).
3. Pas d’opérations de chainage (-> contours !).
4. Présents dans une grande majorité d’images ( contours !).
UFRIMA 1
Détection de points d’intérêts - Mise en correspondance
Détection de points d’intérêts
La détection de points d’intérêts (ou coins) est, au même titre que la détec- tion de contours, une étape préliminaire à de nombreux processus de vision par ordinateur. Les points d’intérêts, dans une image, correspondent à des doubles dis- continuités de la fonction d’intensités. Celles-ci peuvent être provoquées, comme pour les contours, par des discontinuités de la fonction de réflectance ou des dis- continuités de profondeur. Ce sont par exemple : les coins, les jonctions en T ou les points de fortes variations de texture.
Différents types de points d’intérêts :
coins, jonction en T et point de fortes variations de texture.
Avantages des points d’intérêts :
1. Sources d’informations plus fiable que les contours car plus de contraintes sur la fonction d’intensité.
2. Robuste aux occultations (soit occulté complètement, soit visible).
3. Pas d’opérations de chainage (-> contours !).
4. Présents dans une grande majorité d’images ( contours !).
UFRIMA 1
Détection de points d’intérêts - Mise en correspondance
Détection de points d’intérêts
La détection de points d’intérêts (ou coins) est, au même titre que la détec- tion de contours, une étape préliminaire à de nombreux processus de vision par ordinateur. Les points d’intérêts, dans une image, correspondent à des doubles dis- continuités de la fonction d’intensités. Celles-ci peuvent être provoquées, comme pour les contours, par des discontinuités de la fonction de réflectance ou des dis- continuités de profondeur. Ce sont par exemple : les coins, les jonctions en T ou les points de fortes variations de texture.
Différents types de points d’intérêts :
coins, jonction en T et point de fortes variations de texture.
Avantages des points d’intérêts :
1. Sources d’informations plus fiable que les contours car plus de contraintes sur la fonction d’intensité.
2. Robuste aux occultations (soit occulté complètement, soit visible).
3. Pas d’opérations de chainage (-> contours !).
4. Présents dans une grande majorité d’images ( contours !).
UFRIMA 1
Points d’intérêt
Invariance:
région uniforme arête coin
Points d’intérêt
Différentes approches:
- Approches contours : détecter les contours dans une imag. Les points d'intérêts sont ensuite extraits le long des contours en considérants les points de courbures maximales ainsi que les intersections de contours.
- Approches intensité : regarder directement la fonction d'intensité dans les images pour en extraire directement les points de discontinuités (Moravec 1980, Harris 1988).
- Approches à base de modèles : les points d'intérêts sont identifiés dans l'image par mise en correspondance de la fonction d'intensité avec un modèle théorique de cette fonction des point d'intérêts considérés.
Points d’intérêt
Détecteur de Harris (1988):
M = g( ) ⇤
✓ I
x2I
xI
yI
xI
yI
y2◆
1. Dérivées 2. Dérivées au carré
3. Dérivées au carré, filtrées avec gaussienne
4. Calculer fonction des valeurs propres de M
Points d’intérêt
Classification des points en fonction des valeurs propres
Détecteur de Harris: interprétation
Classification des points en fonction des valeurs propres
λ1 λ2
Coin!
λ1 et λ2 sont élevées, λ1 ~ λ2;
gradient augmente dans toutes les directions
Région uniforme:
λ1 et λ2 sont petites:
gradient constant dans toutes les directions
Arête:
λ1 >> λ2 Arête:
λ2 >> λ1
Région uniforme (λ1 et λ2 sont petites): gradient constant dans toutes les directions
λ2
λ1
Une valeur propre élevée : contour Deux valeurs propres élevées : coin
Points d’intérêt
Exemple
Points d’intérêt
Points d’intérêt
R > seuil
Points d’intérêt
Maxima locaux
Points d’intérêt
Résultat