HAL Id: cel-01477225
https://hal.archives-ouvertes.fr/cel-01477225v2
Submitted on 23 Jul 2019
HAL is a multi-disciplinary open access
archive for the deposit and dissemination of
sci-entific research documents, whether they are
pub-lished or not. The documents may come from
teaching and research institutions in France or
abroad, or from public or private research centers.
L’archive ouverte pluridisciplinaire HAL, est
destinée au dépôt et à la diffusion de documents
scientifiques de niveau recherche, publiés ou non,
émanant des établissements d’enseignement et de
recherche français ou étrangers, des laboratoires
publics ou privés.
Franck Luthon
To cite this version:
Fran k Luthon
Fran k.Luthonuniv-pau.fr
Laboratoired'Informatiquedel'UniversitédePauetdesPaysdel'AdourEA3000
DPT G.I.M.,IUT 2 AlléeduPar de Montaury,64600 Anglet, Fran e
http://www.iutbayonne.univ-pau.fr/
∼
luthon/img0.pdf1
28 juin2019
1 Traitement d'image 7
1.1 Introdu tion . . . 7
1.2 Rappelsde théoriede l'information . . . 8
1.2.1 Entropie d'unesour e dis rète. . . 8
1.2.2 Redondan e d'unesour ed'information . . . 8
1.2.3 Codage entropique . . . 9 1.3 Histogramme . . . 9 1.4 Seuillage . . . 10 1.5 Contraste . . . 10 1.5.1 Contraste deMi helson . . . 11 1.5.2 Contraste deWeber . . . 11 1.5.3 Contraste deGordon . . . 11 1.5.4 Contraste deBeghdadi . . . 11 1.5.5 Contraste dePeli . . . 11 1.5.6 Contraste deKöhler . . . 11 1.6 Filtragelinéaire . . . 11 1.6.1 Convolution spatiale . . . 12
1.6.2 Transformée de Fourier dis rète . . . 12
1.6.3 Transformée en Z . . . 14
1.6.4 Typologie desltres . . . 14
1.6.5 Fon tion de transfert . . . 15 1.7 Déte tion de ontours . . . 15 1.7.1 Déte teur deRoberts. . . 16 1.7.2 Déte teur dePrewitt . . . 16 1.7.3 Déte teur deSobel . . . 17 1.7.4 Déte teur deCanny-Deri he . . . 17 1.7.5 Déte teur deShen-Castan . . . 17
1.7.6 Algorithmede Rosenfeld&Kak. . . 17
1.8 Morphologiemathématique . . . 19
1.8.1 Introdu tion. . . 19
1.8.2 Opérations binaires(images N&B) . . . 20
1.8.3 Propriétés . . . 21
1.8.4 Autresopérations. . . 21
1.8.5 Images NdG. . . 22
1.9 Segmentation ouleur. . . 23
1.9.1 Visiondes ouleurs . . . 23
1.9.2 Tri hromie . . . 23
1.9.3 Segmentation ouleur . . . 26
2 Traitement de séquen es d'images 29 2.1 Déte tion demouvement . . . 29
2.1.1 Introdu tion. . . 29
2.1.2 Prin ipe . . . 29
2.2.1 Fon tions d'énergie . . . 31
2.2.2 Estimationdesparamètres . . . 32
2.2.3 Algorithmes derelaxation . . . 32
2.2.4 Synoptique d'unalgorithmede déte tionde mouvement . . . 33
2.3 Multirésolutionspatio-temporelle . . . 34
2.4 Voisinage3-D spatio-temporel . . . 34
2.5 Misesen÷uvre matérielles. . . 36
2.6 Exemplesd'appli ations . . . 37
2.6.1 Télésurveillan e . . . 37
2.6.2 Analysedu mouvement deslèvres d'unlo uteur . . . 38
2.6.3 Con lusion . . . 40
2.7 Estimationde mouvement . . . 40
2.7.1 Méthodesdiérentielles . . . 40
2.7.2 Méthodesfréquentielles . . . 42
2.7.3 Miseen orrespondan ede blo s . . . 43
2.7.4 Modèles paramétriques demouvement . . . 44
2.8 Compensationde mouvement . . . 45
2.8.1 Introdu tion. . . 45
2.8.2 Estimationde mouvement pel-ré ursive . . . 45
2.8.3 Prin ipe du odage vidéo . . . 46
2.9 Méthodeshybrides de ompressionvidéo . . . 47
2.9.1 Transformée en ondelettes . . . 47
2.9.2 Critique delaméthode de Baaziz . . . 48
2.9.3 Dis ussion . . . 50
3 Normes et standards du multimédia 51 3.1 Introdu tion . . . 51
3.2 Manipulation d'objets multimédia. . . 51
3.2.1 Saisie . . . 51
3.2.2 Numérisation . . . 52
3.2.3 Codage . . . 52
3.2.4 Compression . . . 52
3.2.5 Sto kage . . . 52
3.2.6 Prote tion etidenti ation du ontenu . . . 53
3.2.7 Transmission . . . 53
3.2.8 Restitution . . . 53
3.3 Codage et ompression d'objets multimédia . . . 53
3.3.1 JPEG :exemplede DCT . . . 53
3.3.2 JPEG2000 :exemple d'ondelettes . . . 54
3.3.3 Fra tales. . . 55
3.3.4 MPEG. . . 55
3.3.5 H261-H263 . . . 55
3.3.6 MP3 . . . 55
3.3.7 Formatsde hiers imagesxes . . . 56
3.3.8 Représentation 3-D . . . 57
3.4 Les lasses d'appli ations multimédia . . . 58
3.5 Codage desappli ations multimédia . . . 58
3.5.1 HTML . . . 58
3.5.2 XML . . . 59
3.5.3 WAPet WML . . . 59
3.5.4 MHEG. . . 59
3.5.5 Appli ationsdistribuées . . . 59
3.6 Compression de séquen esvidéo . . . 60
3.6.2 NormesMPEG-4 etH.264 . . . 61
3.6.3 Cara téristiques desnouveaux standards . . . 61
4 Exer i es 63 4.1 Débit d'information. . . 63
4.2 Modi ation d'histogramme . . . 63
4.3 Prin ipe del'égalisation d'histogramme. . . 63
4.4 Egalisationetétalement . . . 64
4.5 Déte tion de ontours . . . 65
4.6 Cal ulde Lapla ien. . . 65
4.7 Filtragelinéaire . . . 65
4.8 Eetde moirépar repliement de spe tre . . . 66
4.9 Transformée de Fourier . . . 67
4.10 Morphologiemathématique . . . 67
4.11 Poursuite de ontourbinaire-2+4" . . . 68
4.12 Ouverture etfermeture . . . 68 4.13 Lissagemorphologique . . . 69 4.14 Morphologiemathématique . . . 69 4.15 Zone aveugle . . . 70 4.16 TV ouleur Se am . . . 70 4.17 ACP ouleur . . . 71 4.18 Déte tion demouvement . . . 71
4.19 Déte tion demouvement par étiquetagestatistique ontextuel . . . 71
4.20 Equationde ontrainte dumouvement . . . 72
4.21 Equationfréquentielle de ontrainte dumouvement . . . 73
4.22 Algorithmede Horn&S hun k . . . 73
4.23 Estimationpar miseen orrespondan e deblo . . . 73
4.24 Estimationd'unmodèlede mouvement . . . 74
4.25 Estimateurrobuste . . . 74
4.26 Filtre deCanny-Deri he . . . 74
4.27 Transformée ouleur logarithmique . . . 75
4.28 Filtragelinéaire . . . 75
4.29 Transformée ouleur non-linéaire . . . 76
4.30 Compensationde mouvement . . . 76 4.31 Teinte duvisage . . . 77 4.32 Transformée de Fourier . . . 77 4.33 Appli ation industrielle . . . 77 4.34 Résolution et ontraste . . . 77 4.35 APIJMF-RTP . . . 80 4.36 Phénomène d'Aliasing . . . 81
4.37 QCM3 (1 à4 réponsesVRAI par question) . . . 81
4.38 QCM1 (une ouplusieurs bonnesréponses à o her) . . . 82
4.39 Filtragemédian . . . 84 4.40 Filtragelinéaire . . . 84 4.41 Codage . . . 85 4.42 Filtragelinéaire . . . 85 4.43 Morphologiemathématique . . . 86 4.44 Analysede mouvement . . . 86 4.45 Filtre médian . . . 87 4.46 Codage . . . 88
4.47 Filtragelinéaire :Filtre de Sobel . . . 89
4.48 Morphologiemathématique :Gradient morphologique . . . 89
4.49 Codage entropique deHuman . . . 89
4.51 Filtragenon-linéaire . . . 91
4.52 Etiquetage en omposantes onnexes . . . 92
4.53 Programmation OpenCV. . . 95 4.54 Déte tion de ontour . . . 96 4.55 Morphologiemathématique . . . 97 4.56 Codage . . . 97 4.57 Morphologiemathématique . . . 98 4.58 Morphologiemathématique . . . 98 4.59 Filtragelinéaire . . . 99 4.60 Estimationde mouvement . . . 99 5 Travaux Pratiques 101 5.1 Filtre numérique RII:Implantation enC . . . 101
5.1.1 Filtre de lissage . . . 101
5.1.2 Filtre de dérivation . . . 102
5.1.3 Déte teur de ontours . . . 102
5.2 Estimateurde mouvement :Implantation enC . . . 104
5.2.1 Algorithmede HornetS hun k . . . 104
5.2.2 Cal uldes gradients . . . 104
5.2.3 Estimationitérative desvitesses. . . 104
5.2.4 Test . . . 104
5.3 Corre tiond'histogramme . . . 105
5.4 Transformation deFourier . . . 105
5.5 Filtre Flou etDéte teurde Contours :Implantation Java. . . 107
5.5.1 Présentation. . . 107
5.5.2 Travail demandé . . . 107
5.6 Déte teur demouvement :Implantation Java . . . 107
5.6.1 Présentation. . . 107
5.6.2 Travail demandé . . . 107
5.7 Traitement d'images ave OpenCV:Implantation JavadansE lipse . . . 108
5.7.1 Présentation. . . 108
5.7.2 Travail demandé . . . 108
5.8 Projet:Interfa e deTraitement d'Images . . . 109
5.8.1 Conseilssur letravaildemandé . . . 109
5.8.2 Classesutiles auprojetimage . . . 109
5.9 Projet:A quisition,Traitement etTransmission Vidéo . . . 110
5.10 TPMatLab1 - Séan ed'initiation . . . 111
5.11 TPMatLab2 - Traitementsd'image statique . . . 112
5.11.1 Filtragelinéaire . . . 112
5.11.2 Déte tion deteinte hair . . . 112
Traitement d'image
1.1 Introdu tion
Lavisionest laper eptiondu mondeextérieur.L'image estlareprésentation bidimensionnelle
d'unes ène3-D. C'estl'information issued'un apteur devision( améra, ÷il). Letraitement d'image
omporte diérentes tâ hes : apture, analyse et traitement (bas niveau), interprétation et dé ision
(hautniveau). Ondistingue diérentstraitements:
amélioration, restauration et orre tion d'image : augmentation du ontraste, orre tion des
distorsions optiques,ltragedu bruit
analyse[1℄ :déte tion etlo alisationd'objets,segmentation, re onnaissan ede formes,
estima-tionetmesures
odage pour la ompression, l'en ryptage etlatransmissionnumérique.
Le traitement d'image ouvre plusieurs domaines [2℄:
l'éle tronique ( apteur,optique, a quisition)
letraitement de signal(déte tion,segmentation, estimation, dé ision) [3℄
l'informatique etl'intelligen e arti ielle (re onnaissan e, interprétation, guidagerobotique)
Onnes'intéressei iqu'auximagesnumériques, 'est-à-direé hantillonnéesetquantiées.Uneimage
numérique est déniepar untableau depixels detaille
L
× C
(typ.256
× 256
).Chaquepixel, portantl'information d'intensité lumineuseperçueen e point,est odésur
n
bits.Typ.n = 8
pouruneimageà256 niveauxde gris(NdG)et
n = 24
pourune image ouleurRV B
(8bits par omposante ouleur).Ondénitdansl'image un repère
0xy
etunenotion de distan eetde voisinage(Fig. 1.1).1.2 Rappels de théorie de l'information
1.2.1 Entropie d'une sour e dis rète
L'entropie
H
(exprimée en bits) d'une sour e dis rète d'observations à valeurs dans{0...M − 1}
(typ.
M = 256
) estdénie par [4℄:H
bit
=
−
M −1
X
i=0
p
i
log
2
p
i
(1.1)où
p
i
représente laprobabilité pour que l'observation en lesites = (x, y)
∈ S
vaille :o
s
= i
(S
étantlesupportdes observations, en l'o urren e i iune image de taille
L
× C
).Rappelons quele hoixde labasedu logarithmeestarbitraireet orrespond au hoixdel'unité de
mesure(bit si logbinaire, nat si lognépérien); etl'on a:
H
nat
= H
bit
· log
e
2
≈ 0.7 · H
bit
.En eet,lepassage d'unebase
a
àunebaseb
requiert simplement unemultipli ation par la onstanteK = log
b
a
.Commel'information élémentaireapportéeparunévénement deprobabilité
p
i
vautpardénition:I
i
= log
p
1
i
,onvoitquel'entropieestune mesuredel'information moyennedébitéepar unesour e:H =
P p
i
I
i
.Shannonadémontréquel'entropie(expriméeennats)d'unesour egaussienne entréed'é art-type
σ
vautH
nat
= log(σ
·
√
2πe)
et qu'àσ
xé, lasour e donnant l'entropie maximale est la distributiongaussienne.
Pour une sour e quel onque d'entropie
H
donnée, Shannon dénit lanotion de "puissan eentro-pique"
N
:N =
1
2πe
exp(2H)
(1.2)C'estlapuissan edeladistributiongaussienneéquivalenteàladistributiond'entropie
H
.Pourunbruitgaussien entréd'é art-type
σ
,onretrouve biensûr:N = σ
2
.Commelebruit blan gaussienpossède
l'entropie maximale à puissan e xée, la puissan e entropique d'un bruit quel onque est toujours
inférieure ou égale à sa puissan e ee tive. Toujours selon Shannon, un bruit blan gaussien a la
propriété d'absorbertoutautre signalqui luiest ajouté.La puissan e entropique résultanteestà peu
près égale à lasomme de lapuissan e du bruit blan et de lapuissan e du signal(supposé entré), à
onditionque lapuissan edu signalsoit faible,"dans un ertainsens", omparée aubruit [4℄.
Ensupposant le bruitadditif gaussienetmajoritaire surle support, onpeutdon estimer
l'é art-type entropique
σ
e
équivalent en al ulant l'entropieH
desobservations [5 ℄:σ
e
=
√
N =
exp(H)
√
2πe
=
2
H
bit
√
2πe
(1.3)Enprenant une mesurede seuil
θ
e
estimée par:θ
e
= 4σ
e
≈ 2
H
bit
(1.4)on obtient une te hnique adaptative automatique de déte tion du mouvement dans les séquen es
d'images [6℄.
1.2.2 Redondan e d'une sour e d'information
L'entropie estune notionfondamentale arelle renseignesurlaredondan e spatiale présentedans
une image etpermet de mettre en ÷uvre les outils de odage dénis par Shannon pour réaliser une
ompressionsanspertedel'information ontenuedansl'image(é onomiededébitpourlatransmission:
odage de Human,de Shannon-Fano). La redondan e d'unesour e
X
est déniepar :R = 1
−
H(X)
H
max
(1.5)
Pour une sour e dis rète à
M
événements, l'entropie maximale est atteintequand les événementssont équiprobables etelle vaut :
H
max
= log
1.2.3 Codage entropique
Lesméthodes de odage entropique visent à oderles messagesles plus probables ave les
mots- odes les plus ourts ( ode à longueur variable ou VLC en anglais). Elles permettent d'assurer la
propriété du préxe (obtention d'un ode irrédu tible), et de faire en sorte que
p(0)
≈ p(1)
, pourréduirelaredondan e etatteindre untaux de ompression sansperte.
Méthode de Shannon-Fano
Lapro édure estlasuivante :
1. Classerdansun tableaules messages(ou événements) par ordrede probabilité non roissante.
2. Dé ouper l'ensemble des messages
X
en 2 sous-ensemblesX
1
etX
2
ayant des probabilitésvoisines (aussipro heque possible de l'équiprobabilité).
3. Attribuer àl'un des sous-ensembles le préxe 0 età l'autre 1 ( omme première lettre du
mot- ode).
4. Réitérerlaséquen ed'opérations2&3sur
X
1
puissurX
2
séparément,et ...jusqu'àavoirisoléhaque message individuellement.
5. Le odeobtenu selit dire tement dansletableau simplement de gau he à droite.
Méthode de Human
Lapro édure estlasuivante:
1. On lasseles événementsdansl'ordre desprobabilités dé roissantes(idemShannon-Fano)
2. A haqueétape,onattribueaux2derniersmessages
m
M −1
etm
M
(don les2moinsprobables)unsymbole0 etunsymbole1 respe tivement.
3. On onstruitàpartird'euxunsupermessage(texte
m
M −1
m
M
)deprobabilitésommep
M −1
+p
M
que l'on re lasse dans un nouveau tableau en l'inter alant pour respe ter toujours l'ordre de
probabilités dé roissantes
4. On ontinue jusqu'à e qu'il nereste que 2messagesisolés
5. Onrevient en arrièredans letableau pour le odage (le ture du ode dedroite à gau he).
1.3 Histogramme
L'histogramme est la ourbe
n(i)
oùn
est le nombre de pixels d'intensitéi
. Il peut omporterplusieurs pi s oumodes, ou bienêtre uniforme(Fig.1.2).
Figure 1.2 Exempled'histogramme omportant deux modes.
Sil'onnote
N = L
× C
lenombredepixelsdel'image,etM
lenombredeniveauxdegris possibles (i = 0
· · · M − 1
),laprobablitéd'unniveau degrisvautp
i
=
n
i
N
etlafon tiondedensitédeprobabilité(PDF)s'exprime :
F (i) =
i
P
k=0
Les deux prin ipales orre tions d'histogramme sont l'égalisation et l'étalement. L'égalisation
onsiste àredistribuer les niveaux de grisen remplaçant leniveau
i
par leniveaul
i
tel que:l
i
= (M
− 1)F (i) =
M
− 1
L
× C
i
X
k=0
n
k
(1.6)L'étalement onsiste àutiliser touteladynamiquedes NdG:
l
i
= (M
− 1)
i
− i
min
i
max
− i
min
(1.7)
L'intérêt de es te hniquesest d'être omplètement automatiques, don fa ilement programmables.
Dansle asgénéral,une orre tion d'histogramme orrespondà appliquerune transformation non
linéaire
T
surles niveauxde gris :l
i
= T (i)
(1.8)T
doit êtreune fon tion monotone roissanteetbornéedans l'intervalle[0, M
− 1]
.Cela permet amélioration ou tru age en appliquant un fa teur d'ampli ation non linéaire sur
l'é helle de gris (Fig.1.3).
Figure 1.3 Exemple de orre tion d'histogramme par rehaussement : a) du sombre b) du lair )
entral.
1.4 Seuillage
Leseuillage(surlesNdG,surleurs dérivées,surl'histogramme,surl'entropie,surlestransformées
...)estuneopérationtrèsfréquente(pournepasdiresystématique)entraitementd'image(nombreuses
appli ations en déte tion de ontours, déte tion de mouvement ...) Il permet de passerd'une image
en NdGà uneimage N&B (étiquetage binaire
e(s)
) :∀s = (x, y) ∈ S, e(s) =
“1”
siI(s) > θ
“0”
sinon(1.9)
La di ulté est évidemment le hoix du seuil adéquat
θ
. Il existe de très nombreuses méthodes ette hniques adaptatives, semi-automatiques, ... de séle tion du seuil [6℄. L'intérêt est de pouvoir
en-suiteappliquer desoutilsspé iquesauximagesbinaires (morphologiemathématiquebinaire,suivi de
ontours binaires).
1.5 Contraste
1.5.1 Contraste de Mi helson
'està l'origineune mesurede visibilitéde franges d'interféren e
il onsidère le asd'une luminan e
L
sinusoïdalel'estimateurest :
C
M
=
L
M ax
−L
min
L
M ax
+L
min
ilest utilisé ave su èsen psy hophysique.
variantes :
C
M
=
L
M ax
−L
L
M ax
+L
etC
M
=
L−L
min
L+L
min
1.5.2 Contraste de Weberil onsidère le asd'unfond uniforme
l'estimateurest :
C
W
=
∆L
L
=
L
0
−L
moy
L
moy
ilest utilisé enpsy hophysique (CIE, météo)
NB:La ourbe expérimentale de seuilde visibilitéde Weberest largement utilisée.
1.5.3 Contraste de Gordon
référen e[7℄
il onsidère le as d'un stimulus omplexe (image naturelle de mammographie pour an er du
sein)
'estunestimateurlo albasésurle al ulduNdGmoyen dedeux régions:
C
G
=
L
moy1
−L
moy2
L
moy1
+L
moy2
'estunestimateur signé.
1.5.4 Contraste de Beghdadi
référen e[8℄
'estune mesureentreles NdGmoyens des ontoursestimés sur2régions
C
B
=
C
moy1
−C
moy2
C
moy1
+C
moy2
1.5.5 Contraste de Peli
référen e[9℄
'estunestimateurlo alàbande limitée(gammede fréquen esspatiales
ω
x
,ω
y
).Ilestbasésurles propriétés duHVS (Human VisualSystem)
in onvénient :ila un oût de al ulélevé.
1.5.6 Contraste de Köhler
référen ebibliographique :[10 ℄
soit unseuil
s
tel que:min (f (x), f (x
1
))
≤ s ≤ max (f(x), f(x
1
))
'estunestimateur pon tuel du ontraste:
C
xx
1
(s) = min(
|s − f(x)|, |s − f(x
1
)
|)
ouC
xx
1
(s) = max(
|s − f(x)|, |s − f(x
1
)
|)
variantes possibles:C
xx
1
(s) = min
|s−f(x)|
s+f (x)
,
|s−f(x
1
)|
s+f (x
1
)
ouC
xx
1
(s) = min
|s−f(x)|
max(s,f (x))
,
|s−f(x
1
)|
max(s,f (x
1
))
1.6 Filtrage linéaireLe ltragelinéaire est une opération lassiquepour le pré-traitement des imagesave deux
appli- ations prin ipales:la rédu tionde bruit (ltrage passe-bas)et le rehaussement pour ladéte tion de
ontours (ltrage passe-bande ou passe-haut). Les outils mathématiques utilisés sont la onvolution,
1.6.1 Convolution spatiale
Dansle as1-D ontinu,l'opération( ommutative) de onvolution s'exprime:
f (x)
∗ h(x) =
+∞
Z
−∞
f (χ)h(x
− χ)dχ
(1.10)Le ltragepeut être réalisé dire tement dans ledomaine spatial en onvoluant l'image
I(x, y)
par laréponseimpulsionnelle
h(x, y)
dultre. La onvolution dis rète est ommutative ets'exprime par :J(x, y) = I(x, y)
∗ h(x, y) =
X
i
X
j
I(x
− i, y − j)h(i, j) =
X
i
X
j
I(i, j)h(x
− i, y − j)
(1.11)Si
h(i, j)
estàsupportbornésymétrique,onlareprésentesousformed'untableaude oe ientsH
m×n
appelémasquede onvolution quel'onappliquesurlafenêtreimage orrespondantepour haquepixel.
Par exemple,pour
m = 3
etn = 5
,on aura:H
3×5
=
h
11
h
12
h
13
h
14
h
15
h
21
h
22
h
23
h
24
h
25
h
31
h
32
h
33
h
34
h
35
(1.12)La onvolutionde deuxmasques 1-Ddonne un masque2-D(propriété de séparabilité) :
a b c
∗
α
β
γ
=
aα bα cα
aβ bβ cβ
aγ
bγ
cγ
(1.13)1.6.2 Transformée de Fourier dis rète
Cetoutil permetde passerdudomaine spatialau domainefréquentiel. Le ltragefréquentiel
s'ob-tient en multipliant la TF de l'image par la fon tion de transfert du ltre (gabarit). L'in onvénient
prin ipal est le oût de al ul élévé, bien qu'il existe un algorithme rapide appelé FFT. On réserve
don leltragefréquentielaux as oùlapré ision est lefa teur important.
Latransforméede Fourier dis rète (TFD) 2-Dd'une image s'exprimepar :
F (u, v) =
√
1
LC
C−1
X
x=0
L−1
X
y=0
I(x, y)e
−i2π(
u.x
C
+
v.y
L
)
(1.14)On dénit de même la transformée de Fourier inverse, qui permet de remonter à l'image originale
I(x, y)
onnaissant satransforméeF (u, v)
:I(x, y) =
√
1
LC
C−1
X
u=0
L−1
X
v=0
F (u, v)e
+i2π(
u.x
C
+
v.y
L
)
(1.15)On appelle spe tre d'amplitude (resp. phase) le module
|F (u, v)|
(resp. l'argumentΦ(u, v)
) de latransformée de Fourier, qui est une grandeur omplexe. Si la dynamique du spe tre est importante,
on travaille sur le module en dB :
o
s
= 20 log
10
|F (u, v)|
. Les valeurs de module étant des réels, onpeut se ramener au as d'une sour e dis rète d'observations en quantiant les modules pour obtenir
un ensemble de
M
valeursdis rètes (e.g.,quantumde 0.5dB pourM = 256
).L'interprétation physique importante de la TF repose sur l'examen du lieu de phase nulle. Dans
l'espa e normalisé
X =
x
C
, Y =
y
L
, e lieu orrespondant à :
u.X + v.Y = k
⇔ Y = −
u
v
X +
k
v
.C'estune sériede droitesparallèlesdistantesde
d =
1
√
u
2
+v
2
etde dire tionperpendi ulaireà ladroitede pente
tan θ =
v
u
. Cette relation montre que les hautes fréquen es orrespondent à des lignes dephase nulle rappro hées. En terme d'image, un ontour se traduit en fréquen e par une ligne située
à distan e
d
de l'origine. Plus le ontour est net, plusd
est grande (présen e d'énergie en hautesleshautesfréquen estraduisentdes ontoursnets,etlesbassesfréquen estraduisentdes ontoursous
oudesrégionsuniformes.L'orientationdesfréquen esspatialesrenseignesurl'orientationdes ontours
dansl'image. L'utilisationde laTF permet don de pratiquer desltrages fréquentielssurl'image.
LaFig.1.4montrel'alluretypiqueduspe tred'uneimage réelle.Notonsquel'ontrouvepour ette
image une entropie
H = 6.5
bits< 8
bits , e quiest ohérent pour desobservations odées sur8 bits.Figure 1.4Spe tre d'uneimage réelle(Couloir).
Repliement de spe tre
Onsait quel'é hantillonnage setraduit par une périodisation fréquentielle. Pour éviter le
phéno-mène de repliement de spe tre, le théorème de Shannon stipule que l'on doit respe ter la ondition
suivanteentre fréquen ed'é hantillonnage etfréquen emaximale du signal:
F
e
≥ 2F
max
.Un ltrage passe-bas permet de respe ter ette ontrainte : e ltrage est souvent inhérent au
système de apture pour des images réelles. Par ontre, on devra se méer parti ulièrement de e
problème quandongénère desimages synthétiquespour testerdesalgorithmes de traitement.
Passage de la TF à la TFD Partant de laTF ontinue :
T F : F (ν) =
+∞
Z
−∞
f (x)e
−i2πνx
dx
(1.16)T F
−1
: f (x) =
+∞
Z
−∞
F (ν)e
i2πνx
dν
(1.17)ladis rétisationtemporelle( asdessignauxfon tiondutemps)ouspatiale( asdesimagesfon tion
de l'espa e) donne :
x = kT
e
=
k
F
e
(é hantillonnage spatial àlapériode
T
e
).Sans perte de généralité, on pose souvent
T
e
= 1
ou bien on utilise la notation de fréquen eréduite
u =
ν
F
e
, e qui implique
u
max
≤
1
2
ard'aprèsShannon :F
e
≥ 2ν
max
.On obtient ainsi la TF dis rète dans le temps (TFDT) al ulée sur une durée d'observation
évi-demment limitée:
T = N T
e
.T F DT : F (u) =
N −1
X
k=0
f (k)e
−i2πuk
(1.18)Sil'onyajoutel'é hantillonnage fréquentielave unpas
∆
e
=
F
e
N
oùN
estlenombred'é hantillons,alors
ν = n∆
e
⇔ u =
n
N
etl'on obtient laTFD :T F D : F (n) =
X
f (k)e
−i2π
nk
N
(1.19)T F D
−1
:
f (k) =
X
F (n)e
i2πn∆
e
k
=
X
F (n)e
i2π
nk
N
Sidansla dernièreéquation on rempla e
k
parx
et∆
e
parf
0
oùf
0
estle fondamental du signal(oubiensil'on onsidère unepériodisationarbitrairesurladuréed'observation
T
),onretrouve lelienave leDSF lassique:
f (x) =
X
c
n
exp(i
2πnx
T
)
avec
n
= F (n) =
1
T
Z
[T ]
f (x) exp(
−i
2πnx
T
)dx
(1.21) 1.6.3 Transformée en ZLa transformée en
Z
est l'outil lassique pour l'étude des signaux é hantillonnés. Pour un signal1-D
f (x)
,elle est déniepar :F (z) =
+∞
X
k=−∞
f (k)z
−k
(1.22)z
estun nombre omplexe lié àlavariablesymboliquede Lapla e par l'équation:z = exp (pT
e
) = exp(j2πνT
e
) = exp(j2πu)
(1.23)où
T
e
est lapériode d'é hantillonnage.z
−1
est don l'opérateur retard pur.
1.6.4 Typologie des ltres
Unltre peutavoirde nombreusespropriétés [11,12,13 ,14 ℄:invarian e, ausalité, anti- ausalité,
support borné, symétrie, séparabilité, RIFou RII. Un point parti ulier à résoudre on erne les eets
de bords et la représentation numérique du résultat de ltrage (problème de visualisation de valeurs
négatives).
Laséparabilité estun ritère important pour réduire letemps de al ul.
Lesltres RIF(réponse impulsionnelle nie) sont les plus ourants etles masques de taille
3
× 3
,opérantsurles8pluspro hesvoisinsd'unpixel,sonttrèsutiliséspourtouslestraitementsélémentaires
surles images:
moyenneur :
H =
1
9
1 1 1
1 1 1
1 1 1
séparable:1
3
1 1 1
∗
1
3
1
1
1
binomial gaussien:H =
1
16
1 2 1
2 4 2
1 2 1
séparable:1
4
1 2 1
∗
1
4
1
2
1
lapla ien :H =
0
1
0
1
−4 1
0
1
0
Sobel horizontal :H =
−1 0 1
−2 0 2
−1 0 1
séparable :−1 0 1
∗
1
2
1
gradient oblique:H =
−1 −1 0
−1
0
1
0
1
1
rehausseurde ontraste:H =
1
−3
1
−3
9
−3
1
−3
1
séparable:−1 3 −1
∗
−1
3
−1
Lamiseen as adedeltres(asso iativitédela onvolution)permetdegénérerdesltresdegrande
taille àmoindre oûtde al uls :
H
3×3
∗ H
3×3
=
1
16
1 2 1
2 4 2
1 2 1
∗
1
16
1 2 1
2 4 2
1 2 1
=
1
256
1
4
6
4
1
4 16 24 16 4
6 24 36 24 6
4 16 24 16 4
1
4
6
4
1
= H
5×5
(1.24)Lesltres RII(réponseimpulsionnelle innie)sont ara térisés parleur fon tionde transferten
Z
ou leuréquation auxdiéren es:
H(z) =
S(z)
E(z)
=
b
0
+ b
1
z
−1
+
· · · + b
m
z
−m
1 + a
1
z
−1
+
· · · + a
n
z
−n
(1.25)s
k
= b
0
e
k
+ b
1
e
k−1
+
· · · + b
m
e
k−m
− a
1
s
k−1
− · · · − a
n
s
k−n
(1.26)où
s
k
ete
k
sont les é hantillons resp. de sortie et d'entrée ourants. Si les oe ientsa
i
sont tousnuls, on retrouve un ltre RIF. La stabilitédu ltre est liée auxples de lafon tion de transfert. Un
exemple type deltre RIIestleltre de Canny-Deri he.
1.6.5 Fon tion de transfert
Par dénition, la fon tion de transfert est la TF de la réponse impulsionnelle. Dans le as d'un
ltre 1-D, laTF de
h(x)
vaut :H(u) =
X
k
h(k)e
−i2πu.k
(1.27)où
h(k)
sont les oe ients de la réponse impulsionnelle. Pour le ltre moyenneur symétriqueH =
1
3
[1 1 1]
,on obtient :H(u) =
1
3
(e
−i2πu
+ 1 + e
+i2πu
) =
1
3
(1 + 2 cos 2πu)
(1.28)OnpeutaussiutiliserlaTZ. Considérons par exemplele ltre binomial entré :
H = [1 2 1]
.Laonvolutiondusignal
f (x)
par leltreh(x)
donne:g(x) = f (x)
∗ h(x) = f(x − 1) + 2f(x) + f(x + 1)
.Soit,par transforméeen
Z
:G(z) = (z
−1
+ 2 + z)F (z)
.D'où lafon tionde transfert en
Z
:H(z) =
G(z)
F (z)
= z
−1
+ 2 + z
(1.29)
Pouruneimplantationmatériellede eltre,ondé alelaréponseimpulsionnellepourlarendre ausale
en multipliant la fon tion de transfert par l'opérateur retard
z
−1
. D'où
H
−
(z) = z
−2
+ 2z
−1
+ 1 =
(1 + z
−1
)
2
. On en déduit ainsi deux s hémas fon tionnels possibles pour réaliser e ltre numérique(Fig. 1.5).
Figure 1.5 S hémas fon tionnels dultre binomial 1-D:a) dire tb) versionpipeline.
Ce iestledomaine de lasynthèsedesltres numériques entraitement d'images [15, 16,17 , 18℄.
1.7 Déte tion de ontours
Ondistinguedeux méthodesde déte tion depointsde ontours [19 ℄(Fig. 1.6):
lare her he des extrêmade ladérivée première :ve teur gradient dénipar
G(x, y) =
∇I(x, y) =
"
∂I(x,y)
∂x
∂I(x,y)
∂y
#
Figure1.6 a) Contour 1Didéalisé;b) Lissage; ) Dérivée première;d) Dérivée se onde.
lare her he des passagespar zérode ladérivée se onde :lapla ien dénipar
L(x, y) =
∇
2
I(x, y) =
∂
2
I(x, y)
∂x
2
+
∂
2
I(x, y)
∂y
2
Marr proposedans son s héma de prin ipe brutdu pro essusde vision (raw primal sket h ou
esquisse primitive fondamentale) d'utiliser un ltre passe-bande de type lapla ien d'une
gaus-sienne
∇
2
G
, quel'on peut orre tement approximer en pratique ave unltre
DOG
diéren ede deuxgaussiennes[20 ℄.
1.7.1 Déte teur de Roberts
Ilest basésurdeux masquesqui al ulent legradient spatialdans deuxdire tions
45
◦
et135
◦
:H
45
=
0
1
−1 0
H
135
=
1
0
0
−1
En onvoluant l'image ave es deux masques, on obtient deux images ltrées
I
1
etI
2
que l'onombine pour al uler lemoduleetla dire tiondu ontraste:
M (i, j) =
pI
1
(i, j)
2
+ I
2
(i, j)
2
(1.30)Φ(i, j) = arctan
I
2
(i, j)
I
1
(i, j)
+
π
4
(1.31)Onapplique ensuiteune te hnique de seuillagedu module pour ne garder queles points ontours. Se
poseensuiteleproblèmede haînageetd'approximationpolygonalepour exhiberdes ontours fermés.
Cedéte teur estsensible au bruit hautefréquen e, que l'on peutréduirepar unltrage passe-bas
initial.
1.7.2 Déte teur de Prewitt
Il onsiste endeux masquesélémentaires, qui al ulent lesdérivées horizontale et verti ale
moyen-néessur unvoisinage
3
× 3
:Prewitthorizontal :
H
0
=
−1 0 1
−1 0 1
−1 0 1
etPrewitt verti al:H
90
=
−1 −1 −1
0
0
0
1
1
1
La pro édure est ensuite la même pour extraire les ontours, mis à part la suppression du terme
additif
π
1.7.3 Déte teur de Sobel
Ilutilise également deuxmasques,l'un horizontal
H
0
,l'autreverti alH
90
:Sobelverti al :
H
90
=
−1 −2 −1
0
0
0
1
2
1
séparableen lissageetdérivation:1 2 1
∗
−1
0
1
NB:In luantunpré-ltragepasse-bas,Prewitt etSobelsontmoinssensiblesaubruitqueRoberts.
1.7.4 Déte teur de Canny-Deri he
Ilfaitpartie desextra teurspar optimisationde ritères(sensibilité, lo alisationetdéte tion
opti-malesétant donné un modèlede ontour) [21,22℄. Sa réponseimpulsionnelle 1-Ds'exprime par :
h(x) = cxe
−α|x|
(1.32)α
estun oe ient delissageetc
un oe ientdenormalisationdéterminéenmaximisantl'amplitudede laréponseà uné helon unité:
c =
−
(1−e
−α
)
2
e
−α
.Ilsedé omposeen deuxparties, dont onpeut al ulerles fon tionsde transfert en
Z
:ausale:
h
+
(x) = cxe
−αx
pourx
≥ 0
d'oùH
+
(z) = c
+∞
P
k=0
kz
−k
e
−αk
= c
e
−α
z
−
1
(1−e
−α
z
−
1
)
2
anti- ausale :h
−
(x) = cxe
αx
pourx
≤ 0
d'oùH
−
(z) = c
+∞
P
k=0
−kz
k
e
−αk
= c
−e
−α
z
(1−e
−α
z )
2
Onen déduitaisément les équationsde ré urren e dultre.
1.7.5 Déte teur de Shen-Castan
Le déte teur de Shen et Castan est une version de ltre RII plus simple que le ltre de
Canny-Deri he:ununiqueparamètrepermetderéglerlafor edultre,lese ondparamètreétantle hoixdu
seuilpourne onserverqueles pointsayant lesplusfortes valeursdedérivées [23 ℄.Ila étéutilisé ave
su èsen ontrle qualité automatique pour mesurer lamouillabilité de polymèrestraités par plasma
[24 , 25 ℄.
1.7.6 Algorithme de Rosenfeld & Kak
Contrairementauxltrespré édentsquiopèrentsurdesimagesàNdG,ils'agiti id'unextra teur
de ontours opérant surdesimages binaires(N&B).
Dénitions
Onappelle dire tion ourantedu ontourde l'objetenunpixelappartenant au ontour,leve teur
de translationqui joint epixel aupixel du ontourle pré édant dansle senstrigonométrique.
Partant d'un pixel donné dans l'image, les 8 premiers voisins sont dénis par leur dire tion par
rapport au pixel de départ et par les oordonnées des ve teurs de translation permettant de passer
d'unpixelau suivant onnaissant ladire tion ourante( ode deFreeman, f.Fig .1.7).
Prin ipe de l'algorithme
Duda et Hart suggèrent un algorithme très rapide pour extraire les frontières d'un objet [26 ℄.
L'in onvénient deleur algorithmeprovient dufait quelesuiveur de ontourne prendque4dire tions
(dire tions0,2,4,6,du odedeFreeman).Autrementdit,ilexplore4voisinsdupixeldedépart.Ainsi
les pixels reliés à l'objetselon les dire tions diagonales sont ignorés. Onlui préfère don l'algorithme
de RosenfeldetKak,qui utilise uneexploration à8 voisinsdans lesenstrigonométrique [27 ℄.
Le prin ipe est le suivant : supposons que l'on onnaisse un point de ontour et la dire tion
ou-rantedu ontour en e point. La re her he du point suivant onsiste en unbalayage des 8 voisins du
point ourant. Le balayage estee tué de l'extérieur vers l'intérieur de l'objet. Le premier voisin qui
y
x
7
0
1
2
3
4
5
6
Codage des
directions
point courant
avec direction=4
5
4
3
2
Dans cet exemple, on
s’arrete a la direction 5
(premier pixel trouve
appartenant a l’objet).
pixel de l’objet
sens de poursuite
Figure 1.7Poursuite de ontours dansune image binaire.
joint les deux points ontours. En examinant tous les as de gure possibles, on onstate qu'il sut
d'explorerun se teurlimité à dire tion ourante -2jusqu'àdire tion ourante +4.
Pour a élérer l'exé ution du programme de suivi de ontours, les dire tions à tester et les
om-posantes de ve teurs de translation (qui permettent de passer d'un pixel au suivant, onnaissant la
dire tion ourante) sontregroupéesdans destableaux(Tab.1.1).
Table 1.1 Coordonnées
(v
x
, v
y
)
des ve teurs de translation et Dire tions à explorer en fon tion deladire tion ourante Dire tion ourante 0 1 2 3 4 5 6 7
v
x
1 1 0 -1 -1 -1 0 1v
y
0 -1 -1 -1 0 1 1 1 6 7 0 1 2 3 4 5 Dire tions 7 0 1 2 3 4 5 6 àexplorer 0 1 2 3 4 5 6 7 1 2 3 4 5 6 7 0 2 3 4 5 6 7 0 1 3 4 5 6 7 0 1 2 4 5 6 7 0 1 2 3Unexemple d'appli ation pour l'extra tiondeslèvres d'unvisage estmontré Fig.1.8.
Choix du point initial pour la pousuite des ontours La détermination du point de départ
pour la poursuite des ontours est simple quand on n'a qu'un seul objet binaire onnexe. Mais un
masquede lèvresest onstituépratiquementde deuxobjets:leslèvresetl'intérieurde labou he.Par
onséquent deux points initiaux,au moins, sont né essaires:l'un pour déte ter le ontourexterne, et
l'autre pour déte terle ontour de l'intérieur de labou he ( ontourinterne deslèvres).
Onee tuela déte tion de ontour externe en partant dupoint initial (
x
moy
,y
1
). Ce point est lepoint de ontour externe de la lèvre supérieure situé sur l'axe verti al médian des lèvres. Partant de
y
min
danslesens roissantdesy
, epointestrapidementlo alisé:ils'agitdupremierpointappartenantFigure 1.8Déte tion des ontours deslèvrespar l'algorithmedeRosenfeldetKakave deuxpoints
initiaux. Enhaut :masques binaires delèvres;en bas: ontours extraits.
départestxéeà 6(sensde re her hedu point initial)pour assurerledémarragedelapoursuitedans
lesens trigonométrique.
y1
y4
y2
y3
y
x
xmoy
sens de recherche
de y1 et y2.
sens de recherche
de y4 et y3
Figure 1.9Les 4pointsinitiaux andidats
On her he de même un point initial du ontour interne de la lèvre supérieure situé sur l'axe
verti al médian. L'algorithme d'initialisation re her he, en partant de
y
1
dans lesens roissant desy
(versl'intérieurdelabou he),lepoint limitedumasque ommepointinitial.Onobtient alorslepoint
(
x
moy
,y
2
),(Fig.1.9). Dans e as, ladire tioninitiale estxée à2.NB:Onpeutaussibienutiliser le ouplede pointsinitiaux
y
3
ety
4
.1.8 Morphologie mathématique
1.8.1 Introdu tion
Lamorphologiquemathématique on ernedestransformationsgéométriquesnonlinéaires(ltrage
nonlinéaire).Elleestbaséesurlathéoriedesensembles.Onappliqueàl'image unélément stru turant
E
. Onpeut faire une analogie ave le ltrage linéaire :E
orrespond au masque de oe ients d'unltre.L'opérationmorphologique orrespondà une onvolution. Lesopérationsde basesontl'érosion,
ladilatation,l'ouvertureetlafermeture.Ondistinguelamorphologie binaire,s'appliquantauximages
en N&B,etlamorphologie pour imagesà NdG.
Leprin ipegénéral onsisteà omparerles objetsd'uneimageave unobjetderéféren ede forme
et detailledonnéesqu'on appelleélément stru turant. Cetypedeltrageestre ommandé dansle as
trous etadou irles angles.L'élément stru turant
E
translaté en haque sites
de l'image est notéE
s
.La Fig.1.10montre deséléments stru turants lassiques.
Figure 1.10 Eléments stru turants : a) roix 4- onnexe b) arré 8- onnexe ) traits pivotés
(
×
=indiérent)Tout l'enjeu de la morphologie mathématique repose évidemment sur le bon hoix de l'élément
stru turant, en fon tion duproblème àrésoudre.
1.8.2 Opérations binaires (images N&B)
L'érosion
⊖
s'obtient en onsidérant l'interse tion (in lusion) de l'objetX
ave l'élémentstru -turant
E
:X
⊖ E = X ∩ E = {s|E
s
⊆ X}
(1.33)La dilatation
⊕
s'obtient en onsidérant l'union de l'objetave l'élément stru turant :X
⊕ E = X ∪ E = {s|E
s
∩ X 6= ∅}
(1.34)L'ouverture
◦
est lasu essionérosionpuis dilatation (roll inside) :X
◦ E = (X ⊖ E) ⊕ E
(1.35)La fermeture
•
estla su essiondilatation puisérosion(`roll outside') f.Fig. 1.11:X
• E = (X ⊕ E) ⊖ E
(1.36)1.8.3 Propriétés
Ladilatation est ommutative etasso iative.
L'érosionetladilatation sont invariantesen translation:
X
s
⊕ E = (X ⊕ E)
s
(1.37)X
s
⊖ E = (X ⊖ E)
s
(1.38) Croissan e:X
⊆ Y ⇒
X
⊕ E ⊆ Y ⊕ E
X
⊖ E ⊆ Y ⊖ E
X
• E ⊂ Y • E
X
◦ E ⊂ Y ◦ E
(1.39) Distributivité:(X
∪ Y ) ⊕ E = (X ⊕ E) ∪ (Y ⊕ E)
(1.40)X
⊕ (D ∪ E) = (X ⊕ D) ∪ (X ⊕ E)
(1.41)X
⊖ (D ∪ E) = (X ⊖ D) ∩ (X ⊖ E)
(1.42)(X
∩ Y ) ⊖ E = (X ⊖ E) ∩ (Y ⊖ E)
(1.43) (1.44) Itérativité:(X
⊕ D) ⊕ E = X ⊕ (D ⊕ E)
(1.45)(X
⊖ D) ⊖ E = X ⊖ (D ⊕ E)
(1.46)Complémentarité(Dualité entrefond etforme) :
le omplémentaire de l'ensemble
X
étant dénipar :X
c
=
{s|s /
∈ X}
,ona :(X
⊖ E)
c
= X
c
⊕ E
(1.47)(X
• E)
c
= X
c
◦ E
(1.48)(X
◦ E)
c
= X
c
• E
(1.49) Extensivitéetanti-extensivité :X
◦ E ⊂ X ⊂ X • E
(1.50) Idempoten e:(X
• E) • E = X • E
(1.51)(X
◦ E) ◦ E = X ◦ E
(1.52) 1.8.4 Autres opérationsL'opérationTout-ou-Rien (Hit or Miss)
⊘
s'obtient à l'aided'unélément stru turant plusgénéralE = (E
1
, E
2
)
omposéd'une formeE
1
etd'unfondE
2
.X
⊘ E = (X ⊖ E
1
)
∩ (X
c
⊖ E
2
) = (X
⊖ E
1
)
− (X ⊕ E
2
)
(1.53)Cet ensemblereprésente tous lespointsoù,simultanément,
E
1
` olle'dansX
etE
2
` olle'dansX
c
.
L'extra tionde frontières
β(X)
s'obtient par diéren e entreX
etson érodée par l'élémentstru -turant arré de laFig.1.10b.
β(X) = X
− (X ⊖ E)
(1.54)Leremplissage de région s'obtient à partirde dilatationsitérées :
où
X
est la frontière initiale etX
0
=
{p}
un point initial intérieur à la frontière. L'union deX
etdes
X
k
représente le résultat duremplissage. L'élément stru turant habituellement utilisé est la roix(Fig. 1.10a).
L'extra tionde omposants onnexess'obtient par :
X
k
= (X
k−1
⊕ E) ∩ X
k = 1, 2, 3, ...
(1.56)où
X
estl'objetinitial etX
0
=
{p}
unpoint de onnexioninitial onnu.La oque onvexe
C
d'un objet ( onvex hull,Fig. 1.12) s'obtient par itérations de tout-ou-rien, àl'aide dequatreéléments stru turants pivotés
E
i
avei = 1, 2, 3, 4
(Fig.1.10 ):X
k
i
= (X
k−1
i
⊘ E
i
)
∪ X
i = 1, 2, 3, 4
k = 1, 2, 3, ...
X
0
i
= X
(1.57)C =
4
[
i=1
X
conv
i
(1.58)Figure 1.12 Coque onvexe
L'amin issement
⊗
enlève despointsà lafrontièredeX
:X
⊗ E = X − (X ⊘ E) = X ∩ (X ⊘ E)
c
(1.59)L'épaississement
⊙
ajoute àX
despointsde lafrontièredeX
c
:
X
⊙ E = X ∪ (X ⊘ E)
(1.60)Lasquelettisations'obtient par amin issements répétés:
S = X
⊗ {E} = ...((((X ⊗ E
1
)
⊗ E
2
)
⊗ E
3
)
⊗ E
4
)
⊗ E
1
)
⊗ E
2
)...
(1.61)Ilexistedesopérationsplus omplexes ommelataille(`pruning')quiutilisedesérosionssu essives
ave desélémentsstru turantsde plusen plus ns(tamis) permettant de lassier lesrégions.
1.8.5 Images NdG
L'érosion
⊖
donne lapluspetite valeurprise parI
à l'intérieurde l'élément stru turantE
s
entréen lepixel
s
(Fig. 1.13) :∀s, (I ⊖ E)(s) = Inf{I(p); p ∈ E
s
}
(1.62)Ladilatation
⊕
donne laplus grandevaleur prise parI
sur lesupportstru turantE
s
:∀s, (I ⊕ E)(s) = Sup{I(p); p ∈ E
s
}
(1.63)L'ouverture
◦
etlafermeture•
sontdénies ommeenmorphologie binaire.Intuitivement,l'ouver-ture onsiste à suivre le prol par ledessous en montant l'élément stru turant leplus haut possible;
elarevientàé rêterlespi ssanstou herauxvallées.Demême,lafermeture onsisteàsuivreleprol
par ledessusen des endant
E
leplus baspossible; elarevient à ombler les valléessans tou herauxpi s.
L'opération hapeau haut de forme (top hat)
H = I
− I ◦ E
permet d'exhiber les pi s deI
. Demême, onpeutextraireles reux en soustrayant
I
− I • E
.Lelissage peuts'obtenir par ouverture puisfermeture :
L = (I
◦ E) • E
.Figure 1.13Erosion etdilatation enNdG
1.9 Segmentation ouleur
1.9.1 Vision des ouleurs
L'intérêt d'utiliser la ouleur en traitement d'image repose sur plusieurs onstats. D'abord, la
ouleur estundes ripteur puissant arl'÷ilhumainpeutdis ernerdesmilliers de ouleurs, alors qu'il
ne peut distinguer que quelques dizaines de niveaux de gris. Par ailleurs, la teinte est une grandeur
peusensible auxvariations d'é lairage(ombres), ontrairement à laluminan e.
Lesprin ipaux onstituantsde l'÷ilsont présentés Fig1.14 :
la ornée :prote tion, ltre
l'iris:diaphragme (variationd'unfa teur 10 ensurfa e)
le ristallin :indi e optiquevariable, fo us(déformable)
larétine: ou hede apteursphoto-sensibles(120millionsdebâtonnetset6millionsde nes).
Les nes sont sensibles aux trois ouleurs
RV B
(vision hromatique) et les bâtonnets àl'in-tensité lumineuse
I
(visiona hromatique). La fovéa est le entre de larétine. La zone aveugleorrespond auratta hement dunerfoptique.
lenerfoptique:transportde l'information (100000 neurones)
Figure1.14 a) Coupe horizontale de l'÷il;b) Répartition desphoto-ré epteurs surlarétine.
La vision humaine n'a pas une sensibilité égale dans tout le spe tre visible : l'énergie lumineuse
perçue par l'÷ilest fon tionde lalongueur d'onde omprise entre 400et 700nm (Fig.1.15).
1.9.2 Tri hromie
Alors que les images a hromatiques (en NdG) sont ara térisées par une seule valeur (intensité
lumineuse ou luminan e
I
), lesimages ouleurssont ara tériséespar trois omposantes[28 ℄.On peut utiliser les trois ouleurs primaires : rouge, vert et bleu
(RV B)
, orrespondant à troislongueursd'onde du spe trevisible :
λ
R
= 610nm
,λ
V
= 535nm
,λ
B
= 470nm
(Fig. 1.15).LesautresFigure 1.15 Courbede sensibilitéde l'÷ilen fon tion delalongueur d'onde.
Figure1.16 Synthèsedes ouleurs :a) additive;b) soustra tive
Lemodèle
RV B
esttypiquement utilisépourlaréalisation desmoniteurs et améras ouleurs.Onreprésentel'espa e
RV B
par un ube(Fig. 1.17a) :Figure 1.17 a) Cube ouleur RVB;b) Pyramide ouleur TLS
Les ouleurs se ondaires yan, magenta et jaune (CMY) s'obtiennent par additivité des ouleurs
primaires :
C = V + B
(1.64)M = R + B
(1.65)Y = R + V
(1.66)Un troisième modèle nommmé
Y C
r
C
b
est utilisé omme standard en TV ouleur, assurant laompatibilité ave la TV N&B.
Y
représente la luminan e.C
r
, C
b
sont deux omposantes odant lahrominan e (pardiéren es de ouleurs).Leur dénition(et leur appellation) varie selon leformat :
Y U V
pour les formatseuropéens (PAL,Se am),Y IQ
pour leformat nord-améri ain (NTSC).
Y
U
V
=
0.3
0.59
0.11
−1.33
1.12
0.21
−0.45 −0.88 1.33
.
R
V
B
(1.67)
Y
I
Q
=
0.3
0.59
0.11
0.6
−0.28 −0.32
0.21
−0.52
0.31
.
R
V
B
(1.68)D'un point de vue per eption, les ara téristiques pertinentes pour distinguer les ouleurs sont
la teinte, la luminan e et la saturation. On dénit ainsi le modèle
T LS
(ouHSI
en anglais `hue,saturation,intensity').
T
= θ = arccos
1
2
(R
− V ) + (R − B)
p(R − V )
2
+ (R
− B)(R − V )
siB < V
(1.69)= 2π
− θ
siB > V
(1.70)L =
R + V + B
3
(1.71)S = 1
−
min (R, V, B)
L
(1.72)Alapla e delasaturation,on peututiliserlapureté
P = S.L
,etadopter un al ulde teintebasésurl'ar tangente(espa e
T LP
) :T
=
π
2
− arctan
2R
− V − B
√
3(V
− B)
+ k
L =
R + V + B
3
(1.73)P
=
R + V + B
3
− min(R, V, B)
où :k = 0
siV > B
etk = π
sinon.Ilexistedon denombreuxespa espourmodéliser l'informationde ouleur. Unbonespa e
orres-pondà un hoix de trois omposantes biendé orrélées: 'est toutl'enjeu desdiérentes transformées
ouleursproposées.Unautreproblèmeessentielestlasensibilitéaubruitdu al uldelateinte,reposant
surun al ulde rapportdediéren es.
Pour palier e problème, ertaines appro hes s'inspirent de onstatations on ernant le système
visuel humain :
lepremier traitement réalisé parl'÷il estune ompressionlogarithmique del'information qu'il
perçoit
les apteursmajoritaires au entre delafovéa sont les nes sensiblesau Retau V.
la ourbe de sensibiltéde l'÷ilest maximalepour levert.
Ces remarques onduisent à proposer des espa es ouleurs qui orent des alternatives intéressantes
pour faire de la segmentation ouleur robuste, que e soit pour des appli ations en robotique, en
visiophonieou envisio onféren e.Lesystème1.74(où
M = 256
)donne l'expressiondelatransforméelogarithmiqueLUX [29,30 ,31℄.
L = (R + 1)
0.3
(G + 1)
0.6
(B + 1)
0.1
− 1
U
=
M
2
R+1
L+1
ifR < L
M
−
M
2
L+1
R+1
otherwise (1.74)X =
M
2
B+1
L+1
ifB < L
M
−
M
2
B+1
L+1
otherwiseL'eetprin ipalde ettetransforméelogarithmiqueestd'amplierle ontrastetouten
s'aran his-sant lepluspossible del'é lairage.La gure1.18montrequel'espa e
LU X
augmentele ontrastedesomposantes hromatiques touten gardant la ohéren e desteintes(rouge, bleu).
Figure 1.18Transformées hromatiques surune image devisage.Enhaut :Les omposantes
Y
,C
r
et
C
b
;En bas :Les omposantesL
,U
etX
.1.9.3 Segmentation ouleur
Proje tion surun axe
Pourréduirelaquantitéd'informationapportéepar la hrominan e,on peutne s'intéresserqu'àla
proje tion sur unseul desaxes.Un axeprivilégié est l'axeluminan e ar:
'estlaproje tion intrinsèque faitepar une améra vidéo N&B
elle orrespond àla omposante
L
del'espa eT LS
elle se al ulefa ilement en faisant lamoyenne desquantités
RV B
Pour une appli ation spé ique(suivi de teintede visagepar exemple),toute autreproje tion est
possible (parexemple sur l'axerouge).
Analyse en omposantes prin ipales
Une image ouleur peut être onsidérée omme un ensemble d'é hantillons statistiques
I(i, j) =
R(i, j)
V (i, j)
B(i, j)
ara térisé par ses moments d'ordre 1 (ve teur moyenneM =
M
R
M
V
M
B
) et d'ordre 2(matri e de ovarian e symétrique
C =
C
RR
C
RV
C
RB
C
RV
C
V V
C
V B
C
RB
C
V B
C
BB
).Dansle asdis ret, es grandeurs se al ulent par :
M
X
= E[X] =
1
M N
M
X
i=0
N
X
j=0
X(i, j)
(1.75)C
XY
= E[(X
− M
X
)(Y
− M
Y
)] =
1
M N
M
X
i=0
N
X
j=0
(X(i, j)
− M
X
)(Y (i, j)
− M
Y
)
(1.76)L'analyse en omposantes prin ipales (ACP) permet de dénir une proje tion plus intelligente.
omposante orrespondant au oe ient maximal, 'est-à-dire elle apportant le plus d'information.
Elle estbasée surle al uldesvaleurspropres etve teurspropres de
C
.Segmentation par seuillage de la teinte
Unhistogrammede ouleurfournit unedensitédeprobabilité permettant par seuillageou ltrage,
de trouverlespixels d'unerégion spé ique, par exemple lapeau humaine.
Pour déte ter les visages, la teinte à dominante rouge est un dis riminateur satisfaisant quelle
que soit la ouleur ee tive de lapeau (la diéren e de ouleur de peau provient d'une diéren e de
saturation, 'est-à-dire dequantité de ouleur présente danslevisage).
L'espa elogarithmique
LU X
peutêtreradi alementsimpliésil'appli ationne on ernequel'ana-lysede visage:
I =
R + V + B
3
(1.77)H =
(
256
·
V
R
si0
≤ V < R
255
sinon (1.78)Onutiliseuniquementlesplans ouleur
R
etV
pourdeuxraisonsprin ipales:toutd'abordlevisageestprin ipalement rougeet ontient peu debleu;par ailleurs, levertestsouvent utilisé entraitement
vidéo ommeune bonne approximationde laluminan e.Cette expressiona déjàsous d'autresformes
faitses preuves en robotique etvisionpar ordinateur.
Levisage,prin ipalementrouge, orresponddon àuneteintemoyennede128par ettetransformée
logarithmique. L'équation 1.81 donnela justi ationde ette armation :
I =
R + V + B
3
aveB
∼ 0
etI
∼ V
(1.79) d'oùR
∼ 2I ∼ 2V
(1.80) soitH = 256
V
R
∼ 256
V
2V
∼ 128
(1.81)La gure 1.19 montre la distribution typique de lateinte sur une image de visage entrée sur les
lèvres.Pour éliminerlemode dûaufond,prépondérant dansdes onditionsde prisede vuetélévisées,
ilsutdeltrerladistributiondeteintepar unltre entrésur128 depentesusamment dou epour
laisserune relative souplesseà l'estimation (ltregaussiende entre128, d'é arttype 128).
Pourextrairelemodedeslèvres,quisetrouvelaplupart dutemps onfonduave lemodedeteinte
de lapeau duvisage, onpro ède defaçon hiérar hique par itération du ltrage: onapplique làaussi
un ltregaussien de entre 128 maisd'é arttype plusréduit,64.
Classi ation de teinte par appro he rédibiliste
La théoriede l'éviden e, appélée aussithéorie desfon tions de royan es, estune alternative à la
théorieprobabilistebayésienne lassique.Ellepermetdetraiterdessituationsambigues,dansle asde
donnéesin omplètes oubruités, e quiestsouvent lasituation ren ontrée dansletraitement d'images
réelles.
Nous ne la détaillons pas i i, mais on peut onsulter les référen es suivantes qui illustrent son
appli ation pour la déte tion et le suivi de visage basé sur l'information de teinte hair, et où l'on
trouvera une bibliographie sur le sujet [32 , 33, 34℄. Un audioslide est également visible en ligne sur
youtube [35 ℄.
Appli ation à la supervisiondu littoral
On peut utiliser un seuillage sur la teinte bleue
U
pour segmenter l'o éan (Fig. 1.20) pour une0
100
200
300
400
500
600
0
50
100
150
200
250
300
Nbre de pixels
Niveau de gris
Distribution de teinte
Levres
Visage
Fond
0
50
100
150
200
250
300
350
400
0
50
100
150
200
250
300
Nbre de pixels
Niveau de gris
Distribution Filtree
Levres
Visage
Figure 1.19Enhaut:imagede visage( ouleur), planteintelogarithmique orrespondant.Enbas:
distribution deteinte, distributionltrée.
a) b)
) d)
Traitement de séquen es d'images
2.1 Déte tion de mouvement
2.1.1 Introdu tion
L'analysedumouvement dansles séquen es d'images estundomaine de re her he a tif,enraison
desonimportan edansdenombreusesappli ations:télésurveillan e, ompressionpourles
télé ommu-ni ationsoul'ar hivage,diagnosti médi al,météorologie, ontlenondestru tif,robotiquemobile,et .
Ondistinguehabituellementquatrephasesenanalysedemouvement:ladéte tion(deszonesmobiles),
l'estimation (des ve teurs-vitesses, en haque pixel ou pour haque objet), la segmentation (en zones
ohérentes ausensdumouvement)etl'interprétationdehautniveau(re onnaissan edeformesfaisant
appelà l'intelligen e arti ielle). Ces quatreétapes ne sont en au un as indépendantes nifor ément
séquentielles, maisau ontraire fortement interdépendantes (notamment en e qui on erne les deux
phasesestimation-segmentation). Nousnousintéressonsi ià laphasededéte tiondumouvement des
objets mobilesdansle as d'une améra xepar rapport àlas ène observée.
2.1.2 Prin ipe
Ladéte tiondemouvement onsisteàattribuerà haquepixelousite
s = (x, y, t)
desimagesd'uneséquen e unattribut, qu'on appelle étiquette
e
s
,indiquant si lepixelappartient àun objetmobile ouau fondxe delas ène observée :
e
s
= e(x, y, t) =
a = ”1”
si lepixelappartient àune zonemobile,b = ”0”
si lepixelappartient aufond xe.(2.1)
Etiqueter haque pixel
s
de l'image à l'instantt
permetainsi d'obtenir une arte binaire deshange-ments temporels(Fig. 2.1).
Figure2.1Enhaut :6imagesd'uneséquen eRue;Enbas:Cartesbinairesobtenuesparseuillage
entropique(pixels mobilesen blan ,
θ = 4
· σ
e
)Enfaisant l'hypothèse d'une améra xe etd'un é lairement quasi- onstant de la s ène observée,