Initiation au traitement d'images

(1)

HAL Id: cel-01477225

https://hal.archives-ouvertes.fr/cel-01477225v2

Submitted on 23 Jul 2019

HAL is a multi-disciplinary open access

archive for the deposit and dissemination of

sci-entific research documents, whether they are

pub-lished or not. The documents may come from

teaching and research institutions in France or

abroad, or from public or private research centers.

L’archive ouverte pluridisciplinaire HAL, est

destinée au dépôt et à la diffusion de documents

scientifiques de niveau recherche, publiés ou non,

émanant des établissements d’enseignement et de

recherche français ou étrangers, des laboratoires

publics ou privés.

Franck Luthon

To cite this version:

(2)

Fran k Luthon

Fran k.Luthonuniv-pau.fr

Laboratoired'Informatiquedel'UniversitédePauetdesPaysdel'AdourEA3000

DPT G.I.M.,IUT 2 AlléeduPar de Montaury,64600 Anglet, Fran e

http://www.iutbayonne.univ-pau.fr/

∼

luthon/img0.pdf

1

28 juin2019

(3)

(4)

1 Traitement d'image 7

1.1 Introdu tion . . . 7

1.2 Rappelsde théoriede l'information . . . 8

1.2.1 Entropie d'unesour e dis rète. . . 8

1.2.2 Redondan e d'unesour ed'information . . . 8

1.2.3 Codage entropique . . . 9 1.3 Histogramme . . . 9 1.4 Seuillage . . . 10 1.5 Contraste . . . 10 1.5.1 Contraste deMi helson . . . 11 1.5.2 Contraste deWeber . . . 11 1.5.3 Contraste deGordon . . . 11 1.5.4 Contraste deBeghdadi . . . 11 1.5.5 Contraste dePeli . . . 11 1.5.6 Contraste deKöhler . . . 11 1.6 Filtragelinéaire . . . 11 1.6.1 Convolution spatiale . . . 12

1.6.2 Transformée de Fourier dis rète . . . 12

1.6.3 Transformée en Z . . . 14

1.6.4 Typologie desltres . . . 14

1.6.5 Fon tion de transfert . . . 15 1.7 Déte tion de ontours . . . 15 1.7.1 Déte teur deRoberts. . . 16 1.7.2 Déte teur dePrewitt . . . 16 1.7.3 Déte teur deSobel . . . 17 1.7.4 Déte teur deCanny-Deri he . . . 17 1.7.5 Déte teur deShen-Castan . . . 17

1.7.6 Algorithmede Rosenfeld&Kak. . . 17

1.8 Morphologiemathématique . . . 19

1.8.1 Introdu tion. . . 19

1.8.2 Opérations binaires(images N&B) . . . 20

1.8.3 Propriétés . . . 21

1.8.4 Autresopérations. . . 21

1.8.5 Images NdG. . . 22

1.9 Segmentation ouleur. . . 23

1.9.1 Visiondes ouleurs . . . 23

1.9.2 Tri hromie . . . 23

1.9.3 Segmentation ouleur . . . 26

2 Traitement de séquen es d'images 29 2.1 Déte tion demouvement . . . 29

2.1.2 Prin ipe . . . 29

(5)

2.2.1 Fon tions d'énergie . . . 31

2.2.2 Estimationdesparamètres . . . 32

2.2.3 Algorithmes derelaxation . . . 32

2.2.4 Synoptique d'unalgorithmede déte tionde mouvement . . . 33

2.3 Multirésolutionspatio-temporelle . . . 34

2.4 Voisinage3-D spatio-temporel . . . 34

2.5 Misesen÷uvre matérielles. . . 36

2.6 Exemplesd'appli ations . . . 37

2.6.1 Télésurveillan e . . . 37

2.6.2 Analysedu mouvement deslèvres d'unlo uteur . . . 38

2.6.3 Con lusion . . . 40

2.7 Estimationde mouvement . . . 40

2.7.1 Méthodesdiérentielles . . . 40

2.7.2 Méthodesfréquentielles . . . 42

2.7.3 Miseen orrespondan ede blo s . . . 43

2.7.4 Modèles paramétriques demouvement . . . 44

2.8 Compensationde mouvement . . . 45

2.8.2 Estimationde mouvement pel-ré ursive . . . 45

2.8.3 Prin ipe du odage vidéo . . . 46

2.9 Méthodeshybrides de ompressionvidéo . . . 47

2.9.1 Transformée en ondelettes . . . 47

2.9.2 Critique delaméthode de Baaziz . . . 48

2.9.3 Dis ussion . . . 50

3 Normes et standards du multimédia 51 3.1 Introdu tion . . . 51

3.2 Manipulation d'objets multimédia. . . 51

3.2.1 Saisie . . . 51

3.2.2 Numérisation . . . 52

3.2.3 Codage . . . 52

3.2.4 Compression . . . 52

3.2.5 Sto kage . . . 52

3.2.6 Prote tion etidenti ation du ontenu . . . 53

3.2.7 Transmission . . . 53

3.2.8 Restitution . . . 53

3.3 Codage et ompression d'objets multimédia . . . 53

3.3.1 JPEG :exemplede DCT . . . 53

3.3.2 JPEG2000 :exemple d'ondelettes . . . 54

3.3.3 Fra tales. . . 55

3.3.4 MPEG. . . 55

3.3.5 H261-H263 . . . 55

3.3.6 MP3 . . . 55

3.3.7 Formatsde hiers imagesxes . . . 56

3.3.8 Représentation 3-D . . . 57

3.4 Les lasses d'appli ations multimédia . . . 58

3.5 Codage desappli ations multimédia . . . 58

3.5.1 HTML . . . 58

3.5.2 XML . . . 59

3.5.3 WAPet WML . . . 59

3.5.4 MHEG. . . 59

3.5.5 Appli ationsdistribuées . . . 59

3.6 Compression de séquen esvidéo . . . 60

(6)

3.6.2 NormesMPEG-4 etH.264 . . . 61

3.6.3 Cara téristiques desnouveaux standards . . . 61

4 Exer i es 63 4.1 Débit d'information. . . 63

4.2 Modi ation d'histogramme . . . 63

4.3 Prin ipe del'égalisation d'histogramme. . . 63

4.4 Egalisationetétalement . . . 64

4.5 Déte tion de ontours . . . 65

4.6 Cal ulde Lapla ien. . . 65

4.7 Filtragelinéaire . . . 65

4.8 Eetde moirépar repliement de spe tre . . . 66

4.9 Transformée de Fourier . . . 67

4.10 Morphologiemathématique . . . 67

4.11 Poursuite de ontourbinaire-2+4" . . . 68

4.12 Ouverture etfermeture . . . 68 4.13 Lissagemorphologique . . . 69 4.14 Morphologiemathématique . . . 69 4.15 Zone aveugle . . . 70 4.16 TV ouleur Se am . . . 70 4.17 ACP ouleur . . . 71 4.18 Déte tion demouvement . . . 71

4.19 Déte tion demouvement par étiquetagestatistique ontextuel . . . 71

4.20 Equationde ontrainte dumouvement . . . 72

4.21 Equationfréquentielle de ontrainte dumouvement . . . 73

4.22 Algorithmede Horn&S hun k . . . 73

4.23 Estimationpar miseen orrespondan e deblo . . . 73

4.24 Estimationd'unmodèlede mouvement . . . 74

4.25 Estimateurrobuste . . . 74

4.26 Filtre deCanny-Deri he . . . 74

4.27 Transformée ouleur logarithmique . . . 75

4.28 Filtragelinéaire . . . 75

4.29 Transformée ouleur non-linéaire . . . 76

4.30 Compensationde mouvement . . . 76 4.31 Teinte duvisage . . . 77 4.32 Transformée de Fourier . . . 77 4.33 Appli ation industrielle . . . 77 4.34 Résolution et ontraste . . . 77 4.35 APIJMF-RTP . . . 80 4.36 Phénomène d'Aliasing . . . 81

4.37 QCM3 (1 à4 réponsesVRAI par question) . . . 81

4.38 QCM1 (une ouplusieurs bonnesréponses à o her) . . . 82

4.39 Filtragemédian . . . 84 4.40 Filtragelinéaire . . . 84 4.41 Codage . . . 85 4.42 Filtragelinéaire . . . 85 4.43 Morphologiemathématique . . . 86 4.44 Analysede mouvement . . . 86 4.45 Filtre médian . . . 87 4.46 Codage . . . 88

4.47 Filtragelinéaire :Filtre de Sobel . . . 89

4.48 Morphologiemathématique :Gradient morphologique . . . 89

4.49 Codage entropique deHuman . . . 89

(7)

4.51 Filtragenon-linéaire . . . 91

4.52 Etiquetage en omposantes onnexes . . . 92

4.53 Programmation OpenCV. . . 95 4.54 Déte tion de ontour . . . 96 4.55 Morphologiemathématique . . . 97 4.56 Codage . . . 97 4.57 Morphologiemathématique . . . 98 4.58 Morphologiemathématique . . . 98 4.59 Filtragelinéaire . . . 99 4.60 Estimationde mouvement . . . 99 5 Travaux Pratiques 101 5.1 Filtre numérique RII:Implantation enC . . . 101

5.1.1 Filtre de lissage . . . 101

5.1.2 Filtre de dérivation . . . 102

5.1.3 Déte teur de ontours . . . 102

5.2 Estimateurde mouvement :Implantation enC . . . 104

5.2.1 Algorithmede HornetS hun k . . . 104

5.2.2 Cal uldes gradients . . . 104

5.2.3 Estimationitérative desvitesses. . . 104

5.2.4 Test . . . 104

5.3 Corre tiond'histogramme . . . 105

5.4 Transformation deFourier . . . 105

5.5 Filtre Flou etDéte teurde Contours :Implantation Java. . . 107

5.5.1 Présentation. . . 107

5.5.2 Travail demandé . . . 107

5.6 Déte teur demouvement :Implantation Java . . . 107

5.7 Traitement d'images ave OpenCV:Implantation JavadansE lipse . . . 108

5.8 Projet:Interfa e deTraitement d'Images . . . 109

5.8.1 Conseilssur letravaildemandé . . . 109

5.8.2 Classesutiles auprojetimage . . . 109

5.9 Projet:A quisition,Traitement etTransmission Vidéo . . . 110

5.10 TPMatLab1 - Séan ed'initiation . . . 111

5.11 TPMatLab2 - Traitementsd'image statique . . . 112

5.11.1 Filtragelinéaire . . . 112

5.11.2 Déte tion deteinte hair . . . 112

(8)

Traitement d'image

1.1 Introdu tion

Lavisionest laper eptiondu mondeextérieur.L'image estlareprésentation bidimensionnelle

d'unes ène3-D. C'estl'information issued'un apteur devision( améra, ÷il). Letraitement d'image

omporte diérentes tâ hes : apture, analyse et traitement (bas niveau), interprétation et dé ision

(hautniveau). Ondistingue diérentstraitements:

amélioration, restauration et orre tion d'image : augmentation du ontraste, orre tion des

distorsions optiques,ltragedu bruit

analyse[1℄ :déte tion etlo alisationd'objets,segmentation, re onnaissan ede formes,

estima-tionetmesures

odage pour la ompression, l'en ryptage etlatransmissionnumérique.

Le traitement d'image ouvre plusieurs domaines [2℄:

l'éle tronique ( apteur,optique, a quisition)

letraitement de signal(déte tion,segmentation, estimation, dé ision) [3℄

l'informatique etl'intelligen e arti ielle (re onnaissan e, interprétation, guidagerobotique)

Onnes'intéressei iqu'auximagesnumériques, 'est-à-direé hantillonnéesetquantiées.Uneimage

numérique est déniepar untableau depixels detaille

L

× C

(typ.

256 × 256

).Chaquepixel, portant

l'information d'intensité lumineuseperçueen e point,est odésur

n

bits.Typ.

n = 8

pouruneimage

à256 niveauxde gris(NdG)et

n = 24

pourune image ouleur

RV B

(8bits par omposante ouleur).

Ondénitdansl'image un repère

0xy

etunenotion de distan eetde voisinage(Fig. 1.1).

(9)

1.2 Rappels de théorie de l'information

1.2.1 Entropie d'une sour e dis rète

L'entropie

H

(exprimée en bits) d'une sour e dis rète d'observations à valeurs dans

{0...M − 1}

(typ.

M = 256

) estdénie par [4℄:

H

bit

=

−

M −1

X

i=0

p

i

log

2 p

i

(1.1)

où

p

i

représente laprobabilité pour que l'observation en lesite

s = (x, y)

∈ S

vaille :

o

s

= i

(

S

étant

lesupportdes observations, en l'o urren e i iune image de taille

L

× C

).

Rappelons quele hoixde labasedu logarithmeestarbitraireet orrespond au hoixdel'unité de

mesure(bit si logbinaire, nat si lognépérien); etl'on a:

H

nat

= H

bit

· log

e

2 ≈ 0.7 · H

bit

.En eet,le

passage d'unebase

a

àunebase

b

requiert simplement unemultipli ation par la onstante

K = log

b

a

.

Commel'information élémentaireapportéeparunévénement deprobabilité

p

i

vautpardénition:

I

i

= log

_p

1 _i

,onvoitquel'entropieestune mesuredel'information moyennedébitéepar unesour e:

H =

P p

i

I

i

.

Shannonadémontréquel'entropie(expriméeennats)d'unesour egaussienne entréed'é art-type

σ

vaut

H

nat

= log(σ

· √

2πe)

et qu'à

σ

xé, lasour e donnant l'entropie maximale est la distribution

gaussienne.

Pour une sour e quel onque d'entropie

H

donnée, Shannon dénit lanotion de "puissan e

entro-pique"

N

:

N =

1 2πe

exp(2H)

(1.2)

C'estlapuissan edeladistributiongaussienneéquivalenteàladistributiond'entropie

H

.Pourunbruit

gaussien entréd'é art-type

σ

,onretrouve biensûr:

N = σ

2

.Commelebruit blan gaussienpossède

l'entropie maximale à puissan e xée, la puissan e entropique d'un bruit quel onque est toujours

inférieure ou égale à sa puissan e ee tive. Toujours selon Shannon, un bruit blan gaussien a la

propriété d'absorbertoutautre signalqui luiest ajouté.La puissan e entropique résultanteestà peu

près égale à lasomme de lapuissan e du bruit blan et de lapuissan e du signal(supposé entré), à

onditionque lapuissan edu signalsoit faible,"dans un ertainsens", omparée aubruit [4℄.

Ensupposant le bruitadditif gaussienetmajoritaire surle support, onpeutdon estimer

l'é art-type entropique

σ

e

équivalent en al ulant l'entropie

H

desobservations [5 ℄:

σ

e

=

√

N =

exp(H)

√

2πe

=

2 H

bit

√

2πe

(1.3)

Enprenant une mesurede seuil

θ

e

estimée par:

θ

e

= 4σ

e

≈ 2

H

bit

(1.4)

on obtient une te hnique adaptative automatique de déte tion du mouvement dans les séquen es

d'images [6℄.

1.2.2 Redondan e d'une sour e d'information

L'entropie estune notionfondamentale arelle renseignesurlaredondan e spatiale présentedans

une image etpermet de mettre en ÷uvre les outils de odage dénis par Shannon pour réaliser une

ompressionsanspertedel'information ontenuedansl'image(é onomiededébitpourlatransmission:

odage de Human,de Shannon-Fano). La redondan e d'unesour e

X

est déniepar :

R = 1

−

H(X)

H

max

(1.5)

Pour une sour e dis rète à

M

événements, l'entropie maximale est atteintequand les événements

sont équiprobables etelle vaut :

H

max

= log

(10)

1.2.3 Codage entropique

Lesméthodes de odage entropique visent à oderles messagesles plus probables ave les

mots- odes les plus ourts ( ode à longueur variable ou VLC en anglais). Elles permettent d'assurer la

propriété du préxe (obtention d'un ode irrédu tible), et de faire en sorte que

p(0)

≈ p(1)

, pour

réduirelaredondan e etatteindre untaux de ompression sansperte.

Méthode de Shannon-Fano

Lapro édure estlasuivante :

1. Classerdansun tableaules messages(ou événements) par ordrede probabilité non roissante.

2. Dé ouper l'ensemble des messages

X

en 2 sous-ensembles

X

1

et

X

2

ayant des probabilités

voisines (aussipro heque possible de l'équiprobabilité).

3. Attribuer àl'un des sous-ensembles le préxe 0 età l'autre 1 ( omme première lettre du

mot- ode).

4. Réitérerlaséquen ed'opérations2&3sur

X

1

puissur

X

2

séparément,et ...jusqu'àavoirisolé

haque message individuellement.

5. Le odeobtenu selit dire tement dansletableau simplement de gau he à droite.

Méthode de Human

Lapro édure estlasuivante:

1. On lasseles événementsdansl'ordre desprobabilités dé roissantes(idemShannon-Fano)

2. A haqueétape,onattribueaux2derniersmessages

m

M −1

et

m

M

(don les2moinsprobables)

unsymbole0 etunsymbole1 respe tivement.

3. On onstruitàpartird'euxunsupermessage(texte

m

M −1

m

M

)deprobabilitésomme

p

M −1

+p

M

que l'on re lasse dans un nouveau tableau en l'inter alant pour respe ter toujours l'ordre de

probabilités dé roissantes

4. On ontinue jusqu'à e qu'il nereste que 2messagesisolés

5. Onrevient en arrièredans letableau pour le odage (le ture du ode dedroite à gau he).

1.3 Histogramme

L'histogramme est la ourbe

n(i)

où

n

est le nombre de pixels d'intensité

i

. Il peut omporter

plusieurs pi s oumodes, ou bienêtre uniforme(Fig.1.2).

Figure 1.2 Exempled'histogramme omportant deux modes.

Sil'onnote

N = L

× C

lenombredepixelsdel'image,et

M

lenombredeniveauxdegris possibles (

i = 0

· · · M − 1

),laprobablitéd'unniveau degrisvaut

p

i

=

n

i

N

etlafon tiondedensitédeprobabilité

(PDF)s'exprime :

F (i) =

i

P

k=0

(11)

Les deux prin ipales orre tions d'histogramme sont l'égalisation et l'étalement. L'égalisation

onsiste àredistribuer les niveaux de grisen remplaçant leniveau

i

par leniveau

l

i

tel que:

l

i

= (M

− 1)F (i) =

M

_{− 1}

L

_{× C}

i

X

k=0

n

k

(1.6)

L'étalement onsiste àutiliser touteladynamiquedes NdG:

l

i

= (M

− 1)

i

_{− i}

min

i

max

− i

min

(1.7)

L'intérêt de es te hniquesest d'être omplètement automatiques, don fa ilement programmables.

Dansle asgénéral,une orre tion d'histogramme orrespondà appliquerune transformation non

linéaire

T

surles niveauxde gris :

l

i

= T (i)

(1.8)

T

doit êtreune fon tion monotone roissanteetbornéedans l'intervalle

[0, M

− 1]

.

Cela permet amélioration ou tru age en appliquant un fa teur d'ampli ation non linéaire sur

l'é helle de gris (Fig.1.3).

Figure 1.3 Exemple de orre tion d'histogramme par rehaussement : a) du sombre b) du lair )

entral.

1.4 Seuillage

Leseuillage(surlesNdG,surleurs dérivées,surl'histogramme,surl'entropie,surlestransformées

...)estuneopérationtrèsfréquente(pournepasdiresystématique)entraitementd'image(nombreuses

appli ations en déte tion de ontours, déte tion de mouvement ...) Il permet de passerd'une image

en NdGà uneimage N&B (étiquetage binaire

e(s)

) :

∀s = (x, y) ∈ S, e(s) =

“1”

si

I(s) > θ

“0”

sinon

(1.9)

La di ulté est évidemment le hoix du seuil adéquat

θ

. Il existe de très nombreuses méthodes et

te hniques adaptatives, semi-automatiques, ... de séle tion du seuil [6℄. L'intérêt est de pouvoir

en-suiteappliquer desoutilsspé iquesauximagesbinaires (morphologiemathématiquebinaire,suivi de

ontours binaires).

1.5 Contraste

(12)

1.5.1 Contraste de Mi helson

'està l'origineune mesurede visibilitéde franges d'interféren e

il onsidère le asd'une luminan e

L

sinusoïdale

l'estimateurest :

C

M

=

L

M ax

−L

min

L

M ax

+L

min

ilest utilisé ave su èsen psy hophysique.

variantes :

C

M

=

L

M ax

−L

L

M ax

+L

et

C

M

=

L−L

min

L+L

min

1.5.2 Contraste de Weber

il onsidère le asd'unfond uniforme

l'estimateurest :

C

W

=

∆L

L

=

L

0 −L

moy

L

moy

ilest utilisé enpsy hophysique (CIE, météo)

NB:La ourbe expérimentale de seuilde visibilitéde Weberest largement utilisée.

1.5.3 Contraste de Gordon

référen e[7℄

il onsidère le as d'un stimulus omplexe (image naturelle de mammographie pour an er du

sein)

'estunestimateurlo albasésurle al ulduNdGmoyen dedeux régions:

C

G

=

L

moy1

−L

moy2

L

moy1

+L

moy2

'estunestimateur signé.

1.5.4 Contraste de Beghdadi

référen e[8℄

'estune mesureentreles NdGmoyens des ontoursestimés sur2régions

C

B

=

C

moy1

−C

moy2

C

moy1

+C

moy2

1.5.5 Contraste de Peli

référen e[9℄

'estunestimateurlo alàbande limitée(gammede fréquen esspatiales

ω

x

,

ω

y

).Ilestbasésur

les propriétés duHVS (Human VisualSystem)

in onvénient :ila un oût de al ulélevé.

1.5.6 Contraste de Köhler

référen ebibliographique :[10 ℄

soit unseuil

s

tel que:

min (f (x), f (x

1 ))

≤ s ≤ max (f(x), f(x

1 ))

'estunestimateur pon tuel du ontraste:

C

xx

1 (s) = min(

|s − f(x)|, |s − f(x

1 )

|)

ou

C

xx

1 (s) = max(

|s − f(x)|, |s − f(x

1 )

|)

variantes possibles:

C

xx

1 (s) = min

|s−f(x)|

s+f (x)

,

|s−f(x

1 )|

s+f (x

1 )

ou

C

xx

1 (s) = min

|s−f(x)|

max(s,f (x))

,

|s−f(x

1 )|

max(s,f (x

1 ))

1.6 Filtrage linéaire

Le ltragelinéaire est une opération lassiquepour le pré-traitement des imagesave deux

appli- ations prin ipales:la rédu tionde bruit (ltrage passe-bas)et le rehaussement pour ladéte tion de

ontours (ltrage passe-bande ou passe-haut). Les outils mathématiques utilisés sont la onvolution,

(13)

1.6.1 Convolution spatiale

Dansle as1-D ontinu,l'opération( ommutative) de onvolution s'exprime:

f (x)

_{∗ h(x) =}

+∞

Z

−∞

f (χ)h(x

_{− χ)dχ}

(1.10)

Le ltragepeut être réalisé dire tement dans ledomaine spatial en onvoluant l'image

I(x, y)

par la

réponseimpulsionnelle

h(x, y)

dultre. La onvolution dis rète est ommutative ets'exprime par :

J(x, y) = I(x, y)

_{∗ h(x, y) =}

X

i

X

j

I(x

_{− i, y − j)h(i, j) =}

X

i

X

j

I(i, j)h(x

_{− i, y − j)}

(1.11)

Si

h(i, j)

estàsupportbornésymétrique,onlareprésentesousformed'untableaude oe ients

H

m×n

appelémasquede onvolution quel'onappliquesurlafenêtreimage orrespondantepour haquepixel.

Par exemple,pour

m = 3

et

n = 5

,on aura:

H

_3×5

=





h

11 h

12 h

13 h

14 h

15 h

21 h

22 h

23 h

24 h

25 h

31 h

32 h

33 h

34 h

35 



(1.12)

La onvolutionde deuxmasques 1-Ddonne un masque2-D(propriété de séparabilité) :

a b c

_∗





α

β

γ





=





aα bα cα

aβ bβ cβ

aγ

bγ

cγ





(1.13)

1.6.2 Transformée de Fourier dis rète

Cetoutil permetde passerdudomaine spatialau domainefréquentiel. Le ltragefréquentiel

s'ob-tient en multipliant la TF de l'image par la fon tion de transfert du ltre (gabarit). L'in onvénient

prin ipal est le oût de al ul élévé, bien qu'il existe un algorithme rapide appelé FFT. On réserve

don leltragefréquentielaux as oùlapré ision est lefa teur important.

Latransforméede Fourier dis rète (TFD) 2-Dd'une image s'exprimepar :

F (u, v) =

√

1 LC

C−1

X

x=0

L−1

X

y=0

I(x, y)e

−i2π(

u.x

C

+

v.y

L

)

(1.14)

On dénit de même la transformée de Fourier inverse, qui permet de remonter à l'image originale

I(x, y)

onnaissant satransformée

F (u, v)

:

I(x, y) =

√

1 LC

C−1

X

u=0

L−1

X

v=0

F (u, v)e

+i2π(

u.x

C

+

v.y

L

)

(1.15)

On appelle spe tre d'amplitude (resp. phase) le module

|F (u, v)|

(resp. l'argument

Φ(u, v)

) de la

transformée de Fourier, qui est une grandeur omplexe. Si la dynamique du spe tre est importante,

on travaille sur le module en dB :

o

s

= 20 log

10 |F (u, v)|

. Les valeurs de module étant des réels, on

peut se ramener au as d'une sour e dis rète d'observations en quantiant les modules pour obtenir

un ensemble de

M

valeursdis rètes (e.g.,quantumde 0.5dB pour

M = 256

).

L'interprétation physique importante de la TF repose sur l'examen du lieu de phase nulle. Dans

l'espa e normalisé

X =

x

C

, Y =

y

L

, e lieu orrespondant à :

u.X + v.Y = k

⇔ Y = −

u

v

X +

k

v

.

C'estune sériede droitesparallèlesdistantesde

d =

1 √

u

2 +v

2

etde dire tionperpendi ulaireà ladroite

de pente

tan θ =

v

u

. Cette relation montre que les hautes fréquen es orrespondent à des lignes de

phase nulle rappro hées. En terme d'image, un ontour se traduit en fréquen e par une ligne située

à distan e

d

de l'origine. Plus le ontour est net, plus

d

est grande (présen e d'énergie en hautes

(14)

leshautesfréquen estraduisentdes ontoursnets,etlesbassesfréquen estraduisentdes ontoursous

oudesrégionsuniformes.L'orientationdesfréquen esspatialesrenseignesurl'orientationdes ontours

dansl'image. L'utilisationde laTF permet don de pratiquer desltrages fréquentielssurl'image.

LaFig.1.4montrel'alluretypiqueduspe tred'uneimage réelle.Notonsquel'ontrouvepour ette

image une entropie

H = 6.5

bits

< 8

bits , e quiest ohérent pour desobservations odées sur8 bits.

Figure 1.4Spe tre d'uneimage réelle(Couloir).

Repliement de spe tre

Onsait quel'é hantillonnage setraduit par une périodisation fréquentielle. Pour éviter le

phéno-mène de repliement de spe tre, le théorème de Shannon stipule que l'on doit respe ter la ondition

suivanteentre fréquen ed'é hantillonnage etfréquen emaximale du signal:

F

e

≥ 2F

max

.

Un ltrage passe-bas permet de respe ter ette ontrainte : e ltrage est souvent inhérent au

système de apture pour des images réelles. Par ontre, on devra se méer parti ulièrement de e

problème quandongénère desimages synthétiquespour testerdesalgorithmes de traitement.

Passage de la TF à la TFD Partant de laTF ontinue :

T F : F (ν) =

+∞

Z

−∞

f (x)e

−i2πνx

dx

(1.16)

T F

−1

: f (x) =

+∞

Z

−∞

F (ν)e

i2πνx

dν

(1.17)

ladis rétisationtemporelle( asdessignauxfon tiondutemps)ouspatiale( asdesimagesfon tion

de l'espa e) donne :

x = kT

e

=

k

F

e

(é hantillonnage spatial àlapériode

T

e

).

Sans perte de généralité, on pose souvent

T

e

= 1

ou bien on utilise la notation de fréquen e

réduite

u =

ν

F

e

, e qui implique

u

max

≤

1

2

ard'aprèsShannon :

F

e

≥ 2ν

max

.

On obtient ainsi la TF dis rète dans le temps (TFDT) al ulée sur une durée d'observation

évi-demment limitée:

T = N T

e

.

T F DT : F (u) =

N −1

X

k=0

f (k)e

−i2πuk

(1.18)

Sil'onyajoutel'é hantillonnage fréquentielave unpas

∆

e

=

F

e

N

où

N

estlenombred'é hantillons,

alors

ν = n∆

e

⇔ u =

n

N

etl'on obtient laTFD :

T F D : F (n) =

X

f (k)e

−i2π

nk

N

(1.19)

T F D

−1

:

f (k) =

X

F (n)e

i2πn∆

e

k

₌

X

_{F (n)e}

i2π

nk

_N

(15)

Sidansla dernièreéquation on rempla e

k

par

x

et

∆

e

par

f

0

où

f

0

estle fondamental du signal

(oubiensil'on onsidère unepériodisationarbitrairesurladuréed'observation

T

),onretrouve lelien

ave leDSF lassique:

f (x) =

X

c

n

exp(i

2πnx

T

)

ave

c

n

= F (n) =

1 T

Z

[T ]

f (x) exp(

_−i

2πnx

T

)dx

(1.21) 1.6.3 Transformée en Z

La transformée en

Z

est l'outil lassique pour l'étude des signaux é hantillonnés. Pour un signal

1-D

f (x)

,elle est déniepar :

F (z) =

+∞

X

k=−∞

f (k)z

−k

(1.22)

z

estun nombre omplexe lié àlavariablesymboliquede Lapla e par l'équation:

z = exp (pT

e

) = exp(j2πνT

e

) = exp(j2πu)

(1.23)

où

T

e

est lapériode d'é hantillonnage.

z

−1

est don l'opérateur retard pur.

1.6.4 Typologie des ltres

Unltre peutavoirde nombreusespropriétés [11,12,13 ,14 ℄:invarian e, ausalité, anti- ausalité,

support borné, symétrie, séparabilité, RIFou RII. Un point parti ulier à résoudre on erne les eets

de bords et la représentation numérique du résultat de ltrage (problème de visualisation de valeurs

négatives).

Laséparabilité estun ritère important pour réduire letemps de al ul.

Lesltres RIF(réponse impulsionnelle nie) sont les plus ourants etles masques de taille

3 × 3

,

opérantsurles8pluspro hesvoisinsd'unpixel,sonttrèsutiliséspourtouslestraitementsélémentaires

surles images:

moyenneur :

H =

1

9 



1 1 1





séparable:

1

3 1 1 1

_∗

1 ₃





1

1 



binomial gaussien:

H =

1

16 



1 2 1

2 4 2

1 2 1





séparable:

1

4 1 2 1

_∗

1 ₄





1

2

1 



lapla ien :

H =





0

1

0

1 _{−4 1}

0

1

0 



Sobel horizontal :

H =





−1 0 1

−2 0 2

−1 0 1





séparable :

−1 0 1

∗





1

2

1 



gradient oblique:

H =





−1 −1 0

−1

0

1

0

1

1 



rehausseurde ontraste:

H =





1 ₋₃

1 −3

9 ₋₃

1 −3

1 



séparable:

−1 3 −1

∗





−1

3 −1





Lamiseen as adedeltres(asso iativitédela onvolution)permetdegénérerdesltresdegrande

taille àmoindre oûtde al uls :

H

_3×3

_{∗ H}

_3×3

=

1

16 



1 2 1

2 4 2

1 2 1





∗

1

16 



1 2 1

2 4 2

1 2 1





=

1

256 





1

4

6

4

1 4 16 24 16 4

6 24 36 24 6

4 16 24 16 4

1

4

6

4

1 





= H

_5×5

(1.24)

(16)

Lesltres RII(réponseimpulsionnelle innie)sont ara térisés parleur fon tionde transferten

Z

ou leuréquation auxdiéren es:

H(z) =

S(z)

E(z)

=

b

0 + b

1 z

−1

+

· · · + b

m

z

−m

1 + a

1 z

−1

+

· · · + a

n

z

−n

(1.25)

s

k

= b

0 e

k

+ b

1 e

k−1

+

· · · + b

m

e

k−m

− a

1 s

k−1

− · · · − a

n

s

k−n

(1.26)

où

s

k

et

e

k

sont les é hantillons resp. de sortie et d'entrée ourants. Si les oe ients

a

i

sont tous

nuls, on retrouve un ltre RIF. La stabilitédu ltre est liée auxples de lafon tion de transfert. Un

exemple type deltre RIIestleltre de Canny-Deri he.

1.6.5 Fon tion de transfert

Par dénition, la fon tion de transfert est la TF de la réponse impulsionnelle. Dans le as d'un

ltre 1-D, laTF de

h(x)

vaut :

H(u) =

X

k

h(k)e

−i2πu.k

(1.27)

où

h(k)

sont les oe ients de la réponse impulsionnelle. Pour le ltre moyenneur symétrique

H =

1

3 [1 1 1]

,on obtient :

H(u) =

1

3 (e

−i2πu

_{+ 1 + e}

+i2πu

_{) =}

1

3 (1 + 2 cos 2πu)

(1.28)

OnpeutaussiutiliserlaTZ. Considérons par exemplele ltre binomial entré :

H = [1 2 1]

.La

onvolutiondusignal

f (x)

par leltre

h(x)

donne:

g(x) = f (x)

∗ h(x) = f(x − 1) + 2f(x) + f(x + 1)

.

Soit,par transforméeen

Z

:

G(z) = (z

−1

_{+ 2 + z)F (z)}

.D'où lafon tionde transfert en

Z

:

H(z) =

G(z)

F (z)

= z

−1

_{+ 2 + z}

(1.29)

Pouruneimplantationmatériellede eltre,ondé alelaréponseimpulsionnellepourlarendre ausale

en multipliant la fon tion de transfert par l'opérateur retard

z

−1

. D'où

H

−

_{(z) = z}

−2

_{+ 2z}

−1

_{+ 1 =}

(1 + z

−1

)

2

. On en déduit ainsi deux s hémas fon tionnels possibles pour réaliser e ltre numérique

(Fig. 1.5).

Figure 1.5 S hémas fon tionnels dultre binomial 1-D:a) dire tb) versionpipeline.

Ce iestledomaine de lasynthèsedesltres numériques entraitement d'images [15, 16,17 , 18℄.

1.7 Déte tion de ontours

Ondistinguedeux méthodesde déte tion depointsde ontours [19 ℄(Fig. 1.6):

lare her he des extrêmade ladérivée première :ve teur gradient dénipar

G(x, y) =

∇I(x, y) =

"

_∂I(x,y)

∂x

∂I(x,y)

∂y

#

(17)

Figure1.6 a) Contour 1Didéalisé;b) Lissage; ) Dérivée première;d) Dérivée se onde.

lare her he des passagespar zérode ladérivée se onde :lapla ien dénipar

L(x, y) =

_∇

2 I(x, y) =

∂

2 _{I(x, y)}

∂x

2 +

∂

2 _{I(x, y)}

∂y

2

Marr proposedans son s héma de prin ipe brutdu pro essusde vision (raw primal sket h ou

esquisse primitive fondamentale) d'utiliser un ltre passe-bande de type lapla ien d'une

gaus-sienne

∇

2 _G

, quel'on peut orre tement approximer en pratique ave unltre

DOG

diéren e

de deuxgaussiennes[20 ℄.

1.7.1 Déte teur de Roberts

Ilest basésurdeux masquesqui al ulent legradient spatialdans deuxdire tions

45 ◦

et

135 ◦

:

H

45 =

0

1 −1 0

H

135 =

1

0

0 ₋₁

En onvoluant l'image ave es deux masques, on obtient deux images ltrées

I

1

et

I

2

que l'on

ombine pour al uler lemoduleetla dire tiondu ontraste:

M (i, j) =

pI

1 (i, j)

2 + I

2 (i, j)

2

(1.30)

Φ(i, j) = arctan

I

2 (i, j)

I

1 (i, j)

+

π

4

(1.31)

Onapplique ensuiteune te hnique de seuillagedu module pour ne garder queles points ontours. Se

poseensuiteleproblèmede haînageetd'approximationpolygonalepour exhiberdes ontours fermés.

Cedéte teur estsensible au bruit hautefréquen e, que l'on peutréduirepar unltrage passe-bas

initial.

1.7.2 Déte teur de Prewitt

Il onsiste endeux masquesélémentaires, qui al ulent lesdérivées horizontale et verti ale

moyen-néessur unvoisinage

3 × 3

:

Prewitthorizontal :

H

0 =





−1 0 1





etPrewitt verti al:

H

90 =





−1 −1 −1

0

1

1 



La pro édure est ensuite la même pour extraire les ontours, mis à part la suppression du terme

additif

π

(18)

1.7.3 Déte teur de Sobel

Ilutilise également deuxmasques,l'un horizontal

H

0

,l'autreverti al

H

90

:

Sobelverti al :

H

90 =





−1 −2 −1

0

1

2

1 



séparableen lissageetdérivation:

1 2 1

_∗





−1

0

1 



NB:In luantunpré-ltragepasse-bas,Prewitt etSobelsontmoinssensiblesaubruitqueRoberts.

1.7.4 Déte teur de Canny-Deri he

Ilfaitpartie desextra teurspar optimisationde ritères(sensibilité, lo alisationetdéte tion

opti-malesétant donné un modèlede ontour) [21,22℄. Sa réponseimpulsionnelle 1-Ds'exprime par :

h(x) = cxe

−α|x|

(1.32)

α

estun oe ient delissageet

c

un oe ientdenormalisationdéterminéenmaximisantl'amplitude

de laréponseà uné helon unité:

c =

−

(1−e

−α

)

2 e

−α

.

Ilsedé omposeen deuxparties, dont onpeut al ulerles fon tionsde transfert en

Z

:

ausale:

h

+

_{(x) = cxe}

−αx

pour

x

≥ 0

d'où

H

+

_{(z) = c}

+∞

P

k=0

kz

−k

_e

−αk

_{= c}

e

−α

z

−

1 (1−e

−α

z

−

1 )

2

anti- ausale :

h

−

_{(x) = cxe}

αx

pour

x

≤ 0

d'où

H

−

_{(z) = c}

+∞

P

k=0

−kz

k

_e

−αk

_{= c}

−e

−α

_z

(1−e

−α

z )

2

Onen déduitaisément les équationsde ré urren e dultre.

1.7.5 Déte teur de Shen-Castan

Le déte teur de Shen et Castan est une version de ltre RII plus simple que le ltre de

Canny-Deri he:ununiqueparamètrepermetderéglerlafor edultre,lese ondparamètreétantle hoixdu

seuilpourne onserverqueles pointsayant lesplusfortes valeursdedérivées [23 ℄.Ila étéutilisé ave

su èsen ontrle qualité automatique pour mesurer lamouillabilité de polymèrestraités par plasma

[24 , 25 ℄.

1.7.6 Algorithme de Rosenfeld & Kak

Contrairementauxltrespré édentsquiopèrentsurdesimagesàNdG,ils'agiti id'unextra teur

de ontours opérant surdesimages binaires(N&B).

Dénitions

Onappelle dire tion ourantedu ontourde l'objetenunpixelappartenant au ontour,leve teur

de translationqui joint epixel aupixel du ontourle pré édant dansle senstrigonométrique.

Partant d'un pixel donné dans l'image, les 8 premiers voisins sont dénis par leur dire tion par

rapport au pixel de départ et par les oordonnées des ve teurs de translation permettant de passer

d'unpixelau suivant onnaissant ladire tion ourante( ode deFreeman, f.Fig .1.7).

Prin ipe de l'algorithme

Duda et Hart suggèrent un algorithme très rapide pour extraire les frontières d'un objet [26 ℄.

L'in onvénient deleur algorithmeprovient dufait quelesuiveur de ontourne prendque4dire tions

(dire tions0,2,4,6,du odedeFreeman).Autrementdit,ilexplore4voisinsdupixeldedépart.Ainsi

les pixels reliés à l'objetselon les dire tions diagonales sont ignorés. Onlui préfère don l'algorithme

de RosenfeldetKak,qui utilise uneexploration à8 voisinsdans lesenstrigonométrique [27 ℄.

Le prin ipe est le suivant : supposons que l'on onnaisse un point de ontour et la dire tion

ou-rantedu ontour en e point. La re her he du point suivant onsiste en unbalayage des 8 voisins du

point ourant. Le balayage estee tué de l'extérieur vers l'intérieur de l'objet. Le premier voisin qui

(19)

y

x

7

0

1

2

3

4

5

6 Codage des

directions

point courant

avec direction=4

5

4

3

2 Dans cet exemple, on

s’arrete a la direction 5

(premier pixel trouve

appartenant a l’objet).

pixel de l’objet

sens de poursuite

Figure 1.7Poursuite de ontours dansune image binaire.

joint les deux points ontours. En examinant tous les as de gure possibles, on onstate qu'il sut

d'explorerun se teurlimité à dire tion ourante -2jusqu'àdire tion ourante +4.

Pour a élérer l'exé ution du programme de suivi de ontours, les dire tions à tester et les

om-posantes de ve teurs de translation (qui permettent de passer d'un pixel au suivant, onnaissant la

dire tion ourante) sontregroupéesdans destableaux(Tab.1.1).

Table 1.1 Coordonnées

(v

x

, v

y

)

des ve teurs de translation et Dire tions à explorer en fon tion de

ladire tion ourante Dire tion ourante 0 1 2 3 4 5 6 7

v

x

1 1 0 -1 -1 -1 0 1

v

y

0 -1 -1 -1 0 1 1 1 6 7 0 1 2 3 4 5 Dire tions 7 0 1 2 3 4 5 6 àexplorer 0 1 2 3 4 5 6 7 1 2 3 4 5 6 7 0 2 3 4 5 6 7 0 1 3 4 5 6 7 0 1 2 4 5 6 7 0 1 2 3

Unexemple d'appli ation pour l'extra tiondeslèvres d'unvisage estmontré Fig.1.8.

Choix du point initial pour la pousuite des ontours La détermination du point de départ

pour la poursuite des ontours est simple quand on n'a qu'un seul objet binaire onnexe. Mais un

masquede lèvresest onstituépratiquementde deuxobjets:leslèvresetl'intérieurde labou he.Par

onséquent deux points initiaux,au moins, sont né essaires:l'un pour déte ter le ontourexterne, et

l'autre pour déte terle ontour de l'intérieur de labou he ( ontourinterne deslèvres).

Onee tuela déte tion de ontour externe en partant dupoint initial (

x

moy

,

y

1

). Ce point est le

point de ontour externe de la lèvre supérieure situé sur l'axe verti al médian des lèvres. Partant de

y

min

danslesens roissantdes

y

, epointestrapidementlo alisé:ils'agitdupremierpointappartenant

(20)

Figure 1.8Déte tion des ontours deslèvrespar l'algorithmedeRosenfeldetKakave deuxpoints

initiaux. Enhaut :masques binaires delèvres;en bas: ontours extraits.

départestxéeà 6(sensde re her hedu point initial)pour assurerledémarragedelapoursuitedans

lesens trigonométrique.

y1

y4

y2

y3

y

x

xmoy

sens de recherche

de y1 et y2.

sens de recherche

de y4 et y3

Figure 1.9Les 4pointsinitiaux andidats

On her he de même un point initial du ontour interne de la lèvre supérieure situé sur l'axe

verti al médian. L'algorithme d'initialisation re her he, en partant de

y

1

dans lesens roissant des

y

(versl'intérieurdelabou he),lepoint limitedumasque ommepointinitial.Onobtient alorslepoint

(

x

moy

,

y

2

),(Fig.1.9). Dans e as, ladire tioninitiale estxée à2.

NB:Onpeutaussibienutiliser le ouplede pointsinitiaux

y

3

et

y

4

.

1.8 Morphologie mathématique

1.8.1 Introdu tion

Lamorphologiquemathématique on ernedestransformationsgéométriquesnonlinéaires(ltrage

nonlinéaire).Elleestbaséesurlathéoriedesensembles.Onappliqueàl'image unélément stru turant

E

. Onpeut faire une analogie ave le ltrage linéaire :

E

orrespond au masque de oe ients d'un

ltre.L'opérationmorphologique orrespondà une onvolution. Lesopérationsde basesontl'érosion,

ladilatation,l'ouvertureetlafermeture.Ondistinguelamorphologie binaire,s'appliquantauximages

en N&B,etlamorphologie pour imagesà NdG.

Leprin ipegénéral onsisteà omparerles objetsd'uneimageave unobjetderéféren ede forme

et detailledonnéesqu'on appelleélément stru turant. Cetypedeltrageestre ommandé dansle as

(21)

trous etadou irles angles.L'élément stru turant

E

translaté en haque site

s

de l'image est noté

E

s

.

La Fig.1.10montre deséléments stru turants lassiques.

Figure 1.10 Eléments stru turants : a) roix 4- onnexe b) arré 8- onnexe ) traits pivotés

(

×

=indiérent)

Tout l'enjeu de la morphologie mathématique repose évidemment sur le bon hoix de l'élément

stru turant, en fon tion duproblème àrésoudre.

1.8.2 Opérations binaires (images N&B)

L'érosion

⊖

s'obtient en onsidérant l'interse tion (in lusion) de l'objet

X

ave l'élément

stru -turant

E

:

X

_{⊖ E = X ∩ E = {s|E}

s

⊆ X}

(1.33)

La dilatation

⊕

s'obtient en onsidérant l'union de l'objetave l'élément stru turant :

X

⊕ E = X ∪ E = {s|E

s

∩ X 6= ∅}

(1.34)

L'ouverture

◦

est lasu essionérosionpuis dilatation (roll inside) :

X

◦ E = (X ⊖ E) ⊕ E

(1.35)

La fermeture

•

estla su essiondilatation puisérosion(`roll outside') f.Fig. 1.11:

X

_{• E = (X ⊕ E) ⊖ E}

(1.36)

(22)

1.8.3 Propriétés

Ladilatation est ommutative etasso iative.

L'érosionetladilatation sont invariantesen translation:

X

s

⊕ E = (X ⊕ E)

s

(1.37)

X

s

⊖ E = (X ⊖ E)

s

(1.38) Croissan e:

X

⊆ Y ⇒











X

_{⊕ E ⊆ Y ⊕ E}

X

_{⊖ E ⊆ Y ⊖ E}

X

• E ⊂ Y • E

X

_{◦ E ⊂ Y ◦ E}

(1.39) Distributivité:

(X

∪ Y ) ⊕ E = (X ⊕ E) ∪ (Y ⊕ E)

(1.40)

X

_{⊕ (D ∪ E) = (X ⊕ D) ∪ (X ⊕ E)}

(1.41)

X

_{⊖ (D ∪ E) = (X ⊖ D) ∩ (X ⊖ E)}

(1.42)

(X

_{∩ Y ) ⊖ E = (X ⊖ E) ∩ (Y ⊖ E)}

(1.43) (1.44) Itérativité:

(X

_{⊕ D) ⊕ E = X ⊕ (D ⊕ E)}

(1.45)

(X

⊖ D) ⊖ E = X ⊖ (D ⊕ E)

(1.46)

Complémentarité(Dualité entrefond etforme) :

le omplémentaire de l'ensemble

X

étant dénipar :

X

c

₌

_{{s|s /}

_{∈ X}}

,ona :

(X

_{⊖ E)}

c

= X

c

_{⊕ E}

(1.47)

(X

• E)

c

= X

c

◦ E

(1.48)

(X

◦ E)

c

= X

c

• E

(1.49) Extensivitéetanti-extensivité :

X

_{◦ E ⊂ X ⊂ X • E}

(1.50) Idempoten e:

(X

_{• E) • E = X • E}

(1.51)

(X

_{◦ E) ◦ E = X ◦ E}

(1.52) 1.8.4 Autres opérations

L'opérationTout-ou-Rien (Hit or Miss)

⊘

s'obtient à l'aided'unélément stru turant plusgénéral

E = (E

1 , E

2 )

omposéd'une forme

E

1

etd'unfond

E

2

.

X

_{⊘ E = (X ⊖ E}

1 )

∩ (X

c

⊖ E

2 ) = (X

⊖ E

1 )

− (X ⊕ E

2 )

(1.53)

Cet ensemblereprésente tous lespointsoù,simultanément,

E

1

` olle'dans

X

et

E

2

` olle'dans

X

c

.

L'extra tionde frontières

β(X)

s'obtient par diéren e entre

X

etson érodée par l'élément

stru -turant arré de laFig.1.10b.

β(X) = X

_{− (X ⊖ E)}

(1.54)

Leremplissage de région s'obtient à partirde dilatationsitérées :

(23)

où

X

est la frontière initiale et

X

0 =

{p}

un point initial intérieur à la frontière. L'union de

X

et

des

X

k

représente le résultat duremplissage. L'élément stru turant habituellement utilisé est la roix

(Fig. 1.10a).

L'extra tionde omposants onnexess'obtient par :

X

k

= (X

k−1

⊕ E) ∩ X

k = 1, 2, 3, ...

(1.56)

où

X

estl'objetinitial et

X

0 =

{p}

unpoint de onnexioninitial onnu.

La oque onvexe

C

d'un objet ( onvex hull,Fig. 1.12) s'obtient par itérations de tout-ou-rien, à

l'aide dequatreéléments stru turants pivotés

E

i

ave

i = 1, 2, 3, 4

(Fig.1.10 ):

X

_k

i

= (X

_k−1

i

_{⊘ E}

i

)

∪ X

i = 1, 2, 3, 4

k = 1, 2, 3, ...

X

0 i

= X

(1.57)

C =

4 [

i=1

X

_conv

i

(1.58)

Figure 1.12 Coque onvexe

L'amin issement

⊗

enlève despointsà lafrontièrede

X

:

X

_{⊗ E = X − (X ⊘ E) = X ∩ (X ⊘ E)}

c

(1.59)

L'épaississement

⊙

ajoute à

X

despointsde lafrontièrede

X

c

:

X

_{⊙ E = X ∪ (X ⊘ E)}

(1.60)

Lasquelettisations'obtient par amin issements répétés:

S = X

_{⊗ {E} = ...((((X ⊗ E}

1 )

⊗ E

2 )

⊗ E

3 )

⊗ E

4 )

⊗ E

1 )

⊗ E

2 )...

(1.61)

Ilexistedesopérationsplus omplexes ommelataille(`pruning')quiutilisedesérosionssu essives

ave desélémentsstru turantsde plusen plus ns(tamis) permettant de lassier lesrégions.

1.8.5 Images NdG

L'érosion

⊖

donne lapluspetite valeurprise par

I

à l'intérieurde l'élément stru turant

E

s

entré

en lepixel

s

(Fig. 1.13) :

∀s, (I ⊖ E)(s) = Inf{I(p); p ∈ E

s

}

(1.62)

Ladilatation

⊕

donne laplus grandevaleur prise par

I

sur lesupportstru turant

E

s

:

∀s, (I ⊕ E)(s) = Sup{I(p); p ∈ E

s

}

(1.63)

L'ouverture

◦

etlafermeture

•

sontdénies ommeenmorphologie binaire.Intuitivement,

l'ouver-ture onsiste à suivre le prol par ledessous en montant l'élément stru turant leplus haut possible;

elarevientàé rêterlespi ssanstou herauxvallées.Demême,lafermeture onsisteàsuivreleprol

par ledessusen des endant

E

leplus baspossible; elarevient à ombler les valléessans tou heraux

pi s.

L'opération hapeau haut de forme (top hat)

H = I

− I ◦ E

permet d'exhiber les pi s de

I

. De

même, onpeutextraireles reux en soustrayant

I

− I • E

.

Lelissage peuts'obtenir par ouverture puisfermeture :

L = (I

◦ E) • E

.

(24)

Figure 1.13Erosion etdilatation enNdG

1.9 Segmentation ouleur

1.9.1 Vision des ouleurs

L'intérêt d'utiliser la ouleur en traitement d'image repose sur plusieurs onstats. D'abord, la

ouleur estundes ripteur puissant arl'÷ilhumainpeutdis ernerdesmilliers de ouleurs, alors qu'il

ne peut distinguer que quelques dizaines de niveaux de gris. Par ailleurs, la teinte est une grandeur

peusensible auxvariations d'é lairage(ombres), ontrairement à laluminan e.

Lesprin ipaux onstituantsde l'÷ilsont présentés Fig1.14 :

la ornée :prote tion, ltre

l'iris:diaphragme (variationd'unfa teur 10 ensurfa e)

le ristallin :indi e optiquevariable, fo us(déformable)

larétine: ou hede apteursphoto-sensibles(120millionsdebâtonnetset6millionsde nes).

Les nes sont sensibles aux trois ouleurs

RV B

(vision hromatique) et les bâtonnets à

l'in-tensité lumineuse

I

(visiona hromatique). La fovéa est le entre de larétine. La zone aveugle

orrespond auratta hement dunerfoptique.

lenerfoptique:transportde l'information (100000 neurones)

Figure1.14 a) Coupe horizontale de l'÷il;b) Répartition desphoto-ré epteurs surlarétine.

La vision humaine n'a pas une sensibilité égale dans tout le spe tre visible : l'énergie lumineuse

perçue par l'÷ilest fon tionde lalongueur d'onde omprise entre 400et 700nm (Fig.1.15).

1.9.2 Tri hromie

Alors que les images a hromatiques (en NdG) sont ara térisées par une seule valeur (intensité

lumineuse ou luminan e

I

), lesimages ouleurssont ara tériséespar trois omposantes[28 ℄.

On peut utiliser les trois ouleurs primaires : rouge, vert et bleu

(RV B)

, orrespondant à trois

longueursd'onde du spe trevisible :

λ

R

= 610nm

,

λ

V

= 535nm

,

λ

B

= 470nm

(Fig. 1.15).Lesautres

(25)

Figure 1.15 Courbede sensibilitéde l'÷ilen fon tion delalongueur d'onde.

Figure1.16 Synthèsedes ouleurs :a) additive;b) soustra tive

Lemodèle

RV B

esttypiquement utilisépourlaréalisation desmoniteurs et améras ouleurs.On

représentel'espa e

RV B

par un ube(Fig. 1.17a) :

Figure 1.17 a) Cube ouleur RVB;b) Pyramide ouleur TLS

Les ouleurs se ondaires yan, magenta et jaune (CMY) s'obtiennent par additivité des ouleurs

primaires :

C = V + B

(1.64)

M = R + B

(1.65)

Y = R + V

(1.66)

(26)

Un troisième modèle nommmé

Y C

r

C

b

est utilisé omme standard en TV ouleur, assurant la

ompatibilité ave la TV N&B.

Y

représente la luminan e.

C

r

, C

b

sont deux omposantes odant la

hrominan e (pardiéren es de ouleurs).Leur dénition(et leur appellation) varie selon leformat :

Y U V

pour les formatseuropéens (PAL,Se am),

Y IQ

pour leformat nord-améri ain (NTSC).





Y

U

V





=





0.3

0.59

0.11 −1.33

1.12

0.21 −0.45 −0.88 1.33





.





R

V

B





(1.67)





Y

I

Q





=





0.3

0.59

0.11

0.6 _{−0.28 −0.32}

0.21 _−0.52

0.31 



.





R

V

B





(1.68)

D'un point de vue per eption, les ara téristiques pertinentes pour distinguer les ouleurs sont

la teinte, la luminan e et la saturation. On dénit ainsi le modèle

T LS

(ou

HSI

en anglais `hue,

saturation,intensity').

T

= θ = arccos

1

2 (R

− V ) + (R − B)

p(R − V )

2 _{+ (R}

_{− B)(R − V )}

si

B < V

(1.69)

= 2π

− θ

si

B > V

(1.70)

L =

R + V + B

3

(1.71)

S = 1

₋

min (R, V, B)

L

(1.72)

Alapla e delasaturation,on peututiliserlapureté

P = S.L

,etadopter un al ulde teintebasésur

l'ar tangente(espa e

T LP

) :

T

=

π

2 − arctan

2R

− V − B

√

3(V

− B)

+ k

L =

R + V + B

3

(1.73)

P

=

R + V + B

3 − min(R, V, B)

où :

k = 0

si

V > B

et

k = π

sinon.

Ilexistedon denombreuxespa espourmodéliser l'informationde ouleur. Unbonespa e

orres-pondà un hoix de trois omposantes biendé orrélées: 'est toutl'enjeu desdiérentes transformées

ouleursproposées.Unautreproblèmeessentielestlasensibilitéaubruitdu al uldelateinte,reposant

surun al ulde rapportdediéren es.

Pour palier e problème, ertaines appro hes s'inspirent de onstatations on ernant le système

visuel humain :

lepremier traitement réalisé parl'÷il estune ompressionlogarithmique del'information qu'il

perçoit

les apteursmajoritaires au entre delafovéa sont les nes sensiblesau Retau V.

la ourbe de sensibiltéde l'÷ilest maximalepour levert.

Ces remarques onduisent à proposer des espa es ouleurs qui orent des alternatives intéressantes

pour faire de la segmentation ouleur robuste, que e soit pour des appli ations en robotique, en

visiophonieou envisio onféren e.Lesystème1.74(où

M = 256

)donne l'expressiondelatransformée

logarithmiqueLUX [29,30 ,31℄.

L = (R + 1)

0.3 (G + 1)

0.6 (B + 1)

0.1 _{− 1}

U

=







M

2 R+1

L+1

if

R < L

M

−

M

2 L+1

R+1

otherwise (1.74)

X =







M

2 B+1

L+1

if

B < L

M

₋

M

₂

_B+1

L+1

otherwise

(27)

L'eetprin ipalde ettetransforméelogarithmiqueestd'amplierle ontrastetouten

s'aran his-sant lepluspossible del'é lairage.La gure1.18montrequel'espa e

LU X

augmentele ontrastedes

omposantes hromatiques touten gardant la ohéren e desteintes(rouge, bleu).

Figure 1.18Transformées hromatiques surune image devisage.Enhaut :Les omposantes

Y

,

C

r

et

C

b

;En bas :Les omposantes

L

,

U

et

X

.

1.9.3 Segmentation ouleur

Proje tion surun axe

Pourréduirelaquantitéd'informationapportéepar la hrominan e,on peutne s'intéresserqu'àla

proje tion sur unseul desaxes.Un axeprivilégié est l'axeluminan e ar:

'estlaproje tion intrinsèque faitepar une améra vidéo N&B

elle orrespond àla omposante

L

del'espa e

T LS

elle se al ulefa ilement en faisant lamoyenne desquantités

RV B

Pour une appli ation spé ique(suivi de teintede visagepar exemple),toute autreproje tion est

possible (parexemple sur l'axerouge).

Analyse en omposantes prin ipales

Une image ouleur peut être onsidérée omme un ensemble d'é hantillons statistiques

I(i, j) =





R(i, j)

V (i, j)

B(i, j)





ara térisé par ses moments d'ordre 1 (ve teur moyenne

M =





M

R

M

V

M

B





) et d'ordre 2

(matri e de ovarian e symétrique

C =





C

RR

C

RV

C

RB

C

RV

C

V V

C

V B

C

RB

C

V B

C

BB





).

Dansle asdis ret, es grandeurs se al ulent par :

M

X

= E[X] =

1 M N

M

X

i=0

N

X

j=0

X(i, j)

(1.75)

C

XY

= E[(X

− M

X

)(Y

− M

Y

)] =

1 M N

M

X

i=0

N

X

j=0

(X(i, j)

− M

X

)(Y (i, j)

− M

Y

)

(1.76)

L'analyse en omposantes prin ipales (ACP) permet de dénir une proje tion plus intelligente.

(28)

omposante orrespondant au oe ient maximal, 'est-à-dire elle apportant le plus d'information.

Elle estbasée surle al uldesvaleurspropres etve teurspropres de

C

.

Segmentation par seuillage de la teinte

Unhistogrammede ouleurfournit unedensitédeprobabilité permettant par seuillageou ltrage,

de trouverlespixels d'unerégion spé ique, par exemple lapeau humaine.

Pour déte ter les visages, la teinte à dominante rouge est un dis riminateur satisfaisant quelle

que soit la ouleur ee tive de lapeau (la diéren e de ouleur de peau provient d'une diéren e de

saturation, 'est-à-dire dequantité de ouleur présente danslevisage).

L'espa elogarithmique

LU X

peutêtreradi alementsimpliésil'appli ationne on erneque

l'ana-lysede visage:

I =

R + V + B

3

(1.77)

H =

(

256 _·

V

_R

si

0 ≤ V < R

255

sinon (1.78)

Onutiliseuniquementlesplans ouleur

R

et

V

pourdeuxraisonsprin ipales:toutd'abordlevisage

estprin ipalement rougeet ontient peu debleu;par ailleurs, levertestsouvent utilisé entraitement

vidéo ommeune bonne approximationde laluminan e.Cette expressiona déjàsous d'autresformes

faitses preuves en robotique etvisionpar ordinateur.

Levisage,prin ipalementrouge, orresponddon àuneteintemoyennede128par ettetransformée

logarithmique. L'équation 1.81 donnela justi ationde ette armation :

I =

R + V + B

3

ave

B

∼ 0

et

I

∼ V

(1.79) d'où

R

∼ 2I ∼ 2V

(1.80) soit

H = 256

V

R

∼ 256

V

2V

∼ 128

(1.81)

La gure 1.19 montre la distribution typique de lateinte sur une image de visage entrée sur les

lèvres.Pour éliminerlemode dûaufond,prépondérant dansdes onditionsde prisede vuetélévisées,

ilsutdeltrerladistributiondeteintepar unltre entrésur128 depentesusamment dou epour

laisserune relative souplesseà l'estimation (ltregaussiende entre128, d'é arttype 128).

Pourextrairelemodedeslèvres,quisetrouvelaplupart dutemps onfonduave lemodedeteinte

de lapeau duvisage, onpro ède defaçon hiérar hique par itération du ltrage: onapplique làaussi

un ltregaussien de entre 128 maisd'é arttype plusréduit,64.

Classi ation de teinte par appro he rédibiliste

La théoriede l'éviden e, appélée aussithéorie desfon tions de royan es, estune alternative à la

théorieprobabilistebayésienne lassique.Ellepermetdetraiterdessituationsambigues,dansle asde

donnéesin omplètes oubruités, e quiestsouvent lasituation ren ontrée dansletraitement d'images

réelles.

Nous ne la détaillons pas i i, mais on peut onsulter les référen es suivantes qui illustrent son

appli ation pour la déte tion et le suivi de visage basé sur l'information de teinte hair, et où l'on

trouvera une bibliographie sur le sujet [32 , 33, 34℄. Un audioslide est également visible en ligne sur

youtube [35 ℄.

Appli ation à la supervisiondu littoral

On peut utiliser un seuillage sur la teinte bleue

U

pour segmenter l'o éan (Fig. 1.20) pour une

(29)

0

100

200

300

400

500

600

0

50

100

150

200

250

300 Nbre de pixels

Niveau de gris

Distribution de teinte

Levres

Visage

Fond

0

50

100

150

200

250

300

350

400

0

50

100

150

200

250

300 Nbre de pixels

Niveau de gris

Distribution Filtree

Levres

Visage

Figure 1.19Enhaut:imagede visage( ouleur), planteintelogarithmique orrespondant.Enbas:

distribution deteinte, distributionltrée.

a) b)

) d)

(30)

Traitement de séquen es d'images

2.1 Déte tion de mouvement

2.1.1 Introdu tion

L'analysedumouvement dansles séquen es d'images estundomaine de re her he a tif,enraison

desonimportan edansdenombreusesappli ations:télésurveillan e, ompressionpourles

télé ommu-ni ationsoul'ar hivage,diagnosti médi al,météorologie, ontlenondestru tif,robotiquemobile,et .

Ondistinguehabituellementquatrephasesenanalysedemouvement:ladéte tion(deszonesmobiles),

l'estimation (des ve teurs-vitesses, en haque pixel ou pour haque objet), la segmentation (en zones

ohérentes ausensdumouvement)etl'interprétationdehautniveau(re onnaissan edeformesfaisant

appelà l'intelligen e arti ielle). Ces quatreétapes ne sont en au un as indépendantes nifor ément

séquentielles, maisau ontraire fortement interdépendantes (notamment en e qui on erne les deux

phasesestimation-segmentation). Nousnousintéressonsi ià laphasededéte tiondumouvement des

objets mobilesdansle as d'une améra xepar rapport àlas ène observée.

2.1.2 Prin ipe

Ladéte tiondemouvement onsisteàattribuerà haquepixelousite

s = (x, y, t)

desimagesd'une

séquen e unattribut, qu'on appelle étiquette

e

s

,indiquant si lepixelappartient àun objetmobile ou

au fondxe delas ène observée :

e

s

= e(x, y, t) =

a = ”1”

si lepixelappartient àune zonemobile,

b = ”0”

si lepixelappartient aufond xe.

(2.1)

Etiqueter haque pixel

s

de l'image à l'instant

t

permetainsi d'obtenir une arte binaire des

hange-ments temporels(Fig. 2.1).

Figure2.1Enhaut :6imagesd'uneséquen eRue;Enbas:Cartesbinairesobtenuesparseuillage

entropique(pixels mobilesen blan ,

θ = 4

· σ

e

)

Enfaisant l'hypothèse d'une améra xe etd'un é lairement quasi- onstant de la s ène observée,