Combining neural-based approaches and linguistic knowledge for text recognition in multimedia documents


Academic year: 2021

Combining neural-based approaches and linguistic

knowledge for text recognition in multimedia documents

Khaoula Elagouni

Combining neural-based approaches and

linguistic knowledge for text recognition in

multimedia documents

Khaoula Elagouni


i ToMoez,toElye s, Tomy parent s,family, friend sandallt ho sewho su p portedmeduringt he se year s...

















This thesis owes its existence to the help and the support of many people.

First, I would like to express my deep gratitude to my advisors Franck Mamalet, Christophe Garcia and Pascale Sébillot for all their valuable guidance in these three last years. I enjoyed working with them and learning from them. I am particularly thankful for their large contribution during the publication stage of this work, in order to create well-structured and readable texts.

I also want to thank the members of my jury; in particular Olivier Lézoray and Bernard Mérialdo, for the time they spent reviewing my thesis manuscript, and for the valuable feedback and suggestions they provided me with. My thanks also go to Christian Viard-Gaudin for honoring me by presiding my jury, and to Emmanuel Morin for his interest to my work and his relevant questions during my PhD defense. I would like to thank the Orange Labs company, in particular Alexandre Nolle (head of the ACTSunit) and Sid-Ahmed Berrani (head of the MASteam), for giving me the opportunity to explore an interesting industrial topic. I also want to thank all the members and PhD students of the MASteam, in particular Moez, Alina, Ali and Haykel, for their cooperative spirit and the excellent working atmosphere. I really spent three very pleasant years.

I also would like to express my gratitude to everybody at TexMex research team of the IRISA Laboratory, and particularly Patrick Gros (head of TexMex) for their advices and help during these years.

Finally, I want to say thank you to my parents for their continuing support in every respect and to my Moez, and my sweet angel Elyes for their constant encouragement and love.



!" #$#%&'# (# )#*%#"+,+-.") ./+#"0#) 1 '#) 23#%-") 4#5+) 2.55#)&."6 (#"+ ,0$ )#*%#"+,+-.") 78,/'#)9,'.5) :0# '#) 5.0*#) 2.55#)&."(#"+ ,0$ )#*%#"+,+-.") 7; 5-):0#9< < < < < < < < < < < < < < < < < < < < < < < < < < $-$ = ># &5.2#))0) (# 7)2,""-"*9 %0'+-6?23#''# (# '@-%,*# (0 +#$+#1 h (?)-*"# '@3,0+#05 (# '@-%,*#< < < < < < < < < < < < < < < < < < < < < < < < < < < < $$

A B''0+5,+-." (#) ).5+-#) (0 C>DEF ,&&5-) #" 0+-'-),"+ ', GEG 1 23,:0# 2.05/# (@0"# 2.0'#05 5#&5?)#"+# '# "-4#,0 (@,2+-4,+-." (@0"# 2',))# (.""?# #+ ', 2.05/# 5.)# 2',-5# 2.55#)&."( ; ', 2',))# )0&&'?%#"+,-5#

7C>HIJ9< < < < < < < < < < < < < < < < < < < < < < < < < < < < < < < < < <

$$---K L$#%&'#) (# +#$+#) -"250)+?) (,") '#) 4-(?.) (# M.05",0$ +?'?4-)?)< < < $$-4

N L$#%&'#) (# +#$+#) (# )2O"# (# ', /,)# BGPHQ =RRA< < < < < < < < < < $$-4

< L$,%&'#) .S 72,&+-."9 THU CV ,"( 7)2#"#9 TGU PV +#$+)< < < < < < < < < A

<= L$,%&'#) .S 23,''#"*-"* +#$+)1 THV +#$+) .S (-W#5#"+ S."+) ,"( )-X#)U TCV +#$+) ." 2.%&'#$ /,2Y*5.0"() ,"( TGV +#$+) 2,&+05#( Z-+3 3,5( 2."(-+-.")< < < < < < < < < < < < < < < < < < < < < < < < < < < < < < < < < < K

=< L$,%&'#) .S +#$+ 5#2.*"-+-." +,)Y)< < < < < < < < < < < < < < < < < < < < [

=<= E#$+ 5#2.*"-+-." )+#&)< < < < < < < < < < < < < < < < < < < < < < < < < < < \

=<A G.%&,5-)." .S ).%# +35#)3.'(-"*6/,)#( /-",5-X,+-.")1 THV .5-*-",' +#$+ -%,*#)U TCVU TGV ,"( TPV ,5# 5#)&#2+-4#'] 5#)0'+) .S %#+3.() &5#)#"+#( -" ^_+)[N`U ^DDabc[` ,"( ^I-/\N` T8*05# &5.4-(#( /] ^FHd `V< < < < R

=<K H" #$,%&'# .S )#'#2+#( )##()1 THV .5-*-",' 7)2#"#9 +#$+ -%,*#U ,"( TCV +#$+ ,"( /,2Y*5.0"( )##()1 +#$+ ."#) ,5# -" /'0# ,"( /,2Y*5.0"( ."#) -" 5#( ^FHd `< < < < < < < < < < < < < < < < < < < < < < < < < < < < < < < =

=<N B''0)+5,+-." .S +#$+ &-$#' )#'#2+-."1 THV .5-*-",' +#$+ -%,*#U TCV G,""] (#+#2+.5 5#)0'+U TGV &,5,''#' #(*# '-"#) ,"( TPV )#'#2+#( +#$+ &-$#') ^efaRK`< < < < < < < < < < < < < < < < < < < < < < < < < < < < < < < < < < A =<g B''0)+5,+-." .S >- ! "#$@) %#+3.( ^>PRR`1 T V , 4-(#. S5,%# Z-+3 /'055#( '-2#")# &',+#U T=V +3# 5#)0'+) .S +3# b_GD6/,)#( )0&#565#).'0+-." TT,V6 TSV 2.55#)&."( +. +3# -%,*#) ./+,-"#( ,+ -+#5,+-.") U NU RU =RU NR ,"( RRV< < < < < < < < < < < < < < < < < < < < < < < < < < < < < < < < < < < < < K -$


❋❡♥❝❤ ✉♠♠❛②

Introduction

❆✈❡❝❧❡❞ ✈❡❧♦♣♣❡♠❡♥ ❞❡♥♦✉✈❡❛✉① ② ♠❡ ❞✬❛❝✉✐✐✐♦♥❞✬✐♠❛❣❡❡ ❧✬❛✈♥❡♠❡♥ ❞❡♥♦♠❜❡✉① ❡✈✐❝❡ ❞❡♣❛ ❛❣❡❞❡✈✐❞♦✱❧✬✐♥❞❡①❛✐♦♥❛✉♦♠❛✐✉❡❞❡❞♦❝✉♠❡♥ ♠✉❧ ✐♠❞✐❛ ❡ ❞❡✈❡♥✉❡❝✉❝✐❛❧❡♣♦✉ ❣ ❡ ❝❡ ✈❛ ❡ ❝♦❧❧❡❝✐♦♥✳ ▲✬❡♥❥❡✉ ♠❛❥❡✉ ❝♦♥✐❡ ❡① ❛✐❡❧✬✐♥❢♦♠❛ ✐♦♥♣❡✐♥❡♥❡♣❡♠❡ ❛♥ ❞❡ ✉♠❡ ❧❡❝♦♥❡♥✉❡❞❡ ❡ ♦✉✈❡ ❧❡❞♦❝✉♠❡♥ ✳ ❉✉❛♥ ❝❡ ❞❡♥✐ ❡ ❛♥♥❡✱❞❡♥♦♠❜❡✉① ❛✈❛✉① ❡ ♦♥ ❢♦❝❛❧✐ ✉ ❧❛♣♦❜❧✲ ♠❛ ✐✉❡❞❡❧✬✐♥❞❡①❛✐♦♥❞✬✐♠❛❣❡❡ ❞❡✈✐❞♦ ❢♦♥❞❡ ✉ ❧✬❛♥❛❧②❡❛✉♦♠❛✐✉❡❞❡ ❝♦♥❡♥✉ ♠✉❧ ✐♠❞✐❛✳ ❈❡❛✐♥ ♣♦♣♦❡♥❞❡❞❝✐❡❧❡❝♦♥❡♥✉❛✉ ♠♦②❡♥❞✬✐♠❛❣❡✲ ❝❧ ❬❈❩❑❆✵✷❪✱❡♥❡❜❛❛♥ ✉ ❧❛❝❧❛✐✜❝❛✐♦♥❞✬✈♥❡♠❡♥ ❬❙❲✵✺❪✱❡♥♦♣❛♥♣♦✉ ❧❛❞ ❡❝✐♦♥❞✬♦❜❥❡ ❝♦♥✐❞ ❞❡❤❛✉ ♥✐✈❡❛✉ ♠❛♥ ✐✉❡❬▼❇ ▲▼✵✽❪✱✈♦✐❡❡♥✐♥✲ ❣❛♥ ❧❛ ❛♥❝✐♣✐♦♥❞❡❧❛♣❛♦❧❡♣♦♥♦♥❝❡❬❈❩❑❆✵✷❪✭❞❛♥❧❡❝❛❞❡❧❛✈✐❞♦✮✳ ❉✬❛✉ ❡♦♣❡♥♣♦✉ ❧❛♣✐❡❡♥❝♦♠♣❡❞❡ ❡①❡♣ ❡♥ ❞❛♥ ❧❡❞♦❝✉♠❡♥ ♠✉❧✲ ✐♠❞✐❛❝♦♠♠❡♥♦✉✈❡❛✉ ♠♦②❡♥❞✬❛❝❝ ❧❛ ♠❛♥ ✐✉❡❞❡ ❝♦♥❡♥✉ ❬▲❙✾✻❪✳ ❈✬❡ ❞❛♥ ❝❡❝♦♥❡①❡ ✉❡ ➆✐♥❝✐✈❡♥♥♦ ❛✈❛✉①❞❡ ❤ ❡ ✉✐ ❡❢♦❝❛❧✐❡♥ ✉ ❧❛♣♦❜❧✲ ♠❛ ✐✉❡❞❡❧❛ ❡❝♦♥♥❛✐ ❛♥❝❡❛✉♦♠❛✐✉❡❞❡ ❡①❡❞❛♥ ❧❡❞♦❝✉♠❡♥ ♠✉❧ ✐♠❞✐❛✳ ❈❡ ✐♥ ❡ ❥✉✐✜♣❛ ❧❡❢❛✐ ✉❡❝❡ ❡①❡✖ ✉✐♣❡✉✈❡♥ ❝♦ ❡♣♦♥❞❡ ❞❡ ✐❡ ❞❡ ❡♣♦ ❛❣❡✱ ❞❡ ♥♦♠ ❞❡♣❡ ♦♥♥❡ ♦✉❞❡✈✐❧❧❡✱❡❝✳✖ ❡♣ ❡♥❡♥ ❞❡ ✐♥❞✐❝❡ ♠❛♥ ✐✉❡ ❢♦ ❡ ❢♦✉♥✐ ❡♥ ❞❡ ❧♠❡♥ ✐♠♣♦❛♥ ♣♦✉ ❞❡♥♦♠❜❡✉❡ ❛♣♣❧✐✲ ❝❛✐♦♥ ❡❧❧❡ ✉❡❧✬✐♥❞❡①❛✐♦♥❡❧❛❡❝❤❡❝❤❡❞❡ ✐♠❛❣❡❡ ❞❡ ✈✐❞♦✱❧✬❛❝❤✐✈❛❣❡❡ ❧❡❝❤❛♣✐❛❣❡❞✉✢✉①❚❱✱❧❡ ❜✐❜❧✐♦❤ ✉❡ ♥✉♠ ✐✉❡✱❧❛✈✐✐♦♥♦❜♦✐✉❡✱❡❝✳❈❡ ❡ ❡① ❛❝✐♦♥❞✬✐♥❞✐❝❡ ❡①✉❡❧ ♥❝❡ ✐❡❝❡♣❡♥❞❛♥❞❡ ② ♠❡ ♦❜✉ ❡ ❧❛✈❛✐❛❜✐❧✐ ❞❡ ②❧❡ ❡ ❞❡ ❛✐❧❧❡ ❞❡ ❝❛❛❝ ❡✱ ❧❛❢❛✐❜❧❡ ♦❧✉✐♦♥✱ ❧❛❝♦♠♣❧❡①✐ ❞✉❢♦♥❞✱ ❛✉①❝♦♥❞✐✐♦♥❞✬❛❝✉✐✐✐♦♥❞✐✣❝✐❧❡✱❡❝✳ ❉❛♥ ❝❡ ❡❤ ❡✱♥♦✉♣♦♣♦♦♥❞❡ ② ♠❡ ❝♦♠♣❧❡ ❞✬❖❈❘✭❖♣✐❝❛❧❈❤❛❛❝❡ ❘❡❝♦❣♥✐✐♦♥✮♣❝✐✜✉❡♠❡♥❛❞❛♣ ❛✉①✐♠❛❣❡❡❛✉①✈✐❞♦❡ ✉✐ ✬❛♣♣❧✐✉❡♥❛✉ ✐ ❜✐❡♥❛✉① ❡①❡✐♥❝✉ ✭❛❥♦✉ ❛ ✐✜❝✐❡❧❧❡♠❡♥❞❛♥ ❧❡✐♠❛❣❡♦✉❧❡✈✐❞♦✮✉✬❛✉① ❡①❡ ❞❡ ❝♥❡✭❛❝✉✐ ♥✬✐♠♣♦ ❡♦❀✉ ❞❡ ❛✣❝❤❡✱❞❡♠✉ ♦✉❞❡ ♣❛♥♥❡❛✉①❡ ✉✐♣❡✉✈❡♥ ❛✈♦✐ ❞❡ ❢♦♥❡ ❡① ♠❡♠❡♥ ✈❛✐❛❜❧❡❡ ❡♣✐❞❛♥ ❞❡ ❝♦♥❞✐✐♦♥ ❛ ❡③❝♦♠♣❧❡①❡✮✳ ❉❡✉① ②♣❡ ❞✬❛♣♣♦❝❤❡✱❡♥✉✐❧✐❛♥ ❡ ❡♥ ✈✐❛♥ ❧✬❛♣❡❞❡❧❛ ❡❣♠❡♥❛✐♦♥❡♥❝❛❛❝ ❡✱♦♥ ❝♦♥✉ ❡ ✉❞✐ ♦✉ ❡♥ ♠❡ ❛♥ ❡♥ ✈✐❞❡♥❝❡❧❡ ①✈✐✐


!""" !"#$% &'(()!* #!#$%#&'( '% )'( )"*"%'( +' ,'%%' -%#.'/

0'%%' %12(' '(% 34&#$"(-' ,3**' (5"%/ 6.42( #!3"4 .4-('$%- $3%4' .4'*"24' #.7 .43,1' 83$+-' (54 5$' ('&*'$%#%"3$ #+#.%-' 9 )# *34.13)3&"' )3,#)' +'( "*#&'( +' %' %'( +#$( )# (',%"3$ :/;< +'5 #5%4'( *-%13+'( =5" (' .#(('$% +' ,'%%' -%#.' (3$% +-,4"%'( +#$( )'( (',%"3$(:/> '%:/?/ 6)34( =5' )# .4'*"24' #..43,1' '(% 83$+-' (54 5$ .43,'((5( +' @(,#$$"$&A *5)%"7-,1'))' '% 5$ *3+2)' +' &4#.1'< )# +'5 "2*' (B#..5"' (54 5$' $35!'))' 4'.4-('$%#%"3$ +'( "*#&'( +' %' %'( '% (54 5$ *3+2)' +' ,)#(("C7 ,#%"3$ ,3$$' "3$$"(%'/ D3( %43"( (E(%2*'( +BF0G (3$% '$(5"%' %'(%-( '% -!#)5-( (54 +'5 H#('( +' %' %'(I '$ )B3,,544'$,' 5$' H#(' +' %' %'( "$,45(%-( '% 5$' H#(' +' %' %'( +' (,2$'/ J'( 4-(5)%#%( +' ,'( ' .-4"*'$%#%"3$( (3$% 8354$"( '% +"(,5%-( +#$( )# (',%"3$ :/K/ L$C$< )# (',%"3$ :/M ,3$,)5% ,'%%' -%5+' '% *'% '$ -!"+'$,' $3( %4#!#5 85%54(/

L'approche fondée sur la segmentation

0+34+-5%56(-6C$ +' 4',3$$#"%4' )'( %' %'( .4-('$%( +#$( )'( +3,5*'$%( *5)%"*-+"#< $35( .437 .3(3$( 5$' .4'*"24' #..43,1' =5" ,3$("(%' 9 ('&*'$%'4 )'( "*#&'( +' %' %'( .354 3H%'$"4 +'( 4-&"3$( ,3$%'$#$% +'( ,#4#,%24'( "$+"!"+5')( #!#$% +B'$%#*'4 )'54 4',3$7 $#"((#$,'/ 03$%4#"4'*'$% #5 *-%13+'( +' )B-%#% +' )B#4%< $3%4' #..43,1' +-C$"% +'( ('&*'$%#%"3$( $3$7)"$-#"4'( C#H)'( '% .4-,"('(/ F5%4' )# 43H5(%'((' +' )# *-%13+' +' 4',3$$#"((#$,' +' ,#4#,%24'( 83$+-' (54 5$' #..43,1' +' ,)#(("C,#%"3$ $'543$#)'< $3%4' (',3$+' ,3$%4"H5%"3$ .4"$,".#)' 4-("+' +#$( )B"$%43+5,%"3$ +B5$ *3+' +' (5.'47 !"("3$ 4'.3(#$% (54 5$ *3+2)' +' )#$&5'/ N5 =5' )# ('&*'$%#%"3$ +' )B"*#&' +' %' %'( '$ ,#4#,%24'( '(% 5$ .3"$% ,45,"#) .354 )# 4',3$$#"((#$,' O%35%' '44'54 4-+5"% '$ 'P'% +"4',%'*'$% )'( .'4834*#$,'( +' )BF0GQ< $35( $35( (3**'( +3$, "$%-4'((-( 9 *'%%4' '$ R5!4' 5$' *-%13+' ('&*'$%#%"3$ C#H)' =5" .'4*'% +' (-.#4'4 )'( ,#4#,%24'( %35% '$ (B#+#.%#$% 9 )# *34.13)3&"' )3,#)' +' )B"*#&'/ S354 ,' 8#"4'< $35( ,3**'$T3$( .#4 )B#$#)E(' (%#%"(%"=5' +B"$%'$("%-( +'( "*#&'( +' %' %'( O=5B3$ ,3*H"$' 9 "$%-&4#%"3$ *5)%"7%'*.34'))'< +#$( )' ,#( +' )# !"+-'Q +#$( )' H5% +' +"(,4"*"$'4 '$%4' )# ,)#((' @%' %'A '% )# ,)#((' @83$+A/ U$' ,#4%' V35' +' +'&4-( +B#..#4%'$#$,' 9 )# ,)#((' @%' %'A '(% #"$(" &-$-4-'/ L$ 5%")"(#$% ,'%%' ,#4%'< $35( +-%'4*"$3$( '$(5"%' )'( (-.#4#%"3$( '$%4' )'( ,#4#,%24'( ,3**' +'( ,1'*"$( %4#!'4(#$% )' 83$+ '% =5" ,35.'$% )B"*#&' +5 %' %' !'4%",#)'*'$%/ 0'( ,1'*"$( (3$% ,#),5)-( #!', 5$ #)&34"%1*' +5 .)5( ,354% ,1'*"$ (.-,"C=5'*'$% #+#.%- 9 $3%4' #..)",#%"3$/ JB"$%-4W% +' ,'%%' #..43,1' +' ('&*'$%#%"3$ 4-("+' +#$( (# ,#.#,"%-9 8354$"4 +'( (-.#4#%"3$( .4-,"('( '% #+#.%-'( ,#.#,"%-9 )# *34.13)3&"' +'( ,#4#,%24'(/ S#4 #"))'54(< $35( +"(%"$&53$( '$%4' +'5 %E.'( +' ('&*'$%#%"3$( X +'( ('&*'$%#%"3$( +"%'( @C#H)'(A '% +3$% 3$ '(% (Y4 '% +'( ('&*'$%#%"3$( +"%'( @9 4"(=5'A =5" (3$% +35%'5('( '% =5" ('43$% 4'*"('( '$ =5'(%"3$ .#4 )# (5"%'/ 03**' )' *3$%4' )# C&54' Z< ,'( ('&*'$%#%"3$( @9 4"(=5'A .'5!'$% ,344'(.3$+4' 9 +'( (547('&*'$%#%"3$( O%'))'( =5' )' ,#( +5 @4AQ 35 9 +'( ('&*'$%#%"3$( +' ,#4#,%24'( #%%#,1-( 9 5$ 83$+ ,3*.)' ' O%'))'( =5' )' ,#( +5 @4%AQ/


French Summary

!" #$%&&'()*+ ,%-,

,+./+-0%01(-!"#$ %&# $'()# *)#+"#) ,-,(.+# /0123 )#*',# ,&) &$# +4(5'/# ,#6+#$(7("'$ *)48",# 8798&97$( /#, ,4*7)7("'$, $'$:9"$47")#, #$()# 9#, 87)78(.)#,; 9#, *#)<')+7$8#, /# 8# ,-,(.+# )#,(#$( <7"=9#, /7$, 9# 87, /#, "+76#, *)4,#$(7$( /0"+*')(7$(#, /",('),"'$,> 2# <7"( *#&( ?()# # *9"%&4 *7) 904(7*# /# 97 ,#6+#$(7("'$ %&"; /7$, 9# 87, /# 8#, "+76#,; *)'/&"( /# $'+=)#&,#, ,'&,: #( ,&):,#6+#$(7("'$,; 8'$/&",7$( @ /#, #))#&), /# )#8'$$7",,7$8#>

A'&) )#+4/"#) @ 8#((# 9"+"(#; $'&, *)'*','$, &$# /#& ".+# 7**)'85# %&" ,# *7,,# /# 904(7*# /# 97 ,#6+#$(7("'$ #$ "$(46)7$( &$ *)'8#,,&, /# ,87$$"$6 +&9(":485#99# *#): +#((7$( /# )#8'$$7"()# 9#, 87)78(.)#, @ 9#&) *)'*)# *',"("'$ #( 485#99# /")#8(#+#$( @ *7)(") /# 90"+76# /& (# (#> B0"/4# #,( /0&("9",#) %&7()# <#$?()#, 69",,7$(#, /# (7"99#, /"<: <4)#$(#, C*)'*')("'$$#99#, @ 97 57&(#&) /# 90"+76#D %&" ,'$( /4*9784, @ ()7E#), 90"+76# /7$, 9# =&( /07E'") 7& +'"$, &$# <#$?()# %&" ,#)7 ="#$ 79"6$4# 7E#8 857%&# 87)78(.)#> B7 F6&)# G "99&,()# 8# *)'8#,,&,> A'&) 8'&E)") ('&, 9#, 87)78(.)#, #( ="#$ 9#, 87/)#); $'&, *)'*','$, 7&,," /07/7*(#) 9#, =')/, E#)("87& /#, <#$?()#, @ 97 +')*5'9'6"# 9': 879# /#, "+76#,> H"$,"; /#, =')/, $'$:9"$47")#, C8798&94, /# +7$".)# ,"+"97")# @ 8#99# /#, ,#6+#$(7("'$, $'$:9"$47")#, /# 907**)'85# <'$/4# ,&) 97 ,#6+#$(7("'$ *)4,#$(4# #$ ,#8("'$ I>GD ,'$( 7(()"=&4, @ 857%&# <#$?()# 69",,7$(# /7$, 90"+76#>

J"6&)# GK B# *)'8#,,&, /# L,87$$"$6M +&9(":485#99# /# 90"+76# /& (# (#K h /4,"6$# 9057&(#&) /# 90"+76#>

2'++# 9# +'$()# 97 F6&)# G; 907**9"87("'$ /# /& *)'8#,,&, /# ,87$$"$6 +&9(": 485#99# 7& "+76#, /# (# (#, 64$.)# /# $'+=)#&,#, <#$?()#, %&" *#&E#$( 8'))#,*'$/)# @ /#, 87)78(.)#, "$/"E"/&#9, ="#$ 8#$()4, '& @ /#, "+76#, /# 87)78(.)#, $'$:E79"/#,


✵✳✹✳ ▲✬❆ ❘❖❈❍❊❘➱❈❯❘❘❊◆❚❊❈❖◆◆❊❳■❖◆◆■❙❚❊ ①①✐ ✭❡❧ ✉❡❞❡ ♣❛ ✐❡❞❡❝❛❛❝ ❡✱❞❡❝❛❛❝ ❡ ♠❛❧✲❛❧✐❣♥ ♦✉❞❡ ❡♣❛❝❡ ✐♥❡✲ ❝❛❛❝ ❡✮✳ ❯♥❡ ❛♣❡❞❡❝❧❛ ✐✜❝❛✐♦♥❡ ❛✐♥✐♥❝❡ ❛✐❡♣♦✉ ✐❞❡♥✐✜❡❧❡❝♦♥❡♥✉ ❞❡❝❡ ❢❡♥ ❡✳ ❉❛♥❝❡❝♦♥❡①❡✱♥♦✉ ♣♦♣♦♦♥ ✉♥❡❝❧❛ ✐✜❝❛✐♦♥❤✐❛❝❤✐✉❡ ✉✐ ❞❜✉❡♣❛ ✉♥❡♣❤❛❡❞❡ ✐♣♦✉❞✐ ✐♥❣✉❡❧❡❢❡♥ ❡ ❝♦♥❡♥❛♥ ❞❡ ❝❛❛❝ ❡ ✏✈❛❧✐❞❡✑❞✉❡ ❡✱❡ ✉✐❡♥✉✐❡❛♥❛❧②❡❝❡ ❢❡♥ ❡ ❧❡❝✐♦♥♥ ❛✜♥❞❡ ❡❝♦♥♥❛✐ ❡ ❧❡✉ ❝❛❛❝ ❡✳ ♦✉ ❝❡❝✐✱♥♦✉ ♥♦✉ ❜❛♦♥ ✉ ❧❛❝♦♠❜✐♥❛✐♦♥❞❡❞❡✉① ❡❛✉① ❞❡♥❡✉♦♥❡ ❝♦♥✈♦❧✉✐♦♥✭❛②❛♥❞❡ ❛❝❤✐❡❝✉❡ ✐♠✐❧❛✐❡ ❝❡❧✉✐✉✐❧✐ ♣♦✉ ❧❛ ❡❝♦♥♥❛✐ ❛♥❝❡❞❡ ❝❛❛❝ ❡ ❞❛♥ ❧✬❛♣♣♦❝❤❡❢♦♥❞❡ ✉ ❧❛❡❣♠❡♥❛✐♦♥♣ ❡♥ ❡ ❡♥ ❡❝✐♦♥✵✳✷✮❞♦♥❧❡ ❧❡ ❡♣❡❝✐❢ ♦♥ ❧❡ ✐❞❡❢❡♥ ❡ ❡ ❧❛❡❝♦♥♥❛✐ ❛♥❝❡❞❡ ❝❛❛❝ ❡✳ ❆♣ ❛✈♦✐ ❝❛♥♥❧❡✐♠❛❣❡❞❡ ❡①❡❡❝❧❛ ❧❡❢❡♥ ❡❣❧✐ ❛♥❡✱❧❛♣♦❝❤❛✐♥❡ ❛♣❡❡ ❞✬❛♥❛❧②❡❝❡ ✉❧❛ ❞❡❝❧❛ ✐✜❝❛✐♦♥♣♦✉ ❡❝♦♥♥❛✐ ❡❧❡ ❡①❡♣ ❡♥ ❞❛♥ ❧❡✐♠❛❣❡✳ ♦✉ ❝❡ ❡ ❝❤❡✱♥♦✉ ♦♣♦♥ ♣♦✉ ✉♥ ♠♦❞❧❡❞❡❣❛♣❤❡♣❡♠❡✲ ❛♥ ❞❡ ❡♣ ❡♥❡ ❧❡❝♦♥ ❛✐♥❡ ♣❛✐❛❧❡❡♥ ❡❧❡ ❞✐✛ ❡♥❡ ❢❡♥ ❡✳ ♦✉ ❧❛ ❝♦♥ ✉❝✐♦♥❞❡❝❡❣❛♣❤❡✱♥♦✉ ❡♣ ❡♥♦♥ ❧❡❜♦❞ ❞❡ ♦✉❡ ❧❡❢❡♥ ❡ ✉❧✲ ❛♥❡ ♣❛ ❞❡ ♥ ✉❞ ❝♦♥♥❡❝ ♣❛ ❞❡ ❛❝ ❝❤❛❝✉♥ ❡♣ ❡♥❛♥ ✉♥❡❢❡♥ ❡✳ ❊♥ ❛ ✐❜✉❛♥❧❡ ✉❧❛ ❞❡❧❛❝❧❛ ✐✜❝❛✐♦♥❛✉①❛❝✱♦✉❡❧❡❝♦♠❜✐♥❛✐♦♥ ♣♦ ✐❜❧❡ ❞❡❢❡♥ ❡ ♦♥ ❡ ❡ ❡ ✈❛❧✉ ❛✜♥❞❡ ❡❝♦♥♥❛✐ ❡❧❡ ❡①❡♣ ❡♥ ❞❛♥ ❧✬✐♠❛❣❡✳ ❯♥❛❧❣♦✐❤♠❡❞❡❱✐❡❜✐❡ ❛✐♥✐❛♣♣❧✐✉ ❞❛♥ ❧❡❣❛♣❤❡♣♦✉ ❞ ❡♠✐♥❡ ❧❡❝❤❡♠✐♥ ❧❡♣❧✉♣♦❜❛❜❧❡✭✈✐❛♥❧❡❛❝❝♦ ❡♣♦♥❞❛♥ ❞❡ ❢❡♥ ❡❝♦♥❡♥❛♥❞❡❝❛❛❝ ❡ ♥♦♥✲✈❛❧✐❞❡✮❡❞♦♥❝♦❜❡♥✐ ❧❛ ✉❡♥❝❡❞❡❝❛❛❝ ❡ ✭✐✳❡✳✱❧❡❡①❡✮ ❡❝♦♥♥✉❡✳ ❉❛♥ ❝❡ ❡❛♣♣♦❝❤❡✱♥♦✉ ♣♦♣♦♦♥ ❛✉ ✐❞✬✐♥♦❞✉✐❡❝❡ ❛✐♥❡ ❝♦♥♥❛✐ ❛♥❝❡ ❧✐♥❣✉✐✐✉❡ ♣♦✉ ♣❡♥❞❡❡♥❝♦♥✐❞❛✐♦♥❧❡❝♦♥❡①❡❧❡①✐❝❛❧❞❡ ♠♦ ❡ ❧❡✈❡ ✉❡❧✉❡ ❛♠❜✐❣✉ ❞❡❧❛❝❧❛ ✐✜❝❛✐♦♥✭♥♦❛♠♠❡♥❧❡❝❛❞❡❝❡ ❛✐♥❡ ❢❡♥ ❡♠❛❧✲ ❛❧✐❣♥❡❛✈❡❝✉♥❝❛❛❝ ❡ ✉✐ ♦♥❝♦♥❢♦♥❞✉❡❛✈❡❝❞✬❛✉ ❡❝❧❛ ❡❞❡❝❛❛❝ ❡ ❡❧❧❡ ✉❡✉♥❡♣❛ ✐❡❞✬✉♥✏❲✑❝♦♥❢♦♥❞✉❡❛✈❡❝✉♥✏❱✑♦✉✉♥✏◆✑✮✳ ♦✉❝❡ ❡❛♣♣♦❝❤❡✱♥♦✉ ♥♦✉ ❡♣♦♦♥ ❛✉ ✐✉ ✉♥♠♦❞❧❡❞❡❧❛♥❣✉❡♥✲❣❛♠♠❡ ❝❛❛❝ ❡❡♥♦✉ ✐♥❣♦♥ ❧❡♣♦❜❛❜✐❧✐ ❡ ✐♠ ♣❛ ❝❡❞❡♥✐❡ ❞❛♥ ♥♦ ❡❣❛♣❤❡✳❈❡ ♣♦❜❛❜✐❧✐ ♣❡♠❡ ❡♥ ❛✐♥✐❞❡♣✐❧♦❡❧❡♣♦❝❡ ✉ ❞❡❧❛ ❡❝♦♥♥❛✐ ❛♥❝❡ ♦✉ ❡♥♣♦♥❞ ❛♥❧❡ ❛♥✐✐♦♥❡♥✲ ❡❧❡ ❛❝ ❞✉❣❛♣❤❡✳▲❡ ❡①❡❡❝♦♥♥✉❡ ❞♦♥❝♦❜❡♥✉❡♥♣❡♥❛♥❡♥❝♦♠♣❡❞❡✉① ✐♥❢♦♠❛ ✐♦♥❝♦♠♣❧♠❡♥ ❛✐❡❀ ❛✈♦✐ ❧❡ ✉❧❛ ❞❡❧❛❝❧❛ ✐✜❝❛✐♦♥❡❧❡❝♦♥❡①❡ ❧❡①✐❝❛❧✳ ❈❡ ❡❛♣♣♦❝❤❡❡ ✈❛❧✉❡❛✉ ✐✉ ❞❡ ❡①❡ ✐♥❝✉ ❡❞❡ ❡①❡❞❡ ❝♥❡❡ ❡ ♣❡❢♦♠❛♥❝❡ ❞❡ ❡❝♦♥♥❛✐ ❛♥❝❡ ♦♥ ❝♦♠♣❛ ❡ ❝❡❧❧❡ ❞❡❧✬❛♣♣♦❝❤❡❢♦♥❞❡ ✉ ❧❛❡❣♠❡♥❛✐♦♥✳▲❛❡❝✐♦♥✵✳✺ ❛♣♣♦ ❡❧❡ ♣✐♥❝✐♣❛✉① ✉❧❛ ♦❜❡♥✉ ❡ ♦✉❧✐❣♥❡ ❧✬✐♥ ❡ ❧❡❧✐♠✐❡ ❞❡ ❡♣❛ ❡ ❞❡❧❛♣❤❛❡❞❡ ❡❣♠❡♥❛✐♦♥✳

✳✹ ▲

✬❛♣♣♦❝❤❡ ❝✉ ❡♥❡❝♦♥♥❡①


✐ ❡

❊♥✐♥ ❣❛♥ ✉♥♣♦❝❡ ✉ ❞❡✏❝❛♥♥✐♥❣✑ ♠✉❧✐✲❝❤❡❧❧❡❡ ❡♥✉✐❧✐❛♥ ✉♥ ♠♦❞❧❡❞❡ ❣❛♣❤❡✱♥♦ ❡❡❝♦♥❞❡❛♣♣♦❝❤❡♣♦✉✈❡ ✉✬✐❧❡ ♣♦ ✐❜❧❡❞✬✈✐❡❧❛♣❤❛❡❝✉❝✐❛❧❡❞❡❧❛ ❡❣♠❡♥❛✐♦♥✉✐♣❡✉ ❞✉✐❡❧❡♣❡❢♦♠❛♥❝❡ ❞❡ ❡❝♦♥♥❛✐ ❛♥❝❡✱❡♥♣❛ ✐❝✉❧✐❡❞❛♥


!! !"#$% &'(()!* "# $%& '#& (# (#& '# &$)*#+ ,-%*./!*&0 "% 12!*$!1%"# 3%!4"#&&# '# $# &5&().# '#.#62# "% $/.1"# !(- '6 72%18# 96! *-$#&&!(# '# (#&(#2 6* 72%*' */.42# '# $/.4!*%!&/*& '# 3#*:(2#& %;%*( '</4(#*!2 "# (# (# 2#$/**6+

,/(2# (2/!&!).# %112/$8# 12/1/&# %!*&! 6* */6;#%6 ./5#* 1/62 &# 1%&&#2 '# "% &#7.#*(%(!/* #( -;!(#2 "% $/.1"# !(- '6 ./')"# '# 72%18#+ =#((# .-(8/'# /1)2# #* '#6 18%&#& > (/6( '<%4/2' #* 7-*-2%*( 6*# 2#12-&#*(%(!/* /2!7!*%"# '#& !.%7#& '# (# (#& 3/*'-# &62 '#& &-96#*$#& '# $%2%$(-2!&(!96#& %112!&#&0 #*&6!(# #* 6(!"!&%*( 6* ./')"# $/**# !/**!&(# 2-$622#*( &1-$!?96# $%1%4"# '# $"%&&#2 $#& $%2%$(-2!&(!96#& 12#*%*( #* $/.1(# "#62 '-1#*'%*$# (#.1/2#""#+

@%*& $#((# %112/$8#0 "#& !.%7#& '# (# (#& &/*( (/6( '<%4/2' &$%**-#& A '!B-2#*(#& -$8#""#& #* 6(!"!&%*( "# .:.# 12/$#&&6& '# C&$%**!*7D '-?*! 1/62 "<%112/$8# 12-$-E '#*(# F;/!2 &#$(!/*G+HI+ J#& 3#*:(2#& 2-&6"(%*(#& &/*( #*&6!(# #.1"/5-#& 1/62 12/'6!2# 6*# 2#12-&#*(%(!/* 1#2(!*#*(# '#& !.%7#& '# (# (#&+ =/*(2%!2#.#*( A "% .%K/2!(- '#& .-(8/'#& '# "<-(%( '# "<%2( 96! /1(#*( 1/62 '#& 2#12-&#*(%(!/*& 3/*'-#& &62 '#& $%2E %$(-2!&(!96#& $/*L6#& .%*6#""#.#*(0 */6& 12/1/&/*& '# 2#12-&#*(#2 $8%$6*# '# $#& 3#*:(2#& 1%2 6* #*&#.4"# '# $%2%$(-2!&(!96#& %112!&#& 1%2 6* ./')"# *#62/*%"#M#* "</$$622#*$# 6* 2-&#%6 '# *#62/*#& A $/*;/"6(!/*&+ J<!'-# $/*&!&(# A #*(2%!*#2 6* 2-&#%6 '# *#62/*#& A 2#$/**%!(2# '#& !.%7#& '# $%2%$()2#& #( 6*# 3/!& "<%112#*(!&&%7# #&( (#2.!*-0 6(!"!&#2 "<%;%*(E'#2*!)2# $/6$8# '6 2-&#%6 $/..# 6* # (2%$(#62 '# $%2E %$(-2!&(!96#&+ N51!96#.#*(0 '%*& */(2# (2%;%!" $8%96# 3#*:(2# 7"!&&%*(# #&( 12-&#*(-# %6 2-&#%6 %112!& 1/62 2-$61-2#2 "#& %$(!;%(!/*& '# "% '#2*!)2# $/6$8# 7-*-2%*( %!*&! 6* ;#$(#62 '# $%2%$(-2!&(!96#&+ J<#*&#.4"# '#& ;#$(#62& /4(#*6&0 1/62 6*# !.%7# '# (# (# '/**-#0 #&( #*&6!(# 2%&&#.4"- #* 6*# &-96#*$# '# ;#$(#62& $/*&(!(6%*( 6*# 2#12-&#*(%(!/* .6"(!E-$8#""# '# "<!.%7#+

@%*& "# 46( '# 2#$/**%!(2# "#& (# (#& 12-&#*(& '%*& "#& !.%7#&0 "% 12/$8%!*# -(%1# #&( '<%*%"5&#2 "#& 2#12-&#*(%(!/*& /4(#*6#& #( $"%&&#2 "#& ;#$(#62& '#& $%2%$(-2!&(!96#& %112!&#&+ O/62 $# 3%!2#0 */6& $8/!&!&&/*& '<6(!"!&#2 6* 2-&#%6 '# *#62/*#& 2-$622#*(& 1%2(!$6"!#20 "# !"!#$%&!'()* *'(+,-.'#& &$#/ /$/'#0 FPJQNRI0 %5%*( '#& $/**# !/*& 2-$622#*(#& "6! $/*3-2%*( 6*# .-./!2# !*(#2*# #( "# 2#*'%*( %!*&! $%1%4"# '# 2-&/6'2# '#& 12/4").#& '# $"%&&!?$%(!/* '# &-96#*$#& '# '/**-#&+ S6(2# &% $%1%$!(- A 7-2#2 "% '-1#*'%*$# #*(2# "#& -"-.#*(& &6$$#&&!3& '<6*# &-96#*$#0 "# PJQNR /B2# "<%;%*(%7# '# 12#*'2# #* $/.1(# %6&&! 4!#* "# $/*(# (# 1%&&- 96# "# $/*(# (# 36(62 "/2& '# "% $"%&&!?E $%(!/*+ ,-%*./!*&0 $# ./')"# *-$#&&!(# 6*# /1-2%(!/* '# &#7.#*(%(!/* 1/62 12-$!&#2 "% 1/&!(!/* # %$(# '# $8%96# $%2%$()2# '%*& "% &-96#*$# '# $%2%$(-2!&(!96#& '<#*(2-#+ T6 96# */(2# %112/$8# ;!&# A &# 1%&&#2 '# (/6(# &#7.#*(%(!/*0 */6& !*(-72/*&0 '%*& */(2# 2-&#%6 PJQNR0 6*# $/6$8# &1-$!?96#0 %11#"-# $"%&&!?$%(!/* (#.1/2#""# $/*E *# !/**!&(# F=N=I0 !*(2/'6!(# 1%2 U2%;#& $& )*1 VUJW+GXY #( 1#2.#((%*( '<-(#*'2#

"<%11"!$%(!/* '<6* 2-&#%6 '# *#62/*#& 2-$622#*(& %6 $%& '#& '/**-#& */* &#7.#*(-#&+ Z* #B#(0 "% =N= 1#2.#( '# $2-#2 "# "!#* #*(2# "% &-96#*$# '# &/2(!# '<6* PJQNR #( "% &-96#*$# $!4"# '# $%2%$()2#& #* !*(2/'6!&%*( 6*# $"%&&# &611"-.#*(%!2#0 %11#"-# PJ[,\0 96! &#2% %$(!;-# #*(2# '#6 $%2%$()2#&+ ]*# 3/!& "<%112#*(!&&%7# #B#$(6-0 !" #&( *-$#&&%!2# '<!*(#212-(#2 "#& &/2(!#& '6 PJQNR 1/62 #* '-'6!2# "% &-96#*$# '#&


✵✳✺✳ ❘➱❙❯▲❚❆❚❙❊❳ ➱❘■▼❊◆❚❆❯❳ ①①✐✐✐ ❝❛❛❝ ❡ ❡❝♦♥♥✉❡✳ ❈❡❡ ❛♣❡♣♦ ❡❧❡♥♦♠❞❡❞❝♦❞❛❣❡✳▲❛✜❣✉❡✸♠♦♥ ❡✉♥ ❡①❡♠♣❧❡❞❡ ❡①❡ ❡❝♦♥♥✉❡♥❞❝♦❞❛♥❧❡ ✉❡♥❝❡ ❞❡ ♦ ✐❡❞✉ ❡❛✉✳ ❋✐❣✉❡✸✿■❧❧✉ ❛✐♦♥❞❡ ♦ ✐❡❞✉❇▲❙❚▼❛♣♣✐❡♥✉✐❧✐❛♥❧❛❈❚❈✿❝❤❛✉❡❝♦✉❜❡ ❞✬✉♥❡❝♦✉❧❡✉ ❡♣ ❡♥❡❧❡♥✐✈❡❛✉❞✬❛❝✐✈❛✐♦♥❞✬✉♥❡❝❧❛❡❞♦♥♥❡❡ ❧❛❝♦✉❜❡ ♦❡ ❝❧❛✐❡❝♦ ❡♣♦♥❞ ❧❛❝❧❛❡ ✉♣♣❧♠❡♥ ❛✐❡✏❇▲❆◆❑✑✳

✳✺ ❘ ✉

❧❛ ❡①♣ ✐♠❡♥❛✉①

❈❡ ❡❡❝✐♦♥♣ ❡♥❡♥♦♣✐♥❝✐♣❛❧❡❡①♣ ✐♠❡♥❛✐♦♥❡❧❡✉ ✉❧❛ ✳❊❧❧❡❞❜✉❡ ♣❛ ✉♥❡❞❡❝✐♣✐♦♥❜✈❡❞❡ ❜❛❡ ✉✐❧✐❡ ❞❛♥ ❝❡ ❡ ✉❞❡✱❡♥❧✬♦❝❝✉ ❡♥❝❡✉♥❡ ❜❛❡❞❡❡①❡✐♥❝✉ ❞❛♥ ❞❡ ✈✐❞♦ ❡❧❧❡❞❡❥♦✉♥❛✉① ❧✈✐ ❡❢❛♥❛✐ ❡✉♥❡ ❜❛❡♣✉❜❧✐✉❡❞❡ ❡①❡ ❞❡ ❝♥❡✭❧❛❜❛❡■❈❉❆❘✷✵✵✸✮✳ ❊♥ ✉✐❡✱♥♦✉ ♣ ❡♥♦♥ ❧✬✈❛❧✉❛✐♦♥❞❡♥♦ ♦✐ ❛♣♣♦❝❤❡ ❞❡ ❡❝♦♥♥❛✐ ❛♥❝❡❞❡ ❡①❡ ❛❧✐ ❡ ✉ ❝❡ ❞❡✉① ❜❛❡ ❡ ♥♦✉ ❞✐❝✉♦♥ ❧❡♣✐♥❝✐♣❛✉① ✉❧❛ ✳


Données expérimentales


◆♦ ❡①♣ ✐♠❡♥❛✐♦♥ ♦♥ ❡✛❡❝✉❡ ✉ ❞❡✉① ②♣❡ ❞❡ ❡①❡ ❡♣ ❡♥ ❞❛♥ ❞❡✉① ❜❛❡ ✿ •❯♥❡❜❛❡❞❡ ❡①❡ ✐♥❝✉ ❞❛♥ ❞❡ ✈✐❞♦ ❞❡❥♦✉♥❛✉① ❧✈✐ ❢❛♥❛✐ ✿ ❝❡ ❡❜❛❡❝♦♠♣♦ ❡❞❡ ❡①❡ ❛ ❡③✈❛✐❛❜❧❡❡♥ ❛✐❧❧❡ ✭❞❡8 24♣✐①❡❧ ❞❡ ❤❛✉❡✉✮✱❝♦✉❧❡✉ ✱ ②❧❡ ❡❢♦♥❞✭❢♦♥❞✉♥✐❢♦♠❡ ♦✉♣❧✉ ❝♦♠♣❧❡①❡✮✳ ◆♦♦♥ ✉❡✱♣♦✉ ❝❡ ❡❜❛❡✱❛✈❛♥❞✬❛♣♣❧✐✉❡ ♥♦ ② ♠❡ ❞✬❖❈❘✱♥♦✉ ❛✈♦♥ ♠✐ ❡♥ ♣❧❛❝❡✉♥❡❝❤❛✐♥❡❛✉♦♠❛✐✉❡❞❡ ❛✐❡♠❡♥ ✉✐♣❡♠❡ ❞❡❞ ❡❝❡❡❞✬❡① ❛✐❡ ❧❡ ❡①❡ ✐♥❝✉ ❞❛♥ ❧❡✈✐❞♦✳


①①✐✈ ❋❘❊◆❈❍❙❯▼▼❆❘❨ •❯♥❡❜❛❡♣✉❜❧✐✉❡❞❡ ❡①❡ ❞❡ ❝♥❡✱■❈❉❆❘✷✵✵✸✿ ❝❡ ❡❜❛❡❝♦♠♣♦ ❡ ❞❡ ✐♠❛❣❡❞❡ ❡①❡ ❛✐✐❡♥✬✐♠♣♦ ❡♦✉❞❛♥❧✬❡♥✈✐♦♥♥❡♠❡♥ ❞❛♥ ❞❡ ❝♦♥❞✐✲ ✐♦♥❛ ❡③❞✐✣❝✐❧❡✭❢❛✐❜❧❡ ♦❧✉✐♦♥✱✐❧❧✉♠✐♥❛✐♦♥♥♦♥✉♥✐❢♦♠❡ ✱❡♥♣ ❡♥❝❡ ❞✬♦♠❜❡❡❞❡ ❡✢❡ ✱❡❝✳✮✳▲❡ ❡①❡❞❡❝❡ ❡❜❛❡♦♥❡① ♠❡♠❡♥ ✈❛✐❛❜❧❡ ❡ ♣❡✉✈❡♥ ❡✐♠♣✐♠✱❝✐ ♦✉ ♠♠❡❞❡ ✐♥✳ ▲❡ ✜❣✉❡ ✹❡✺♠♦♥ ❡♥ ✉❡❧✉❡ ❡①❡♠♣❧❡ ❞✬✐♠❛❣❡ ❞❡ ❡①❡ ❡① ❛✐❡ ❞❡❝❡ ❞❡✉①❜❛❡✳ ❋✐❣✉❡✹✿❊①❡♠♣❧❡ ❞❡ ❡①❡ ✐♥❝✉ ❞❛♥ ❧❡✈✐❞♦ ❞❡❥♦✉♥❛✉① ❧✈✐ ✳ ❋✐❣✉❡✺✿❊①❡♠♣❧❡ ❞❡ ❡①❡ ❞❡ ❝♥❡❞❡❧❛❜❛❡■❈❉❆❘✷✵✵✸✳



Performance des approches proposées

◆♦ ♦✐ ② ♠❡ ❞✬❖❈❘♦♥ ❡ ❡ ✈❛❧✉ ✉ ❧❡❞❡✉①❜❛❡ ♣ ❡♥ ❡ ❝✐✲❞❡ ✉✳


!"! #$%&'()(% *+,$#-.*/()&+ ! "# $%&'&()#% ') *+)&#, *-#.$, /, /0%,*%&-# ,% ($&!& /, %, %,( /)#( ',( !&/0-(1 /, #-234,$(,( , 504&2,#%)%&-#( -#% 0%0 ,6,*%$0,( 5-$4 0!)'$,4 #-( )554-*+,( ,% *-27 5)4,4 ',$4( 5,48-42)#*,( 9 *,'', /,( 20%+-/,( , &(%)#%,( ,% /, *,4%)&#( 2-%,$4( /:;<= *-22,4*&)$ 1 ,# ':-**$44,#*, >??@@A&#,=,)/,4 ;<= ,% B,((,4)*% ;<=C

D,( 40($'%)%( -3%,#$( -#% 2-#%40( E$, %-$%,( #-( )554-*+,( -3%&,##,#% /,( 3-##,( 5,48-42)#*,( ($4 *,%%, 3)(, )!,* /,( (*-4,( /, %)$ /, 4,*-##)&(()#*, *)4)*%F4,( ($504&,$4( 9 90%C "# 5)4%&*$'&,41 ',( (*-4,( G95% ,% 88% /, %)$ /, 4,*-##)&(()#*, *)4)*%F4, ,% %)$ /, 4,*-##)&(()#*, 2-%H )**-25'&( 5)4 ') 20%+-/, 8-#/0, ($4 ') (,I2,#%)%&-# 54-$!,#% E$, '-4(E$, ':0%)5, /, (,I2,#%)%&-# 8-#*%&-##, 3&,#1 ,'', 5,47 2,% $#, 4,*-##)&(()#*, 540*&(, ,% )&#(& $#, )20'&-4)%&-# /,( 40($'%)%(C D:)554-*+, *-##, &-##&(%, ) 0I)',2,#% 40)'&(0 $#, , *,'',#%, 5,48-42)#*, )!,* $# %)$ /, 4,*-#7 #)&(()#*, *)4)*%F4, /, 97.35% ,% $# %)$ /, 4,*-##)&(()#*, 2-% /, 87, 20% G*, %)$ &#804&,$4 9 *,'$& )%%,&#% 5)4 ':;<= 8-#/0 ($4 ') (,I2,#%)%&-# 5,$% J%4, , 5'&E$0 5)4 ', 2)#E$, /,( *,4%)&#( ,(5)*,( ,#%4, ',( 2-%(1 *, E$& *-#/$&% 9 /,( ,44,$4( /, /,$ 2-%( *-#(0*$%&8(HC <,( 40($'%)%( 2,%%,#% ,# 0!&/,#*, ') *-#%4&3$%&-# /,( 4,540(,#%)%&-#( 3)(0,( ',( *)4)*%04&(%&E$,( )554&(,( ,% /02-#%4, ') I4)#/, *)5)*&%0 /, ') 20%+-/, 54-7 5-(0, 9 I04,4 ',( /05,#/)#*,( ,#%4, ',( !,*%,$4( /, *)4)*%04&(%&E$,( %-$% ,# 0!&%)#% ':0%)5, /, ') (,I2,#%)%&-#C

"# *, E$& *-#*,4#, ') *-25)4)&(-# )!,* ',( (K(%F2,( /:;<= *-22,4*&)$ 1 %-$%,( #-( 20%+-/,( -#% )%%,&#% /,( 40($'%)%( 3&,# 2,&'',$4( E$, *,$ /$ 2-%,$4 B,((,4)*% ;<= G)!,* 5'$( /, +10% /, %)$ /, 4,*-##)&(()#*, 2-%HC L-%4, )554-*+, 8-#/0, ($4 ') (,I2,#%)%&-# ,% *,'', *-##, &-##&(%, 40)'&(,#% /,( 5,48-42)#*,( (&2&')&4,( 9 *,'', /, >??@@ A&#,=,)/,4 ;<= )!,* $#, /&604,#*, /, 4,(5,*%&!,2,#% +0, 13% ,% −0, 50% /, 2-%( *-44,*%,2,#% 4,*-##$(C <,5,#/)#%1 ':)554-*+, ()#( (,I2,#%)%&-# -3%&,#% $# %)$ /, 4,*-##)&(()#*, 5'$( 8)&3', E$, >??@@ A&#,=,)/,4 ;<= G)!,* −6% /, %)$ /, 4,*-##)&(()#*, 2-%HC <, 40($'%)% 5,$% J%4, , 5'&E$0 5)4 ') *-25', &%0 /$ 2-/F', /, I4)5+, E$& 54-/$&% /,( ,(5)*,( 2)#E$)#%( *-#/$&()#% 9 /,( ,44,$4( /, 4,*-##)&(()#*, /, 2-%(C

D,( %4-&( )554-*+,( 54-5-(0,( -#% 0%0 0I)',2,#% 0!)'$0,( ($4 ') 3)(, /, %, %, /, (*F#,C D,( %,(%( 40)'&(0( -#% 2-#%40 E$, ') 20%+-/, 8-#/0, ($4 ') (,I2,#%)%&-# 5,42,% /:-3%,#&4 /,( 5,48-42)#*,( (&2&')&4,( 9 *,'',( /,( 20%+-/,( (%)%,7-87%+,7)4%1 %)#/&( E$, ':;<= ()#( (,I2,#%)%&-# )%%,&#% /,( 40($'%)%( E$& /05)((, ',( )$%4,( 20%+-/,( , &(%)#%,( G,#!&4-# 47% /, %)$ /, 4,*-##)&(()#*, 2-%( *-44,(5-#/)#% 9 70% /, %)$ /, 4,*-##)&(()#*, *)4)*%F4,(HC <,') 54-$!, ':)55-4% /, (, 5)((,4 /, ':0%)5, /, (,I2,#%)%&-# ,% 2,% ,# 0!&/,#*, (,( '&2&%,( M %-$%, ,44,$4 /, (,I2,#%)%&-# /&2&#$, /&4,*%,2,#% ',( 5,48-42)#*,( /, 4,*-##)&(()#*, /$ (K(%F2,C "# ,6,%1 /)#( ', *)( 5)4%&*$'&,4 /,( %, %,( /, (*F#,1 ',( &25-4%)#%,( /&(%-4(&-#( 540(,#%,( /)#( ',( &2)I,( 4,#/,#% ') (,I2,#%)%&-# 5)4%&*$'&F4,2,#% /&N*&', 2,#)#% 9 /,( ,44,$4( /, ($47 ,% (-$(7 (,I2,#%)%&-#( E$& 40/$&(,#% *-#(&/04)3',2,#% ',( 5,48-42)#*,( /, 4,*-##)&(()#*,C

<-#*,4#)#% ':)554-*+, *-##, &-##&(%,1 ',( %,(%( ,6,*%$0( -#% 2-#%40 E$,1 3&,# E$, *,%%, 20%+-/, ,(% *)5)3', /:)%%,&#/4, /, 3-#( (*-4,( ($4 ':,#(,23', /:)554,#%&(()I, G98% /, %)$ /, 4,*-##)&(()#*, *)4)*%F4,H1 #0)#2-&#( ,'', -3%&,#% /, 2-&#( 3-##,(


xxvi FRENCH SUMMARY performances sur l'ensemble de test (seulement 56% de taux de reconnaissance car-actère). Nous pouvons expliquer ce fait par un problème sur-apprentissage, proba-blement parce que l'ensemble de données d'apprentissage ne comprend pas assez de variabilité dans le contexte passé et futur de chaque lettre. Ce résultat peut également être justié par l'absence d'un modèle de langage dans cette approche.

Les performances de nos méthodes sur cette base de textes de scène ont été aussi comparées à celles de deux moteurs d'OCR commerciaux, ABBYYFineReader OCR et Tesseract OCR. Les tests réalisés ont montré que toutes nos méthodes obtiennent des résultats meilleurs que ceux des systèmes commerciaux. Cela prouve que, bien que les systèmes OCR commerciaux puissent réaliser des résultats satisfaisants sur les textes incrustés, nos systèmes se distinguent par leur grande capacité à gérer à la fois les textes incrustés et les textes de scène.














Dans cette thèse, nous avons élaboré trois approches complètes de reconnaissance de textes dans les documents multimédia. Outre leur capacité à traiter aussi bien les textes incrustés que les textes de scène, nos méthodes conçoivent de nouveaux moyens pour entamer les diérentes étapes de la reconnaissance et proposent des solutions originales pour entamer de nombreuses dicultés rencontrés par les méthodes de la littérature.

Une première contribution de ce travail réside dans la dénition de segmentations non linéaires entre les caractères qui s'adaptent à la morphologie locale des images. Ces segmentations permettent ainsi de séparer les caractères de manière précise fa-vorisant une meilleure reconnaissance. Nous avons aussi prouvé qu'il est possible de se passer de l'étape de segmentation en intégrant un processus de scanning multi-échelle et un modèle de graphe. Dans ce travail, une représentation originale des im-ages de textes fondée sur des caractéristiques apprises par un modèle neuronale a été proposée. Cette représentation a été utilisé pour alimenter un modèle de classication connexionniste particulier qui en combinant un réseau de neurones récurrent spécial et une classication connexionniste permet de gérer la dépendance des caractèris-tiques apprises et ainsi reconnaitre le texte sans aucune phase de segmentation. Par ailleurs, à travers nos expérimentations nous avons montré l'intérêt de l'intégration des modèles de langues dans nos approches et mis en évidence leur apport en terme de performance.

Comme perspectives d'extention de ce travail, nous pouvons distinguer des trois types de perspectives :

• Des perspectives directes qui constituent une continuité de nos travaux et peu-vent améliorer les performances de nos approches: parmi ces approches, nous citons l'intégration d'un modèle de langue dans l'approche connexioniste qui permetra ainsi introduire le contexte lexical des mots et réduire les erreurs.


Figure 3.4: Examples of character images of the CharDatasetI.
Figure 4.2:Steps of the proposed character segmentation:parts with dotted lines concern only video texts.
Figure 6.9: Computation of the geometrical hand-crafted features.


