• Aucun résultat trouvé

Méthodes statistiques de sélection de modèles neuronaux ; applications financières et bancaires

N/A
N/A
Protected

Academic year: 2021

Partager "Méthodes statistiques de sélection de modèles neuronaux ; applications financières et bancaires"

Copied!
159
0
0

Texte intégral

(1)Méthodes statistiques de sélection de modèles neuronaux ; applications financières et bancaires Hervé Stoppiglia. To cite this version: Hervé Stoppiglia. Méthodes statistiques de sélection de modèles neuronaux ; applications financières et bancaires. Modélisation et simulation. ESPCI ParisTECH, 1997. Français. �tel-00005624�. HAL Id: tel-00005624 https://pastel.archives-ouvertes.fr/tel-00005624 Submitted on 13 Jul 2004. HAL is a multi-disciplinary open access archive for the deposit and dissemination of scientific research documents, whether they are published or not. The documents may come from teaching and research institutions in France or abroad, or from public or private research centers.. L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau recherche, publiés ou non, émanant des établissements d’enseignement et de recherche français ou étrangers, des laboratoires publics ou privés..

(2) Introduction. . INTRODUCTION 

(3) 

(4)     

(5)       

(6)         

(7)            

(8)  

(9)   

(10)           

(11)     

(12) .              

(13)      

(14)   

(15) 

(16)      

(17)                   .      

(18)    

(19)    

(20)    ∑

(21)  

(22)      

(23)       .  

(24)                

(25) .     

(26)     

(27)  .   . ∑

(28)           

(29)    

(30)  

(31) .   !    

(32) 

(33) 

(34)  .            

(35)      

(36)  

(37)      

(38)     

(39)   . " 

(40)  

(41)        

(42)      

(43)              # 

(44)       

(45)  

(46)   

(47) 

(48)  

(49) .    $ 

(50) 

(51)                   

(52)   

(53) .   .               

(54)    ∑.   

(55)              

(56)          

(57)   

(58)   

(59)

(60) .   

(61) !  

(62)      

(63)           %      .      

(64)   "     

(65)    

(66)  .         

(67)   

(68)   

(69)  

(70)    

(71)

(72)   . ∑.  

(73)   

(74)  

(75)  

(76)        

(77)         &          

(78)      

(79)  

(80)       

(81)     

(82)       

(83)  

(84)  

(85)   

(86)  ' 

(87)      "    

(88)       

(89) " 

(90)       ( (

(91)     

(92)         "   

(93)    

(94) 

(95)  

(96)  . ∑       

(97)

(98)      

(99)   

(100)   

(101)   %.            

(102)         

(103)     

(104)    )      

(105)         

(106)         

(107)  .  

(108)         

(109)   *  

(110)    

(111)  .

(112) Introduction.      +        

(113)

(114)  

(115)  

(116)   

(117)   )  

(118)  ,

(119)    

(120)      

(121)        

(122) 

(123)           

(124)       

(125) 

(126)     

(127)       

(128)     %  ,    

(129)    

(130)   -  

(131)  )

(132)  &.  )    & /        

(133)    

(134) 

(135)  

(136)    

(137)    .      

(138) 0  

(139) 1*)-       

(140) .

(141)     

(142)

(143)  

(144)   )      2     

(145) 

(146)  

(147)       

(148)        -   )&)  3

(149)        

(150)   *  

(151)   

(152)     4     

(153)              

(154)  

(155)  

(156)         5        

(157)    

(158)

(159)   

(160) .   

(161)      

(162) 

(163)     

(164)   )      

(165)        6   

(166) .    

(167) $4  

(168)    

(169)

(170) 

(171) $4      

(172)   

(173)    * 

(174)     

(175) 

(176) .       

(177)      

(178)   

(179)     

(180)  

(181)     

(182) $4       

(183)   

(184)    

(185)        

(186)

(187)   

(188)      5         

(189)   

(190)      

(191)

(192) 

(193)    7     

(194)         

(195)  .   8   9    

(196)     *                     "  

(197)     . /          

(198)  

(199)      :      

(200)   

(201)   -

(202)     

(203)   

(204)    5  

(205)      

(206)   

(207)         

(208)   

(209)  + 5       

(210)    

(211)   "   . 

(212)  

(213)     

(214)          

(215)         

(216)  

(217)     ;     

(218) 

(219)  

(220) 

(221)       " 

(222)      

(223) 

(224)                    &              

(225)  

(226) 

(227)  

(228) 

(229)                    

(230)   

(231)  

(232)           

(233)    

(234)  

(235)   

(236)         )  

(237)        

(238)

(239)  

(240) /         

(241)  

(242)   .

(243) Introduction. !.      2      

(244)    

(245)     -   )&) 8 4   

(246)        

(247)    9     

(248)       

(249) 

(250)  

(251) 

(252)        

(253)    

(254)  &   

(255)  4   

(256)       

(257) 

(258)      . 

(259)  3<<; =    

(260)       

(261) 

(262)     .    $  ) .    

(263)    

(264)  

(265)    

(266) >     .

(267)  + %  

(268)  

(269)      .      

(270)

(271)   

(272)   

(273)   .  $ %    

(274)          

(275)  

(276)  4        

(277)   .  ) ?  

(278)   (-

(279)     > @(       

(280)       

(281) 

(282)   .  & .              ?1-*)A,<B 8   1  *    )    9 %    . 

(283)   

(284)

(285)   

(286)  .  

(287) 

(288) 

(289)  

(290)       

(291)           

(292)    

(293)  +  

(294) 

(295)   .  C.

(296) 

(297)  

(298)    . 1.. QU'EST-CE QUE LA CLASSIFICATION ? Résumé. Nous présentons ce qu'est un problème de classification. Dans certains cas, il est possible de décrire complètement, de manière linguistique, la démarche de classification ; dans ce cas, un algorithme reproduisant cette démarche peut être construit, et le problème est résolu. Dans d'autres cas, il est impossible de décrire précisément la classification ; une solution consiste alors à demander à un professeur (ou superviseur, expert) de classer un échantillon d'individus. Des méthodes de résolution qui "apprennent par l'exemple" (ici un exemple est un individu déjà classé par le superviseur) sont capables de reproduire la classification de l'expert et, ensuite, de classer automatiquement de nouveaux exemples inconnus. Ces dernières méthodes sont donc essentiellement statistiques ; c'est à elles que nous nous intéresserons dans ce mémoire. Nous posons également une question très importante en classification, et, plus généralement, dans tout problème de modélisation statistique : celle du choix des variables descriptives pertinentes (dont la connaissance est susceptible de contribuer utilement à la solution du problème posé) parmi un ensemble de variables descriptives possibles. 1.1. Introduction.     

(299)  

(300)                

(301)      

(302)  

(303)  

(304)        

(305)   

(306) 

(307) 

(308)         

(309) .    

(310)         

(311) 

(312)     . ∑ !   

(313)          

(314)  

(315) 

(316) 

(317)  

(318)    

(319)    

(320)    

(321)    

(322)  "

(323) 

(324)    

(325)     #$ classes        $  %   variables descriptives 

(326)   &  

(327)          

(328)   

(329) 

(330) chiffre     ∑ !       

(331)              & 

(332)   

(333)     

(334) 

(335)   

(336)        

(337)  '     individus          variables descriptives        (  

(338)          )

(339)  

(340)      

(341) 

(342)  classes 

(343)    *  

(344)  

(345)  

(346)       . Dans ce contexte, les statisticiens utilisent fréquemment le terme de , et réservent le terme de classification au cas où les classes ne sont pas définies à l'avance ; nous conserverons néanmoins ici la dénomination consacrée par l'usage dans le domaine des réseaux de neurones..

(347) 

(348)  

(349)    . . "

(350) 

(351) *   

(352)       

(353)   

(354)  

(355) .  

(356)        

(357)         '    

(358)    

(359)   

(360) 

(361)   

(362)   individus    

(363)  

(364)  

(365) 

(366) 

(367)     variables descriptives        

(368)     +  , *  

(369)  classes   

(370)     

(371)     '              

(372)              

(373)   -. 

(374)   

(375)         

(376)   

(377)      *    . 

(378)               

(379)           

(380)     

(381)      

(382)     

(383)           

(384) *          ∑. 1.2. Chaîne de reconnaissance de formes. !       

(385)  

(386)            /

(387)  

(388)  0  

(389)      1     " %23 4 

(390) *             

(391)    ∑

(392)

(393)  

(394)   

(395)  

(396)     

(397)  

(398)             

(399)   

(400)          ∑

(401)

(402)   -    

(403)  & 

(404) 

(405)      

(406)  

(407)  

(408)   

(409)  

(410)              

(411)  

(412)   &   a priori 

(413)      "         

(414) 

(415)  

(416)  

(417) 

(418)         

(419)     

(420)       4   

(421) 

(422)   .    

(423)   

(424)  

(425)      ∑ 

(426) 

(427)      

(428)         

(429)     5            

(430)    

(431)           --    

(432)     

(433)         

(434)   

(435)   

(436)     

(437)   (        ∑

(438)

(439)                        

(440) - 

(441)       

(442)  

(443)    

(444)       

(445)     

(446) 

(447)    

(448)       

(449)   

(450)     6$7         8 9 

(451)  ## 

(452) 

(453)  0       

(454) 

(455) 

(456)      :  

(457)    

(458)       

(459)     )

(460)    

(461)    

(462)    

(463)   -   5              

(464)    

(465)     

(466) .

(467) 

(468)  

(469)    . 1 représentation de l'objet. . ère. Objet Capteurs. 2 représentation de l'objet ème. Pré-traitement. Classification. Classe. 

(470)    

(471)    . 9 (        

(472)   

(473)   

(474)            "    

(475)        

(476)  

(477)   

(478) . 

(479)     

(480)        

(481)       

(482)               

(483)      ; 

(484)  

(485) 

(486)      

(487)      

(488)         

(489) -  

(490)        

(491)     

(492)   1.3. Formalisation mathématique d’un problème de classification. 9        0    

(493)  ( 

(494)          

(495) individus  

(496)     variables descriptives 

(497)     

(498) classes   a priori <

(499)      

(500) 

(501)              

(502)   ∑

(503)   

(504)   N  

(505)  I  i    #  N ∑ P   X  

(506)         

(507)  5    

(508)   

(509)      

(510)  d    #  P ∑ C  C   

(511)        

(512)  k    #  C =

(513) 

(514)        

(515) 

(516)                         9  

(517)   

(518)  

(519)       classifieur 9          

(520)    

(521)            

(522)  

(523)  

(524)   

(525)   &  

(526)  

(527) -       i. i. d. k. 1.4. Un premier exemple. )

(528)  

(529)  

(530)            

(531)   

(532)           > 

(533)  /       

(534)        

(535)   

(536)       ?   

(537) 

(538)  

(539)       

(540)  '        

(541)  /   

(542)   population    

(543)  individu 

(544)     9 classes   

(545)   % "  8  "  8$  "  8 @ "  #$  "  # @ "  #$ @ "  A$  "  A @ "  A$ @.

(546) . 

(547)  

(548)    . : 

(549)  &    

(550)     

(551)   

(552)    

(553) 

(554)  B 9     

(555)  

(556)     '  C

(557)  "  .

(558) 

(559)  D

(560)     

(561)  D  E  E       

(562)  ;

(563)        

(564)    *    .

(565)  

(566)         >  

(567)  

(568)   &        

(569)      '     

(570) ?  

(571)      

(572)             

(573)  

(574)  >   

(575)   

(576)      /     

(577) 

(578)       &  ?   

(579)    ?

(580)  

(581)    '      F 

(582)               @ 

(583)     F   8  @ 

(584)  *  F   #$   @ 

(585)  G     F   A$ @ )   

(586)   

(587) ?

(588)    

(589)  ?

(590)    

(591)       

(592) -&

(593)    H  

(594)  H    

(595)  

(596)      F    :    

(597)  

(598) 

(599)      

(600)  

(601)     

(602)  

(603)   

(604)          

(605)       '         

(606)   &       / 

(607) ?

(608)  

(609)   

(610)            

(611)   

(612) &  

(613)  9 

(614) 

(615)   (  & 

(616)             

(617) 

(618)    

(619)        

(620)  

(621)   I  

(622) 

(623)         >   

(624)         

(625)   &       

(626)    J  

(627) J 

(628)     &  

(629) 

(630)    

(631)  

(632)      

(633)  *   

(634) -    

(635) -& 

(636)       

(637)      

(638)    ?-- 

(639)     

(640)   +          

(641)  F    D

(642) 

(643)      

(644)        

(645) 

(646)  

(647)          

(648)   

(649) 

(650)  & .

(651) 

(652)  

(653)    . 1.5. . Deux ou trois étoiles dans le guide Michelin ? Les choses se compliquent.... '

(654)  (    

(655)       

(656)   

(657)     

(658)  & 

(659)   9   

(660)      

(661)   

(662) 

(663)     

(664)      

(665)    , ?    ?   

(666)  

(667)     ?

(668)   

(669)   

(670) 

(671)   

(672)    

(673)   

(674)     > *   - &  ?

(675)  

(676)   

(677)   K ?         

(678)  

(679)  exceptionnel satisfaisant correct  à éviter 

(680)  ?

(681)         

(682) 

(683)    ∑  ?  

(684) 

(685)           

(686)  ?         ∑   

(687)               

(688)  ?   ?-       ?   

(689)    ' 

(690)   

(691)    

(692)  

(693)  

(694)        

(695) 

(696) I      J J 5

(697)  

(698)        JJ 

(699)     

(700)    J

(701) 

(702) J ' 

(703)  

(704)    

(705) 

(706)     .

(707)  

(708) ? ? 

(709)   

(710)  ?

(711)       

(712)  

(713)  5   J

(714) 

(715) J ?    

(716)   

(717)   JJ  J J  4     

(718)           

(719)  

(720)  ?        

(721)    

(722)   

(723) 

(724)        

(725) ?   "

(726)    

(727)  &     

(728)     ? "        ?

(729)   

(730)   

(731)        * 

(732)    

(733)  

(734)  

(735)         ?

(736)   

(737)  

(738)    

(739) & :. 

(740)   

(741)       

(742)      

(743) 

(744)        

(745)    

(746)  ?    

(747)  ? 

(748)  9?   

(749)     

(750)    

(751)       

(752)     

(753)    

(754)   

(755) 

(756)   1.6. Vers une classification probabiliste. '            

(757)      5     

(758) 

(759)      

(760)  

(761)  ( 

(762)               

(763) 

(764)  

(765)  taille "

(766)    

(767)    

(768)      

(769)     

(770)   ∑  *  

(771)      

(772)        

(773)     ∑         

(774)  

(775)    * ! #28 

(776) -*  #2   *  F #68  -* F #8  

(777)     Ces données n'ont bien évidemment aucune valeur significative..

(778) 

(779)  

(780)    . . L

(781)     

(782)    

(783)   #2$ M.           

(784)  M !      .   

(785)    

(786)     

(787)    D 

(788)     0       9       !  

(789)           

(790)    

(791) 

(792)     2$7 &

(793)            &

(794)   N$7 )

(795)    

(796)    

(797)     

(798)   

(799) 

(800)    

(801)     ' 

(802)   

(803)    

(804)      

(805)     

(806)  5      

(807)          

(808)      

(809)              '    

(810)  

(811)    

(812)       .* 

(813)     

(814)         

(815)           

(816)  

(817)     > 

(818)    

(819)    

(820)        

(821)               

(822)   

(823)       

(824)   )     

(825)   

(826)    

(827)    

(828)              

(829)       

(830)    

(831)    floue 

(832)   

(833)  

(834)    

(835)   

(836)  *  )

(837)                 1.7. Résolution des problèmes de classification. 9 

(838)    

(839)      

(840)      

(841)   

(842)     *    

(843)  J     J 4  

(844)    

(845)       *  

(846)         4    *      

(847) 

(848)   

(849)  . 

(850)   

(851)    

(852)        

(853) apprentissage. "  ?    

(854)  

(855)   

(856) 

(857)     >     

(858) 

(859)          A2  

(860)       ? ;   

(861) -   

(862)  

(863)      

(864) 

(865)       

(866) ? ? ?

(867) 

(868)        

(869)     ? 

(870)        

(871)  

(872)  B. !. Pour être plus précis, il faudrait donner la loi de distribution de la taille des hommes et des femmes comme par exemple la loi de Gauss, mais ce n'est pas le point important de ce paragraphe. Le chapitre suivant décrit la règle de décision tirée des courbes de distribution des individus des différentes classes..

(873) 

(874)  

(875)    . . "      - 

(876)   - & 

(877)  JJ

(878) JJ M =. ?A. '   

(879)       ?

(880)    

(881)    

(882)    ?

(883)  

(884)  ?--       

(885)       D  

(886)          

(887)                   

(888)  JJ 

(889)  ?  

(890)           

(891)       

(892)             

(893) 

(894)            

(895)        

(896)   

(897)   

(898)     d'exemples "          0   JJ   

(899) 

(900)    

(901)     

(902)  

(903)          ?

(904)  

(905)   . 

(906) 

(907)  

(908)   

(909) 

(910)    . 9  

(911)            

(912)    

(913) 

(914)   ∑     

(915)   ? 

(916)  

(917)  5             

(918)   

(919)   

(920)    base d’apprentissage ∑ 

(921)          O

(922) 

(923)     classifieur 

(924)     

(925)     ?    ∑     

(926)   

(927) 

(928) 

(929)   ?

(930)   

(931)     

(932)      

(933)     

(934)  

(935) 

(936)             base de test ∑          

(937)       

(938)     ?      

(939)    ?   

(940)  

(941)   

(942)   

(943) ?     

(944)  ?

(945)      

(946)    >       classification supervisée   

(947)  ?   ?

(948) J

(949) 

(950) J

(951)  )        

(952)   

(953)        

(954)       ?     

(955)   

(956) 

(957)     

(958)      

(959) 

(960)     .   O

(961)  !. "#

(962)     

(963)    $ 

(964)  

(965)    %

(966)  

(967) . > 

(968)    

(969)       

(970)         O

(971)   

(972)  

(973) 

(974)     "  ?   ?

(975)   

(976) . ? 

(977)  P,Q 

(978)  ? 

(979)         4 .   ,    

(980) . 

(981)  

(982)     

(983)  

(984)          #8    

(985)             - 4  

(986) 

(987)  .

(988) 

(989)  

(990)    . .       

(991)     *     9  

(992)  

(993)  

(994)   

(995)      

Références

Documents relatifs

et elle peut se faire à n'importe quel stade d'évolution du peut donc, sans trop se tromper, prévoir l'évolution future des une première phase de sélection récurrente pour fixer

Premièrement, nous mettons en place des méthodes inspirées de la sélection de modèles (telle qu'elle est décrite dans Massart 2007) et de la sélection de fenêtres (inspirée

Contribution aux méthodes de synthèse de correcteurs d’ordres réduits sous contraintes de robustesse et aux méthodes de réduction de modèles pour la synthèse robuste en

Dans cette partie de ce chapitre, nous allons mettre en avant les différents processus de sélection et de qualification des fournisseurs mis en place au sein des

Vers des traitements morphologiques couleur et spectraux valides au sens perceptuel et physique : méthodes et critères de sélection [En ligne]. Thèse Traitement du signal et

Propriétés de moindres carrés de la matrice de covariance d’un vecteur aléatoire et applications statistiques.. Annales

Rupture de modèles : loi asymptotique des statistiques de tests et des estimateurs du maximum de vraisemblance.. Annales scientifiques de l’Université de Clermont-Ferrand 2, tome

Session : Méthodes adaptatives pour les séries chronologiques Selection et aggrégation de modèles pour la prédiction de séries temporelles faiblement dépendantes. par Pierre Alquier