• Aucun résultat trouvé

L Apprentissage Artificiel pour la Fouille de Données Multilingues : Application à la Classification Automatique des Documents Arabes

N/A
N/A
Protected

Academic year: 2022

Partager "L Apprentissage Artificiel pour la Fouille de Données Multilingues : Application à la Classification Automatique des Documents Arabes"

Copied!
23
0
0

Texte intégral

(1)

Université Lumière Lyon 2

École doctorale : Sciences de l’éducation, Psychologie, Information, Communication Équipe de recherche : Équipe de recherche de Lyon

en Sciences de l’information et de communication

L’Apprentissage Artificiel pour la Fouille de Données Multilingues : Application à la Classification Automatique des Documents Arabes

Par Saeed RAHEEL

Thèse de doctorat en Sciences de l’Information et de la Communication

Sous la direction de Mohamed HASSOUN et Joseph DICHY Présentée et soutenue publiquement le 22 octobre 2010

Thèse au format PDF

Composition du jury : Mohamed HASSOUN, Professeur des universités, Ecole Nationale Supérieure des Sciences de l’Information et des Bibliothèques Joseph DICHY, Professeur des universités, Université Lyon 2 Abdelkader ZIGHED, Professeur des universités, Université Lyon 2 Youssef AMGHAR, Professeur des universités, Institut National des Sciences Appliquées de Lyon Richard CHBEIR, Maître de conférences, Université de Bourgogne Jean-Pierre DESCLES, Professeur des universités, Université Paris 4 Thierry LAFOUGE, Professeur des universités, Université Lyon 1

(2)
(3)

Table des matières

Contrat de diffusion . .

4

[Epigraphe] . .

5

Table des matières . .

6

Liste des abréviations . .

7

Liste des figures . .

8

Liste des tableaux . .

9

Liste des algorithmes . .

10

Remerciements . .

11

Glossaire . .

12

Introduction . .

13

Chapitre 1. L’apprentissage artificiel et la classification automatique des documents ayant

un contenu monolingue . .

14

Chapitre 2. La Classification de Documents : Comment? . .

15

Chapitre 3.La construction inductive des classifieurs pour une classification supervisée

. .

16

Chapitre 4. Le jeu de données : conception et choix de la nature des attributs ; une

approche statistique basée sur l’analyseur morphologique de DIINAR.1 . .

17

Chapitre 5. Evaluation d’un classifieur, expérimentations, et résultats . .

18

Chapitre 6. La classification automatique des documents arabes ayant un contenu

multilingue :motivation, problématique et solutions . .

19

Conclusion . .

20

Perspectives . .

21

Bibliographie . .

22

[Annexes] . .

23

(4)

4

Sous contrat Creative Commons : Paternité-Pas d'Utilisation Commerciale- Pas de Modification 2.0 France (http://creativecommons.org/

licenses/by-nc-nd/2.0/fr/) - RAHEEL Saeed - Université Lyon 2 - 2010

Contrat de diffusion

Ce document est diffusé sous le contrat Creative Commons « Paternité – pas d’utilisation

commerciale - pas de modification » : vous êtes libre de le reproduire, de le distribuer et de le

communiquer au public à condition d’en mentionner le nom de l’auteur et de ne pas le modifier,

le transformer, l’adapter ni l’utiliser à des fins commerciales.

(5)

[Epigraphe]

5 Sous contrat Creative Commons : Paternité-Pas d'Utilisation Commerciale-

Pas de Modification 2.0 France (http://creativecommons.org/

licenses/by-nc-nd/2.0/fr/) - RAHEEL Saeed - Université Lyon 2 - 2010

[Epigraphe]

raheel_s_epigraphe

(6)

6

Sous contrat Creative Commons : Paternité-Pas d'Utilisation Commerciale- Pas de Modification 2.0 France (http://creativecommons.org/

licenses/by-nc-nd/2.0/fr/) - RAHEEL Saeed - Université Lyon 2 - 2010

Table des matières

raheel_s_table_des_matieres

(7)

Liste des abréviations

7 Sous contrat Creative Commons : Paternité-Pas d'Utilisation Commerciale-

Pas de Modification 2.0 France (http://creativecommons.org/

licenses/by-nc-nd/2.0/fr/) - RAHEEL Saeed - Université Lyon 2 - 2010

Liste des abréviations

raheel_s_liste_des_abreviations

(8)

8

Sous contrat Creative Commons : Paternité-Pas d'Utilisation Commerciale- Pas de Modification 2.0 France (http://creativecommons.org/

licenses/by-nc-nd/2.0/fr/) - RAHEEL Saeed - Université Lyon 2 - 2010

Liste des figures

raheel_s_liste_des_figures

(9)

Liste des tableaux

9 Sous contrat Creative Commons : Paternité-Pas d'Utilisation Commerciale-

Pas de Modification 2.0 France (http://creativecommons.org/

licenses/by-nc-nd/2.0/fr/) - RAHEEL Saeed - Université Lyon 2 - 2010

Liste des tableaux

raheel_s_liste_des_tableaux

(10)

10

Sous contrat Creative Commons : Paternité-Pas d'Utilisation Commerciale- Pas de Modification 2.0 France (http://creativecommons.org/

licenses/by-nc-nd/2.0/fr/) - RAHEEL Saeed - Université Lyon 2 - 2010

Liste des algorithmes

raheel_s_liste_des_algorithmes

(11)

Remerciements

11 Sous contrat Creative Commons : Paternité-Pas d'Utilisation Commerciale-

Pas de Modification 2.0 France (http://creativecommons.org/

licenses/by-nc-nd/2.0/fr/) - RAHEEL Saeed - Université Lyon 2 - 2010

Remerciements

raheel_s_remerciements

(12)

12

Sous contrat Creative Commons : Paternité-Pas d'Utilisation Commerciale- Pas de Modification 2.0 France (http://creativecommons.org/

licenses/by-nc-nd/2.0/fr/) - RAHEEL Saeed - Université Lyon 2 - 2010

Glossaire

raheel_s_glossaire

(13)

Introduction

13 Sous contrat Creative Commons : Paternité-Pas d'Utilisation Commerciale-

Pas de Modification 2.0 France (http://creativecommons.org/

licenses/by-nc-nd/2.0/fr/) - RAHEEL Saeed - Université Lyon 2 - 2010

Introduction

raheel_s_introduction

(14)

14

Sous contrat Creative Commons : Paternité-Pas d'Utilisation Commerciale- Pas de Modification 2.0 France (http://creativecommons.org/

licenses/by-nc-nd/2.0/fr/) - RAHEEL Saeed - Université Lyon 2 - 2010

Chapitre 1. L’apprentissage artificiel et la classification automatique

des documents ayant un contenu monolingue

raheel_s_chapitre1

(15)

Chapitre 2. La Classification de Documents : Comment?

15 Sous contrat Creative Commons : Paternité-Pas d'Utilisation Commerciale-

Pas de Modification 2.0 France (http://creativecommons.org/

licenses/by-nc-nd/2.0/fr/) - RAHEEL Saeed - Université Lyon 2 - 2010

Chapitre 2. La Classification de Documents : Comment?

raheel_s_chapitre2

(16)

16

Sous contrat Creative Commons : Paternité-Pas d'Utilisation Commerciale- Pas de Modification 2.0 France (http://creativecommons.org/

licenses/by-nc-nd/2.0/fr/) - RAHEEL Saeed - Université Lyon 2 - 2010

Chapitre 3.La construction inductive des classifieurs pour une classification supervisée

raheel_s_chapitre3

(17)

Chapitre 4. Le jeu de données : conception et choix de la nature des attributs ; une approche statistique basée sur l’analyseur morphologique de DIINAR.1

17 Sous contrat Creative Commons : Paternité-Pas d'Utilisation Commerciale-

Pas de Modification 2.0 France (http://creativecommons.org/

licenses/by-nc-nd/2.0/fr/) - RAHEEL Saeed - Université Lyon 2 - 2010

Chapitre 4. Le jeu de données :

conception et choix de la nature des attributs ; une approche statistique

basée sur l’analyseur morphologique de DIINAR.1

raheel_s_chapitre4

(18)

18

Sous contrat Creative Commons : Paternité-Pas d'Utilisation Commerciale- Pas de Modification 2.0 France (http://creativecommons.org/

licenses/by-nc-nd/2.0/fr/) - RAHEEL Saeed - Université Lyon 2 - 2010

Chapitre 5. Evaluation d’un classifieur, expérimentations, et résultats

raheel_s_chapitre5

(19)

Chapitre 6. La classification automatique des documents arabes ayant un contenu multilingue :motivation, problématique et solutions

19 Sous contrat Creative Commons : Paternité-Pas d'Utilisation Commerciale-

Pas de Modification 2.0 France (http://creativecommons.org/

licenses/by-nc-nd/2.0/fr/) - RAHEEL Saeed - Université Lyon 2 - 2010

Chapitre 6. La classification automatique des documents arabes ayant un contenu multilingue :motivation, problématique et solutions

raheel_s_chapitre6

(20)

20

Sous contrat Creative Commons : Paternité-Pas d'Utilisation Commerciale- Pas de Modification 2.0 France (http://creativecommons.org/

licenses/by-nc-nd/2.0/fr/) - RAHEEL Saeed - Université Lyon 2 - 2010

Conclusion

raheel_s_conclusion

(21)

Perspectives

21 Sous contrat Creative Commons : Paternité-Pas d'Utilisation Commerciale-

Pas de Modification 2.0 France (http://creativecommons.org/

licenses/by-nc-nd/2.0/fr/) - RAHEEL Saeed - Université Lyon 2 - 2010

Perspectives

raheel_s_perspectives

(22)

22

Sous contrat Creative Commons : Paternité-Pas d'Utilisation Commerciale- Pas de Modification 2.0 France (http://creativecommons.org/

licenses/by-nc-nd/2.0/fr/) - RAHEEL Saeed - Université Lyon 2 - 2010

Bibliographie

raheel_s_bibliographie

(23)

[Annexes]

23 Sous contrat Creative Commons : Paternité-Pas d'Utilisation Commerciale-

Pas de Modification 2.0 France (http://creativecommons.org/

licenses/by-nc-nd/2.0/fr/) - RAHEEL Saeed - Université Lyon 2 - 2010

[Annexes]

raheel_s_annexes

Références

Documents relatifs

Il a régulièrement publié des articles dans des revues académiques (M@n@gement, Finance-Contrôle-Stratégie, Politiques et Management Public, Revue Internationale

Ainsi, le calcul des niveaux énergétiques des orbites moléculaires est ramené à un problème des valeurs et des fonctions propres à partir de

On peut partir du théorème Schur qui stipule qu’il existe une matrice unitaire U telle que U AU = T * , T étant une matrice triangulaire dont les éléments diagonaux sont

Le PAST recruté assurera des enseignements de projet de paysage dans la formation de paysagiste (cycle préparatoire et cycle Diplôme d’État) dispensée au Département École de

En effet, la chaleur de compression est récupérée à la sortie du compresseur puis stockée et réutilisée pour réchauf- fer l’air pendant la détente au moyen d’un

2007-2010 : Recherche menée dans le cadre de l’ERTé de l'IUFM de la Guyane Étude comparative des interactions éducatives en contexte multiculturel et plurilingue -

Arrêté du 18 février 1992 fixant les modalités d’organisation du concours de recrutement des conservateurs stagiaires, élèves de l’Ecole nationale supérieure

Another way to probe the network’s visual knowledge is to consider the feature activations induced by an image at the last, 4096-dimensional hidden layer. If two images produce