HAL Id: dumas-01558176
https://dumas.ccsd.cnrs.fr/dumas-01558176
Submitted on 12 Dec 2017
HAL is a multi-disciplinary open access archive for the deposit and dissemination of sci-entific research documents, whether they are pub-lished or not. The documents may come from teaching and research institutions in France or abroad, or from public or private research centers.
L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau recherche, publiés ou non, émanant des établissements d’enseignement et de recherche français ou étrangers, des laboratoires publics ou privés.
Développement du moteur de recherche LEOnard au
sein des Études Économiques de BNP Paribas
Sébastien Tessaro
To cite this version:
Sébastien Tessaro. Développement du moteur de recherche LEOnard au sein des Études Économiques de BNP Paribas. Sciences de l’information et de la communication. 2008. �dumas-01558176�
UNIVERSITÉ
CHARLES DE GAULLE - LILLE 3FACULTE DES SCIENCES
HUMAINES, LETTRES
ET
ARTS
UFR IDIST
MEMOIRE DE STAGE POUR LE
MASTER 2 PRISME
Développement
du
moteur
de recherche LEOnard
au sein des Etudes
Economique de BNPPARIBAS
Présenté par Tessaro Sébastien
Etsoutenu le 23
septembre
2008
Responsable du diplôme
:Mustapha El Hadi Widad
Responsable de
stage : Bernardini Michel1 3
Mille
REMERCIEMENTS
Jetienstoutparticulièrement à remercier Madame Widad Mustafa el Hadi, Maître de
Conférencesen Sciences de l'Informationetde la Communication etprofesseur à l'Université
de LilleIII, d'avoirdirigémontravail de mémoire. Je la remercietoutparticulièrementpour
sadisponibilité, sapatience, sonimmense gentillesse, ses conseilsetses encouragements.
Mesremerciements s'adressent aussi auxmembres des EtudesEconomiques de BNPARIBAS pourl'ambiance amicaleetle sérieux du travail,etils s'adressentnotamment et tout
particulièrement àMichel Bernardini, monresponsable de projetinformatique, quipar sa
compréhension, sapatience, sondynamisme mais aussi sabonne humeur, permettentde
mettre àl'aise "sesjeunes stagiaires" etde lesintégrer rapidement dans le travail.
Jeremercie aussi Paul Regnardpourm'avoir encadré directement dansmonstage avectoute
sa disponibilité mais aussisapatience etsavolonté d'êtreparfaitement clair dans sespropos. J'engarderai l'exemple.
Jevoudraisencoreremercier lesdocumentalistes qui onttoujours étéaimables etdisponibles
pour merenseigner.
Ungrand merciaussi àtousmes collègues ex-étudiants qui m'ont encouragé dans la
préparation demonmémoire.
Table des matières
REMERCIEMENTS 3
INTRODUCTION 8
1 APROPOSDE B.N.P.PARIBAS... 12
1.1 Lesecteurd'activité deBNPPARIBAS, son importance 12
1.1.1 LaBanque de détail (en FranceetInternationalRetailServices) 13 1.1.2 Corporate and InvestmentBanking (Banque de Financementetd'Investissement) _ 14
1.1.3 AssetManagement andServices 16
1.1.4 Lesmétiers transversaux 16
1.2 Lesmétiers, leseffectifs 17
1.3 Son histoire 17
1.4 Sesvaleurs, sonimage 19
2 LEPROJET LEONARDETMON INTEGRA TION AUSEINDECE PROJET 21
2.1 Présentation duprojet LEOnard: sagenèse 21
2.2 Immersionavecles nouvellestechnologies 23
2.3 L'organisation du travail 25
2.3.1 Apprentissageetcréation d'une méthodologie de travail personnel 25
2.3.2 Lesdifférents tests 27
2.4 Lamaîtrise d'ouvrage (MOA)ausein des Etudes Economiques 29
2.4.1 Lesprincipes de la MOA 29
2.4.2 La MOAaux Etudes Economiques :larépartition du travailentreles différents acteursduprojet (MOE BNPPARIBASetles éditeurs) 30
2.5 Lamissionprincipale demonstage 31
2.5.1 Lechoixdemamission 32
2.5.2 L'accord du responsableprojet infromatique 33
3 PRESENTA TIONDUMOTEURDERECHERCHE 35 3.1 Historique des moteursde recherche 35
3.1.1 L'apport technologique des différents éditeurs pourLEOnard 36
3.2 Letyped'information traité 39
3.2.1 Saprovenance 39
3.2.2 L'accès à l'information économique àtraversLEOnard 40
3.4 Dequellefaçon estdiffuséeetclasséel'informationparLEOnard 48
3.4.1 Le documentnumériqueetsaconstitution 48 3.4.2 Extractionde termes dans undocument 49
3.5 Lestechniquesd'extraction d'information 52
3.5.1 L'objectifdel'extractiondetermeavecla méthodestatistique 52
3.5.2 Leslimitesdela méthodestatistique nécessitantlepassageàlafouille detexte 53
3.5.3 Différenceentreletextminingetle data mining 54
3.6 Principe defonctionnement de Témispourl'extraction d'entités nommées 55
3.6.1 Xelda le moteurmultilinguistique 56 3.6.2 L'extracteurInsightDiscoverer Extractor (IDE) 56
3.6.3 Les cartouches de connaissances 57
3.6.4 Le fonctionnement de cescartouches 57
4 L'INTEGRATIONDES CARTOUCHES DE CONNAISSANCES DE TEMIS 62
4.1 Témisdansles différents environnements de travail 62
4.2 Laphase d'intégrationsurl'environnement detest(staging) 64
4.2.1 Laméthodologieappliquée 66
4.2.2 Classifications destypesde problème rencontré 67
4.3 Lancement de Témisenproduction 69
4.3.1 Le constat 69
4.4 L'activité 71
4.4.1 La cartouche IDEInsight DiscovererExtractorenversionbeta 71
CONCLUSION 75 RÉFÉRENCES BIBLIOGRAPHIQUES 77 ANNEXES 80 ANNEXE 1 81 ANNEXE2 91 ANNEXE4 93 ANNEXE5 95 ANNEXE6 96 ANNEXE 7 100 ANNEXE 8 102 ANNEXE 9 110
ANNEXE 10 111
INTRODUCTION
Dansunmonde enmouvements, enmutationsconstantes etparfois imprévisibles,
l'informationestau cœurdu fonctionnement del'Entreprise.
Ilestcapital pourles«Acteurs» d'une GrandeEntreprised'avoir accès àtoutesles
connaissancesconcernantleur domaine afin depouvoiragirenconnaissance decause, mieux
connaître ses concurrents, lesproduitsdivers surle marché, l'état du marchéetsaréceptivité
pourpouvoir créeretproposerdes produits plusattrayants, capter etconserver uneclientèle, etaussi depouvoir anticipersur les comportements,les évolutions, les risques. Cette phase
d'anticipationetd'observation estcertainement, denosjours, l'enjeu majeurpourlesgrandes
Entreprises. Prévoir, analyser, anticiper, risqueravec une connaissance aussi complèteque possible des enjeux, sontlesatoutsnécessairespouraffronter ceXXIème siècle.
Pourcefaire, la recherche de l'informationetsonanalyseest stratégique. Mais,
l'informationest aujourd'huipartoutprésente etbienquecelle-cinousparvienne sousdes
formesmultiples (écrites, orales, visuelles ...), nous sommes «noyés»dansune
surabondance d'informationetnousarrivons difficilement àen extraire lesens essentiel et,
finalement, àen connaître sapertinence età savoir l'utiliser. Ceciestnotammentvérifiéparle
célèbreadage«tropd'information,tuel'information». C'est justementtoutl'enjeu des
techniques de l'information quivontdevoir résoudrece problème afin deproposerdes
solutionsaux «Acteurs et Décideurs» desEntreprises.
Danscetunivers deTechnologies de l'Informationetdela Communication, lesGrands Groupesontcompris la nécessité demettre enplace desmoyens efficacespour «gérer ces informations»afin de mieuxrépondreauxbesoins d'informations de leurs collaborateurs, de
leurs clients etde leurs fournisseurs.
L'enjeu estimportant danstous les Groupes maisoncomprendra aisément qu'il estmajeur
desréactivités sansfaille. Or, BNPPARIBAS regroupetousces secteurs, il estdonc normal que le Groupe s'engage danscettedémarche du traitement de l'informationetse dote de
moyensefficaces.
Eneffet, face àl'augmentationvertigineusedunombre demoyens informatiquesetàleurs
évolutions constantes, lemétier de « documentaliste » s'estcomplètement transforméet
d'une situation dedépendance vis-à-vis des professionnels de la documentation, l'usager devientl'interlocuteur direct aveclamachine, ilaappris à s'adapter à la technologie
informatique.
C'estincontestable, l'informatique apermisle développement d'outilspourtraiter
l'information, pourfacilitersarechercheetétablir la représentation des documents aumoment de leurindexation. Cependant, auseindes Etudes Economiques de BNPPARIBAS, les
documentalistes fournissentuntravailpointu de recherche, tandis quela«technologie
informatique»nommée «projet LEOnard» propose uneinformation généraliste sur
l'économie etla finance. Ils sontparconséquent complémentaires.
Cemémoirea étéeffectué dans le cadre demonstagede fin d'étudespourvalidermon
master2professionnel P.R.I.S.M.E (Produits de l'Information SpécialiséeetMédiation
Electronique) à l'Université Charles de Gaulle, Lille3.
Cemémoire apourobjetl'étudedumoteurde recherche LEOnardauseindes Etudes
Economiques de BNPARIBAS.
Cetteétude estcomposée dequatreparties :
- La
première partie estconsacrée à la présentation générale de BNPPARIBAS et
notammentau département des Etudes Economique du pôle BFI (Banque de Financementet
d'Investissement) dans lequel j'ai évolué.
- Ladeuxième
partieconcerne l'observationdu projet LEONardetmonincorporation ausein deceprojet.
- La
- La
quatrièmepartie estconsacrée à l'objet même de la mission demonstage,
c'est-à-dire, àl'intégrationde l'outiltextmining de l'éditeur Témis surlemoteurde recherche
PARTIE I
1 A PROPOS DE B.N.P. PARIBAS...
Enannexe 1 setrouveune plaquette récemment publiéeparB.N.P Paribas relatant les
donnéesessentielles, chiffrées, deceGrandGroupe, pardomaine d'activités.
Je souhaitais,ci-après, résumer lesprincipaux métiers du Groupe afin demettre en exergue, parmi ce dédale d'activités, le département dans lequel j'ai effectuémonstage pourd'une
partcomprendre son imbrication, ses implications,etd'autrepart, les enjeuxet l'utilité d'un
teldépartementet, parvoie de conséquence, de l'utilité du métier queje m'apprête à
appréhender, c'est-à-dire l'assistance à la maîtrise d'ouvrage.
1.1 Le secteur d'activité de BNPPARIBAS, son importance
B.N.P. Paribasest l'un des leaderseuropéens des services bancaireset financiers, elleest la
cinquième banque mondiale et la première entreprise française (source : Global 2000 Forbes
2008). Voici l'organigramme avec les directeursetles différents responsables des pôles BNPARIBAS.
Sotvca BNP Parttu»
B.N.PParibasestprésente dans 85 paysoùelle détient des positions clés à traversses
différents métiersquisontclassésentrois grandspôlesd'activités, auxquels il convient
d'ajouterunquatrième pôlequel'onpeutqualifié«administratif», concernantles métiers
transversaux etauqueltous les autresontrecours :
1.1.1 LaBanque de détail (en France etInternational Retail Services)
Elle offretoutelagammedes services etproduits bancaires, de la simpletenue des
comptesà divers services financiers spécialisés telsquele crédit à la consommationetà l'équipement des particuliers (le célèbre crédit Cetelem fait partie de sesactifs), le crédit
immobilier, ainsiqu'unegammenombreuse etvariée demontagesde produits financiers
destinésaux particuliersetauxentreprises.
Très forteenFranceetdans les Dom-Tom, labanque de détailestaussi présente à l'International(notammentenItalie, sous lenomde Banca Commerciale BNL bc,une
implantation parfaitement réussieavec 800 Agencesréparties dans lepaysregroupantplus de
2,5 millions de clients particuliers etplus de 36000 entreprises, auxUSAetdans lespays émergents).
En Franceet dans lesDom-Tom, BNPPARIBAS s'adresse :
àuneclientèle departiculiersavecplus de 6 millions de clients. Sontauxde
pénétration estde 22 % dans lesfoyersayant desrevenusannuelsnets déclarés
supérieurs à 82000euros (source: Ipsos2007)
- à
uneclientèled'entrepreneursavec500000 clients
àune clientèled'entreprisesetd'institutionsavec60000 comptes. BNPPARIBAS
déploie d'énormes moyens pourcapterce secteur. Acet effet, elleamisenplaceen
2005, undispositif unique dans lepaysagebancaire français, avec24 Centres
d'Affairesrépartis surtoutle territoire et2 services d'assistance : le Service d'AssistanceEntreprise (S.A.E.) etunCash Customer Services (C.C.S.)
1.1.2 Corporate and Investment Banking (Banque de Financement et
d'Investissement)
C'est labanque de financementetd'investissement du Groupe qui intervient dans les activités de conseils etde marchés descapitaux.
Cepôlepropose àses clients (particuliersetentreprises) des« solutionssur mesure »dans
les domaines desobligations européennes etinternationales, le domaine des actions, mais
surtoutdansle domaine des investissements structurésetindiciels, lagestion des devises,
lemultimanagement, le partenariat stratégiqueavecdes gérants locaux.
Il estleader mondial dans le financement d'acquisitions, d'exportation de biens
d'équipement, de projets d'infrastructures, d'énergieetde matières premières.
Legroupeesttrès présentsurlesmarchésenforte expansion (Brésil, Maroc)ets'engage également dans des«investissements responsables » .
Sa notoriété esttellequ'il abénéficié de la meilleure notation Novethic (aaa) etla qualité
globale de sonorganisation estconfirméeparFitch qui lui aattribué l'une des meilleures
notes : AM2+.
Le succèset la notoriété d'un telpôlenepeutêtrequele fruit d'un travail d'équipe qui se
dotenonseulementd'experts financiers mais aussi de solidesmoyensd'analyses etde
regroupement d'informations quipermettrontde s'approprier les informations clés surles entreprisesetles marchés, suivre la conjonctureen « tempsréel» etles grands sujets de
l'actualité, decomprendre les données macro-économiques qui sous-tendent les analyses.
Lacollecte des informations ainsique leurs analysessontdes moyens stratégiques qui permettentd'anticiper les changements affectant l'économie d'unpays oud'unsecteur,
lespolitiques économiques des banques centralesou de leurs confrères, les risquesetles
opportunités des marchés émergents.
C'estpourtoutes ses raisonsque ce Pôle s'est doté d'un solide département dénommé :
département des Etudes Economiques quiregroupe des économistes, des
documentalisteset des statisticiens ainsiqu'un secrétariat.
Cetteéquipeest composée de 54 personnes et s'adresse àtous les décideurs du Groupe dont le directeur dupôle CIB estJacques d'Estais. Philippe d'Arvisenet dirige les Etudes
Economiques. Michel Bernadini, monresponsable de stage,occupe la fonction de
« Responsable de Projet Informatique. ».
CORPORATE FINANCE Thieify VARENE GLOBAL EQUITIES S COMMODITY DERIVATIVES YannGERARDIN EricRAYNAUD
Alfonso PALLAV1CINI/ LincolnPAYTON
Un coinPAYTON FIXED INCOME
Fred«ric JANBON STRUCTURED FINANCE
Dominique REMY
CORPORATE A TRANSACTION GROUP André BOULANGER «
LOAN AND PORTFOLIO MANAGEMENT NathalieHARTMANNn
ALMTREASURY
MichelEYDOUX
FUNCTIONS
COVERAGEl
tpirl taEre Rayiaie
r^rt ta□emuqiF R*my
rqrttajrai Niin
Capture d'écran présentant l'organigramme de Corporate Investment Banking (BFI)
EnJanvier2003, ce département, pourmieux répondreauxexigences du traitement de la
documentation, lanceun vasteprojet : le projet LEOnard (LEO Navigateur Assistant de
Recherche Documentaire), portail de recherche d'informations économiques, sous la direction de Michel Bernadini. Leprojet LEOnard consiste à mettre envaleur les
informations des EtudesEconomique à partir d'umoteurde recherche interne destiné aux
C'estainsi que le 15 Juillet 2007, je suis recrutéenqualité de stagiairechargé, durant6
mois, de m'occuper deplusieursaspectsdu portail LEOnard, notammentde
l'amélioration de lapertinence des résultats dumoteurde rechercheauniveau sémantique
(cette partieestdéveloppée dans la partie 4 duprésentmémoire).
1.1.3 Asset Management and Services
Leaderégalement dans cesecteur, le Groupe le définitcommeunpôle de services. Services liés à lagestion d'Actifs, aucourtage, àl'épargneen ligne, mais aussi liés aux activités diverses del'importantsecteurde l'immobilier. C'est l'un desacteursmajeurs de l'immobilierrésidentiel enFrance etleleader de l'immobilierd'entreprises enEurope Occidentale.
Il propose, dansson département«Assurance», de nombreuxproduitsetservices d'
assurances (en épargne,enprévoyanceetenassurancedommages).
Il assuretousles services liésauxtitres. 45 millions de transactions ontététraitées en2007
dontplus de la moitié hors de France.
1.1.4 Les métierstransversaux
Afinqueles 3 premierspôles d'activités du Groupetravaillenten coordination étroite et
«enbonneintelligence »,BNPPARIBAS acrééunsecteurde métierstransversauxtels quelesjuristes, les fiscalistes, les métiers de la financeetde l'informatique, les métiers liésàlagestion des risques etaucontrôle desopérations (l'auditinterne, l'inspection
générale).
Touscesmétierssont appelés à intervenir danstous lespôlesd'activités afin degarantir la
1.2 Les métiers, les effectifs
Pour assurerle bon fonctionnement detous cesServices, BNP Paribasregroupeunetrès large
diversité de métiers correspondantauxdiverses spécialités des secteurs. Ellecompte 300 métiers différents.
Avec 163.000 collaborateurs dans le monde dontprèsde 120.000enEurope (63000en France
etdans lesDom-Tom), BNPParibas seveutuneentrepriseanimée« par unesprit
d'ouverture». Pourcela, ellejoue surladiversité de sessalariés : «la diversité doit êtreune
priorité » asouligné Michel Pérebeau, Président de BNPPARIBAS etil souhaiteque « de plus enplus le public des salariés correspondeaupublic des clients ».Ladiversité de la
communautéhumaineestune réalité dansceGroupe, 95 nationalités sontreprésentées en
France.
LeGroupe offre également denombreux stagesauxétudiants ets'engage à leur fournirune expérience riche etformatrice. Il offre, à chacun d'eux, aprèsunepériode de formation initiale, unemission riche enresponsabilités.
C'estdans cecadrequej'ai effectuéunstagede 6 mois auseinde BFI Etudes Economiques
pourparticiperetcontribueraudéveloppement de LEOnard l'application dumoteur de
recherche entreprise, auparamétrage de veilles internet via l'outil KBCrawl, auxentretiens
auprès des utilisateurs etprescripteursde veille, auxtestsdenouvelles fonctionnalités, à l'intégration de l'outil textmining Témiset, auxdémonstrations eninterneetàl'externe. Pourcela, Michel Bemardini,monresponsable de stage etPaulRégnard, chargé de veilleet
documentationm'ontencadré danscesactivités.
1.3 Son histoire
Ilafalluplus d'un siècleetdemipour que ceGroupe, suite à denombreuses fusions,
devienne cequ'ilestaujourd'hui : BNPPARIBAS.
1820 : lesprémisses decette grande banquesemettentenplace. C'est d'abordune «histoire de famille» : Louis-Raphaël Bischoffsheim fondeunebanque à Amsterdam
tandisque sonfrère créeuneagenceà Anversen 1927 etquecelui-ci épouseplus tard la fille dubanquier de Francfortetfondentensembleen 1863 La Banque deDépôtet
deCréditdesPays-Bas. Parallèlementun groupedebanquiers français créenten
1869, la Banque de Paris qui s'installe prèsde l'Opéra.
1872 : cesdeuxbanquesvont fusionnerpourcréerla Banque de Paris et des Pays-Bas
1966 : naissance deBNP suite àunefusion de deuxbanques : la BNCIet leCNEP,
faisant alors de laBNP lapremière banquefrançaise, la deuxièmeenEuropeetla
septièmedans le Monde.
1968 : Naissance de laCompagnie financière de Parisetdes Pays-Bas
1982 : Nationalisation de laBNPetde CFPP dans le cadre del'opération des nationalisations desbanques françaises
1993 : Ladéréglementation dusecteurbancaire qui s'opère à la fin des années 80
modifieprofondément le métier de la banqueetsesconditions d'activités, enFrance et
dansle Monde. C'est ainsique BNPestprivatiséeen 1993. Elle prendunnouveau
départenlançant desnouveaux «produits»et« servicesbancaires»et setournevers l'International.
1998 : Naissance de Paribas dans le cadre d'une fusion entrelaCompagniefinancière deParibas, de labanque Paribasetde la Compagnie Bancaire
1999 : Rapprochement de BNP etde Paribas
2000 : Création de BNPParibas
LeGroupe vatirersa force des deux grandes lignées bancairesetfinancières dont il procède. Ilprendson envoletaffiche des résultats quitraduisent le succèsdecette
fusion. LeGroupe poursuitsastratégie de croissanceenFranceetdans le Monde.
- 2006
: Durant la seule année2006, lataille duGroupe aaugmentéde 25 %. Ilne
cesse desetransformerpourmieuxs'adapteràunmonde enpleinemutation.
- 2007
: LeMonde estmarqué par une gravecrise financièreetlesecteurbancaire
connaîtdeprofondsrevers. Endépit des difficultés de la conjoncture économiqueet
de leurspressions surles performanceséconomiques, le Groupe amaintenusa dynamique de développent danstous sespôles. Lesmotsdu Président Michel
Peberreau, ouvrantsondiscourslorsde laprésentation des résultats de 2007, résumera
la situation :
« Laperformanceréaliséeen2007 illustre la robustesse denotremodèle, quiest fondésur un équilibreentreles activités de banque de détail générant lamoitié desesrevenus, les métiers
de l'assetmanagementetceuxde banquede financement etd'investissement quienassurent
respectivement le sixièmeetle tiers ».
La solidité financière duGroupe, quiaobtenu lanoteAA+ délivréeparStandard & Poor's,et
saculturerigoureuse du risque ontfortement contribué à sacapacité de résistance.
1.4 Ses valeurs, son image
PourunGroupe d'une telle ampleur, ilestprimordial demettreenplaceune cohésion
de communication,d'image, de publicité, d'identité visuellephysique etélectronique, d'unepolitique de relationavec lapresse.
S'ilestimportant de garantir«l'imageinstitutionnelle dugroupebancaire mondial » etde contribuerausuccès commercial de sesmarquesetde sesproduits, ilestaussi
capital de contribuerau développement d'un sentiment d'appartenanceau Groupe
chez les Collaborateurs afin d'avoir leurcomplèteadhésion à la stratégie mise enplace
parles décideurs mais aussi de développer chez eux, unmode decomportement
conformeauxvaleurs mises enplace etquisontaunombre de 4 :
Laréactivité, La Créativité,L'EngagementetL'Ambition
Lelogo de BNP Paribas, représentépar une courbe d'envolaux4 étoiles, symbolisele dynamismeetle progrès, valeursqui font le succès du Groupe.
Aprèsavoir faituneprésentation de BNPPARIBASetde cesdifférents métiers,nous allons
nous attacher à faireuneprésentation demes activités quim'ont animé toutaulong demon
parcoursà BNPPARIBAS, et notammentde la principale mission demon stage.
Nous allons aussi voir quecesmultiples activités découlent d'un type d'activitébien lié à la gestionde projet informatique.
PARTIE II
2 LE PROJET LEONARD ET MON INTEGRATION AU
SEIN DE CE PROJET
2.1 Présentation du projet LEOnard : sa genèse
BNPPARIBAS possèdeune formidable richesse d'informations économiques, financièreset
statistiques. Nous comprendrons aisément la nécessité pour unetelle banque de disposer d'un
outilpermettantd'offriraux3 000décideurs de l'établissementunaccèsà l'information à la hauteurdesenjeux d'une banque moderne.
Nousallons voir dans ceparagraphe commentle projet LEOnard s'est construitetàpartir de
quelcontexteje m'ysuis intégré et commentj'y ai évolué.
Avant la création deLEOnard, BNPPARIBAS étaitconfrontée àdes contraintes importantes : multiplicité dessourcesinterneset externes,autantdedemandes différentes quedesources interrogées (internet, intranet, GED, bases métiers) et dansdes formats multiples, d'où l'obligation de consolider manuellement chaque liste de résultats.
Effectuer alors desrequêtesexhaustives surl'ensemble des informations disponibles étaitune
opérationcomplexe, sachanten outrequeles données internes étaient volatiles. Aucun logiciel n'était alors capable de fédérerces différentes sources d'information.
Deplus, "Beaucoup depersonnes produisaientuneinformation de qualité mais celle-ci n'était
malheureusementpasassezmise enavant",remarqueMichel Bernardini, responsable
informatiqueausein du pôle.
Lesobjectifsessentielsdu projet LEOnard étaient donc :
- de rendre l'utilisateur
indépendant du service documentaire de BNP Paribas etde lui
permettred'accéder à deux bases différentesen une seule interface : la base interne (intranets, Filenet, etc.) etla baseexterne (sitesweb publics ousécurisés).
-casserlaconcurrenceentre lescorpsde métierencréantunesynergieausein du
groupe.
Leleitmotiv était detrouverunoutilquicorresponde aubesoindesutilisateursetqui
soit réactif.
Pourpouvoirmettreplusenavantles écrits des collaborateurs enparallèleavec la sélection
des articles effectuéepard'autres, legroupemise dès février 2003sur unprojet d'intranet«le
projet
Léonard
» (LéoNavigateur Assistant de Recherche Documentaire).
Ceprojet
vise àrecenseretàindexer les résultatsdumoteurde recherche interneet externe,
fonctionnant avec unlangage naturel. Cet outil de KM devra enoutrerecevoirunthésaurus
ducentrededocumentation existant pouraugmenter la pertinence des résultats produits.
Deux
pilotes
ont été lancés pendantl'été
2003. Unelongue
série d'essais « envraie
grandeur» ont alors étéeffectués,
avecdes bases
dedonnées actualisées
afin quele
public testeurreste motivé tout au longde l'expérimentation.Laréalisation duportail LEOnardestconfié àun panel d'éditeurs performantset spécialisés.
Les grosses SSIIontvolontairement étaient évitées afin de pouvoir développer les spécificités
propresàla BNP.
Unedouzaine d'éditeurs ontétéinterrogés, puis cinqontété présélectionnés.
Finalement, en
septembre, le
moteurdu Français Polyspot (Triplehop
àl'époque)
aétésélectionné et l'aveniradémontré quece
projet répondait bien
auxbesoins des
utilisateurs.
« C'était lemoteurderecherche le
plus convivial
etle plus intelligent
que nous ayons testé»,indique Michel
Bernadini.Début2004, commencel'implémentation. L'outil de rechercheestconnectéauxbases internes
(intranets, Filenet, etc.) et externes (sitesweb publics ousécurisés). Le thésaurus, constitué de plusieurs milliers determesaccumulés depuis 1988,estintégré à LEOnard.
Début 2005, l'équipeencharge de LEOnardpasse unerude épreuve : développer l'interface utilisateuretconvaincre de l'efficacité de la solution. Pour ce,le groupede travail solliciteun
ergonome spécialisé enintranets qui collaboreaveclesinfographistespour uneergonomie
conviviale etfonctionnelle.
Avantla miseenproduction, le département des«Etudes économiques» décide d'adjoindreà
Polyspotun système de veille surinternet, KB Crawl, de l'éditeur français KB Intelligence afind'automatiser la surveillance des sites Internetetderapatrier les informations
intéressantes. Enseptembre 2005, la solutionestmise à la disposition de 3 000 décideurs de BNPParibas.Les résultats serévèlentconcluants.
2.2 Immersion avec les nouvelles technologies
Dès lespremiers jours, ilm'a fallu d'abordm'intégrersur mon lieu de travail. C'est-à-dire
qu'il fallait identifiertoutd'abord dans quelle branche je travaillaisetqu'elle étaitsonbut.
C'est-à-direque le département des« Etudes Economiques»peutavoir certains buts
légèrement différents de celui dunouveauprojet LEOnard auquel il est important qu'ils
adhérent.
Ensuite, il m'a fallu faire la connaissance des diverses branches demétierexistantes au sein
des « Etudes Economiques» pourmieuxsituer les objectifs etlesobligations denotre
spécialité etla leur. En résumé, oùet commentse situele projet LEOnard dans les Etudes Economiques. J'ai donc fait connaissanceavec les différentespersonnesdu départementetje
les ai questionnéessur leurfonction etles diverses tâches qu'ils opéraientau sein du
Puisje suispassé àla phase pratique enprocédant àunepremière phase d'apprentissagepar
destests surdivers logicielsquej'aurai à utiliser à l'avenir.
J'ai utilisé les outilsprincipauxcomme :
- KbCrawl outil de
veille,
- Jira outil de suivi de
projet1,
Polyspot interface de gestion des abonnés à LEOnard,
Lotus Notes outils de communication /courrier
etsuivi destâches, ainsique,bien sûr, surLEOnardobserver les différences entre l'environnement detest(staging) quiesttoutefois opérationnelet l'environnement
production.2
Deplus,j'aisuivi desformationssur l'outil Kbcrawletj'aiassisté à des séminaires surla
thématique desmoteursde recherche qui m'ontpermis de vraiment m'intégrer grâce à un
apport supplémentaire de connaissancessurle sujet. En effet, ces séminaires m'ont permis de
prendreconnaissance des points devuedes professionnels. Ce quiaété extrêmement
enrichissant.
Unefoiscettephase de connaissance effectuée, l'intégration s'est poursuiviepar ma
présenceetaussima participationaux diverses réunions concernant leprojet LEOnardavec
unesprit curieuxetje n'aipashésité àposerdes questions, etmême à faire force de
proposition lorsque lecasseprésentait.
Ces réunionsontété, notamment, l'occasion des faire connaissanceavec lesdifférentes
personnes directement impliquées dans le projet LEOnard. Il faut direque lorsque jelesai
rencontrées, elles étaient déjàenrelation depuis longtemps etelles avaient donc leurs
habitudeset leurs propres langages de communication qu'il m'a fallu décrypter. Les
collaborateurs avec lesquelsj'ai été encontactquasi-permanentontétéceuxde l'équipe
développementde la BNP (MOE) ainsi queles éditeurs : l'équipe Kbcrawlet l'équipe Témis.
1
Voirannexe2
2
2.3 L'organisation du travail
2.3.1 Apprentissage etcréation d'une méthodologie de travail personnel
Dès les débuts lors demonstage,il afallu quej'adopteuneméthode detravail afin d'être le
plus efficace possible. Eneffet,dès les premiers jours, il m'afallumémoriserune masse
colossale d'informationssurles diversaspects du projet LEOnard. La méthode utilisée alors
était de classer les activitésprioritaires. De plus, le projetLEOnard estenconstante
évolution,ce qui conduit à fairedes modifications afin d'êtreplus efficaceetplus ergonomique.
Comptetenudelamasse detravail, j'ai d'abord répertorié les tâches prioritairessans cependant abandonner les tâches secondaires. J'ai donc procédé àuneclassification demon
travail.
Lestatutdestagiaire appelle àuntravail nonseulement d'apprentissage des dossiersetoutils
existants, mais aussipermetde faire des propositions susceptibles de faire évoluer l'outil. En effet, c'estentravaillant à l'intérieur même dumoteurde recherchequel'on comprend son
fonctionnementetque l'onest à même de faire des propositions. Ilnefautpasoublier aussi quec'estun outil qui évolueautourde réflexions internes. Dans ce contexte,j'ai fait des propositions. Celles qui n'ontpas étéretenues,je les ai mises de côtépourles rappeler parfois
lorsdemomentsplus opportuns.
2.3.1.1 A la recherche d'un bug...
Dansle détail, lesprincipales tâches à effectuer chaque matin étaient de vérifier l'état de marche dumoteurde rechercheetde soninterface. Eneffet, ilyavaitsouvent des problèmes d'accès, de connexionsoud'incohérenceentre les entités nomméesetlestermesproposés. Cette vérificationest essentielle. Lemoteurde recherche doitêtreopérationnel tôt dans la journéecarc'estle matinquenotre outil estle plus utilisé.
Pourremédier àcesproblèmes, l'équipe LEOnardessayed'analyser lapanneetdetrouverla
solution. Nouscommuniquonslapanneà la MOE de la BNPquis'occupe de la régler.
2.3.1.2 Le suivi des communications
Ladeuxièmeétape concernelagestion des emails. Dès le matin, nous avonsdes emails de demande d'accès à LEOnard. Il faut donc les inscrire leplusrapidement possibleavantd'être attelé à d'autres tâchesplus importantes. En général, la réactivité esttrès appréciéeparles
nouveauxabonnés. Ensuite, il faut créer des dossiersthématiques dans Lotus Note afin de
classer les emailsreçus etdepouvoir lesretrouverrapidement.
2.3.1.3 Le paramétrage de laveilleavec KBCrawl
Des testsréguliers avec
Kbcrawl3
sontrecommandés dansnotre activitécaril arrive quecertaines denospagesweb crawlés aient changéde corps, de structure. Celaa pour effet, dans
certains cas, dedésorganisernosparamétragesetdonc, deneplus crawlé correctement
l'information désirée, enplus, lorsquenous recevons des mises à jours du logiciel, ilnous faut
lestester. Cestestsm'ont donc incombés.
'
Voirannexe3
JflBUawiVersion 3.1| Lonnrcté à U base de door**»t:Mtcrdatatxport US!Al AUX USUS.U06
ficher Edhon a'fichage Actan* Cvlfc Par«aàr« Mtetenanee ?
a-an
s
m
■GS-Q-cb-
5
r! ™
CM» ii*HTTC M CmpwmKf Un 04W E^o» M*j< CV>J#fr»OIM«W r£jVfIUi -0AÉ 0 .w.œ.t ■GC.oe.» l«JOU B 0 3 3 ■ £ *WT #*«:*<com/»«6/gjwC'rriiga»/rf»wjo»jnaAVx*ni_ccrfcrt^6. £ <# HRp//««mhth»r.:««carv»»»/gjrji/m«g«sn»/jhoi»jMnA'wni.ccrlirt.'S H. ^NT thm*«h#*, i*caVret/gjMt/toagMna/iftowjxjnA'ojniartr»^.X t i NI»/Aew» fitamtccrv/^gjW/magaane.'rfiowjftjr^icwr*_ccrtfrt/5fc
j # Kfcthmm theassai cwn/^Mab/gjejfymagaane/^ow.jcMnafiouni.cortert^É.
•à l#K! //Wa* Jheasseï ccftvw»/g*r./mag<^/show_icMr^'cuTHl.cor<er*/5£
25 À 4f Map//W* th**u«ia^v^g*a/m*j)4ant/thow'j<xJMl,»xfri«_cort<rt75É. £ ^ MAP'/Ww tt**u«con/wib/gjMtAftigaanp/iftow>jMnNfajni(_cortartâ6.
îK ^'îwm\l9miécan/<mt)/9jmtM*tÊam/&omj**hé/tunéLcmimt/%,
_»l * * "
£ 4 hMph'nm. ecm/Mft/gjts/bagnnt/tfiowjumVojn*corhrt/56 t mh»/A*»*» fi»**)coath4b/gjMtAnagaif»/#ioi»joJnaf|xmA_corter</5É.
£ I# MAP'/**** cont/v*6/gjMlAnagAar»/to*jowulfairMi.carM/SÇ,
^ # MAP//w*> the**ccrvtMeC/gjer./rriêgaane-'tfw_)cxjMi'ixind_corttrt^
tL 4 MAPIhtmthMiiafcan/*nt/9*&firnçBfJ*o*juniU0jn*_ccrtort&m £ 4. N*t/nm, Ihaatt*cc«V«<e/gj»ji/mègè»*/|hO-jfc»a4VMn*_C«rt»rfcfl6. 4 MAPthmm thusW COnvMBb/pJAIt/tnagASnA/tAo*JMrnVpjTté^corltri.fy^ £ I# MAP//mm the«se<am^mb/pjtt/miQa^iwijBmtéfaunâjtrtmtAt, ^ p# ^//nmtthmit(U!ih/<N«b/9**/it*Q»!rmJihCMj*Mhd'tand_c&riertJ%M il; 4 MAP//mm com/^(^tt/inA9A^jhowjCMri4lA((xm«l_conl«rty5t.
NSTANCI.A«3/14/28984/34142Ml INS TANCE_Ao3/1 4/28912/3414214|
,MSTANCE>a3/14/29038/3414214|
,IN$TANCE_Att3/14/29098/34142Ml INS TANCE,A*s3/14/29406/34142(61
INSTANCE_AB3/14/29421/34142 Ml
INSTANC£_Àii3/14/29471 /34142 (5| .INS ! ANC£_A«3/14/41104/34142 f5|
INSTANCE_An3/14/43142/14436 «2|
wthe«î«tcoo^»*b<'ji»-,/r,.j5aar*.'ffo^.pjr * ccrttrt5E. INSTANCE ,A«2/T4/45061/3414231 .INSTANCE_AB2/1 4/47092/3414217| ,INSTANCE.A«t3n 4/48402/14436 (74| .INSTANCE .Ab3/14/48618/14436(77) .INSTANCE .An3/14/48639/34142(61 .WSTANCE_AB3/14/486SÛ/34142MI .INSTANC£.AB3n 4/48667/34l42 (4| ,INSTANC£_A«3/14/48697/14436(731 INSTANCE_Ab3/14/48701 /34142 ml .INSTANCE_AB3/14/48877/34142 ml ,INSTANC£_AB3/1 4/48972/14436 ml
TheAisetMagaanc
ElectroncTradng
Airmatr-'?tradngplaifonnîpushntcAsu
TbeAssetMar-2008By Rodnry Diola
Tony MackayunicelebratorymoodTheelectrouetradmgplatform. Ch-X Europe bar maderteadvgans sucebe andhtsteau£Instnet Europe crtabbhed8a yc* ago Snce the MirIL1 (MwkettmFmar.rul Instrument Directives reguUrtoryrégimetook effectnEuropem
Noveraber butyear.the afcematrvetradingryrtem(ATS),whereEurope» brted stocksc»betraded.barfaredextremelyweD
Byal wfcjftoa*.flooks lie Clu-XEuropewiE become thefirsttrulysuccesdulelectrouccommunicationnetwork (ECK)opermrçoutside
NorthAœnca
v/itr»taeariysuccess nEurope. Mackay\s oowtakagThi-Xtotbe ^ob^arenaHisne£stopuAsu.pamcularly Austraka. wLere regùators
havearme-uneedplanstoopenthe marierîtocompetiùooand provide»altemoveplatfonn for tradmg Austrahan stocks,m adeparturefromthe
Prnje navalêe Paçtnon«aveiée /'totexusn
^^nb*Btoda(t
^fW«Mnceî ejgnwig;t»g; •»*emportée Pagenone>poMée ftageer.Ignc NoueeUsource
Captured'écran de l'outil de veille KbCrawlayantterminésaphase de crawl.
2.3.2 Les différents tests
2.3.2.1 L'amélioration du rendu des documents avec KB Scrapper, KB portai
Enfin, au coursdece stage,j'aieu l'occasion d'utiliser certains outils de KBlntelligence. KBScraperpermet de sélectionner, dansune page web, une zonequi nous intéresseetde
demander, ensuite, à KBcrawl de crawler lecontenu de cettezone à chaque fois qu'elle
refit» Edter Atficfiog* Actom Otite PmmMrut Matlarmc* ?
CS^BC
31♦
♦ i B,r 33"Ltl'r 9 3 3otm SwwwQwHiMTTP Cm* c«r««w*» S»<o AuMmMmw :+vx« El*»» «*w«
DquKOMMke £2%mmm 1 AfP 1E~ à
H—®-^dessoueiejenceo^^ télp ttvm ateteéfodepoiy/inlwmahqjegl 31 à * c.wr.-.isrtfS!g<0 hlfp //«* *»*«h/aw.'cfiwvVérticto/cMriew-roma23«4w**<**»$«richne<r-2O061204)
^ «f Hlp//aiieaM»N/«e,'cNne/artide/gi«e^*i-enl!Www«i*Nues4onl4»ctM$eHBr««ele|1S?) $ 4 Mp//mm «éwl/é»»Afirw/»teM»*>x>4»Ke»<jr><»dné»w<w«itte-o-35Wall« (1*1 ^ É Mtp/Zone *<** Mnm/r&trnlKk/bmvùx+kuryjnmnMmiMtmtmmki/nniiommvM!'»)
*âf (fi ^ /ltm ***"**Zocqiwoico/ohdo/oltxbo-dom VMcMrnomfr-durij» mcwuoUvi-yihoo(186)
& fit M» //m» «Mè» •«•«<»*«« c*|166) J223È i jEnta»votre tfnX | ©aBaiduChtfiaMaWte Googte LÔMcrosoft Sina Yahoo' Youtube ■vFI#J*V.v'd
LGetSarrcurigrestentprudentssurleBUhRay
ieion I* Kern)7lm«etmalgréle («m potentielde U technotefte16» fc»jrles deuxplus S'er.dsfabricants coréens, Semfung et 10,nesouhaitentpas pourlemomet*investir
davantage dane cette technologie
Un porte parole deSamsungadéclaré fejr.#dernier tors d'uncommuniquédepresse<w# "pour le momentl'entreprise n'eve*aucuneintentiond'augmentersesinwdttuemenU
auprès desesfoumkseun de pièces'".Lesbénéfice:encoretroplimités d'unetete
technologienemotiventpaste constructeur * continuersesInuesttssementj Un officiel
del'entrepriseaajoutéqued'importantes études de marchéétaient en cours en ce
momentafin étudier de nouvelle:stratégies.
DesoncôteLG considéré te marche du 8lu-RayencoretropMMepourjustifie' de
nouveau*investissements tepri.encoreélevé des produits mot»quel'évoiutiondela
TVparInternet sont acftar*tfarguments annoncéspourexpliquerce p
masse
dm»j pemriretepMetorme di Seing 2008 atWele <fwpour le se*offasdesJOdeWM-.
debmse*TD-SCDMAenOane
«apoYertre sv m«ercfié des télécommaosabcviÊ
"*>]
fiJtor□ a h h w
«■
Jfirirar» Barqv Zoom* Zoom• Seuveproar
FBreaKkW r»esavarcés Sauter les flfiw S
J iJ"
i
jjj£
Ptgtnonc.portM[IK
Captured'écran de l'interface de KbScraper. Lazone rougesélectionnéeestlazone
pertinentequeKbCrawI devra surveiller régulièrement.
KBportal estun portail web. C'estun projet quia été lancéparMichel Bernardini. Il permet
auxgroupesveilles des filiales de BNPPARIBAS volontaires,devisualiser leurs veilles à
partir d'une interface de LEOnard. Bien entendu, chaque veilleur doit avoirl'outil KBcrawl.
Ilstransmettent lesparamètres deveille à la maison KBcrawl qui se charge de gérercette
veille etde diffuser les fruits decesveilles surLEOnard.
L'utilisation decesoutils aété l'occasion de débats et de réflexions utiles, cefutpourmoiun apprentissage intéressantetconcret de cesoutils.
J'ai aussieul'occasion deprésenter les fonctionnalités dumoteur de recherche auprès de
futurs utilisateurs. Cefut donc là,untravail de formation ànotreoutilqui m'a beaucoup enrichi.
2.4 La maîtrise d'ouvrage (MOA) au sein des Etudes Economiques
2.4.1 Lesprincipes de la MOA
Dansnotre contexte de réalisation deprojet informatique, ilestimportant de faireune
distinctionentredeux métiers. Lamaîtrise d'œuvre(MOE) etla maîtrise d'ouvrage (MOA).
Lamaîtrise d'œuvreestchargée de définir la solutionetles moyens pourréaliser,
mainteniretexploiter le produit finienconformitéavec le cahier des charges établi parla
maîtrised'ouvrage. Elleestresponsable durespect des standards techniques denature
informatique etde la pérennité des produits livrés.
Tandisquela maîtrise d'ouvrage estle donneur d'ordrepourlequel le produit fini seraréalisé. Elle estchargée de formaliser l'expression de besoins ainsiquelesnormesmétiers etles
dispositions qualité qui devront être appliquées, elle établit le cahier des chargesetensuite
contrôle la conformité des livrables remisparla maîtrise d'œuvre dans lerespectdu cahier
descharges.
Lesdeux métiers doivent marcher ensemble.
e Expertise métier -esseeeeeeeeee.
4
Pilote
*•
: MpA : eeeseeeeeeeee Équipe MOA <3 Document compréhensibleparlesacteurs de
la décision Expertise informatique
4
Pilote • * : ÉquipeMOE1
-I
e •e teSchémades relationsdynamiques entrela MOA etla
MOE4
4
Repris dans :PRINTZ Jacques,MESDON Bernard, Ecosystème des projets informatiques, agilité et discipline, Paris: Hermes
2.4.2 La MOAauxEtudesEconomiques : larépartition du travailentreles différents
acteurs duprojet (MOEBNPPAR1BAS etles éditeurs)
D'énormes étapes ontété franchiesdepuis les premières recherches des années 60, où
l'utilisateurposaitsaquestionaudocumentaliste qui la transmettait àl'informaticien, jusqu'à l'utilisation actuelle desmoteursderecherche, enpassantparl'interrogation des banques de donnéesparle Minitel. Nousvoyons qu'il existaitainsiune interdépendance des divers métiersavec lapertedetempsqui s'ensuivait.
LeprojetLEOnardromptavec ce processus. Eneffet, c'estundesobjectifs denotreprojet :
veilleràceque l'utilisateur soit leplus indépendant possible sansà avoir,nonseulement,un
rapportdirectavec lesdocumentalistespourdes sujets de recherche assezsimple,mais aussi,
pour ne pasà avoir à chercher,troplongtemps, le principe de fonctionnement dumoteurde
recherche. Les usagerssontpassésd'une situation de dépendance totalevis-à-vis des
professionnels àuneinteraction directeavec les outils.
Une foisl'objectif bien formulé, nouspouvionscommenceràentamerunedémarche qui
consistait à faire de lamaîtrise d'ouvrage, engardantenmémoirequel'objectif principal de la maîtrised'ouvrage estd'assurer le bondéroulement du projet informatique.
Dansleprojet LEOnard, lamaîtrise d'ouvrage aconsisté à faire :
-une étuded'opportunitéetde faisabilité du projet,une analyse des besoins des utilisateurs,
- l'évaluationetla
gestion des crédits allouésauprojet,
- la
réalisation du cahier descharges,
- le
pilotage età la coordination des activités des différents acteursdu projet,
- la vérificationdes livrablesen conformitéavecle cahier des
charges,
- la
définitionetde la mise en œuvreduplan decommunication, de formation, et
d'accompagnement,
-etenfin, le supportfonctionnel ettechnique des sites utilisateurs.
Danscettedescription détaillée des activitésmenéesparla maîtrise d'ouvrage, j'ai participé
aurecueil etàl'analyse des besoins des utilisateurs mais de façoninformelle. Eneffet,
puisque j'ai intégrél'équipe, lors demon stage, le projet LEOnard était à 3 ansde sesdébuts,
cette activité était doncdéjà effectuée. Cependant, il était utile,pour monapprentissage et
pourrafraîchir les donnéesde l'époque, detesterles évolutionsdumoteurde recherche auprès de certainséconomistes deBFI, ainsique, lorsque l'occasionseprésentait, auprès des
utilisateurs quinouscontactaientpouruneraison lambda. Connaissant ainsi plus endétail les besoins desutilisateurs, ilm'était doncpossible d'exprimer leursattentes en cequi concerne leprojet LEOnard lors deréunionavec leséditeurs. C'estune des activitésprincipales des assistants à la maîtrised'ouvrage. Us sontles intermédiaires entrelesutilisateursetle produit,
enl'occurrenceLEOnard.
J'aiégalement participé àl'accompagnementduchangement, c'est-à-direauxintégrations successives desmodifications évolutives dumoteurde recherche. Jeparticipaisnon pasà la
rédactionde larecettefonctionnelle mais à la validationdes fonctionnalitésexprimées dans le
cahier descharges etdétaillées dans les spécifications fonctionnelles. Cela s'est fait à l'aide deplusieurstestseffectués à chaque nouvellemodification apportée afin dedéterminer si
cettedernière était valideoupas. Lorsque celle-ci était concluante, je le signalais à la MOE de
BNPParisbas afin de clorela tâche.
Enfin,étantdonnée lenombre depersonnes ayantunniveau de connaissancevariable en
informatique, leurtempsd'appropriation auxfonctionnalités deLEOnardétait variable. Pour
nepasarrangerles choses, les ordinateurs, surlesquels ils travaillent, sontdifférents, sans
parler des systèmesd'exploitation etdesdifférents navigateurs avecleurs multiples versions. Pourcesraisons,nousproposons d'unepartla consultation d'un didacticiel afin de mieux
maîtriser lesprincipes defonctionnement de LEOnard, mais aussi,nous offronsunservice d'assistancetechniquepartéléphone. J'ai donc collaboré àcetteassistance téléphoniqueen
indiquantla procédure de marche dumoteurderecherche auprès des utilisateursetje leur
rappelaiségalement les principales fonctionnalités deLEOnard.
2.5 La mission principalede mon stage
Touteslesactivités décrites ci-dessusontfaitpartie demonquotidien ausein dugroupe
« EtudesEconomiques»mais ellesneconstituaient cependantpasl'essentiel dematâche,
Unemission essentielleetprincipale m'a été confiée etaconstitué letroncprincipal demon
stage.
2.5.1 Le choixdemamission
Dès ledébut demonstage, Michel Bernardini m'a informé qu'il souhaiteraitquejetravaille surl'intégration de l'outiltextmining de chezTémis. Cependant, il m'a exprimé cecisans
obligation, etm'alaissé le choix d'exprimerunetoute autremission qui répondeaux attentes
dedéveloppement/évolution de LEOnard.
J'ai donc décidé deme laisser dutempspourréfléchirafind'avoirunevision plus éclairée de
l'intérêtd'une missionplutôtqued'uneautre,mais aussi de la capacité à rassembler les
compétencesnécessairespourmeneràbiencettemission proposée.
Jeme suis concentré surdeux choix : l'un, qui aurait étéunemission de veilleavec
l'utilisation de l'outil KBCrawl etKBSraper. L'objectif aurait été d'améliorer le choix des
sources deveilles, d'améliorerles paramètresenplace etenfin, grâce à KBScraper, de
nettoyer les articlesdiffusésparLEOnard, detoutsdéchets(publicités, contenunon désiré,...). Cette mission était intéressantecarl'outil KBscraperaétéréceptionné lors des premiersjoursdemon stage. C'estunoutil développé parKBIntelligence, àlademandede l'équipe LEOnard. Un outil qu'il fallaittester etqui aurait engagé plusieurs réflexions.
Cependant,monchoix s'est orientéversl'intégration de l'outil textmining. Ce choix était, à
monsens, plus ambitieuxquele choix présenté précédemment. Je savais qu'en le choisissant,
jenepourrai assister, avantla fin demon stage,aufonctionnement parfait de l'outil.
Toutefois, les raisons qui m'ont déterminées à le choisirsont :
toutd'abord, j'ai des connaissances théoriquessurletextmining, acquisespar ma
formation demaster2PRISME àLille3,
ensuite, l'intégration decetoutil s'est déroulée pratiquementaudébut demon
stage. J'allaisdonc le découvriren mêmetempsque lesautrescollaborateursme
laissant ainsipenser queje pouvais, surcertains domaines aumoins, êtresur le
mêmepiedd'égalitéqueles collaborateursconstants de l'équipe.
Et, enfin, enparticipant àtousles tests,dèsle départ, j'auraisunepartactiveen
notantles failles inévitablesqui allaient seprésenter etendemandant leurs
corrections. Cela m'a vraiment donné l'occasion d'avoiruneintégrationactiveet
totale.
Plusieursproblèmes se sontprésentésaucoursdeces tests. Leprincipal, selon moi, était celui de lapertinence dusens des résultats diffuséparLEOnard. Dans l'interface dupanorama de la
pressequotidienne, ilyavait des incohérences entrecertainstermes desentités nommées
provenantdes cartouches de connaissance de Témis, etdes articles qu'ils retransmettaient. Parconséquent, j'ai pensé qu'il serait intéressantetpertinent detrouverunesolution afin de
remédier àceproblème.
Maparticipationà l'outil TextMiningestdéveloppéeendétaildans lechapitre suivant.
2.5.2 L'accord du responsableprojetinfromatique
Ayanttoutesles donnéesenmainpoureffectuermonchoixetenconnaissance de cause,j'ai prisma décisionetprésentémon choix àmonresponsable de projet informatique. Ilmefallait
aussi son avalpoursavoir si la mission confiée n'allaitpas êtretrop compliquée. J'ai obtenu
l'accord demonresponsable quimeprécisa qu'il fallaitque j'organiseunplan d'actions à
mener (détaillé plus loin)
Parconséquent,mamission consistait à faireunesérie de testspour :
évaluer laversion de cartouche de connaissanceactuelle,
analyser les problèmes rencontrés,
rédiger lesrecettes fonctionnellesmais de façon informelle,
etenfin,proposerunesolutionpouraméliorerla pertinence des articles diffusés par lestermes.
PARTIE III
3 PRESENTATION DU MOTEUR DE RECHERCHE
Dans cettepartie, nousverrons endétail des fonctionnalités dumoteurde recherche, comment
secompose le projetLEOnard, mais aussi de queltyped'informationnousdisposons etavec
quelle méthodenouslatraitons.
3.1 Historique des moteurs de recherche
Unmoteurde recherche estunrobotquirécupère chaque jour, surla Toile, des millions de
pagesWebpour les stocker dans les index afin d'identifier lestermes correspondant à la
question poséepar le demandeur.
Iltrie les pages trouvées selon les différents critèresavantd'afficher le résultatsous forme
d'une liste de références accompagnéesducontexte, phrases ouportionde texte, ayantpermis leur sélection. Bien sûr, lemoteurnepeut trouverquelespages qu'ilapréalablement aspirées
etindexées.
L'origine desmoteurs derecherche estapparuedansuncontexte où desmillions
d'informationsparcouraient Internet, et il était nécessaire detrouverunesolution afin de les
organiserd'une manière ordonnée etfacile d'accèspourtous.
Lepremiermoteurde recherche date de 1990. Depuis lors, unlong chemina étéparcouru jusqu'à Google crééparSergei BrinetLarry Pageen 1998. C'était alors l'époque où les
connexionsInternetétaient à bas débit, et, lavéritablerévolution consistaità avoirconçu une
interfacedépouilléepour quelespagespuissentse chargerassez rapidementd'unepart, et d'autrepart, detrouverdes investisseurs qui financent leurs recherches etdéveloppementen établissant des lienssponsorisés. L'innovation deGoogle sebasait surlenombre de liens
pointantsur une pagequi déterminaitsapertinence.
LEOnardest toutd'abordunmoteurderecherchequi stocke despagesweb sur leserveur internedeBFI. Ensuite, il identifie leoulestermesde larequête, trouvelespages
correspondantes, c'est-à-dire lespagespossédantun oulatotalité destermes exprimés dans la requête. Enfin, il présente les résultats sousforme de listeavec pour chacun d'eux le titre de
l'article sousforme de lien, plus lecontexte, sous forme de paragrapheavec lesmotsde la