L'évaluation des logiciels de veille, un cas pratique : la mise en place de la cellule de veille au sein d'ELDA

(1)

HAL Id: dumas-01689378

https://dumas.ccsd.cnrs.fr/dumas-01689378

Submitted on 22 Jan 2018

HAL is a multi-disciplinary open access

archive for the deposit and dissemination of sci-entific research documents, whether they are pub-lished or not. The documents may come from teaching and research institutions in France or abroad, or from public or private research centers.

L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau recherche, publiés ou non, émanant des établissements d’enseignement et de recherche français ou étrangers, des laboratoires publics ou privés.

L’évaluation des logiciels de veille, un cas pratique : la

mise en place de la cellule de veille au sein d’ELDA

Florent Bride

To cite this version:

Florent Bride. L’évaluation des logiciels de veille, un cas pratique : la mise en place de la cellule de veille au sein d’ELDA. Sciences de l’information et de la communication. 2009. �dumas-01689378�

(2)

eL

Da

UFR IDISTde Lille III Charles de Gaulle ELDA

L'évaluation des

logiciels de veille,

un

cas

pratique

_:

La mise

en

place de

la cellule

de veille

au

sein

d'ELDA

Mémoire de_{Stage M2 ICD}_parcours_PRISME_2008/2009

Etudiant: Florent Bride

Tuteursuniversitaire :_{Stéphane Chaudiron} _et _Ismaïl_Timimi Tuteur_{professionnel} _:_{Valérie Mapelli}

(3)

(4)

Remerciements

Je remercieValériepourletempsqu'ellem'a consacréetles conseils qu'elle m'aprodigués.

Jeremerciel'équipe d'ELDApour sagentillessequia surendrecestageaussiagréablequepossible.

(5)

(6)

SOMMAIRE

INTRODUCTION 8

I. PRESENTATION DE LA MISSION ET DU CORPUS 10

A. Le cadre etle domaine 10

1. Les_{technologies de la langue} ₁₀

2. Lesacteurs 10

a) ELDA 10

b) Concurrents 11

B. La missionet l'audit 13

1. La mission 13

a)

Étude

du stage précédent 13

b) Mission dustage actuel 14

2. L'audit 15

a) La veilleau seind'ELDA 15

b) Analyse des besoinsinternes 16

c) Analysedesbesoinsexternes 16

C. _Sourcing _et_corpus ₁₇

1. _Sourcing ₁₇

a) Identification du type de veille 17

b) Critèresde sélection 18 c) Méthodologie 19 d) Typesde sources 19 e) Modes de diffusion 20 f) Classification 22 2. _{Corpus de}_test ₂₂ a) Critères de sélection 22 b) Sélection 23 c) Limites 25

(7)

II. RECENSEMENT ET TYPOLOGIE 28

A. _Questions _{préliminaires} ₂₈

1. Outils de veille : définitionet_{spécificités} ₂₈

2. Évaluation_technique_ou _{évaluation d'usage ?} ₂₉

3. Boîte noireou boîte _transparente _? ₃₀

4. Retoursurinvestissement ? 31

a) Rôle du ROI dans la veille 31

b) Au seind'ELDA? 33 B. Recensement 35 1. Critères de sélection 35 2. Fonctionnalités ciblées 35 3. Méthode de recherche 36 4. Méthode de validation 37

C. _{Typologie des outils} ₃₇

1. Outils de _{surveillance des pages}_web ₃₈

2. LecteursRSS 40

3. Moteurs de recherche 40

4. Outils_{complémentaires} ₄₂

III. ÉVALUATION 44

A. _{Critères pour}_{l'évaluation} ₄₄

1. _{Méthodologie} ₄₄

2. Étatde l'art des_{méthodologies}_{d'évaluation} ₄₅

3. Critères _{d'évaluation pour}_{les outils} _{de surveillance} ₄₇

4. Critères _pour_{l'évaluation des lecteurs}_RSS ₅₀

5. Critèresd'évaluation_pour_les_moteurs _de_recherche ₅₂

B. Grilles d'évaluation 53

1. Grilles _propres _à_chaque_catégorie ₅₄

2. Grille de _{synthèse des fonctionnalités} ₅₄

(8)

C. Barèmeet_remarques ₅₇

1. Barème 57

2. Informations_techniques ₅₈

3.

_Épuration

_de_{la liste} _des_logiciels_à _évaluer ₅₉

CONCLUSION 62

BIBLIOGRAPHIE 64

SITOGRAPHIE 66

ANNEXES 68

A. Cahier des _charges ₆₈

B. _{Planning prévisionnel} ₇₁

C. Grille des sources 72

D. Liste des_logiciels _{de veille} ₇₄

1. _{Logiciels de surveillance de} _site _web ₇₄

a) Solutions propriétaires 74

b) Solutions open-source 74

2. Moteurs de recherche etcrawler 75

a) Moteursde recherche sanscrawlers 75

b) Moteursde recherche aveccrawlers 75

c) Crawlers 76

3. Lecteurs RSS 76

a) Lecteursenligne 76

b) Lecteurssur poste 76

c) Lecteurssur serveur 77

4. Autres 77

E. Grilles d'évaluation 78

(9)

b) Lecteurs RSS 80

c) Les moteursde recherche 81

2. Grille de_{synthèse des}_{fonctionnalités} ₈₂

(10)

Introduction

La _veille, _{contrairement à} ce _{que ce} _{terme peut} _laisser _penser _{à certains,} _est

tout sauf une activité _statique. _{Elle implique} _une _pratique _dynamique, _un _suivi _des

évolutions constant. Ce suivi ne se manifeste pas _uniquement_{dans les} _informations

auxquelles elle s'intéresse, mais également danssapratiqueenelle-même. Eneffet, la

veille se doit de _s'adapter _{en permanence aux} _{évolutions du} _monde _{de l'information}

afin de resteraussi_pertinente _que _possible.

Or le monde de l'information a bien changé depuis _une _quinzaine d'années.

Le webestdevenu une source d'information_importante _dont_{l'exploitation}_a _posé _de

nouveaux _problèmes,_tels_que _« _comment_éviter_{l'infobésité} _? _».

Si la veille est avant tout le fruit d'un savoir-faire et d'une _{méthodologie, le}

recours à des _{logiciels s'est alors} _{avéré précieux} _pour _{les professionnels de}

l'information.

La mise en _{place d'une cellule de veille} _passe _{donc aujourd'hui} _{par une}

réflexion sur le choix du _logiciel _à _adopter _pour _le _{fonctionnement de} _cette _veille.

Cette _réflexion, _si_elle _veutêtre _pertinente, _{doit s'appuyer} _sur _{des données fiables}_qui

peuventêtre recueillieslors d'une évaluation.

On _peut _alors _se _demander _: _comment _évalue-t-on _{des logiciels de veille} _?

Quelsproblèmescela peut-ilposer? Quelle méthodologie cela peut-ilnécessiter ?

Nous allons aborderces _questions _{au cours} _de _ce _mémoire _au _travers _d'un _cas

pratique,lamiseenplace d'une cellule deveille auseind'ELDA.

Dans une _première _partie, _nous _allons _présenter _le _contexte _du _stage _pour

lequel s'est déroulée cette réflexion ainsique la mise en place du corpus de test quia

été élaboré _pour_cette _évaluation.

Nous allons ensuite aborder la _question _du _recensement _ainsi _que _{de la}

(11)

Enfin, notre dernière _partie _va _porter sur l'évaluation en elle-même,

l'élaboration des critères de _sélection, _leur _exploitation _au _sein _{de grilles}

(12)

I. Présentation de la mission et _{du corpus}

A. Le cadre etle domaine

1. Les_technologies _de _{la langue}

L'expression « technologies de la langue » recouvre l'ensemble des produitset

desservices _ayant_pour _{objet le} _{traitement automatique}_{des langues,}_que _{l'on désigne}

égalementsous l'acronyme TAL. Les technologies de la langue sont donc le fruit de

l'allianceentre la_linguistique _et_la_technologie.

Elles s'intéressent à tout _type _{de données linguistiques, qu'elles} _soient _des

textes écrits ou des corpus oraux par _{exemple. Elles} _ont _{de multiples applications}

auxquellesnous faisons face tous les jours, telles que la correction automatique dans

les traitements detexte oules_{logiciels de traduction} _automatique.

Elles sont _{également l'un des domaines-clefs capables de répondre} _aux

problèmes posés par l'augmentation ininterrompue des flux d'informations et les

nouvelles_{technologies.}

2. Les acteurs

a) ELDA

ELDA, _{agence pour}_{la distribution des} ressourceslinguistiquesetl'évaluation,

est une société commerciale. Elle est _{le corps} _{opérationnel d'ELRA,} _association

européenne pourlesressourceslinguistiques.

ELDAaété créée dans le but_{d'identifier, classer, collecter, valider}_et_distribuer

les ressources _{linguistiques} _pour _le _compte _d'ELRA _et _à _{destination de} _ses _membres,

de ses clients et de la communauté de _{l'ingénierie linguistique dans} _son _ensemble.

Ellea ainsi_{également la charge de la} _gestion _des _questions_{techniques, commerciales}

(13)

ELDA _s'occupe _aussi _{de la} _maintenance _et _{l'alimentation de plusieurs} _sites

web. Il y a naturellement les sites web d'ELDA et ELRA1, le site web d'ELRA

incluant lui-même le _{catalogue des} _ressources _{linguistiques distribuées} _par _ELRA2.

De _{plus, Il} _y _a _le _Catalogue _Universel _qui _{est, quant} _à _lui, _un _inventaire _des

ressources _{linguistiques3.} _Il _{y a} _{également les} _{portails Technolangue} _et

HLT-Evaluation4.

Le cas de Technolangue _est particulier puisqu'il s'agit du fruit d'une

collaboration entre _plusieurs _partenaires _{dans le cadre} _d'un _{projet européen} _qui _a

prisfinen2006.Sonexistenceestactuellement exclusivementassurée parELDA.

b) Concurrents

ELDA a donc comme activités _principales _{la distribution} _et _{la production de}

ressources _{linguistiques} _ainsi _que _{l'évaluation} des technologies de la langue _et la

diffusion d'informations sur le TAL. En raison de ces activités transversales dans le

domaine,les axesdeconcurrence ne sont_pas _uniques.

Si Ton considère le domaine de la distribution et de la _production _des

ressources _{linguistiques,} _son principal _{concurrent est}le LDC5, _créé _en _1992. Comme

ELDA,le LDC _{dispose d'un catalogue} en ligne6 qui recense aussi bienles ressources

produites sous un financement gouvernemental que toute autre ressource produite

par le LDC ou un acteur externe souhaitant la partager avec le reste de la

communauté. La _politique _{tarifaire du LDC} _est_{également proche de celle d'ELDA}_en

^ttp:// www.ELDA.org/ et http:/ /www.elra.info/ (consultés le 1er

septembre 2009)

2

http://catalog.elra.info/ (consulté le 1erseptembre 2009)

3

http://universal.elra.info/ (consulté le 1er septembre 2009)

4

http://www.technolangue.net/ ethttp://www.hlt-evaluation.org/

(consultés le 1erseptembre 2009)

5

Linguistic Data Consortium dont le siteweb est:

http://www.ldc.upenn.edu/ (consulté le 2septembre 2009)

6

(14)

ayant notamment largement recours à la pratique de prix réservés à des adhérents

cotisants.

Il faut _également _noter _qu'il _existe _{le ChineseLDC1} _en _Chine _et _{le GSK2} _au

Japon. De même, au sujet de la distribution de ressources linguistiques, remarquons

le _{développement actuel de} _{centres autour} _des _ressources _{linguistiques,} _notamment

enIndeavec le TDIL3et LDC-IL4.

De nombreux laboratoires et différentes sociétés _produisent _aussi _des

ressources _{linguistiques dans le cadre de leurs} _{travaux et} _{les rendent disponibles} _en

dehors des réseaux LDC et ELDA. Contrairement à ELDA _qui_distribue _tout _type _de

ressources, celles _produites _par _les _{laboratoires dépendront} _de _{la spécialité dudit}

laboratoire. À titre _d'exemple, _citons _l'UPC5 _qui _est _spécialisé _dans _{les technologies}

dereconnaissancevocale.

Dans le domaine de l'information,unconcurrentdirectestle DFKI, qui estun

organisme allemand, avec son portail anglophone LT-World6. C'est un portail

d'informations sur les _{technologies de la langue} _constitué _de _quatre _grandes_parties _:

les _{informations, les} _acteurs, _les _produits _et _les _ressources _et _enfin _une _partie

communication _qui _inclut _{les actualités, les} _conférences _et _une _{base de} _connaissance

surles brevets.

1_le _site_web

enversion_anglophone_:

http:/ / www.chineseldc.org/EN/index.htm (consulté le2 septembre 2009)

2 _le _site _web _en _version

anglophone : http://www.gsk.or.jp/index e.html

(consulté le2septembre 2009)

3

http://tdil.mit.gov.in/ Technology Development for Indian Languages

4

Language Data Consortium for Indian Languages : http://www.ldcil.org/

5_Université

Polytechnique de Catalogne, ontrouveses ressources ici :

http:/ /gps-tsc.upc.es/veu/LR/ (consulté le2 septembre 2009)

6

(15)

Concernantl'activité en évaluation des technologies, _on _peut faire _mentionde

CELCT1 _qui _est _un _acteur _{italien directement relié} _à _DFKI. _On _peut_aussi _remarquer

le NIST2 _qui _est _un _{important organisme} _{gouvernemental américain très} _impliqué

dansles activitésd'évaluation.

B. Lamission etl'audit

1. Lamission

a)

Étude

dustage précédent

Un _précédent _stage _relatif _à _{la veille} _a _été _effectué _au _sein _{d'ELDA du 2 avril}

au31 août2007 _parSandra _Ferret. Sonthème _étaitl'analyse _et l'évaluation du portail

Technolangue qui est, entre autres choses, un portail d'informations sur les

technologies de la langue.

En tant _que _{tel il} _nécessite _d'être _{régulièrement alimenté} _en _nouvelles

informations du domaine des_{technologies de la langue. C'est}_en _partie _dans _ce _cadre

que Sandra Ferret - qui fut pour le temps de son stage chargée de l'alimentation

dudit _portail _- _a _mis _en _place _une _veille. _Sa _veille _servait _également _à _{alimenter le}

catalogue de ressourceslinguistiques égalementmaintenupar ELDA.

Afin de l'aider dans cette _{tâche, elle} a eu recours au _logiciel Website Watcher

édité par Aignes3. Il s'agit d'un logiciel payantmais dont l'éditeur met à disposition

du _public _une _version _{d'évaluation. Cela lui} _a _permis _de _{surveiller jusqu'à 1110}

pagesweb différentes.

Toutefois, la licence du logiciel n'a pas été acquise par ELDA à la suite de ce

stage. Il n'y a pas eu non plus de mise en place de dispositif pérenne. La seule

documentationsur _laquelle _{nous pouvons} _aujourd'hui _nous _{baser afin} _{de capitaliser}

sur_{l'expérience de}_ce _stage _précédent_est_le_rapport_du _stage.

1 _Center _{for the Evaluation of}

Language and Communication Technologies

http:// www.celct.it/ (consulté le 2 septembre 2009)

2_{National Institute of}_{Standards and}

Technology

http: / / www.itl.nist.gov/iad / (consulté le 2 septembre 2009)

3

(16)

La conclusion _principale _de _ce _rapport _est _que, _{malgré la} _quantité

d'informations utiles que cela a pu apporter, la surveillance de 1110 signets apporte

trop de bruit. Il était donc conseillé d'en réduire significativement le nombre afin de

passer moins de temps à sélectionner les informations pertinentes. L'un des objectifs

de cette _{préconisation était} _{d'avoir davantage de} _temps _pour _{la rédaction des brèves}

etleur miseen_ligne_sur_le _site _{Technolangue.}

b) Mission dustage actuel

Le _stage _se _{déroule du} ₁₄ _avril _au ₃₀ _septembre ₂₀₀₉ _et _sa _mission_est _la _mise

en_place _d'un_dispositif_pérenne_{de veille} _au _sein_d'ELDA.

Cette veille devra _permettre _{l'alimentation} _du _site _Technolangue _ainsi _que

d'un futur _{portail du} _nom _{de HLT-Central.} _Ce _dernier _{sera une} _version _anglophone

de _Technolangue _et_{s'inspirera également du} _site_LT-World.

L'objectif final est de faire des sites Technolangue et HLT-Central deux

sources d'informations incontournables pour _tout _{professionnel} _{officiant dans} _les

technologies de la langue. La veille ne s'intéressera donc pas uniquement aux

signauxfaibles, elleporteraégalementsurl'ensemble des informations dudomaine.

La veille sera essentiellement_{technologique} _tout _en _recouvrant _{également des}

aspects d'une veille économique. Ses axes de surveillance ont été prédéfinis par

ELDA et sont: les produits, _{à savoir} quels _nouveaux _produits _peuvent _{être mis à}

disposition du public; les technologies, le but étant en partie de s'intéresser à elles

afin d'en _{dégager les tendances du} _moment_; _{le marché} _et _son _évolution, _suivre _les

différents acteurs du marché ainsi _{que ses} _mouvements _tels _que _les _{partenariats,}

fusions, etc.; les événements, afin de _pouvoir recenser les différentesmanifestations,

colloques ouautresconférences.

Dans _{l'idéal, la veille s'effectuera exclusivement} à l'aide d'outils _gratuits _et

open-source. Toutefois, si cela s'avèrenécessaire, l'achat d'unelicence ou le recours à

unlogiciel_{propriétaire}_pourra _être_{envisageable.}

Le _stage _se _décomposera _en _cinq _étapes. _Dans _un _{premier temps,} _un _audit

aura lieu afin _{d'analyser l'existant} _et _{d'établir le} _{cahier des} _{charges selon} _une

(17)

c'estune fois écoulée une certaine durée _{préalablement définie} _que _l'on _passera _à _la

troisième_phase. _En _effet, _nous _{effectuerons alors} _un _{recensement et} _une _évaluation

des différents outils existants en vue de décider _{quelle solution logicielle} _sera

adoptée. En conséquence de ce choix, onprocéderaà la mise en place de la solution

et à sa validation. Enfin, la dernière _étape _sera _{l'exploitation de} _la _solution _au _sein

d'ELDA.

Une réflexionau _sujet_du _retour _sur _{investissement}_sera _également_menée _au

cours de la mission. Elle pourra aboutir _{sur une} _mise _en_application, _mais _cela _reste

optionnel. Ajoutons qu'ilestsouhaitableque la solutionpuisse servir àl'alimentation

du_{Catalogue Universel}_mais_{que ce} _n'est_{pas une} _exigence.

2. L'audit

a) Laveille au seind'ELDA

ELDA _emploie _actuellement _une _{dizaine de} _{personnes, son} _effectif _variant

légèrement selon lesprojets, certains nécessitant d'avoir recours àd'autres personnes

embauchées àtitre_temporaire.

ELDA est structurée en _quatre _{départements. Il} _{y a} _{le département de}

communication et de _{marketing, le département informatique, le} _département

d'identification et de distribution des ressources _{linguistiques} _et _{enfin celui} _de _la

productionetde l'évaluation desressources linguistiques.

Concernant l'alimentation du _portail _{Technolangue,} _personne _n'y _est

actuellement_assigné. _Si_{le personnel d'ELDA effectue} _une _{veille quotidienne, celle-ci}

s'inscrit dans la démarche du «currentawareness1 ».

Il faut aussi _{rappeler qu'il n'y} _a _pas _eu _de _{capitalisation possible de}

l'expérience du stage effectué en 2007. Le recours à un logiciel dédié à la veille n'a

!Le «current awareness » - expression _que Ton pourrait traduire _par _« être

actuellement aucourant » - étantle fait de s'assurer d'être en _{permanence au} _fait_des

dernières actualités dans des domaines _précis. _{Il s'agit d'une} _{pratique aussi} _courante

quenécessaire dans de nombreux métiers, notammentet pour des raisons évidentes,

(18)

donc pas changé les pratiques en interne. La veille s'y effectue donc toujours grâce

aux lettres _{d'informations,} _aux _listes de _diffusion ou autres _publications _papier _ou

bien encoreà des_{logiciels tels} _que _des _agrégateurs _RSS.

b) Analyse des besoinsinternes

En _interne, _ELDA a besoin d'undispositif de veille _structurée afin _de _pouvoir

effectuer une alimentation _rapide _et _de _{qualité de Technolangue} _ainsi _que _de

HLT-Central. L'alimentation du _{Catalogue Universel} _a _{été mentionnée} _{précédemment}

comme étant une _{application potentielle de} _ce _dispositif, _mais _elle _est _optionnelle _et

n'aurait pas lieu dans l'immédiat. Elle n'est donc pas qualifiée ici comme relevant

d'unbesoin.

La _personne _qui _sera _{chargée d'utiliser} _le _{dispositif de veille} _mis _en _place _ne

sera _{pas une personne} _{recrutée à} _cette _{occasion, mais} _proviendra _{de l'effectif} _actuel

d'ELDA. Elle sera _désignée _par _la _suite, _une _{fois le dispositif de veille} _mis _en _place.

On verra alors comment _dégager _un _créneau _horaire _{à cette} _personne _{afin qu'elle}

puisse s'en occuper. La question du temps est donc cruciale, le dispositif se doit

d'être aussi_peu_chronophage _que _possible.

Enfin, le fait de créer deux sources d'informations incontournables _pour _les

professionnels des technologies de la langue permettrait d'apporter un prestige

supplémentaire àELDAfaceà sesconcurrents.

c) Analysedes besoins externes

En _externe, _il _y _a _une _forte _attente _{de la} _part _{des professionnels des}

technologies de la langueenmatièred'informations dans leur domaine.

Il leur faut bien évidemmentêtreconstammentau fait des dernières _actualités,

qu'il s'agisse de nouvelles normes ou des dernières avancées de la recherche. Un

portail assurantune veille efficace pourraitalors, sice n'est remplacer complètement,

dumoins _{compléter leur}_propre _veille.

De _{plus, le fait de} _{proposer en un} _point _centralisé _un_{ensemble d'informations}

permet de mettre à disposition un point de départ pour une recherche

(19)

sous-domaine avec _lequel _{il n'est} _pas _familier _et _{qui, à} _ce _titre, _ne _fait_{ordinairement}

pas partie de ses pratiquesde veille, le portail lui permettrait de rapidement palier à

ses lacunes.

C. _Sourcing_et_corpus

1. _Sourcing

a) Identification dutype de veille

Le _sourcing _est _la _démarche _qui _consiste _à _{rechercher, sélectionner} _et _valider

les sources _qui _vont _servir _à _la _{veille. C'est} _une _étape _{importante puisque} _{sans un}

sourcing de qualité on ne peuteffectuer de veille efficace. Or, pour effectuer un bon

sourcing ilfauttoutd'abordidentifier quelleestlaveilleà mettre enplaceet quels en

sontlesbesoins.

Ici, nous recherchons à alimenter un _portail _en _actualités _ayant _un _rapport

avec les technologies de la langue. Notre veille _se révèle donc _être principalement

une veille _{technologique,} _aussi _scientifique _et _technique. _Cependant, _si _l'on

s'intéresse aux axes de surveillance tels que définis _par _ELDA, _on s'aperçoit _que _la

veille aura aussi une dimension _économique _puisqu'elle _{aura en} _partie _pour _{objet le}

marchéetl'évolution desacteursdu TAL.

Après avoir défini le type de veille àmettre en place, il nous faut identifier le

degré de fiabilité exigée de nos sources. En effet, toute veille ne recherche pas un

même _{degré de fiabilité. Certaines} _vont_{principalement s'intéresser} _aux_informations

informelles, chercher à être autant en amont du flux d'information que possible. Le

prix de cette course à la primauté est le fait d'accepter d'avoir recours à des

informations _{potentiellement fausses.}

Dans le cas _présent, le produit de la veille _se doit d'être _aussi fiable _que

possible. En effet, l'objectif d'ELDA est de mettre au point deux portails web

incontournablesdans leurs domaines. À ce titre,on ne saurait se _permettre _de _mettre

en _{ligne des} _rumeurs _{et autres} _{bruits de couloirs. Il} _est_très _important _que _le _public

ait _{l'assurance que} _{les informations publiées} _sont _toutes _fiables. _La _fiabilité _vient _ici

(20)

b) Critères desélection

Nous _pouvons _tout _d'abord _nous _reporter _au _{compte-rendu du} _séminaire _du

groupe de travail du GFII « Intelligence économique etéconomie de laconnaissance,

outils et solutions d'accès à l'information » tenu le 23 octobre 2006 à la Chambre de

commerce et d'industrie de Paris1. Bien _que _{légèrement daté,} _on_peut_voir _qu'il _y _est

préconisé de surveiller principalement les dépôts de brevets. Il y est également

mentionnéun cas _{particulier, celui} _{du Cemagref,}_où_{la veille} _scientifique _et_technique

se doit d'avoir recours à des sources _élargies. _Cependant, _ce _point_n'est _pas _détaillé,

le choix dessources_n'ayant_{pas encore eu}_{lieu lors du} _séminaire.

Si la surveillance de brevets semble être une _sage _{idée, elle} _requiert _des

compétences techniques poussées afin de pouvoir les déchiffrer correctement. Or la

personne qui sera chargé de la veille n'a pas encore été désignée et l'on ne saurait

donc être certain de ses connaissances en la matière. De _plus, _le _secteur _du _TAL _est

très riche et une _personne _experte _en _résumés _automatiques _ne _l'est _pas

nécessairement en traduction _automatique _de _{la langue.} _Nous _devons _donc _nous

tournervers d'autres_types de_sources.

Sinousne _pouvons _{sélectionner}_{des brevets,} _{nos sources}_{doivent toutefois}_être

aussi _{officielles que} _{possible afin d'en} _assurer _{la fiabilité.}

_À

_{ces sources} _officielles,

nous devons _ajouter _celles _réputées _fiables _auprès _{de leurs} _pairs. _Nous _faisons

principalementréférence iciaux listes de diffusion.

Face à cette stricte restriction de nos _{sources, on} _pourrait _craindre_un _éventuel

« effetde_pénurie d'informations

», phénomène parlequelonviendraitàmanquer de

matièreafin d'alimenter les sites web._{Cependant, la richesse du domaine du}_TAL _est

assez_grande _{pour nous assurer que}_pareil _scénario_relève _{de l'improbable.}

1

Jennifer Clerté. « Quelles sources pour quelles veilles ? Compte-rendu du

séminaireGFII » inBases n°233. Bases, Paris, décembre 2006. Disponible_enligne _:

http://

(21)

c) Méthodologie

Un _premier _travail _de _sourcing _a _été _{effectué lors du} _{projet tutoré}

Technolangue qui a eu lieu en coopération entre le Master 2 PRISME et ELDA

pendant les trois mois qui ont précédé le stage. Ce sourcing a eu lieu selon des

critères sensiblement semblables à ceux _que _nous _venons _d'évoquer. _{Il s'est}

principalement servi des sources fournies par un document provenant du stage de

Sandra Ferret ainsi _{que par un} _{travail de recherche} _sur _Internet. _{Ce travail de}

recherche a notamment _procédé _{par recours aux} _annuaires _{et autres} listes de liens

des sites _{déjà identifiés. Il}_{y a} _également _eu _une _partie _du _sourcing _par _{interrogation}

directe demoteurs derecherche _puis_par _tri_{des différents} _{sites trouvés.}

Les sites ontalorsétévalidés_par_{le personnel d'ELDA}_qui _les _a_classés _suivant

les sous-domaines des _{technologies de la langue}_couverts.

Ce _sourcing _a_été _{complété lors du} _stage _{par un nouveau} _{travail de recherche}

sebasantnotammentsurla lecture de NetRecherche1. Ma tutrice_{professionnelle} _ainsi

que le PDG d'ELDA m'ont également faitparvenir les noms de plusieurs sites qu'ils

désiraientvoir_apparaître _{dans la liste des}_sources_à _surveiller.

d) Typesde sources

Les sources _qui _ont_été _retenues _sont _{principalement les}_sites _{web officiels des}

laboratoires, les sites officiels d'organismes ou d'entreprises reconnus dans le milieu

etles listes de diffusionde référence. Cesontdonc icides sources _{spécialisées dans le}

domaine duTAL.

Des sources _{généralistes} _ont _également _été _{sélectionnées. Il s'agit} _toujours _de

sources officielles ou de référence comme les _agrégateurs _{Yahoo News2} _ou _Google

News3 ou les sites comme 01 _{Informatique4.} _Bien _que _n'abordant

1Véronique Mesguich, Armelle Thomas. Net Recherche, Le guide Pratique pour

mieux trouver_{l'information utile.} _2007,_{ADBS Editions,}_Paris.

2

http://fr.news.yahoo.com/ (consulté le 1erseptembre 2009)

3

http://news.google.com/ (consulté le 1erseptembre 2009)

4

(22)

qu'occasionnellement les technologies de la langue, on considère qu'elles peuvent

être des sources intéressantes, _apporter _un _autre éclairage _voire _mettre _en _avant

certaines informations _pouvant _être _négligées _par _les _sources _{spécialisées. Toutefois,}

leur sélection _apporte _{obligatoirement du bruit qu'il} _nous _faudra _savoir _gérer _par _la

suite,sans_quoi_nous _serions _aufinal obligés de _{nous passer} _de _{ces sources.}

Nous _{n'avons pas} _{sélectionné de}_blogue_ou _{de forum}_parmi_{nos sources.} _Nous

justifions ce choix par le fait de ne pas avoir trouvé de blogue à la fois pertinent et

objectif. Si certains blogues présentent des informations intéressantes, ils le font de

manière _trop _subjective _pour _pouvoir _être _conservés _ou _bien_portent _{principalement}

sur des retours _{d'expérience.} _Si _nous _étions _{dans le cadre d'une} _{veille d'opinion, ils}

nous auraient fortement _intéressé, mais dans le cadre de _notre veille nous ne les

avons _pas _retenus.

C'estla surveillance des acteurs du marché _qui _{s'est révélée} _être_{la plus ardue.}

En _{effet, cela}_{suppose en}_{théorie d'avoir}_recours _à _des_sites _{spécialisés} _{dans l'actualité}

économique. Toutefois, ceux-ci drainent une grande quantité d'information

entraînant inévitablement un bruit _conséquent. _{La maîtrise} _de _ce _bruit _exige _donc

une connaissanceaussiexhaustive quepossible des différents _acteurs du marché.

De _plus, _nous _{recueillons déjà des} _informations _sur _{les évolutions du marché}

au travers denos sources _{spécialisées} _et _{généralistes.} _Les _agrégateurs _comme _Google

News font notamment _apparaître _{dans les} _rubriques _«_Technologies _» _toutes _les

évolutions du marché touchantàunacteur du marché_{technologique.}

En _{conséquence,} _{nous avons} _{décidé de} _{ne pas} _{sélectionner} _de _sources _portant uniquement sur le secteur économique. Nous avons estimé que cela nous permettait

de considérablement atténuer _{l'ampleur du bruit} _à _gérer _sans _entraîner _{de silence}

gênant.

e) Modes de diffusion

Une _typologie _suivant _{les modes de diffusion} _a _été _mise _en _{place. Nous} _en

avons recensés trois: la _pageweb classique, la liste diffusion _etle flux RSS. Le but de

cette _typologie _était _de _{savoir si} _l'outil _mis _en _place _pouvait_{ne pas} _savoir _exploiter

un mode de diffusion ou bien si tous lui étaient nécessaires. Cette information nous

(23)

Il en est ressorti _que _{six sites} _ne _mettent _pas de flux _RSS _à disposition du

public. Il s'agit de LT-World1, Langage naturel (LN du CINES)2, CorporaList3,

Terminometro4, l'OESI5, le ministère de la culture (promotion de la langue)6 et la

SIGGEN7.

Parmi ces _sites, _{tous mettent} en _ligne _sur _leur _page _{web les informations} _qui

nous intéressent. Il faut alors mentionner le fait _qu'il _peut_être _{aujourd'hui possible,}

grâce à divers outils dontcertains que nousévoquerons plus loin, de créer soi-même

un flux RSS _depuis _{une page} _web _existante. _Ce _peut_être _une _solution_{intéressante} _si

l'on désire _{prioritairement avoir} _{recours au} _{RSS. Cependant,} _{le mode} _de _mise _en

ligne de CorporaList ne permet pas la création de flux RSS à l'aide des outils

existants.

Précisons _que _si _nous _ne _pouvons _{obtenir de} _flux _RSS _directement _{depuis le}

site web de _Corpora, _on _peut _avoir _{accès à} _ses _informations _par _{messagerie, étant}

donné _qu'il_s'agit_d'une _liste _de _diffusion_{dont le}_site _web _présente _les _archives_mises

à_jour _{quotidiennement.}

Enfin, précisons que Corporaest l'une de nos sources incontournables et qu'à

cetitre on ne _peutl'omettre_au _coursde _notreveille.

Dans_{l'idéal, l'outil}_qui _sera _mis _en_place _ne _doit_donc _pas _{uniquement être}_un

lecteur de flux _{RSS, il}_doit_également_pouvoir _{surveiller les} _pages_web_ou _{les listes de}

diffusion. Une veille _passant _par _un_lecteur _RSS _reste _{toutefois envisageable,} _soit _en

appoint soit en la complétant d'une consultation en ligne de la liste de diffusion

Corpora.

1

http://www.lt-world.org/ (consulté le 1erseptembre 2009)

2

http: / /liste.cines.fr/info/ln (consulté le1er septembre 2009)

3

http://gandalf.aksis.uib.no/corpora/ (consulté le 1erseptembre 2009)

4

http://www.terminometro.info (consulté le 1erseptembre 2009)

5

http://oesi.cervantes.es/ (consulté le1erseptembre 2009)

6

http:/ /www.dglflf.culture.gouv.fr/ (consulté le 1erseptembre 2009)

7

(24)

f) Classification

Une classification des sources, _jointe_en_{annexe page} _67, _a _été _{dressée selon les}

axes desurveillance _{préalablement} _définis, _{à savoir} _{les produits, les technologies, le}

marché et son évolution et les événements. A cela nous avons _également _ajouté _le

critère de la _langue _et _du_type _de _source, _à _savoir _{s'il s'agit d'une} _source _{spécialisée}

ou _{généraliste.}

On a ainsi _pu _voir clairement _que _les _sources _sont _{principalement}

francophones et anglophones. On peutmême remarquer une nette prédominance de

la _{langue française. Il faut toutefois la relativiser} _en _raison _du _fait _que _certaines

sources, comme celles de l'Union _Européenne - sont multilingues et que par

commodité nous avons choisi la _langue _française. _De _{plus, les listes de} _{diffusion de}

Corpora et Linguist, probablement les deux sources les plus riches en informations

parminos sources spécialisées, sontprincipalementanglophones.

Il est _apparu _{également qu'aucune} _source _{n'est classée} _dans _un _seul _axe _de

surveillance. Nous l'avons donc noté comme étant un _{point à} _{considérer lors de}

l'évaluation des outils. En _effet, si l'outil n'autorise pas l'attribution d'une même

source à _{plusieurs dossiers alors il} _ne _nous _permet _pas _{de classer} _{nos sources} _selon

nos axesde surveillancesans créer dedoublon.

2. _Corpus _de _test

«

Corpus» et « Evaluation» vont de pair dans les technologies de l'information. En _effet, si l'on évalue à l'aide d'une _grille - nous aborderons la

questionde la nôtre plus tard- onle fait égalementparrapportàun corpus.

a) Critèresde sélection

Les _règles_concernant_{l'établissement d'un} _corpus_connaissent _{logiquement de}

légères variations en fonction de la nature de l'évaluation à mettre en place. Ainsi,

l'évaluation d'une lemmatisation de _{logiciels n'a} _pas _les _{mêmes exigences} _que

l'évaluation de _{l'usage d'un logiciel de recherche d'informations dans le cadre d'une}

(25)

Nous _précisons _donc _que _{l'évaluation} _menée _{dans le cadre du} _stage _consiste

en un_{comparatif des différentes technologies des outils évalués.} _Nous_en_{justifions le}

choix dansla seconde _partie_de_ce_mémoire.

Nous _pouvons _maintenant _nous _intéresser _aux _{règles de} _constitution _d'un

corpus correspondant à ce type d'évaluation. Tout d'abord, si l'on veut garantir la

plus grande équité il faut que le corpus soit le même pour tous les outils évalués.

Cela _appelle _une _première _question_: _si _certains _outils _peuvent, _par _des

fonctionnalités _{particulières,} _{exploiter des} _{ressources que} _d'autres _concurrents _ne

savent_pas_{exploiter, doit-on}_les_{sélectionner} _?

Nous _pensons _{qu'une évaluation doit, dans la} _mesure _{du possible,} _porter _sur

l'intégralité des capacités d'un outil.

À

ce titre, elle doit faire apparaître les points

forts et les faiblesses des outils, tant au niveau de leurs performances qu'au _niveau

de leurs _capacités. _Il _revient _toutefois _à _{l'évaluateur de} _{ne pas non} _plus _se _laisser

griser par des arguments commerciaux et de savoir ignorercertaines fonctionnalités

qu'il considérerait, après réflexionetargumentation, comme inutiles.

Ensuite, le corpus se doit d'être représentatif. Si nous évaluons un traducteur

dans seize _{langues, il} _convient _d'établir _{un corpus} _comprenant _{des documents dans}

ces seize _langues. _Le _{but de} _notre _évaluation _étant _de _permettre _une _prise _de

décision, il lui est nécessaire d'être à _{l'image d'une utilisation} _{quotidienne. Elle} _ne

doit pas pouvoir être taxée de s'être déroulée dans un cadre uniquement théorique,

elle doit rendre _compte_{d'une utilisation}_pratique.

b) Sélection

Dans la_{configuration} _d'une _« _{évaluation idéale} _», _nous _pourrions _imaginer _la

conception d'une série de sites web nous servantcomme corpus. Nous contrôlerions

alors _{l'intégralité de l'évaluation. Cela}_nous _permettrait, _entre _autres, _{d'avoir le choix}

des différentes _{technologies utilisées} _sur _les _sites _web _- _entendre _ici _{les protocoles} _et

les _{langages de} _{programmation}_comme_l'ajax _ou _le_javascript_-_et_de _pouvoir_élaborer

des « scénarios» - une _page _web _{devenant inaccessible} _ou _{dont le} _contenu _serait

(26)

L'INISTa eu comme _projet de _mettre _à disposition du public _un_«_crash _site _»

dans le cadre du _projet _« _Analyse _comparative _{des outils} _{de veille »1. Il s'agit d'une}

démarche sensiblement semblable à celle de la mise à _{disposition de} _«_kits

d'évaluation», fruits de _campagnes d'évaluation _et dont l'objectif de leur _{mise à}

disposition est de permettre à d'autres d'effectuer leur propre évaluation2.

Malheureusement, le projetsemble avoir été suspendu si ce n'estarrêté avant que le

crashsite ait été mis en_ligne.

En raison _{du manque} _de _temps _pour _la _conception _de _sites _{web spécialement}

dédiés à notre évaluation et de l'absence de «kit d'évaluation» disponible, _nous

avonsdécidé d'élaborernotre_corpus _{d'évaluation d'après les}_sites_{web identifiés lors}

du _sourcing.

Nous avons _dirigé _notre _choix _selon _le _critère _de _{représentativité}

préalablement évoqué. Cela nous a conduit à sélectionner CorporaList car il s'agit

d'une liste de diffusion _qui_n'est_pas _accessible _en _flux _RSS. _Il _importait_donc _de _voir

dans _quelle _mesure _les _différents _{outils pouvaient} _{l'exploiter. Toutefois,} _cette

sélection dans notre _corpus _n'exclut _pas _{d'office la sélection de lecteurs} _RSS _pour

notre évaluation. S'il est _préférable _que _{l'outil sélectionné} _au _{final sache exploiter}

Corpora, il n'est pas non plus exigé que l'intégralité de la veille à mettre en place

passe par un outil. Ainsi, la consultation de manière traditionnelle de Corpora

comme_{appoint à}_une_veille _par_RSS_est_{envisageable.}

Le deuxième site sélectionné est _LT-World, en raison de son _importance dans

le _{domaine, du fait} _qu'il _ne _{propose pas} _{de flux} _RSS _et _que, _de _surcroît, _il _recourt _à

une _navigation_par _«_cadres _». _Les _« _cadres _» _- _ou_« _frames _» _en _anglais_- _sont _connus

pour causeruncertain nombre de problèmes aux crawlersnotamment-ce quiesten

partielaraison de leur désaffection- ettendentà disparaître. Toutefois,certains sites

1 _{Le site} _{web du}

projet est disponible à cette url : http://outils.veille.inist.fr/

(consulté le 6 mai2009)

2

Stéphane Chaudiron, Khalid Choukri. « L'évaluation :fondements, processus

et résultats » in L'évaluation des technologies de _traitement de la langue. _{Hermès, Paris,}

(27)

web _persistent _donc _à _{les utiliser,} _ce _qui _nous _conduit _à _nous _intéresser _au

comportementdes différents outils aveceux.

Nous avons ensuite choisi la liste _Linguist _car elle _est accessible _à la fois _par

un site _qui _n'a _{pas recours aux} cadres _et _par des flux RSS. L'intérêt _est alors de

pouvoir observer la manière dont les outils peuventexploiter la technologie du RSS

et de _pouvoir _comparer _{la surveillance} _d'une _page_web _par _rapport _à _{la surveillance}

du flux RSS d'unemêmeliste de diffusion.

Enfin, nous avons sélectionné Google News car il s'agit d'un agrégateur de

pressegénéraliste quiestaussiaccessible par flux RSS. Nous pouvons doncavoir une

idée du bruit _qu'il _peut _générer _{utilisé de} _manière _« _brute _». _De _{plus, le flux RSS de}

Linguist se cantonne à afficher le titre de la page ainsi que sa date de publication

alors que Google News joint une image, le début de l'article ainsi que le nom de sa

source et _{quelques liens} _ayant_un _rapport _avec _{l'article. Il s'agit donc d'un flux} _RSS

plus « complet», qui en exploite davantage les capacités. Il nous permet ainsi

d'évaluer _plus_en _{profondeur les}_capacités_{des outils}_avec _la_{technologie RSS}

c) Limites

Notre _{corpus a} _été _composé _{en vue} _{de l'évaluation d'outils de surveillance,}_ce

quiexplique le fait qu'il soit uniquement constituéde sites web. Nousavons éliminé

d'emblée l'évaluation d'outils de fouille detexte.

En _effet, _pour _trois _de _ses _quatre _axes _{de surveillances la veille doit} _se

concentrer sur les éléments factuels contenus dans les actualités des différentes

sources identifiées. Or, l'objet de _ces actualités _apparaît le plus _souvent dans le _titre

même de l'article et soncontenu fait rarement_{plus de} ₅₀₀ _mots. _Il _{ne nous} _est _donc

pasnécessaire d'utiliserun outil de fouille de textes pourenextraire les élémentsqui

nousintéressent.

S'il reste un dernier axe de surveillance, celui des _{technologies,} _pour lequel le

recours à un outil de fouille de textes _{pourrait être} utile afin d'en identifier les

signaux faibles, il n'est pas pour autant indispensable. Le veilleur peut très bien

opérer cetravail par lui-même. Il peut, au fil desa veille età la lecture des actualités,

(28)

Enfin, une évaluation des outils de fouille de textes en_plus _{de celle des outils}

de surveillance aurait nécessité un surcoût en _temps _très _important. _Nous _avons

donc _préféré _écarter _ce _volet _{dispensable afin de} _nous _assurer _de _mener _notre

(29)

(30)

III. Recensement et

_typologie

A. _Questions_{préliminaires}

1. Outils de veille : définitionet _{spécificités}

Avant de commencer le recensement et _{l'évaluation, il} nous est nécessaire

d'effectuer une réflexion sur l'expression _même _« _{outils de veille} _». _Afin _d'éviter

toute _méprise, _il_convient_d'en_ôter _toute _ambiguïté.

A _{l'image des} _« _{outils bureautiques} _», _les _« _outils _de _veille _» _{ne se} _définissent

pas parleurs fonctionnalités maisparleur utilisation. Ainsi, c'estune désignationpar

l'usage qui englobe une série de différents logiciels qui, eux, pourront être désignés

par leurs fonctionnalités. Nous pouvons à nouveau illustrer cela avec l'exemple de

l'expression «outils bureautiques » qui désigne, entre autres, les logiciels de

traitement detexte etlestableurs.

Cela _signifie _que _si _{les logiciels} _{que nous} _allons _recenser _et _évaluer _auront

comme _point _commun _principal _leur _usage, _ils _pourront _avoir _diverses

fonctionnalités.

En_conséquence_{et avant}_{d'aller plus loin,}_nous _{devons clairement}_expliciter _ce

que nous entendons par le terme «veille » que nous avons déjà utilisé à plusieurs

reprises. Nous définissons ici la veille comme une pratique visant à surveiller un

environnement - qui peutêtre aussi bien économique

que technologique ou social

-afin de _{collecter, sélectionner} _et _d'analyser _les _informations _utiles _à _un _organisme,

notamment _par _{la détection} _ou _{l'anticipation} _des _{changements de l'environnement}

surveillé.

Un outil de veille est donc un logiciel _se _rapportant _à _ces _tâches _de

surveillance, de collecte et _{d'analyse des informations utiles.} _Cette _{clarification} _nous

permetde considérer les difficultés quel'évaluation decesoutils de risque deposer.

Nous _pouvons _commencer _par _remarquer _que _si _nous _avons _{levé les}

éventuelles _ambiguïtés _concernant _{la signification du} _terme _« _veille _», _cela _n'a _pas

résolu tous les _{problèmes inhérents} _à _l'expression _« _{outils de veille} _». _En _{effet, le fait}

de connaître la finalité de _l'usage_ne _définit_pas _de _{fait le détail des fonctionnalités. Il} faut _{ajouter à} _cela _la _question _{des détournements} _d'usage, _{outil peut-il}

(31)

réellement considéré comme étant « de veille» si on l'utilise pour _{effectuer de} _la

veille d'unemanière _qui_n'était_pas_prévue_{lors de} _sa_{conception ?}

Nous _{pensons que} _si _un _outil _peut _se _révéler _être _{efficace lorsqu'il} _est _utilisé

pour effectuer une veille, alors nous pouvonsle qualifier « d'outil de veille », quand

bienmêmecelane serait_{pas son}_but_premier._L'idée _est_d'obtenir_{un panorama} _aussi

large que possible des différentes possibilités de mise en place d'une solution

logicielle de veille. L'identification d'éventuels détournements d'usage pourra

également être l'occasion de soulever des perspectives d'évolutions pour certains

logiciels.

Pour le volet de _{l'évaluation, c'est la multitude de fonctionnalités} _{que nous}

risquons de rencontrer qui peut poser problème. En effet, bien que notre évaluation

porte sur des logiciels dont le principal point commun est l'usage, nous avons

préféré mettre en place une évaluation technologique plutôt qu'une évaluation

d'usage.

Évaluer _{technologiquement} _les _outils _{de veille} _nous _{demandera donc}

probablement d'évaluer des technologies différentes. La question d'une évaluation

globale des outils de veille aux technologies divergentes ou bien d'une série

d'évaluations de _chaque _type _d'outils _de _veille _aux _{caractéristiques} _proches _apparaît

déjà ici comme étant une question importante et épineuse. Nous la développerons

parlasuite.

2. Évaluation_technique_ou _{évaluation d'usage} _?

Nous_{justifions le fait d'avoir} _opté _{pour une} _évaluation _prenant_la _forme _d'un

comparatif technique par l'impossibilité que nous avions de mettre en place une

évaluation _d'usage _pertinente. _En _effet, _une _{évaluation d'usage n'aurait} _pu _porter

que sur notre propre usage alors que nous ne sommes pas la personne qui sera

chargée de laveilleau final. Ornous pensons qu'une évaluation d'usage, à défautde

pouvoir directement porter sur l'usager concerné, doit se dérouler avec un corpus

d'usagers représentatif. N'ayant à notre disposition qu'un seul usager, nous ne

pouvons prétendre à la représentativité et avons préféré opter pour une évaluation

technologique dont la validité des résultats ne dépendrait pas du nombre de

(32)

Nous _pouvons _cependant _mentionner _{l'évaluation d'usage des outils de veille}

tel que nous l'avions envisagé. Elle aurait nécessité la mise en place de métriques

provenant d'une « veille-type » déjà effectuée sur le corpus. Ces métriques auraient été constituées _par _une _{liste des} _informations _pertinentes _contenues _au _sein _du

corpus d'évaluation. Nous aurions alors pu mesurer l'efficacité de la veille tant au

niveau de sa _rapidité _que _{de la} _quantité _{d'informations} _pertinentes _{identifiées.} _Le

premier point pourrait être évalué en chronométrant le temps passé par l'usager à

utiliser l'outil avant _qu'il _{estime avoir} _fini _sa _{veille, identifié} _toutes _{les informations}

pertinentes. Le second point peut être évalué en se basant sur la métrique classique

qu'est le ratio bruit/silence. On obtiendrait alors un indicateur de temps et un taux

de_rappel_permettant_de _se_faire _une_idée _précise _des _{performances de chaque outil.}

Notons_également_que _{l'absence de contrôle} _sur_le_corpus _était_un_autre _frein_à

lamise en _{place d'une évaluation d'usage.} _En_effet, _{les informations}_provenant_d'une

partie tierce, aucune validation de leur pertinence dans le cadre de notre évaluation

n'auraitété _possible.

Enfin, pour les mêmes raisons de moyens limités nous n'avons pas pu

procédernon plusà une évaluation technique poussée avec des mesurestelles que le

ratio_{bruit/silence.} _Notre _évaluation_se _présente _donc _sous _{la forme} _{d'un comparatif}

technique.

3. Boîte noire ouboîte _transparente_?

Toute évaluation se _rapportant _à _la _{technologie d'un logiciel soulève la}

question de procéder à une évaluation de type « boîte noire » ou « boîte

transparente » est inévitable. En quelques mots, l'évaluation « boîte noire » ne

s'intéresse _qu'à _{ce que} _Ton _peut _voir, _{ce que} _Ton _{obtient, tandis} _que _{l'évaluation}

« boîte_transparente

» tientcompte de lamanière dont le logicielfonctionne, procède.

L'avantage d'une évaluation en «boîte transparente » est qu'elle peut

identifier les raisons des _disparités _au _sein _des _résultats _entre _{les divers outils}

évalués. Elle _peut _ainsi _permettre _une _{évaluation plus} _{fine des différentes}

technologieset proposer des pistes d'amélioration pour leslogicielstestés. Toutefois,

(33)

propriétaires ayant un code source non disponible pour le public, on ne peut

théoriquement pas savoir précisément comment fonctionne ledit logiciel. Effectuer

une évaluation en «boître _transparente _» _requiert alors l'acceptation de la _part _des

propriétaires des logiciels de donneraccès àce que d'ordinaire ils gardentsecret.

À _l'opposé, _une _évaluation _en _« _boîte _noire _» _{a comme} _avantage _le _{fait d'être}

plus simple à mettre en place. Elle ne nécessite pas de connaissances poussées pour

comprendre dans les détails le fonctionnement de chaque technologie. Elle demande

également moins de temps car, ne s'intéressant qu'aux résultats, elle a moins de

donnéesàtraiter.

Ainsi, on _peut considérer qu'une évaluation _en _«_boîte _transparente _» _est

préférable dans l'idéal car elle permet de recueillir davantage d'informations. C'est

par contre sa complexité à être mise en place qui n'en fait pas systématiquement le

choixle_plus _pertinent.

Dans notre cas, il est assez simple de déterminer quel _type d'évaluation il

convient de mener. En effet, _a _présence _{de logiciels} _{propriétaires} _à _évaluer_ainsi _que

les moyens dont nous disposons nous conduisent logiquement à opter pour une

évaluationen« boîtenoire ».

4. Retoursurinvestissement ?

a) Rôle du ROI dans la veille

Nous devons encore aborder un dernier _point_: _{celui du} _retour _sur

investissement, ouROI_pour _{Return On Investment.}

Le retour sur investissement est un ratio financier _{qui consiste à} _{calculer le}

rendement d'un investissement. Il _{s'agit donc de} _savoir _combien _on _a _pu

financièrement gagner ouperdre par rapport à uninvestissement donné, lequelpeut

être aussibien l'achat d'un _logiciel _que _la _mise _en _{place d'un} _projet _{de recherche} _et

développement1. Le ROI se calcule donc dans une perspective temporelle. Onva par

1

Digimind.

Évaluer

le retoursurinvestissementd'un logiciel de veille. Livreblanc,

juin 2005. Disponible en ligne : http:/ /