• Aucun résultat trouvé

Emergence d’une innovation au travers de deux projets

Chapitre 4 : Emergence d’une innovation au travers de deux projets

3. L E PROJET P RESS P RO :

3.4 L’organisation du projet à partir de mai 2004 :

3.4.3 Les étapes du projet :

Nous présentons maintenant les étapes du projet, par brique logicielle, puis pour le système complet, une fois les différentes briques logicielles intégrées à celui-ci, i.e. à partir de fin 2004.

3.4.3.1 Les briques logicielles de Temis :

Pour le projet PressPro, Temis a vendu les logiciels IDE (« extractor ») et IDK (« categorizer »), briques logicielles qui doivent être personnalisées. Dans le cas de ce projet :

1. Le travail sur IDE fait par Temis, consistait à créer une « cartouche de connaissance » ou « cartouche métier » (logiciel permettant d’extraire de tout article de presse les informations susceptibles d’intéressés les journalistes du groupe PressPro). Ce travail est estimé par Temis au minimum à 50 jours/homme, quand le domaine est nouveau pour l’éditeur, ce qui était le cas ici. Dans le cas du projet PressPro, la cartouche était considérée comme très particulière par Temis, car elle n’avait rien à voir avec les cartouches déjà réalisées pour l’intelligence économique, ou la gestion des CV.

2. Le travail sur IDK fait par Temis consistait à entraîner, et à modifier si besoin est, un moteur statistique sur les catégories du plan de classement de PressPro (estimation initiale minimum de 10 jours/homme de travail). C’est un travail plus simple et plus marginal, car non directement couplé avec le travail de personnalisation de Mondeca. Nous n’y reviendrons donc pas par la suite, si ce n’est pour souligner la similarité des problèmes rencontrés par cette brique logicielle, avec celle de la cartouche de connaissance « people » dans le cadre de ce projet.

Temis conçoit des « cartouches métier », qui sont des briques logicielles adaptées à un domaine particulier (exemple : « intelligence économique dans l’industrie pétrolière ») qui viennent s’interfacer avec le moteur d’extraction IDE. Pour développer ces cartouches, il faut une

Chapitre 4 : Emergence d’une innovation au travers de deux projets __________________________________________________________________________________________

connaissance des métiers en question, et pour cela, dans le cas qui nous intéresse, rencontrer les documentalistes et les responsables de la documentation. Pour PressPro, il s’agissait d’intégrer tous les noms de personnes traquées par PressPro, susceptibles d’intéresser leurs journaux et magazines, et de créer toutes les relations pouvant exister entre ces personnes (ex : mariage). Concernant les différentes cartouches développées, Temis travaille généralement sur des domaines génériques comme les concepts de veille stratégique ou concurrentielle, qui peuvent être réutilisés. Par contre, pour cette cartouche « people », Temis n’a pu reprendre que quelques éléments de cartouches existantes (notamment en Intelligence Economique).

Une cartouche représente un ensemble de concepts. Il existe un plan de classement des biographies chez PressPro, et la cartouche doit être le reflet de ce plan de classement. Ensuite, ce qui sera extrait d’un article par exemple « X se marie avec Y », constitue une relation qui sera extraite et stockée dans la base de connaissance de Mondeca.

Après analyse du plan de classement de PressPro, et de certains documents, les linguistes de Temis ont défini un certain nombre de concepts. Par exemple, le concept « couple » : en cliquant sur « couple », dans le logiciel, on met en évidence 247 relations relatives au concept « couple ». Et on peut tout de suite accéder aux textes où l’on trouve ces relations. Pour PressPro, tous les concepts étaient déjà définis dans un plan de classement, et les documentalistes faisaient manuellement le travail d’analyse du texte en lien avec ces concepts.

« J’aime », « J’étais amoureuse », « il vit une passion » etc. Toutes ces formes verbales sont à placer dans la cartouche et ensuite le logiciel les sélectionne automatiquement quand elles figurent dans un article, quelles que soient leur conjugaison.

Il y a aussi dans ce plan de classement les concepts de « naissance », « santé », « nécrologie ». Le détail de l’extraction (exemple : la date de naissance d’une actrice), et ce que l’on va envoyer dans les bases de connaissance de Mondeca. Pour « nécrologie » : « […] Adhémar Dion, le père de Céline s’est éteint le 30 novembre », on peut voir le détail de l’extraction, tous les éléments qu’on envoie à Mondeca : « nom de la chanteuse », « prénom de la personne décédée », « lien de parenté avec la chanteuse », « date du décès ».

Chapitre 4 : Emergence d’une innovation au travers de deux projets __________________________________________________________________________________________

Le développement d’une préversion de la cartouche métier d’août à novembre 2004 :

Pendant l’été 2004, les linguistes de Temis ont commencé à développer la cartouche personnalisée « people ». Les gens qui y ont travaillé chez Temis étaient : Fabienne et Amandine. Ce fut donc surtout un travail de linguiste. Ce travail réalisé de septembre à novembre 2004, s’est traduit par l’élaboration d’une cartouche et la préversion de cette cartouche a été livrée à PressPro fin novembre 2004.

Temis a livré à PressPro des résultats d’extraction, effectuées à partir d’articles de presse, pour montrer ce que le logiciel de Temis arrivait à extraire comme information à partir de ces articles, aux user groups, à Catherine et à Fabrice. Ce n’était donc pas un logiciel utilisable.

Le travail sur la « qualité » à partir de décembre 2004 :

Temis voulait savoir si les informations extraites correspondaient bien à celles qui devaient l’être. Finalement, seule la responsable de la documentation a fait un feed-back, du fait des problèmes rencontrés avec les groupes de travail. Celui-ci a d’abord été jugé excellent par Temis, mais Catherine a ensuite fait certaines remarques négatives. Mais pour Temis, il ne pouvait s’agir alors que d’un problème de « fine tuning », d’optimisation de la cartouche de connaissance (quelles sont les informations non extraites et qui auraient dû l’être (le « silence ») ? Quels sont les problèmes posés par ce qui est extrait ? Il est apparu, par exemple, un problème, nouveau pour Temis, lié à la résolution d’anaphore : « Johnny Hallyday est récemment parti en tournée […], il s’est marié […]. » Il fallait que le système comprenne que « il », c’est Johnny Hallyday). De nouveaux échanges entre Temis et PressPro ont eu lieu (réunions donnant lieu à des comptes- rendus écrit, en décembre 2004 et début 2005) à ce propos.

3.4.3.2 L’application documentaire par PressPro, de mai à décembre 2004 :

L’application appelée « application documentaire », est en fait le logiciel qui doit rassembler les différentes briques logicielles des trois éditeurs, et proposer aux utilisateurs les interfaces de validation et de recherche d’information, ainsi que de constitutions de dossiers aux utilisateurs finaux. Initialement, il était prévu que cette tâche soit effectuée par des informaticiens de PressPro : étaient concernés un développeur dédié au projet (spécialement recruté en CDD), un chef de projet/développeur, et toujours Fabrice, qui devait suivre l’avancement du projet. Après

Chapitre 4 : Emergence d’une innovation au travers de deux projets __________________________________________________________________________________________

développer les interfaces, après que celles-ci eurent été spécifiées grâce au travail avec les user

groups. Il y a aussi eu la participation des gens, cinq personnes, de l’infrastructure informatique de

PressPro pour calibrer le système requis : le matériel et le système informatique.

3.4.3.3 Les briques logicielles de Mondeca :

La définition de l’ontologie :

L’ontologue expert a travaillé avec des groupes d’utilisateurs, et la chef de documentation de PressPro, a la définition d’une ontologie, permettant de représenter la connaissance contenu dans les articles de la presse « people ». Il a ainsi pu proposer une première version de l’ontologie qui a été intégrée à la version V0, livrée à PressPro en décembre 2004. Comme nous l’avons vu, la définition de l’ontologie et la définition de la cartouche de connaissance sont deux tâches distinctes, mais qui doivent être conduites en cohérence, ce qui a conduit l’ontologue expert de Mondeca et le linguiste expert de Temis, a des échanges réguliers.

La création de la passerelle OntoPop

La chef de projet couplage de Mondeca a d’abord travaillé avec l’équipe informatique interne de Mondeca, au développement des briques logicielles constitutives d’une passerelle logicielle susceptible de relier, dans un premier temps, les logiciels IDE et ITM. Pour effectuer ce développement, la chef de projet couplage a régulièrement consulté le linguiste expert de Temis, et l’ontologue expert de Mondeca, ainsi que le responsable produit ITM de Mondeca. Le concept de Règles d’Acquisition des Connaissances ou RAC, a ainsi été défini qui permet de définir un couplage personnalisé entre IDE, et à terme tout type de moteur d’extraction, et ITM, et à terme tout type de système de représentation des connaissances. Nous renvoyons ici à la partie suivante, qui traite en détail de la passerelle et de la méthodologie OntoPop.

Le paramétrage des RAC :

Le paramétrage des RAC s’effectue, une fois l’ontologie et la cartouche de connaissances définies avec précision. Or, comme nous le verrons, cette cartouche de connaissance n’a finalement pas pu être finalisée lors de ce projet, ce qui a eu pour conséquence, que les RAC n’ont pu l’être non plus.

Chapitre 4 : Emergence d’une innovation au travers de deux projets __________________________________________________________________________________________

3.4.3.4. Le système intégré (à partir de décembre 2004) :

Une version V0 du système livrée en décembre 2004 :

Une version V0, regroupant une préversion de l’application documentaire et des briques logicielles de Xyleme et de Mondeca, mais pas celles de Temis, a été livrée à PressPro en décembre 2004. Dans cette version du système, les logiciels de Xyleme et de Mondeca étaient de plus encore indépendants. Xyleme avait repris pratiquement l’ensemble du fond documentaire de PressPro constitué de plus de deux millions d’articles dans sa base XML Server, et, l’ensemble des thésaurus de PressPro avait été transféré dans le module présenté par Mondeca. Cette V0 était un logiciel testable par PressPro, le but étant avant tout de montrer que le « consortium » était capable de reprendre l’existant, de proposer une solution qui engloberait ce que faisait l’ancienne. En résumé, les éditeurs ont voulu montrer à PressPro leur capacité à récupérer ses données et à l’intégrer dans leur système. Mais cette version V0 montrait peu de choses relatives aux fonctionnalités du futur système, et ne montrait pas les liens entre les différentes briques logicielles. C’était donc une sorte de prototype permettant à PressPro, de comprendre la direction prise par le consortium et de commencer à formuler des remarques à ce sujet. La partie Temis était absente, tandis qu’il restait encore du travail à Mondeca pour finaliser l’ontologie du domaine, et que l’application documentaire était en suspens.

Cette version a été présentée en décembre 2004 à l’ensemble des documentalistes chez PressPro, par les chefs de projet des trois éditeurs. Lors de cette présentation, certaines documentalistes ont contesté l’objet du projet, et ont réussi à susciter une réaction de rejet de la part de l’ensemble des documentalistes à son égard. Cela a abouti à l’arrêt immédiat des user groups.

L’application documentaire confiée à Xyleme (02/2005) :

Jusqu’en janvier 2005, ce travail, qui devait durer six mois (200 à 300 jours/homme) avançait très lentement. L’équipe-projet de PressPro avait du mal à appréhender la solution dans son ensemble, alors que de nombreuses tâches visant à la définition des différentes briques logicielles, étaient conduites en parallèle par Mondeca, Temis et Xyleme, au travers de relations généralement bilatérales. La tâche des informaticiens de PressPro n’était effectivement pas aisée, car elle consistait à intégrer différents modules en cours de développement et de personnalisation, modules dont ils ne maitrisaient a priori pas la technologie. Le chef de projet de PressPro, a été

Chapitre 4 : Emergence d’une innovation au travers de deux projets __________________________________________________________________________________________

Aussi en février 2005, suite aux échanges entre la chef de documentation de PressPro et les différents acteurs du projet du consortium, PressPro souhaitant absolument que cette application fonctionne en juin 2005, Xyleme, avec l’appui de Mondeca, a pris la direction de ce projet (maîtrise d’ouvrage déléguée). Xyleme a alors estimé la charge de travail à 120 jours/homme. Ce travail a finalement pu être réalisé grâce à l’embauche d’un informaticien par Xyleme.

- Version Beta de la version V1.0 du système en juin 2005 :

Livraison en juin 2005 :

Les deux briques logicielles de Temis n’avaient pu être livrées en décembre 2004. Le travail sur la catégorisation des articles qui avait débuté en avril 2004, a abouti en avril 2005. Le travail sur la cartouche d’extraction, qui avait débuté en décembre 2004, a abouti en Mars 2005. Ces tâches effectuées, les différentes briques logicielles ont pu être assemblées à l’application documentaire, pour aboutir à une version Beta de la solution en juin 2005. A partir de mai 2005, le second projet destiné à Exinis, que nous retracerons dans la partie 7 de ce chapitre, a été lancé en parallèle du projet PressPro : ce projet a conduit à des développements nouveaux dans les modules logiciels constituant la passerelle logicielle OntoPop par Mondeca. La chef de projet couplage a alors du s’assurer que de tels développements touchant au cœur de ces modules pouvaient bien être repris dans la solution développée pour PressPro.

Phase de test jusqu’en octobre 2005 :

Les trois éditeurs (Temis, Mondeca et Xyleme) ont alors formé les membres d’un groupe de test chez PressPro (composé de la chef de documentation et de quelques documentalistes) pour qu’ils puissent tester la solution. Ils ont aussi formé deux formateurs, consultants indépendants, qui devaient eux-mêmes, par la suite, former l’ensemble des documentalistes de PressPro. Pendant l’été 2005, Catherine et le groupe de tests de PressPro ont donc fait des remarques sur la version Beta du système, qui ont entraîné des corrections. Ces remarques ont concerné principalement :

La qualité de la catégorisation et de l’annotation des articles, cette dernière fondée sur la cartouche de connaissance.

L’interface utilisateur : l’ergonomie du système s’est avérée insatisfaisante, ce qui a pu être amélioré grâce à des modifications relativement mineures.

Chapitre 4 : Emergence d’une innovation au travers de deux projets __________________________________________________________________________________________

Le problème de la qualité de l’extraction et de la catégorisation des articles :

Les premiers dysfonctionnements qui avaient sauté aux yeux des documentalistes effectuant des tests, concernaient les briques logicielles de Xyleme et de Mondeca, car cela concernait des fonctionnalités de base et des performances facilement mesurables (temps d’accès à la base, etc.…). Pour que les documentalistes puissent faire un test complet de la solution, il fallait tout d’abord que ces problèmes soient réglés. Donc, les briques logicielles de Temis sont restées « invisibles » aux yeux des documentalistes jusqu’au mois d’octobre 2005. En septembre 2005, il y a eu un grand nombre de corrections de bugs, finalement mineurs, par Mondeca et Xyleme, tandis que Temis n’était pas encore sollicité.

A partir de ce moment-là, les problèmes majeurs ont concerné les résultats d’extraction et de catégorisation des briques logicielles de Temis, le taux implicitement attendu de 80% d’indexation et de catégorisation pertinentes n’étant pas respecté.

Des tensions sont alors apparues entre la chef de documentation de PressPro et les acteurs du projet de Temis. La première reprochant les mauvaises performances des briques logicielles d’extraction et de catégorisation, les seconds reprochant à la chef de documentation de PressPro, son incompréhension du fonctionnement de ces briques. Une partie du contentieux est venue de ce que PressPro a testé les briques d’extraction et de documentation sur des articles de la presse traditionnelle, comme Le Monde, et non pas sur ceux de la presse « people » à partir desquels Temis avait travaillé. Pour Temis, il était normal que dans ces conditions ses briques logicielles fonctionnent imparfaitement, alors que pour PressPro cela n’était pas acceptable. Le responsable de l’informatique documentaire ayant quitté son poste, la chef de documentation était alors la seule responsable du projet chez PressPro, et à ce titre d’autant plus fragilisée par ce qui était perçu chez PressPro, comme l’échec des briques logicielles de Temis. Son travail dans le cadre du projet a alors été remis en cause par sa hiérarchie, et elle a quitté à son tour son poste en mars 2006. In fine, les chefs de projet du consortium ont estimé que la chef de documentation et le responsable informatique ne possédaient pas les compétences requises pour comprendre précisément et mener un tel projet.

- Pré-production de novembre 2005 à février 2006 :

Chapitre 4 : Emergence d’une innovation au travers de deux projets __________________________________________________________________________________________

pré-production à la phase de production se fait normalement après le « recettage » de la solution, i.e. la reconnaissance par le client que la solution développée correspond bien à ce qui avait été décrit dans le cahier des charges. La recette est définie par un cahier de recette qui définit le périmètre de la recette, les fonctionnalités à tester, la qualité à atteindre, etc. Normalement un tel cahier est rédigé au début du projet, mais dans le cas du projet PressPro, cela n’a pas été le cas.

Le système est rentré en phase de pré-production chez PressPro, en novembre 2005. Auparavant, le groupe de test de PressPro (Catherine et deux documentalistes) avait commencé à lister des bugs. Fin novembre 2005, cette recette n’était pas encore finalisée. Concernant le la recette, le problème de Temis était différent de celui de Xyleme ou de Mondeca :

• Les briques logicielles développées par Xyleme et de Mondeca, qui proposent des fonctionnalités de transfert, validation, recherche, publication d’information, sont plus faciles à évaluer par le client : la fonction est-elle effective ou pas ?

• Par contre, dans le cas des briques logicielles de Temis, il s’agit de faire une évaluation qualitative de l’extraction et de l’indexation effectuée sur différents corpus documentaires. Il faut déterminer les taux d’extraction et d’indexation pertinents qui sont atteints, sachant que ces deux tâches sont effectuées habituellement par des opérateurs humains et aboutissent donc à des résultats relativement hétérogènes.

A partir de novembre 2005, chez PressPro un « comité de qualité » a été chargé de faire la liste des bugs. Il comprenait la chef de documentation, quatre documentalistes de PressPro réellement impliquées dans le projet, et le directeur technique de Xyleme. Globalement, les documentalistes ont jugé que la qualité du traitement des articles par le logiciel de Temis n’était pas satisfaisante, et qu’elles « ne voyaient pas à quoi servait Temis ! ». Par contre, les problèmes relatifs à l’application documentaire étaient quant à eux résolus et cette application donnait satisfaction à PressPro.

- Un système incomplet en production de février à juillet 2006 :

De février à juillet 2006, l’application documentaire a été mise en production, mais sans les briques logicielles de Temis. Celles-ci ne donnaient pas satisfaction, et Temis a dû les retravailler pendant cette période. Or, sans celles-ci, l’automatisation recherchée (d’annotation et de peuplement d’ontologie) devenait impossible, et seule subsistait une application permettant

Chapitre 4 : Emergence d’une innovation au travers de deux projets __________________________________________________________________________________________

d’annoter/peupler manuellement, puis de stocker les articles au format XML, pour ensuite faire des recherches et publier de dossiers.

Installation de la « cartouche » Temis et recette en février 2006 :

Le comité de qualité de PressPro, s’est réuni pour faire le point sur les bugs et sur les fonctionnalités, et a émis une recette « avec réserves », portant sur l’ensemble du projet, fin décembre 2005. Le service informatique de PressPro a ensuite installé une nouvelle version de la cartouche de connaissance de Temis en février 2006, et sans que celle-ci ait réellement été testée, la recette « définitive » de la solution a été validée par le « comité de qualité » de PressPro en février 2006.

Fin du consortium et départ de la chef de documentation de PressPro, en mars 2006 :

En mars 2006, le consortium a cessé d’exister, la recette de la solution ayant été signée par PressPro. A peu près au même moment, Xyleme a déposé son bilan. Une période de flottement s’en est suivie. Les informaticiens de PressPro ont repris le contrôle du projet, travaillant avec les chefs de projet de Mondeca et de Temis, à l’amélioration de la solution en production. Dès lors, ce travail n’a plus donné lieu qu’à des collaborations parallèles Temis/PressPro et Mondeca/PressPro. Au même moment, en mars 2006, la responsable de la documentation a quitté son poste, très certainement sanctionnée pour ce qui était perçu par la hiérarchie de PressPro comme l’échec du projet, quand bien même la solution était en production au service documentation. La question de l’efficacité des briques logicielles de Temis n’étant toujours pas