L'entreprise dans l'économie de la connaissance:
Vision et savoir-faire d'une communauté d'éditeurs de logiciels
Conférence de presse Mardi 11 octobre 05 – Paris
Groupe de travail « Fédérer les sources d’information: outils et méthodes »
A propos de notre groupe de travail
Trois axes de travail:
Collecte des sources d’information (droits, techniques,…).
Typologie et organisation des sources d’information et applications.
Lisibilité des informations recherchées et diffusées.
Complémentarité « fournisseurs » - « utilisateurs »
11-10-2005
Pourquoi ce livre blanc ?
Réflexions depuis 2 ans ½ du groupe:
Réunions mensuelles.
5 séminaires publiques
(cfwww.gfii.asso.fr).Atelier à i-expo 2005.
Synthèse des travaux:
État de l’art.
Exemples de réalisations.
Un double constat
Le développement de l’internet s’est accompagné : d’un accroissement considérable des données non structurées,
d’une augmentation très importante du volume d’informations diffusées par chaque entreprise ou organisation.
Le livre blanc est organisé autour de ces deux thématiques :
Comment bénéficier des informations externes qui circulent sur les réseaux.
Comment profiter au mieux du capital que représentent les informations non structurées disponibles en interne.
11-10-2005
A qui s’adresse ce livre blanc ?
Aux responsables d’Intranet ou de sites Internet, de service de documentation ou les services de veille ou
d’Intelligence économique.
Aux acteurs du domaine qui souhaitent
« faire le point ».
Les sujets traités
Quatre chapitres principaux:
Accroître le périmètre informationnel.
• Christian Langevin, Qwam System
Comment et pourquoi structurer les textes.
• Bernard Normier, Lingway Valoriser le capital d’informations.
• Alain Beauvieux, Go Albert Conclusions et perspectives.
• Jean Ferré, Sinequa
Huit fiches « réalisations »:
Total, Crédit agricole, Unesco, Institut Pasteur, …
11-10-2005
L'entreprise dans l'économie de la connaissance:
Accroître le périmètre informationnel
Christian Langevin – Qwam System – langevin@qwam.com
Mardi 11 octobre 05 – Paris
Accroitre le périmètre informationnel Les grandes tendances de fond
Multiplication des ressources informationnelles électroniques (textuelles)
Evolution des pratiques :
Désintermédiation
Automatisation des processus
Outils de productivité individuels et
collectifs
11-10-2005
Accroître le périmètre informationnel
Typologie des ressources
Méthodes pour accroître le périmètre informationnel
Recherches réalisées par les professionnels de l’information sur le web, via des services en ligne, dans des systèmes internes, etc.
Centres de documentation, etc.
Fourniture/livraison d’information par les éditeurs d’information professionnelle
Pour alimenter des applications internes
Par mail pour des individus (via des abonnements à des services)
Solutions logicielles d’accès, de recherche et d’intégration de contenus
11-10-2005
Outils logiciels pour accroître le périmètre informationnel (1)
1) Application de GED, gestion de contenus et moteurs d’indexation/recherche
Pour accéder aux informations résidant en interne et préalablement indexés par le moteur
2) Outils de recherche fédérée (équivalent du méta-moteur sur internet)
Pour accéder et rechercher des informations dans différentes applications internes ou externes à l’entreprise
Outils logiciels pour accroître le périmètre informationnel (2)
3) Crawlers
Pour collecter automatiquement des informations sur le web visible
4) Connecteurs
Pour rechercher (recherche fédérée), surveiller et collecter automatiquement sur tous les types de bases de données (web invisible, services en- ligne, fournisseurs d’information, etc.)
11-10-2005
Outils logiciels pour accroître le périmètre informationnel (3)
5) Solutions de fédération et d’intégration de contenus (ECI)
Pour permettre d’intégrer/de rendre disponible automatiquement n’importe quel contenu à partir de n’importe quelle application
Entrepôt virtuel de données (“virtual repository”) ou agrégation virtuelle (virtual agregation)
Fiches d’illustration
L’extranet Coperia pour alimenter www.service-public.fr
BioLib, portail d’accès à l’information
scientifique et technique pour les chercheurs de l’Institut Pasteur
La mise en place de la veille à la Ligue Nationale Contre le Cancer
Note sur l'achat d’information
11-10-2005
L'entreprise dans l'économie de la connaissance:
Structurer les textes Structurer les textes Structurer les textes Structurer les textes
Bernard Bernard Bernard Bernard NormierNormierNormierNormier
LINGWAY LINGWAYLINGWAY LINGWAY
bernard.normier@lingway.com Mardi 11 octobre 05 – Paris
Structurer: Une tendance de fond…
« Le Web sémantique est une extension du Web actuel, dans laquelle l’information reçoit une signification bien définie, améliorant les possibilités de travail collaboratif entre les ordinateurs et les personnes »
Tim Berners Lee Scientific American, Mai 2001
11-10-2005
Pourquoi structurer ?
Pour faciliter la recherche
Guide de recherche par les méta-données Pour faciliter la lecture
Navigation dans le texte Résumé automatique
Pour faciliter l’interopérabilité Comparaison des contenus Agrégation et synthèses Pour faciliter l’analyse
Extraction dans une base relationnelle
« Rendre le texte calculable »
Comment structurer ?
Manuellement par l’auteur Généralement peu fiable
Manuellement par un documentaliste
Opération coûteuse et souvent impossible du fait des volumes
Automatiquement
Seule solution possible dans de nombreux cas Très grands progrès en qualité
• Notamment grâce à l’utilisation de méthodes linguistiques Du même niveau que l’indexation manuelle dans de nombreux cas
11-10-2005
Exemples d’applications
Aide à la lecture de textes complexes (brevets) Trouver les phrases importantes dans un brevet Comparer des CV et des offres d’emploi
Faire des calculs sur des textes Word ou PDF Analyser des discours
Politiques, marketing, journalistiques, etc.
Applications de veille (repérage de signaux faibles)
Le même thème n’a pas le même sens
11-10-2005
Fiche d’illustration
Le Monde : du papier à l’électronique, une nouvelle organisation pour de
nouveaux services
L'entreprise dans l'économie de la connaissance:
Valoriser le capital d Valoriser le capital d Valoriser le capital d
Valoriser le capital d’’’’informations informations informations informations
Alain BEAUVIEUX Alain BEAUVIEUX Alain BEAUVIEUX Alain BEAUVIEUX
Go Albert SA Go Albert SA Go Albert SA Go Albert SA abe@albert.com Mardi 11 octobre 05 – Paris
11-10-2005
Les grandes fonctionnalités
Recherche
Navigation
Diffusion Alerte
Analyse de corpus
Aide à la lecture
Mode « Pull »
Mode « Push » Outils de lisibilité
Retrouver une information
Recherche d’informations
Booléen, langage naturel et langage courant.
Texte libre et méta-données Similarité textuelle
Image et flux vidéo
11-10-2005
Naviguer dans un ensemble de résultats Catégorisation
Classification Thèmes liés
Entités nommées
Définition Avantages Inconvénients
Outils de lisibilité
Aide à la lecture
Résumé et citations.
Lecture rapide et outils de visualisation Traduction
Analyse de corpus
Extraction d’informations Analyse de tendances Cartographie de résultats Investigation par l’image
11-10-2005
Détection d’informations et alertes
Veille et automate de collecte.
Génération de messages vers des utilisateurs.
Espace de travail collaboratif.
Fiches d’illustration
Diffusion de panorama de presse au Crédit Agricole Asset Management.
Recherche fédérée sur le portail mondial de l’UNESCO.
L’application Information Miner de
Total.
11-10-2005
L'entreprise dans l'économie de la connaissance:
Conclusions & perspectives Conclusions & perspectives Conclusions & perspectives Conclusions & perspectives
Jean Ferre Jean Ferre Jean Ferre Jean Ferre SINEQUA SINEQUA SINEQUA SINEQUA ferre@sinequa.com Mardi 11 octobre 05 – Paris