• Aucun résultat trouvé

Analyse automatique de textes en vietnamien pour l'intelligence économique et l'information scientifique et technique

N/A
N/A
Protected

Academic year: 2021

Partager "Analyse automatique de textes en vietnamien pour l'intelligence économique et l'information scientifique et technique"

Copied!
23
0
0

Texte intégral

(1)

HAL Id: cel-00677799

https://cel.archives-ouvertes.fr/cel-00677799

Submitted on 9 Mar 2012

HAL is a multi-disciplinary open access

archive for the deposit and dissemination of sci-entific research documents, whether they are pub-lished or not. The documents may come from teaching and research institutions in France or abroad, or from public or private research centers.

L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau recherche, publiés ou non, émanant des établissements d’enseignement et de recherche français ou étrangers, des laboratoires publics ou privés.

Analyse automatique de textes en vietnamien pour l’intelligence économique et l’information scientifique et

technique

Philippe Lambert

To cite this version:

Philippe Lambert. Analyse automatique de textes en vietnamien pour l’intelligence économique et l’information scientifique et technique. École thématique. Semaine NooJ à l’INALCO, INALCO, 2011, pp.22. �cel-00677799�

(2)

Analyse automatique de textes en vietnamien

pour l’intelligence économique et

l’information scientifique et technique

Philippe Lambert

19 janvier 2011

(3)

Plan

1/ Contexte : l’Intelligence économique

Définitions

Cycle

Couches sémantiques (merci NooJ)

Design de l’information

2/ Le module de vietnamien pour NooJ

2 études de cas

3/ A vous de jouer (TP)

(4)

Définition de l’intelligence économique (IE):

1/ L'ensemble des activités coordonnées de

collecte, de traitement et de diffusion de

l'information utile aux acteurs économiques en

vue de son exploitation

(Rapport Martre 1994)

2/ Réduction du niveau de l’incertitude

dans la prise de décision

(5)

IE

Veille technologique Veille multilingue Data Mining Cartographie de l’information (Information Design) Knowledge management Veille prédictive

(6)

Veille Intelligence économique Observation

Donnée Information Connaissance

Définir les critères de recherche Rechercher les données Collecter et traiter Valider, diffuser l’information Analyser l’information et l’intégrer dans le processus de prise de décision

Le cycle de l’IE

(7)

Application de couches sémantiques dans le processus IE

(merci NooJ) (1)

Base de données ISTIE

Mappage (alignement) des différents descripteurs (homogénéisation)

NOOJ

DESIGN DE L’INFORMATION

(8)

« l’art et la science de la préparation de l’information afin qu'elle puisse être utilisée par les êtres humains avec efficacité »

DESIGN DE L’INFORMATION

Benjamin Jotham Fry. (2004). Computational information design. bfa

Communication Design, in Computer Science Carnegie Mellon University. Massachusetts Institute of Technology, April 2004

« une alerte (externe ou interne), des événements et développements qui sont encore trop incomplets pour permettre une estimation fine de leur impact et/ou pour déterminer une réponse pleinement adaptée »

H. I. Ansoff, “Strategic response in turbulent

environments,” Handbook of business strategy, 1985.

Signaux faibles

« Soudaineté et étonnement »

(« effet chocolat »)

(9)

DESIGN DE L’INFORMATION

Signaux faibles

Relations thématiques latentes Diagnostic

(10)
(11)

2. Le module de vietnamien pour NooJ

Principal problème : Une douzaine d’encodage (unicode, VPS, VNI, ABC, …)

- Une trentaine de graphes

- Une vingtaine de dictionnaires thématiques (économie, Noms propres, spécificatifs, etc.)

(12)

2 études de cas :

-Traçage des personnalités de l’actualité VN

- Identification d’experts VN

(13)

Traçage des personnalités de l’actualité VN

Corpus : 1000 textes de l’actualité vietnamienne (source AVI)  Application de la grammaire syntaxique de reconnaissance

des entités nommées (noms de personnes, de lieux, d’organisations, les dates ou les unités monétaires)

(14)
(15)

Cas 2 : Identification d’experts

(16)
(17)

Restructuration des données

Entrepôt de données

(18)
(19)

Logiciels de type Open Source pour la visualisation des données :

1/ Gephi (http://gephi.org)

2/Pajek (http://vlado.fmf.uni-lj.si/pub/networks/pajek/)

3/ Netdraw (http://www.analytictech.com/netdraw/netdraw.htm)

Formats de fichier pour la visualisation : 1/ CSV

2/ .net (Pajek) 3/ .txt

4/ Graphml

Processus de traitement de l’info pour la visualisation 1/l’acquisition (acquire) des données depuis un support quelconque,

2/le découpage (parse) structuration aux données, 3/ le filtrage (filter) les données pertinentes,

4/ la fouille (mine) données dans un contexte mathématique, 5/ la représentation (represent) une représentation simple que les données peuvent revêtir,

6/le raffinage (refine) rendus visuels plus évolués

7/ l’interaction (interact) : l’ajout de méthodes de manipulation de données via la visualisation

(20)

NooJ

+

Les techniques de visualisation / cartographie de l’information

Quelques pistes de recherche :

- Modélisations cognitives des décideurs (entreprise) questionnaires / interviews

- Géographie littéraire -> cartographie romanesque

- Traductologie – Analyse :

(21)

Remerciements

Nouveaux modèles de l’IE Knowledge, Information and Web Intelligence

(22)

Eléments de bibliographie :

1/ Benjamin Jotham Fry. Computational information design. bfa Communication Design, in Computer Science Carnegie Mellon University. Massachusetts Institute of Technology, April 2004.

2/ M. J. Eppler and R. A. Burkhard, “Visual representations in knowledge management: framework and cases,” Journal of

Knowledge Management, vol. 11, no. 4, pp. 112–122, 2007.

3/ S. Sidhom, “Approche conceptuelle par un processus d'annotation pour la représentation et la valorisation de contenus informationnels en intelligence économique (IE),” 2008. [Online]. Available: http://hal.archives-

(23)

3. A vous de jouer (TP)

1. Ouvrir le projet « Lambert »

2. Demander à NooJ une analyse textuelle sur le nœud « Titre » uniquement

3. Appliquer la grammaire SN2

Références

Documents relatifs

- L'eau municipale dont les caractéristiques chimiques sont à retirer auprès du service municipal des eaux doit comporter une teneur en ions sulfate largement inférieure à 100 mg.L -1

Cette enquête de six mois, réalisée au sein du service de l’Information Scientifique et Technique de l’Onera, a permis de mieux cerner les évolutions intervenues récemment dans

L’approche cartographique, au sens géographique du terme, place les éléments de la carte suivant une position (coordonnées) bien déterminée. Nous envisageons de traiter de cette

Perspectives pour la Médiathèque du Bachut : situer les sciences et les techniques dans leur contexte Un segment documentaire conséquent consacré à l’Histoire des Sciences

Télécharger le document "Le Berger allemand, le Renard roux et le Teckel à poils ras ". Télécharger le document "La Jument

3/ Le sang transporte le O2 depuis les poumons vers les organes et permet le rejet du CO2 depuis les organes jusqu'aux poumons.. La

Vous pouvez consulter les séismes présents dans le monde ces trente derniers jours sur cette carte interactive des séismes mondiaux.. Vous pouvez choisir vos dates d'observation

7/ Les règles vont permettre le renouvellement de l'endomètre pour qu'il soit épais et neuf pour accueillir un futur