11 Avril 2016
Jean-Louis Vila
SWORD INSIGHT
Intelligence platform & investigation visuelle Analyse de réseaux de communication
2
−
Directeur technique de la société Sword, SSII spécialisée dans la valorisation de contenu.Docteur Es Sciences de l’Université de Savoie en traitement et analyse d’images
Filtrage d'ordre directionnel adaptatif: application aux autoradiographies de séquences d'ADN.
Présentation
http://fr.linkedin.com/in/jlvila https://twitter.com/jlvila
Ingénierie des Documents et du Contenu Portails d’entreprise
Search / Valorisation de l’Information
CRM / Business Intelligence
Systèmes d’Information Géographique Mobilité
Intelligence platform
Sword Insight
−
2 axes & 2 objectifs :− Aide à la décision : Répondre rapidement aux questions d’hier et à celles qui ne sont pas encore posées !
− Investigation visuelle : Aide moi à me poser des questions
La branche de Sword qui va plus loin dans les données en concevant des solutions « Intelligence » de la captation à l’investigation …
Présentation
Réseau Sword Insight
Analystes criminels
(FR / EN) Data Scientists Hacker « White hat »
Centres d’excellence Sword: Search & Semantic, ECM & Case Management, SIG, IP, …
Analystes Avocats Ethiciens
Editeurs
4
Intelligence platform
Les principes directeurs …
−
Un outil dédié à chaque rôle dans le cycle du renseignement :− hacker, informaticien, data scientist, veilleur, analyste et expert.
−
N’est pas forcément de construire le gisement universel mais des ensembles de données ciblés−
Mettre en place un dispositif capable de gérer les « cas » en diminuant de façon drastique les temps de mise à disposition des informations, de la captation/signalement à la restitution sur les 3 périmètres que constitue« Intelligence Platform ».
Intelligence platform
Data pipeline // ETEP
(Extract, Transform, Enrich & Publish »
Découverte / Détection
Analyse avancée
6
Restructurer en masse et dans le détail …
Data Pipeline
Captation / Extraction
Annotation Normalisation
Inférence Curation
Texte
Publication Référentiels
Rétro-action -Concepts candidats -
Archives ouvertes
Bases d’indexation
RDF Endpoint
SPARQL
2.0
3.0
xhtml+RDFa
Linked Open Data Machines
Bases de données / BI
Web Investigation
Analyse des communications
8
Le cas d’usage
−
Partie cachée, Data pipeline :− Captation & Signalement :
− Extraction des emails et des PJ
− Enregistrements communications
− Récupérations des données de forums
− Récupérations des données de chats
− Extraction
− Normalisation et traitements linguistiques et sémantiques
− Indexation
Analyse de communication
Extraction
verbatim Annotation Indexation
Identités numériques multiples :
• Nom,
• Screen name
• Numéro téléphone
• Alias
• ….
Le cas d’usage
−
Partie visible 1 :− Recherche & découverte,
− Analytique niveau « généraliste »
Analyse de communication
10
Le cas d’usage
−
Partie visible 2, analyse :− Consolidation,
− Analytique niveau « spécialiste »
− Investigation visuelle (cognitive)