• Aucun résultat trouvé

Détecter l’innovant sur le web par des techniques non booléennes :

N/A
N/A
Protected

Academic year: 2021

Partager "Détecter l’innovant sur le web par des techniques non booléennes :"

Copied!
14
0
0

Texte intégral

(1)

Détecter l’innovant sur le web par des techniques non booléennes :

méthode, outils, application

Eric Boutin, USTV, [email protected]

Gabriel Gallezot, UNS, [email protected]

Luc Quoniam, USTV, [email protected]

(2)

Le cycle de vie de l’information

émergence croissance maturité déclin temps

Qté d’information perceptible

Notre objet d’étude : l’émergent  KD

Capacité à agir sur son environnement

L’organisation doit subir des contraintes exogènes

(3)

Le KDD ( Knowledge Discovery in Databases ):

Etat de l’art et perspective

Principales

caractéristiques Etat de l’art Perspective de ce travail

Source d’information privilégiée

BDD bibliographique Information provenant du web

Traitement de

l’information utilisée Techniques non booléennes (logique transitive, …) Champ d’application

privilégié

médical généralisation

(4)

Plan

Etat de l’art (domaine médical)

Méthode proposée

Illustration expérimentale

identifier des indicateurs de pertinence innovants dans le domaine des moteurs de recherche

(5)

Phases de recherche et

développement d’un médicament

Un processus :

 coûteux : 820 millions US$ par médicament (18% du chiffre d’affaires consacré à la R&D)

 risqué : 1 molécule sur 10.000 deviendra un médicament

 long : 10 ans d’efforts pour créer un médicament

(6)

Nouvelle cible Nouvelle molécule

Médicament sur le marché Changement d’indication Cible connue

Nouvelle molécule

Développement Recherche

KDD

Utilisations possibles du KDD dans la création de nouveaux

traitements

D’après Pierret (2005)

(7)

Innovation mise en perspective historique

Temps

Connaissances disponibles

Compartimentation des savoirs

D’après Swanson (1986)

(8)

Principe de logique non booléenne : le modèle de Swanson

l’huile de poisson est connue pour réduire la viscosité sanguine

et l’agrégation plaquettaire la maladie de Raynaud

est caractérisée par une grande viscosité sanguine et une forte agrégation plaquettaire

Jusqu’en 1985, ces deux données n’étaient pas liées

A

huile de poisson

B

agrégation plaquettaire viscosité du sang

C

Maladie de Raynaud Maladie

Effet physiologique

Médicament

(9)

Modèle proposé : C

ontext

P

roblem

S

olution

Contexte A

Etude de fonctions en mathématiques

Solution A

Algorithmes génétiques

Contexte B solution B

Problème

optimisation

Une dimension pivot

Connu Ouverture

Détecter une solution nouvelle ?

Détecter un domaine applicatif nouveau ?

Transitivité Potentielle

Transitivité Potentielle

(10)

Étapes du traitement de l’information

S

P

P1 P2 … Pn Liste de mots clés

THESAURUS (ex : Rameau)

P1 P2 Pn Pa Pb Pc

Réseau

Pn Pb

Métamoteur Classificateur (Clusterisation)

1

2

3

4 5

Connexion latente

identification de plusieurs P

Généralisation et abstraction

Exploration : parents, enfants, frères

Choix de termes et combinaisons possibles

Génération de possibles

Détection

(11)

Validation expérimentale :

nouvel indicateur de pertinence de moteur de recherche ?

Contexte

Moteurs de recherche

Problème

Pertinence, Évaluation

Ranking criteria Relevance indicator

Solution

Indicateurs content centric Indicateur business centric Indicateur link centric

Indicateur user centric

(12)

Le recours au thésaurus

Repérage des CFC :

Analyse de réseau

Recherche opérationnelle

=> Pistes à suivre ?

+

Génération de nveaux mots clés :

Hypergraphes Sociométrie

Topologie floue

(13)

Le recours au méta moteur classificateur ou moteur qui clusterise

« sociometric network »

« sociometric measures »

« centrality measures »

degree centrality, closeness centrality, information centrality

Pistes potentielles

(14)

En guise de conclusion

Démarche de suggestion des possibles à un expert

Subjectivité : biais des outils, biais de la langue (traduction), biais expert …

Parallèle possible avec la méthodologie de la recherche documentaire : mais non booléen + introduction de la serendipity

Evaluation de la méthode par l’analyse d’études

de cas (différents outils, niveau d’expertise, …)

Références

Documents relatifs

Dans ce contexte, la plateforme « Agenda énergie Suisse occidentale », élaborée par la Haute école d’ingénierie et d’architecture de Fribourg, vise à afficher

L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau recherche, publiés ou non, émanant des

Cas d’une réponse qualitative: Dose nécessaire pour produire un effet chez 50% des animaux.. Cas d’une réponse quantitative: dose nécessaire pour observer 50% de l’effet

Cette publication de 82 pages, bilingue (français-anglais), est issue d'un travail de la commission permanente "Histoire de la cartographie", de l'Association

Etude financée par le CASDAR BioMarq'lait et dans le cadre d'une expérimentation financée par l'ANR Defilait. Remerciements au personnel technique de

De manière paradoxale, les moteurs cherchent à dissuader les webmestres de concevoir leurs sites de manière spécifique pour qu’ils apparaissent bien classés dans

S’il existe une règle de répartition équitable, les salaires augmentent à la même vitesse dans tous les secteurs et cette redistribution des gains de productivité se fait par le

Nous avons proposé un modèle permettant de modéliser la pertinence à partir des clics utilisateurs dans le cas particulier où plusieurs types de clics sont possibles sur un même