• Aucun résultat trouvé

Méthodes utilisées pour l’extraction et la gestion de compétences

Partie 3 : Extraction Automatique des Compétences d’Entreprises

9.2.4 Méthodes utilisées pour l’extraction et la gestion de compétences

Les travaux de [31] sur l’entreprise virtuelle, ont proposé des méthodes et des outils d’aide à la décision pour la construction de réseaux d’entreprises basés sur la collecte et le traitement des données les concernant (les trois compétences clefs qui caractérisent le mieux l’entreprise, le niveau de maitrise de ces compétences, les personnels qui caractérisent le mieux les compétences, etc). Ces données sont collectées manuellement à partir d’un questionnaire rempli par les dirigeants d’en- treprises. Il s’avère que ces derniers ne sont pas toujours collaboratifs et disposés à fournir l’information pertinente.

La plupart des travaux sur les techniques d’acquisition des compétences se concentrent sur l’analyse des textes présentant des données homogènes et structurées qui décrivent le concept de compétence dans l’entreprise ou l’organisation concernée. Ces textes sont soit des documents décrivant les compétences de l’entreprise, soit des interviews (par mail, ou oralement) faites avec les experts des entreprises pour décrire les compétences. Une fois ces données récoltées selon la structure définie, des techniques de Text mining sont appliquées sur le texte pour valider l’existence de telles compétences selon une description logique.

Blanchard [19] et Laukkanen [101] emploient quelques "règles expertes" basées sur les similitudes entre la définition des compétences, comme par exemple, "si les com- pétences Co1 et Co2 sont semblables, si un individu a acquis Co1 alors il a acquis la Co2". Pour illuster cette règle, un exemple réel peut concerner les compétences Java et C++ qui peuvent être considérées comme semblables. Si quelqu’un a la compé- tence Java on peut lui associer aussi la compétence C++.

[154] propose d’autres genres de "règles expertes" basées sur l’expérience profession- nelle individuelle : un exemple de "règle" est ("si un individu a participé à plusieurs projets traitant Java, alors il peut être considéré comme compétent en Java"). Dans le dernier cas, des techniques sémantiques d’annotation sont employées pour analy- ser des documents traitant les activités de l’entreprise. Un autre exemple est fourni par [43] où l’annotation sémantique est également employée pour annoter les docu- ments connexes produits par l’employé. Cette technique de gestion des compétences

9.2. "Compétence" en Génie Industriel 107 est essentiellement basée sur des règles construites manuellement par l’expert du domaine. Celles-ci sont à couverture limitée. Pour identifier la compétence dans les données disponibles (documents, dossiers et données), nous devons à chaque fois reconstruire une ontologie spécifique au domaine traité.

Aucune des méthodes ne présente des résultats de performance issue d’une appli- cation réelle liée à un contexte de description des compétences. Elles se basent sur l’analyse des données homogènes collectées soit manuellement, soit automatique- ment. Ces méthodes exigent des entreprises qu’elles fournissent toutes les données dans une forme structurée. Or il n’est pas évident que l’entreprise soit toujours prête à fournir cette information avec la qualité et la quantité demandée.

Il est indisponsable de disposer d’une méthode automatique de collecte et de trai- tement de données afin d’extraire une trace synthétique des compétences. Cette méthode doit mobiliser des techniques d’extraction puissantes (Text mining, trai- tement de la langue naturelle) pour produire une information dépourvue de toute ambigüité.

9.2.5 Limite des outils et des méthodes standards pour notre be- soin

Notre objectif porte sur l’extraction de connaissances à partir des sites web. Ces connaissances sont des traces synthétiques des compétences que possède l’entreprise et qu’elle décrit de manière trés variable sur son site web, en décrivant ses activités, ses savoir-faire, ses produits, son équipe, ses clients, ses collaborateurs... La finalité applicative des informations extraites est de parvenir à faire émerger des proposi- tions de collaborations inter-entreprises, à travers une similarité entre compétences. Notre corpus, qui est ainsi constitué de pages extraites de sites web des entreprises, est extrêmement hétérogène et complexe. La tâche d’extraction est rendue plus ar- due par le fait qu’il n’existe pas de ressources sémantiques constituant des points de départ pour appliquer des méthodes standard d’extraction d’information (indexa- tion sémantique).

Le site web d’une entreprise est caractérisé par une diversité des informations, à savoir des publicités, des descriptifs de produits, des informations sur les activités, l’équipe de l’entreprise... C’est un document non structuré qui comporte beaucoup de bruit vis-à-vis de notre besoin (repérer des informations sur les compétences de l’entreprise). Dans un document non structuré, par une simple recherche, nous ne pouvons pas savoir si un mot (ou une expression décrivant la compétence) est pré- sent ou non avec une importance particulière. Alors que dans un document structuré, nous pouvons connaître avec une précision relativement fine le degré d’importance de chaque mot dans le texte. Pour extraire une compétence d’un texte, il ne suffit pas de détecter la présence ou non d’un mot. Cela nécessite une analyse contextuelle plus fine parce que la notion de compétence est liée à un réseau de concepts com- pliqué (par ses hyponymies, synonymies) qui dépend le plus souvent du contexte d’utilisation.

prises, nous a conduit à nous approprier de nombreuses techniques informatiques : Text mining, patrons d’extraction, traitement de la langue naturelle, ontologie du domaine, pour les intégrer au sein d’une approche de traitement et d’extraction originale qui répond à notre besoin.

9.3

Notre approche d’extraction des compétences

Notre approche est basée sur l’utilisation d’une ontologie qui décrit le domaine de la compétence. Cette ontologie a été créée selon une méthodologie rigoureuse pour assurer la couverture du domaine. Ainsi représenter des relations complexes et opérationnelles à l’intérieur d’un réseau sémantique permet de rendre opération- nelle la recherche et l’extraction d’information1

. Nous n’avons pas pu utiliser les ontologies existantes qui modélisent la notion de compétence parce qu’elles ne sont pas créées selon la description et la structuration que nous désirons. Cette nécessité pragmatique nous a poussé à concevoir et à créer notre propre ontologie appelée " Ontologie des Traces de Compétences des Entreprises ". La description de l’ontologie et sa méthode de création font l’objet du chapitre suivant.