• Aucun résultat trouvé

Partie 2 : Détection Automatique des Activités d’Entreprises

6.5 Utilisation de l’information détectée sur les activités

La complémentarité des activités est l’un des deux paramètres qui a été identifié comme étant discriminant pour justifier le choix d’un mode de coordination indus- triel [15]. Le choix de ce paramètre est fondé sur l’analyse des activités pour extraire l’information pertinente qui permet d’établir un degré de rapprochement entre deux activités différentes. Ce degré de rapprochement entre les activités est utilisé ensuite comme paramètres de commande dans la création du réseau d’entreprises. Dans la suite nous allons explorer la notion de complémentarité entre les activités pour bien expliciter l’utilisation de l’information détectée sur les activités.

6.5.1 Définition de la complémentarité des activités dans un réseau d’entreprises

Avant de développer une analyse de la complémentarité des activités dans un réseau, il est nécessaire de préciser formellement ce que nous entendons par complé- mentarité des activités. Pour ce faire nous nous référons à des travaux d’économie industrielle et aux théories de l’organisation industrielle. Ainsi en théorie de l’or- ganisation industrielle, Richardson [138] a défini la complémentarité de la manière suivante :

Deux activités sont qualifiées de complémentaires si elles correspondent à différentes phases successives d’un processus de production.

En économie industrielle la définition standard de la complémentarité s’inscrit dans une logique de marché [115] :

Des activités sont mutuellement complémentaires si l’augmentation de l’une de ces activités accroît la rentabilité marginale de toutes les autres activités du groupe. Ce- pendant, nous déduisons que la définition de la complémentarité des activités est la suivante :

Complémentarité d’activités : quand les domaines d’activité de l’entreprise identifiés par des codes NAF interviennent plus ou moins fréquemment dans des produits inté- grés (dans le secteur de la mécanique, produits intégrés : produits dont la conception et la réalisation requiert l’intervention conjointe de plusieurs domaines d’activité). On pourra parler d’activités "supplémentaires" dans un secteur d’activités, quand il s’agit d’activités d’entreprises qui interviennent dans des produits généralement disjoints, qui n’offrent donc généralement pas d’opportunités de collaboration dans la réalisation de produit commun.

6.5.2 Modélisation de la complémentarité

Pour modéliser la complémentarité des activités nous utilisons la théorie des graphes qui offre l’avantage de faciliter la manipulation des objets et de leurs re- lations, avec une représentation graphique naturelle. L’ensemble des techniques et outils mathématiques mis au point en théorie des graphes permet de démontrer fa- cilement des propriétés, d’en déduire des méthodes de résolution. En effet, la théorie des graphes offre un large panel de méthodes et algorithmes qui nous permettent

6.5. Utilisation de l’information détectée sur les activités 67 d’atteindre notre objectif. Elle permet aussi d’extraire des indicateurs représentatifs de la complémentarité des activités.

Dans les définitions données ci-dessus, la relation de complémentarité entre deux entreprises est symétrique. En effet, si une entreprise E1 est complémentaire d’une entreprise E2, cette dernière est forcément complémentaire de l’entreprise E1. Dans notre travail, on constitue un graphe NAF qui modélise la complémentarité des activités où les éléments des graphes sont les secteurs NAFs, la liaison de com- plémentarité entre deux secteurs est représentée par un arc avec une évaluation. Ce graphe de complémentarité est construit manuellement par expertise3.

Figure6.2 – Graphe de complémentarité entre les secteurs d’activités : 28.4 Forge, emboutissage, estampage ; métallurgie des poudres ; 28.5 Traitement des métaux ; mécanique générale ; 28.6 Fabrication de coutellerie, d’outillage et de quincaillerie ; 28.7 Fabrication d’autres ouvrages en métaux

L’intérêt du graphe NAF c’est qu’il est générique, et donc la complémentarité entre les champs d’activités peut être étudiée à partir d’expert du secteur d’activi- tés, sans se reporter à une enquête spécifique à chaque entreprise. Dans des traveaux antérieurs de notre laboratoire, le recueil d’information sur la complémentarité sup- posait de connaître à l’avance les entreprises étudiées.

3. Xavier Boucher, Patrick Burlat (experts en génie industriel et modélisation des compétences d’entreprises) et le laboratoire de la mécanique de l’ENISE

Chapitre 7

Détection automatique des

secteurs d’activités des entreprises

7.1

Introduction

Dans ce chapitre, nous cherchons à étudier la question des performances et de l’adéquation éventuelle des techniques de la recherche d’information dans une application spécifique à un domaine d’information métier ciblé (secteurs d’acti- vités des entreprises). Le domaine métier est en premier lieu caractérisé par une complexité importante liée au fait que l’information s’y exprime de manière peu structurée : les textes composant le corpus ne suivent aucune structure standard ; la sémantique du vocabulaire utilisé est très lié au domaine métier (vocabulaire contextualisé) ; la structure linguistique des textes est parfois absente ; l’ensemble de ces facteurs induisent de forts risques d’ambiguïté. Mais le domaine métier est également caractérisé par un ensemble de spécificités dont on peut tirer parti de manière formelle, permettant de réduire cette complexité intrinsèque. Dans notre démarche de recherche, nous n’avons pas de réponse a priori sur l’efficacité des techniques de RI lorsqu’elles sont confrontées à la réalité de l’information métier : l’évaluation de leurs performances font partie de l’étude.

Dans le cadre des chapitres 7 et 8, le domaine d’information métier que nous ciblons peut être délimité par une double frontière. D’une part, il s’agit d’un secteur industriel particulier (l’industrie mécanique) tel que nous le précisons en section 6.2. D’autre part, il s’agit d’un type d’information spécifique : nous cherchons à identifier des informations caractérisant le domaine d’activité des entreprises. Ayant délimité ce "domaine informationnel métier", nous avons cherché à tirer parti de ses spécificités en cherchant des caractérisations de ce domaine, afin d’accroître l’efficience des dispositifs de RI : par quelle unité informationnelle est exprimée ce domaine (mot, expression ou phrase) ? Quelle granularité peut-on avoir sur les secteurs d’activités des entreprises ? Quelle ambigüité informationnelle et sémantique peut-on croiser dans ce domaine et par quelle ressource sémantique (taxinomie, thesaurus) peut-on guider la recherche ?

Le fait de cibler un domaine métier bien spécifique comme la mécanique nous permet de chercher des ressources sémantiques susceptibles de le caractériser. Nous avons sélectionné comme ressource sémantique le standard national Code NAF (Nomenclature des Activités Françaises), en limitant son utilisation au

domaine industriel de la mécanique. Le code NAF nous fournit une représentation conceptuelle hiérarchisée de tous les secteurs d’activités de ce domaine industriel : c’est une structure hiérarchique de classes et sous-classes de secteurs d’activités. Ce code NAF va être utilisé comme ressource sémantique externe, afin d’améliorer l’expressivité du besoin d’information avant de le soumettre au système de recherche d’information. L’intérêt du code NAF est qu’il délimite le domaine de recherche en explicitant ses caractéristiques et ses spécificités. Le système de détection des secteurs d’activités que nous réalisons traite des entreprises françaises, mais il est facilement exploitable à l’international pour tout pays francophone : la détection automatique du NAF permet de traiter toutes les entreprises, indépendamment du fait que leur NAF soit ou non répertorié dans les bases de données institutionnelles. Dans notre recherche, le NAF est utilisé pour améliorer l’efficacité du processus d’indexation des sites web des entreprises. Il va servir à contrôler l’information qui circule dans le texte pour ne laisser passer que celle pertinente à notre domaine informationnel. Cette indexation conceptuelle tend à ne sélectionner que les plus importants concepts figurant dans le NAF, au contraire d’une indexation classique qui a pour but de couvrir tout le document. Parallèlement nous utilisons cet apport sémantique de manière plus large grâce aux techniques d’apprentissage par réseau de neurones en créant des liens sémantiques (synonymie, généralisation...) entre les termes du domaine.

Ce chapitre est structuré en 5 sections. La section 2 décrit les variables de l’envi- ronnement de recherche d’information à savoir le corpus et le code NAF. La section 3 décrit l’approche de détection des secteurs d’activités des entreprises. Nous met- trons l’accent sur l’usage du NAF en tant que ressource externe pour effectuer une indexation contrôlée et sur le processus d’appariement qui permet de mesurer la per- tinence d’une classe NAF (secteur d’activité) vis-à-vis d’un site web d’une entreprise. Ainsi les sections 4 et 5 décrivent respectivement deux méthodes d’appariement qui ont été appliquées. Des mesures de performances de chacune de ces méthodes sont présentées suite à des tests d’évaluation.