• Aucun résultat trouvé

Dans le travail intitulé "Application de la bibliométrie dans la construction d'indicateurs sur la production scientifique de l'Embrapa", Penteado et al. (2002) ont proposé une première solution intégrée concernant les problèmes de la Collection documentaire et la question de la nécessaire automatisation des opérations de construction d'indicateurs de production scientifique à l'Embrapa par l'application de la scientométrie. Ils indiquent :

DES INFORMATIONS DE GESTION

L'Embrapa dispose de bases de données de gestion, entre autres, le système plan annuel de travail (SISPAT), le système d'évaluation des unités (SAU) et le système

d'évaluation et de récompense par des résultats (SAPRE) qui administrent une bonne partie des processus, plans, activités et résultats.

Les informations du SISPAT sont utilisées pour la procédure de négociation, d'accompagnement et d'évaluation des objectifs du SAPRE, ainsi que pour l'élaboration de rapports de gestion pour le Ministère de l'Agriculture et le Tribunal de Comptes de l'Union, entre autres, outre de servir de base pour la procédure de veille institutionnelle et de planification stratégique de l'entreprise. Celle-ci utilise aussi les indicateurs de performance des unités de travail pour évaluer et récompenser les employés et les équipes de travail selon les objectifs de productivité de l'entreprise comme un tout.

Les principaux indicateurs calculés par le SISPAT/SAU/SAPRE sont :

Production Technique et Scientifique : 1.1-Article en Périodique Indexé ; 1.2- Chapître en Livre Technique et Scientifique ; 1.3-Article dans des Actes de Congrès / Note Technique ; 1.4-Résumé dans des Actes de Congrès ; 1.5- Orientation de Thèse de Doctorat ;

Production de Publications Techniques : 2.1-Circulaire Technique ; 2.2- Comunicat Technique ; 2.3-Bulletin de Recherche et Développement ; 2.4- Documents ; 2.5-Organisation/Édition de Livres ou de Système de Production ; 2.6-Article de Divulgation dans les Mass Médias ;

Développement de Technologies, Produits et Services : 3.1-Cultivar

Produite/Lancée et Événement Élite ; 3.2-Cultivar Expérimentée/Recommandée ; 3.3-Pratique/Processus Agricole ; 3.4-Race-Type ; 3.5-Sous-produits Agricoles ; 3.6-Processus Agro-industriel ; 3.7-Méthodologie Scientifique ; 3.8-Machine, Équipement ou Installation ; 3.9-Lignées ; 3.10-Surveillance/Zoning ; 3.11- Logiciel ; 3.12-Organisation d'Informations pour Base de Données.

INFORMATIONS BIBLIOGRAPHIQUES

Connaître en détail sa production scientifique et technologique est fondamental pour qu'une organisation de recherche, puisse orienter sa planification

stratégique et évaluer si les actions de recherche sont conformes aux programmes de recherche et développement.

L'Embrapa compte avec une collection décentralisée, disponible dans les bibliothèques de ses plusieurs unités. Incorporé à la Base de données de la recherche agronomique, l'entreprise produit la base Collection documentaire (disponible sur CÉDÉROM ou à travers l'Internet dans le site

<http://www.cnptia.embrapa.br/servicos/bdpa/frame_bdpa.html>) qui réunit environ 340.000 références bibliographiques et pratiquement la totalité des travaux scientifiques et technologiques des chercheurs et en plus, les publications présentes dans les bibliothèques de l'entreprise. La Collection documentaire peut être utilisée pour la récupération de données sur les publications de l'Embrapa,

faisant partie du processus d'analyse et de construction d'indicateurs. Néanmoins, le volume d'informations disponibles et la finalité de la base créée pour récupérer des publications, deviennent des défis pour ce processus d'analyse de la

production technique et scientifique.

Selon Faria (2001), la disposition de bases de données électroniques a augmenté l'offre d'informations sur pratiquement tous les sujets (Dou, 1994, Porter, 2003, Wormell, 1998). Mais, quand il y a beaucoup d'informations, comme c'est le cas dans la Collection documentaire de l'Embrapa, le processus d'analyse et de synthèse des informations est plus complexe, exigeant l'utilisation de méthodologies appropriées. Les bases de données offrent des informations abondantes, structurées et électroniques. Ceci a motivé le bourgeonnement de méthodologies d'analyse d'informations assistées par ordinateurs, visant à l'élaboration d'informations à haute valeur ajoutée pour les Décideurs (Quoniam, 1992).

Ce travail vise à la réalisation d'une analyse de la production scientifique de l'Embrapa pour vérifier le volume de la production scientifique et technologique annuelle, les sujets de recherche abordés par l'entreprise et l'évolution de ces sujets au long de son histoire. On cherchera aussi à créer des indicateurs sur la production scientifique des chercheurs de l'Embrapa et de ses centres de

recherche.

MÉTHODOLOGIE

Les logiciels Infotrans (de l'IUK GmbH, d'Allemagne) pour le reformatage des données, Dataview et Matrisme (du CRRM, Université d'Aix Marseille III) seront utilisées pour le traitement bibliométrique des données, Microsoft Excel pour l'élaboration de graphiques et des tableaux (…). La Collection documentaire de l'Embrapa est la base utilisée.

En préliminaire trois indicateurs généraux ont été recherchés : Production scientifique de l'Embrapa par année, production scientifique de l'Embrapa par chercheur et production scientifique de l'Embrapa par centre de recherche. Les champs de la Collection travaillés ont été : Auteur, origine du matériel,

affiliation, année de publication et titre.

Une consultation réalisée avec la bibliothécaire Vera Lúcia de Campos Octaviano a identifié les principales inconsistances des références, dans les champs "auteur" et "titre". Par exemple : Entrées comme "João José Silva", "Silva, João José", "Silva, J. J.", "Silva, JJ" et autres variantes sont normalisés pour "Silva, J. J." Les champs "origine du matériel" et "affiliation" avec des unités de recherche écrites dans des différentes façons sont normalisés. Les champs sélectionnés sont traités avec le logiciel Infotrans lequel permet la création de règles génériques de normalisation pour tous les noms, titres et mots reformatés. D'autre part, le logiciel élimine automatiquement les duplications de références.

À l'issue de cette étape, la base est prête pour l'analyse bibliométrique, les

champs extraits (auteur, origine du matériel, affiliation, année de publication et titre) sont traités dans Dataview, avec la génération des matrices; Année de publication-auteur, année de publication-affiliation, auteur-titre, affiliation-titre, auteur-affiliation. Ces matrices sont exportées pour Matrisme, visant la création de réseaux relationnels d'auteurs et des thèmes et pour MS Excel, pour

l'élaboration de graphiques et de tableaux. (…) DISCUSSION

L'importance et la valeur des indicateurs reposent sur la possibilité de quantifier des "choses" intangibles comme la génération de connaissances. Voici quelques exemples d'indicateurs scientifiques : Nombre de publications par an de la société, nombre de chercheurs actifs, évolution des principaux thèmes de

recherche an par an, ressources financières appliquées et bourses accordées (...) Faria (2001, p. 9) ajoute que "les indicateurs sont une façon de synthétiser et d'ajouter de la valeur aux informations". Ils synthétisent le processus de traitement automatisé des informations comme dans la figure suivante.

Note. [De gauche à droite, de haut en bas : Récupérer des données, traitement bibliométrique, traitement statistique, représentation graphique. Grande quantité de données, analyse difficile ---> Des indicateurs de haute valeur agrégée.]

Figure 3 : Le cycle du traitement automatique de l'information (Penteado et al., 2002, p.8)

Penteado et al. (2002, p.8) soulignent "qu'il est toujours nécessaire d'améliorer les données et aussi d'insérer des données externes ou créer des nouvelles données pour les étudier en profondeur". Et continuent :

La Collection documentaire de l'Embrapa même en réunissant pratiquement la totalité des travaux des chercheurs de l'entreprise, n'a pas été développée pour permettre l'analyse des données, mais au contraire, pour identifier et localiser rapidement les documents. Son utilisation par l'analyse automatique exige, pourtant, une longue étape de préparation et reformatage des données, sans laquelle il n'y aurait pas de qualité dans les informations. (…)

Le processus continu de transformation des données brutes en connaissance stratégique, s'est accru exponentiellement de nos jours. La nécessité même des entreprises d'obtenir connaissance de leur chaîne de production a conduit à une utilisation intensive des technologies de l'information mises à la disposition par l'industrie de logiciels dans tout le monde.

Comme il a été déjà dénommé à ce travail, dans la majorité absolue des cas, les données disponibles dans les bases de données des organisations ne sont pas prêtes pour le processus d'analyse, une difficulté additionnelle du processus de transformation d'information en connaissance.

L'objet de la technologie des supermarchés de données (DW) est de permettre l'organisation de ces données, de les traiter et de les utiliser d'une façon efficiente et encore, faciliter leur récupération pour la prise de décision parmi une interface amiable et de facile accès. Les logiciels Infotrans et Dataview qui exécutent le travail de nettoyage et analyse des données, intègrent le travail de DW. Cette technologie renvoie à la nécessité d'avoir une banque d'informations centrale et intégrée qui pourra devenir et composer de nouvelles structures de données plus tard.

Selon Inmon et Hackathorn (1994) la majorité des outils dans de marché des logiciels offrent une manière de filtrer des données pour garantir leur qualité pendant le processus d'extraction et transformation. Des outils spécifiques comme Infotrans, Dataview et Matrisme offrent des mécanismes bien plus sophistiqués en conséquence une plus grande crédibilité à l'information. Par exemple : Dans le cas de la base de données SISPAT, les indicateurs sont générés à partir

d'informations réunies par les chercheurs et techniciens des centres de recherche de l'Embrapa. Quand ces données sont réunies d'une façon automatique, dans une base publique, nous évitons la subjectivité du travail humain.

RÉSULTATS

Comme résultat de la reformatage et du traitement bibliométrique des données extraites de la Collection documentaire ont été automatiquement produits, en phase pilote, trois indicateurs scientifiques : Classifications, tableaux et figures de la production scientifique de l'Embrapa.

Le premier, un indicateur de fréquence basique comme l'évolution du nombre de publications, représenté dans la figure 4. Nous pouvons observer que, depuis 1997, la production de publications par les chercheurs de l'Embrapa a changé de palier, en dépassant les 1.100 par an et s'en accroissant significativement après.

Note. [De gauche à droite : Année de publication x nombre de publications. Source Collection documentaire de l'Embrapa, jusqu'à 2000.]

Figure 4 : Production scientifique de l'Embrapa par année de publication (Penteado et al., 2002, p.10)

Le deuxième indicateur produit est celui de la production scientifique des chercheurs de l'Embrapa (figure 5), avant et après le reformatage. Après le traitement préliminaire des données, considérant la production des 29 ans de l'entreprise, un résultat initial est obtenu : quatre chercheurs, Santos, H.P.S.; Campos, O.F.; Souza, C.N.A.; Ignaczak, J.C., ont produit de 257 à 150 travaux.

Note. [De gauche à droite : Avant le reformatage x après le reformatage. Source Collection documentaire de l'Embrapa, jusqu'à 2000.]

Enfin, le troisième indicateur concerne la production scientifique dans les centres de recherche de l'Embrapa (figure 6), avant et après le reformatage. Même si ces résultats préliminaires peuvent être affinés, les centres les plus productifs dans ces 29 ans sont le Centre National de Recherche de Blé, le Centre National de Recherche de Bovins à Lait et le Centre National de Recherche de Bovins à Viande, qui ont produit de 2459 à 1735 travaux.

Note. [De gauche à droite : Avant le reformatage x après le reformatage. Source Collection documentaire de l'Embrapa, jusqu'à 2000.]

Figure 6 : Production scientifique de l'Embrapa par centre (Penteado et al., 2002, p.12)

La création d'indicateurs de R&D de la recherche agronomique à partir de la base Collection documentaire de l'Embrapa, nécessitera une réforme des méthodes et routines de travail pour les adapter aux processus d'analyse automatique, comme l'a remarqué Van Raan (1997).

À partir du traitement bibliométrique de la base Collection documentaire, en addition aux indicateurs basiques comme nombre de travaux publiés par an, nombre de travaux publiés par unité de l'Embrapa et nombre de travaux publiés par chercheur, d'autres indicateurs peuvent être calculés, en substitution à des indicateurs du SAU/SAPRE comme :

Production Technique et Scientifique : 1.1-Article en Périodique Indexé ; 1.2- Chapître en Livre Technique et Scientifique ; 1.3-Article dans des Actes de Congrès / Note Technique ; 1.4-Résumé dans des Actes de Congrès ; Production de Publications Techniques : 2.1-Circulaire Technique ; 2.2- Comunicat Technique ; 2.3-Bulletin de Recherche et Développement ; 2.4- Documents ; 2.5-Organisation/Édition de Livres ou de Système de Production.

Néanmoins, pour permettre l'utilisation de ces indicateurs par les systèmes de gestion, SISPAT, SAU et SAPRE, l'actualisation de la Collection documentaire, exécutée deux fois par an, au mois d'avril et novembre, quand sont ajoutées et réunies toutes les nouvelles insertions, devra être coordonnée avec le calendrier de la gestion pour qu'y soient inclus dans les bibliothèques, tous les travaux produits dans la période qui sera analysée. (…)

CONCLUSION

La bibliométrie est un outil important pour le processus de production d'informations pour la gestion des entreprises, en particulier, la génération d'indicateurs à partir de bases de données bibliographiques.

La méthodologie employée permet de travailler avec des données sûres et plus objectives, provenant d'une base bibliographique. Il permet aussi d'éviter la duplication d'efforts avec l'alimentation de différentes bases de données dans l'entreprise avec la même information. Il produit encore en plus de tableaux et de résultats graphiques qui permettent une meilleure visualisation des tendances. Un autre résultat important obtenu avec ce travail est le nettoyage de la base Collection documentaire des inconsistances plus communes comme les entrées doublons d'auteurs et de titres.

En continuant ce travail dans la Collection documentaire, plusieurs autres indicateurs pourront être calculés et des analyses meilleures et plus profondes de la production scientifique de l'Embrapa sont à prévoir dans le futur, en intégrant d'autres sources d'information dans l'entreprise.