bases de données bibliométriques

Top PDF bases de données bibliométriques:

Infrastructures de données bibliométriques et marché de l’évaluation scientifique

Infrastructures de données bibliométriques et marché de l’évaluation scientifique

3.1. RePEc La force de l’ISI-WoS était de proposer des jeux de données multidisciplinaires. Parallèlement, il existait des initiatives de partage de références, de bases de résumés, voire de textes complets selon une logique disciplinaire. Outre le cas d’arXiv, archive ouverte développée en 1991 à Los Alamos pour le dépôt de manuscrits non publiés (preprints), initialement en physique des hautes énergies (Gunnarsdóttir, 2005), on peut donner l’exemple moins connu des Chemical Abstract Services fondés par l’American Chemical Society en 1907, dont la collection de résumés est passée de 12 000 à 6 000 000 en un siècle, et dont les services n’ont cessé de se diversifier par l’inclusion d’une nomenclature des substances, des articles complets et de leurs citations, et d’une base de données de brevets (Baker et al., 1980). En sciences humaines et sociales, PsycINFO, créé par l’American Psychological Association, a inclus en 2001 des outils portant sur les citations. Dans cette veine, le projet Research Papers in Economics (RePEc), initié en 1996, est marqué par une particularité : c’est le premier à adopter une architecture décentralisée et mondiale consacrée initialement aux working papers.
En savoir plus

17 En savoir plus

Entropie et distributions Bibliométriques

Entropie et distributions Bibliométriques

I désigne l’ensemble des items : nombre positif représentant l’occurrence (le nombre d’apparition) de la forme. Toutes ces valeurs constituent la production de la source. Nous avons vu précédemment que plusieurs représentations d’une distribution sont possibles On suppose que cette source est gouvernée par un processus aléatoire stationnaire qu’on peut observer et qu’elle est caractérisée par une fonction qui traduit l’effort pour produire l’ensemble des différents items. Le problème étudié est alors le suivant: pour une quantité d’effort donnée quelle est la relation entre la distribution aléatoire de la source et la fonction d’effort si on cherche à rendre maximum la quantité d’information (au sens de Shannon) produite par la source . Ces techniques, qui consistent à maximiser l’entropie sont utilisés également pour évaluer des bases de données documentaires (Kantor 1998).
En savoir plus

15 En savoir plus

Les villes et la science : apports de la spatialisation des données bibliométriques mondiales

Les villes et la science : apports de la spatialisation des données bibliométriques mondiales

négligeable par exemple en France dans le cas des toponymes issus de saints patrons (Saint-Denis). Dans certains cas, un retour à la source des données a été nécessaire pour pouvoir répartir la production scientifique entre les différentes localités homonymes. Comment, une fois ces corrections et harmonisations effectuées, mettre en place une procédure de géocodage automatique ? On ne pouvait se contenter de choisir une solution « clés en main ». En effet, travailler sur des informations à l’échelle mondiale et sur une période d’une quarantaine d’années élimine les outils de géocodage commerciaux les plus courants, adaptés à un pays précis et à des toponymes actuels. Les autres solutions accessibles se regroupent en deux catégories : les bases de données de toponymes et les outils web de géocodage automatique. Les premières, comme par exemple la base GeoNames (6), malgré leur extension et la gestion de toponymes variés pour un même lieu, se sont révélées insuffisantes, le codage géographique étant inégal et hétérogène géographiquement. Le second type d’outils, basé sur des services web, s’est révélé plus performant, mais sa mise en œuvre plus complexe techniquement (7). Au final, Le service le plus performant pour géocoder nos localités a été celui de Google (8), qui de plus informe sur la qualité des résultats fournis. Le résultat n’est toutefois pas exempt d’erreurs : certaines confusions de noms de quartiers, de villes et de noms de provinces n’ont pu être évitées. Comment vérifier ces données ? Question difficile, car le contrôle de cohérence avec des données plus ou moins équivalentes est impossible (9). Cette phase de vérification et de correction des données (2011-2012) a été fondamentale pour l’amélioration des résultats du géocodage « brut » issus du service Google. Pour ne donner que deux exemples, l’outil, traitant le nom « Garching », avait attribué à un obscur hameau de Bavière le statut de pôle scientifique, alors que cette adresse renvoie en fait
En savoir plus

24 En savoir plus

Les bases de données patrimoniales " IMAGE " et " StatEst "

Les bases de données patrimoniales " IMAGE " et " StatEst "

Les sites web ont été réalisés avec l’appui technique de l’Inist/CNRS (création du modèle de données, choix d’un thème stable, application de notre cahier graphique, confi guration des plugins, etc.). Acronyme Statuaire médiévale et Renaissance de Champagne

2 En savoir plus

Crowdsourcing et bases de données : quelques réflexions

Crowdsourcing et bases de données : quelques réflexions

données textuelles exclusivement ; l’expérience de lecture étant caractérisée au sens large comme le récit personnel ou non d’une interaction entre un être humain et un support écrit. Elle avait également pour objectif de tester la possibilité de réutilisation de données existantes mais également d’offrir la possibilité de réutiliser les données produites par elle-même en se conformant aux principes FAIR (trouvables, accessibles, interopérables, réutilisables). Il fallait également prévoir l’intégration de contenus nativement numériques (tweets, SMS, posts de blogs …). Cette prise en compte a eu pour conséquence l’introduction d’éléments supplémentaires de caractérisation, le tout dans une logique d’acquisition de données massives et de fouille du web. Au total donc, l’ambition affichée de cette preuve de concept était de tester les possibilités et d’identifier les verrous technologiques et conceptuels potentiels pouvant contrarier le développement d’un outil plus évolué permettant d’explorer des corpus multimodaux (textes, images, sons).
En savoir plus

9 En savoir plus

De l'usage des bases de données INA par le chercheur

De l'usage des bases de données INA par le chercheur

L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau recherche, publiés ou non, émanant des établissements d’enseignemen[r]

6 En savoir plus

Sources d'information sur les bases de données internationales

Sources d'information sur les bases de données internationales

L'un des catalogues qui donnent le plus renseignements sur tous les produits en g6n6ral et sur le service automatise en particulier, est celui de BIOSIS "Thisfis BIOSIS 1980&[r]

156 En savoir plus

[PDF] Connexion aux bases de données VB

[PDF] Connexion aux bases de données VB

• Marche à suivre : – Menu Données / Données externes / Créer une req. – Choix de la source de données : Type de BD – Sélection de la base de données : Fichier BD – Sélection table(s)/requête(s) et attribut(s) – Filtrage des données (optionnel)

35 En savoir plus

[PDF] Cours Bases de données réparties

[PDF] Cours Bases de données réparties

! Augmenter la fiabilité (duplication) ! Fusionner des systèmes d’informations ! Def : Une base de données distribuée est une base de données dont les différentes parties sont stockées sur des sites (géographiquement distants), reliés par un réseau. La réunion de ces parties forme la base de données distribuée.

30 En savoir plus

Les outils : clé de détermination bases de données

Les outils : clé de détermination bases de données

Rassembler des données sur les caractéristiques écologiques des carabes de nos sites d’étude (121 espèces). Données récoltées (littérature)[r]

10 En savoir plus

[PDF] Cours Perl : Les Bases de données

[PDF] Cours Perl : Les Bases de données

Un autre avantage de la BD est qu'elle peut être interrogée par plusieurs personnes, dans un réseau sécurisé, par l'intermédiaire d'un système de gestion de base de données (communément abrégé "SGBD"). Le terme entité peut vous paraître abstrait. Pour mieux comprendre, retenez qu'une base de données n'est en fait qu'un ensemble de tables de données, un peu à la manière dont vous pourriez inscrire des données dans une feuille de tableur (Excel ou autre).

16 En savoir plus

Réplication Préventive dans une grappe de bases de données

Réplication Préventive dans une grappe de bases de données

conflict classes and Optimistic multicast (NODO) [KA00a, PMJPKA00] se basent sur la divi- sion des données en classes de conflits. On détermine ainsi que deux transactions accédant à la même classe de conflit ont une grande probabilité de conflit. À l’inverse, deux transactions qui n’accèdent pas aux mêmes classes peuvent s’exécuter en parallèle. Les classes de conflits doivent être connues à l’avance et chaque classe de conflit a un seul noeud maître. Pour exécu- ter une transaction, le protocole diffuse deux messages. Le premier message permet d’exécuter la transaction sur une copie ombre (une copie de la dernière version cohérente de la base), le deuxième message permet de valider la transaction ou alors de l’annuler pour la réordonnancer. L’algorithme utilisé dans le système Database State Machine [SOMP01, SPMO02] supporte les configurations répliquées partiellement et ne viole pas l’autonomie des noeuds. Cependant, il requiert un protocole de terminaison atomique du même type que la validation à 2 phases, et de tels protocoles sont connus pour ne pas passer à l’échelle.
En savoir plus

161 En savoir plus

Forage de données de bases administratives en santé

Forage de données de bases administratives en santé

que de faire une modélisation complètement indépendante sur les différents types de variables à traiter, tout en appliquant notre approche dans le domaine médical. Le regroupement par des modèles de mélanges commence à prendre de la place dans le domaine médical. Garg et collab. (2009) ont développé un arbre de décision pour regrouper les patients en fonction de la durée de leur séjour à l’hôpital. À cette fin, le regroupement hiérarchique a été réalisé en divisant les nœuds de façon récursive en utilisant l’une des trois covariantes (âge, sexe ou diagnostic), tant qu’il y a diminution du critère d’information Akaike (AIC). Leur modélisation est un mélange fini de composantes gaussiennes pour modéliser la durée de séjour hospitalier dans chaque nœud. Le modèle proposé par Garg et collab. (2009) n’est pas construit d’une manière complètement non supervisée et est conçu pour modéliser un mélange de variables numériques. En effet, ce modèle est guidé par une variable numérique (durée de séjour) pour construire un arbre de décision en utilisant les valeurs catégorielles. En outre, Fonseca (2008) ont utilisé le modèle de mélange fini pour découvrir des modèles dans les données numériques pour la maladie coronarienne. Rebuge et Ferreira (2012) ont appliqué un mélange fini de chaîne de Markov de premier ordre pour regrouper les séquences qui représentent les flux composés par les événements de soins. Ils ont appliqué leur modèle pour les processus de la radiologie dans le service d’urgence à l’hôpital Saint-Sébastien au Portugal. Ces modèles ont été appliqués pour un type de variable. À notre connaissance, le travail décrit ici est la première application aux soins de santé du regroupement basé sur un modèle de mélange capable de traiter trois importants types de variables.
En savoir plus

134 En savoir plus

[PDF] Bases de Données formation gratuit

[PDF] Bases de Données formation gratuit

Sur stations de travail et mini ordinateurs sous Unix, trois ou quatre SGBD relationnels dominent : Oracle, Ingres, Informix, Sybase. DB2 (IBM) est un SGBD relationnel sur main frame. Les SGBD, qui sont la raison d'être de l’informatique de gestion, ont vu leur domaine d’utilisation s’élargir considérablement. Bases de Connaissances, Systèmes Experts, Systèmes d’Information Géographique, Edition de Documents Informatisés (EDI), Systèmes d’Information Documentaire (SID), Conception Assistée par Ordinateur (CAO), Gestion de Production Assistée par Ordinateur (GPAO) sont des domaines où une information structurée est enregistrée et gérée par un SGBD générique (relationnel) et traitée selon des besoins spécifiques, l’interface et les outils de traitement dépendant plus particulièrement de l’application.
En savoir plus

48 En savoir plus

[PDF] Bases de Données document pdf

[PDF] Bases de Données document pdf

Manuel d’utilisation- Base de données MEF | Gestion des projets 39 E. Gestion des projets Le champ Gestion des Projets est visible uniquement pour les entités chargées de la mise à jour de la Base de données. En effet, cet espace est réservé à la mise à jour de la base de données et est accessible uniquement aux gestionnaires de ladite base.

61 En savoir plus

Cours Bases de données XML avancées

Cours Bases de données XML avancées

• Standard W3C pour l’échange/publication de données sur le web • Héritage: – HTML: documents publiés sur le web, mais ensemble de balises fixé, dédiées à la présentation du contenu difficile à exploiter le contenu – Données structurées: bases de données, contenu structuré, mais mal

27 En savoir plus

[PDF] Introduction aux bases de données SQL

[PDF] Introduction aux bases de données SQL

une table comprend une ou plusieurs lignes, chacune constituée d’une valeur pour chaque colonne.. les noms de table et de colonne constituent le schéma de la base; les lignes constituent[r]

29 En savoir plus

[PDF] Cours d informatique les bases de données

[PDF] Cours d informatique les bases de données

4.1 Notion de tables Une base de données est constituée par des tables reliées entre elles, c’est pourquoi on parle de bases de données relationnelles. Une table est un tableau. Ses lignes sont appelées les enregistrements et l’intitulé de ses colonnes les champs. A l’intersection d’une ligne et

8 En savoir plus

[PDF] Cours de Bases de Données pdf

[PDF] Cours de Bases de Données pdf

2. Créer une BD (en déchargeant l’utilisateur des problèmes d’implantation physiques des données). 3. Interroger la BD (on parle de requête, query) et manipuler les données en optimisant les coûts. 4. Assurer la cohérence de la base (on dit aussi intégrité) alors que plusieurs utilisateurs peuvent

49 En savoir plus

[PDF] Formation avancé sur les Bases de Données

[PDF] Formation avancé sur les Bases de Données

– l’accès juste et efficace aux données. Ces différentes capacités sont prises en charge par des logiciels appelés système de gestion de base de données (SGBD). Les principaux produits commerciaux sont Oracle, DB2 (IBM) et SQL Server (Microsoft). Plusieurs SGBD gratuits comme MySQL ou PostgreSQL sont de plus en plus utilisés pour la gestion de bases petites et moyennes, et particulièrement adaptés pour s’interfacer avec des pages Web. Ces outils sont basés sur le modèle relationnel, qui est un modèle de données parmi d’autres.

29 En savoir plus

Show all 4070 documents...