• Aucun résultat trouvé

Ingénierie et sciences sociales

N/A
N/A
Protected

Academic year: 2021

Partager "Ingénierie et sciences sociales"

Copied!
28
0
0

Texte intégral

(1)

HAL Id: hal-01893942

https://hal.archives-ouvertes.fr/hal-01893942

Preprint submitted on 11 Oct 2018

HAL is a multi-disciplinary open access archive for the deposit and dissemination of sci- entific research documents, whether they are pub- lished or not. The documents may come from teaching and research institutions in France or abroad, or from public or private research centers.

L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau recherche, publiés ou non, émanant des établissements d’enseignement et de recherche français ou étrangers, des laboratoires publics ou privés.

Ingénierie et sciences sociales

Jean-Claude Poupa

To cite this version:

Jean-Claude Poupa. Ingénierie et sciences sociales. 1995. �hal-01893942�

(2)

lNS·111 " :,i nr 111 RFD1f PPJr ~GAONOMIOUE

Stat1nr, 1fti;onumw •; S1J1;iH%''f Atwales -~ 1D:OCUMENTATION /

65, Aue de St Brieuc 35042 RENNES CEDEX Tél.: 99.28.54.08 et 09

Ingénierie et Sciences sociales

Jean-Claude Poupa 7 novembre 1995

Dans le cadre de la préparation du schéma directeur du Département -d'.Economie et Sociofogie, il a été décidé d'engager ·une réflexion sur les métiers .des ITA} leur recrutement et leur carrière. La Direction du Dépar- tement m'a demandé de prendre en charge ce travail d'élaboration pour la profession d' informaticiein.1

Le Petit ROBERT iPrüi[)OSe pour le mot profess1ion deux définitions: 1. une occupation déterminée: dont .on peu.t tirer ses moyens d'existence;

2. un métier qui a 1..m certain prestige par son camctère intellectuel ou artistique, par la position sociale de ceux qili l'exercent.

L'ingéniem, étymologiquement constructeur, inventeur d·'engins de guerre, est une personne qui(! reçu une formation scientifique et technique le rendant .apte à diriger certains travaux) à partfriper à des recherches.<1;'.. L'ingénieur ... ,est u.ri homme qui s'est spécialisé dans la mise en œuvre de certaines applications de la science> ( De Broglie).

Le tec:hniciein est la personne qui connaft et contrôle professionnellement telle ou telle des applications pr:atiques ,des di·verses sciences dans le domaine de la production et de l'organisation économique.

L'informatique est la science de Finformation, définie comme un élément ou système pouvant ê'lre transmis par un signal ou tme combinaison de si- gnaux appartenant à une s.troct1tre ,commune.

Ce cadre formel préalable délimite un domaine d'activité qui vise à auto- matiser l'exécution d'un ,ensemble d'opérations élémentaiires, pour effectuer des cak1ulls définis sur des structures a1lgéliri,ques et décdts de façon non ambiguë

1 Lettre de mission du Chef de Départ•ement, 20 Avril 1995.

(3)

paII' des a'lgorithmes.2 Comment va s'e~ercer cette activité pour des équipes de recherches ,dan.s les disciplines des sdences sociales?

Ce rapport traite des co:mpétences et métiers à travers deux orientations en matière de gestion des ressources humaines en informatique :

1. La mission des informatkiens est de mettre à. disposition des équipes les outils disponibles sur le marché et d'assister les chercheurs dans l'u tilisatio.n des logiciels ;

2. Le Département se donne les moyens de prnduire des méthodes et instruments po1n des prnjets scientifiques, réaiisables par de petites éq11ipe.s de développement et valorisables dans la discipline scientifique.

Une première partie situe les métiers informatiques aujourd'hui.

La secorrde partie présente et illustre tme démarche formelle, dont la mise en œuvre pratique aboutit à la production de méhodes et instruments adaptés aux problématiques des prnjets scientifiques du Département.

La troisième partie traite des fonctions informatiq1J1es dans le processus des recherches en sciences sociales, situées par rapport à deux directions:

service technique et algorithmique de discipline.

La dernière partie pose les problèmes des missions des informaticiens du Département à long terme et de l'affectation des compétences,

En conclusion, si le technique est évalué à l'aune de critères élaborés par une Direction Logistique, ne faudrait-il pas mettre en place les moyens pour faire reconnaitre le scientifique- au sens de la définition de l'ingénieur citée plus haut- au moyen d'un système émanant d'une Dfrection Scientifique?3

1 Les ' métiers informatiques aujourd'hui

Le système d'information sur les Compétences et les Activités de l'INRA 4 décrit l'activité comme une action pluriannuelle rassemblant plu- sieurs chercheurs et ingénieurs dans le cadre 'un objectif scientifique identi- fié. Les compétences et expertises disponibles dans les principales disciplines

2L'algorithmique numérique correspond à Ulile partie de ce domaine. L'omniprésence de la mesure d,ans les disciplines scientifiqlies ne doi,t pas ocrnlter les autres problèmes logiques de structuration. d'ensembles complexes.

3 La mission qui m'avait é,té confiée en 1986 ;par la Direction Scientifique du Secteur des Sciences sociales dans le cadre de l'élaborat.ion. du Schéma Directeur d'Informatique Scientiiique (SDIS) de l'Institut visait dfectivement à faire prévaloir ce volet scientifique.

4CompAct - Système d'information s1u les Compétences et les Activités, Janvier 1994.

(4)

et champ d'action des chercheurs et ingénieurs5 sont évoquées à travers les spécialités de personnes fournies par le système de gestion de la DRH pour les agents de [·'INRA, par les directeurs d'unités pour les autres.

Comment sont élaiborées puis mises à jour ces descriptions de spécialités de personnes gérées par la DRH? Le t,exte de lancement du débat6 pose de façon globale le problème de la réduction du nombre d'ITA en regard de celui des scientifiques, inscrit au sein de l'Institut dans le mouvement d'ensemble de la division du travail, avec d'un côté un accroissement du professionnalisme des métiers d'accompagnement de la recherche, d'un autre côt,é la spécialisation croissante qui appelle des généralistes pour permettre le fonctionnement d'ensemble de !''organisme. [l note que même l'informatique, qui se simplifie avec les logiciels micros (windows) se complexifie dans le même temps (station de travail sur le bureau d-u chercheur, etc.).7

Le rapport évoque ensuite la nécessité de maintenir les recrutements sur des profils professionnels pour les ingénieurs (informatique, documentation, etc.) et réfléchir à leur déroulement de carrière. Etant entendu que, par ailleurs, les chercheurs ont souvent une mauvaise vision du savoir des JTA susceptibles de répondre à leurs besoins, il est urgent de définir le contenu de ces professi<0nnallismes.

1. l Gestion des ressources matérielles et logicielles

Dans le cadre des I journées de ]a Direction de l'Informatique, l'atelier Informatique et Recherche Agronomique a clairement identifié le rôle de l'in- formaticien dit de proximité, lba,ptisé par le groupe développeur fute,s. Face aux besoins exprimés par les différents chercheurs de son laboratoire, il doit être capable de faire [·'inventaire de ce qui existe déjà et de le récupérer, de modifier les produits existants et enfin d'effectuer les développements spé- cifiques. Il souligne toutefois Ie r.isque de voir se développer des politiques informatiq·ues de laboratoire indépendantes voire contradictoires en termes

5Lettre de mission du Directeur Général de !'INRA, 11 Juin 1993.

6 Jean Cavailhès, Quel schéma Directe·ur? Texte de lanoement du débat, Février 1995.

Schéma directeur du département Contributions a·u débat, Juillet 1995.

7D'un autre point de vue, l',UJ.tilisateur scientifique peut être dérouté par l'empilement d'interfaces dites intuitives g_ui masg_,UJ.en<t la logique du traitement. En revanche, il appré- cie les interfaces bien structurées et adaptées anx langages des disciplines, vues comme simples du fait ,que l'enchaî,nement des actions trad.iuit fidèlement un ensemble ordonné d'opérations formalisées dans ,des modèles matihématig_ues. Ces notions de simplicité et de complexité soFLt donc très relativ-es eu égard aux usages.

8INRA, DirectioFL de l'informatique, l'editeur de liens, numéro spécial, Juin 1995.

(5)

de choix de standards en matériels et logiciefa.

Cette informatique au quotidien mobilise simultanément des compé- tences dites système pou la gestion des ressources, ap1Plicatives dans le contexte des projets scientifiques9 .

Les unités du Département accèdent aux ressources collectives de l'INRA, gérées par la Direction de l'faforrn.atique. Tolites les équipes ont accès à des services fournis p.ar une Informatique de Centre qui met à disposition les logiciels de la boîte à outils. L'exception reste le site d'Ivry10 qui héberge les logidels de la boîte à outils SI.il' des stations de travail, sans avoir le statut d'un serveur de Centre .. 11

Les situations sont très hétérogènes dans les Centres. Pour certaines unités, l'informatique de Centre prend en charge la gestion des utilisateurs, voire celle des postes de travaU. Da.ns d'autres cas, elle fournit seulement les logiciels INRA et la connexion au réseau de Centre, les unités gérant alors leurs propres serveurs de façon autonome.

i.1.1 Gestion des postes de travail et du réseau

La stratégie de gestion des postes de travail est propre aux unités. L 'ins- tallation des postes de travail individuels est une prestation offerte par le fournisseur pour un prix modique. L'installation et la maintenance des logi- cieh sont réalisés selon les cas par les utilisateurs ou des agents spécialisés : l'organisation en la matière relève de la responsabilité des unités .12

L'accès au réseau requiert dans l'état. actuel des technologies des com- pétences spécifiques décrites par la Direction d,e l'Informatique et prises en compte à travers la qualification de techrliicien réseau. Les fonctions assurées sont les suivantes13 :

- installation, connexion et mise en route des équipements ;

9La note de service INRA du 18 Novembre 1991 décrit ces fonctions informatiques et distingue l'mialyste système et l'analyste d',appli-eaticm.

10Ce sjte regroupe quatre unités de recherche et 1me unité de service collectif.

11 Le site ne dispose pas toujours des mises à jour de logiciels. Les agents ne participent pas aux réunions e,t actions de formation .organisées par la Direction de !'Informatique pour la gestion des équipements de Centre. La reconnaissance des compétences pose problème dans les instances d',évaluatiori.

12Certains services rnrnt spécialisé des agents dans des tâches d'acquisition et de mainte- nance des équipements individ~1els : installatiolil. du logiciel x pour le chercheur y à l'instant t # (t + E), assistance, dépa1mage ... Ces fonctions ne sont i!)as répertoriées dans la descrip- tion des fonctions iRformatiqlles définies dans la note de service INRA.

13Cette liste a été établie en 1991, donc antéri-eurement à la disponibilité effective du

(6)

- contrôle, supervision, maintenance de premier niveau;

réalisation des fon.ctions coHectives supportées par le réseau: sauve-- gardes, enregistrement des utilisateurs ...

- assistance: connexion, transferts de fichiers, messagerie, accès a.ux ser- veurs de fichiers ...

Ll.2 Gestion des serveurs de Centres et d'unités

Cert.aines unités sont aujourd 'hu.i équipées d,e façon autonome tout en restant en relation av,ec ]'Informatique de Centre pour l'accès à d'autres ressources et an réseau INRA. Ces ,équipements analogues aux serveurs de Centre Süillt gérés par les ingénieurs et techniciens des unités. Les compé- tences requises sont décrites à travers les fonctions d'analyste système et de chef d'exploitation et regrnupent les tâches suivantes :

- réalisation des implantations de logiciels et _paramétrage dn serveur pour un collège d 'u tilisatenrs ;

- maintenance des logiciels et mise en place de solutions de contourne- ment des bugs ident.ifiés ;

- assistance des utilisateurs sur les aspects système;

- gestion de la charge et. des priorités du calculateur;

- surveillance et maintenance du réseau;

Ces compét-ences sont mises à disposition des Centres par la Direction de l'Informatiq ue, sauf pour le Centre de Paris.

1.l.3 Utilisation des logiciels et langages

Une partie importante de l 'inforrnatique dite scientifique est prise en charge par [es logiciels de la boîte à outills INRA, principalement SAS et se- condairement s. D'autres logiciels plus spécialisés sont utilisés dans certaines unités (TSP, STATA, GEMPACK, MATHEMA'if'ICA ... ) et gérés localement.

Les bases de données d 'équijpes sont gérées sur les servenrs d'unités avec

INGRES à Ivry et Rennes, sur les serveurs d,e Centre avec ORACLE pour les autres implantations.

(7)

Ces logiciels sont utilisés directement par les chercheurs. Les informati- ciens d'unités sont souvent chargés de la gestion des données et de la réali- sation de procédures de traitement statistiques paramétrables, dans les lan- gages propres aux logiciels. Ils réalisent parfois l'intégralité des traitements, epuis l'analyse fonctionnelle jusqu'à l'exécution. Accessoirement, des trai- tements spécifiques sont traduits da.ns des langages d,e programmation, en l'absence d'autres soluitions.

Ce.s compétences sont décrites à travers la fonction d'analyste d'applica- tion, qui, sur les bases d'un cah-ier de charges d''une appUcation informatique,

réalise les analyses fonctionnelle et informatique;

réa.lise la programmation éventuellement en encadrant des program- meurs;

- effectue les différentes opérations d'intégration des produits avant la recette définitive de l'application.

la référence précise .à. un cahier des charges dans la définition de cette compétence suppose une demande informatique statique à l'image du bon de commande adressé à une société de services. Ce modèle, utilisé dans le monde industriel14 , sembl,e plus difficilement applicable pour l'informatique des projets scienüfiques: la production des applications opérationnelles s'ef- fectue de façon dynamique avec des interactions permanentes entre l'équipe scientifique et le développeur.

Cet.te capacité d'intégration et d''orien.tatîon dans un univers de recherche ouvert est un€ composante essentielle du métier d'informaticien dans les disciplines scientifiques.

1.2 Réalisation d'instrun1ents pour la Recherche

La compétence de Chef de p00jet, parmi les métiers de l'informatique dans le monde des entreprises, ,est celle d'un ingénieur capable de piloter 1rne équi·pe de spécia.listes pour concevoir et r,éali.ser un produit. Cette qua- lification regroupe les fonctions suivantes :

- évaluation de la faisabîlité ;

14Il s'agit alo[s de réaliser des développements d'envergure_, souvent pour des milliers d'utilisate11rs, dans des objectifs d·'automatisation de la production de biens ou services, de pilotage de processus complexes ...

(8)

- conception d'un cahier des charg,es;

- coordination du travail d'une équipe;

- direction des analyses fonctjonnelle et informatique;

direction de la réalisation jusqu'à l'élaboration définitive de l'applica- tion.

Cette description est elle aussi calquée sur la logique de développement des applications industrielles, ave,c des oibjectifs de production bien identifiés et en filigrane la méthode nationale MERISE. Elle omet de notre point de vue des Compétences spécifiques aux Activités de la Recherche, en particulier cette aptitude à trouver des so[utions génériques pour automatiser des traitements qui jusqu'alors n'avaient jamais été réalisés par des machines.

L'idée de concevoir et de réaliser des instruments nouveaux répond à un besoin de découvrir des solutions ipmu des classes de problèmes que l'on ne sait pas résoudre avec les outils en usage dans [a discipline. La démarche rel,ève des Sciences de l'Information et ne requiert dans un premier temps aucune machine: il faut d'abord spéci:fier un modèle et évaluer son efficacité.

Cette compétence est illustrée sur deux exemples.

1.2.l Génération de panels et pseudo-panels

Dans le cadre des programmes de rechercihes sur [a consommation alimen- taire, un objectif est de disposer de séries chrono[ogiques longues relatives aux approvisiormements des ménages. La construction des séries à partir des enquêtes INSEE, disponibles depuis 1969, est réalisée par un ensemble de procédures qui effectuent des opérations de calcul ensembliste définies sur une aJgèbre de relations. Ainsi, la quantité x du produit p acheté par le ménage i à 1.a période t, babitueHement notée

xfP

sera représentée par Fensemble des quadmplets (i,t,p,x).15

La forme ensemblist,e s'avère beaucoup mieux adaptée à la gestion de grands volumes de dom1ées m.ultidimensionneHes que la forme matricielle classique, Sur cet exemple., avec seuleme[lt les enquêtes disponibles depuis 1976, on gélilère une matrice à 89 740 lign-es et 518 colonnes, difficile à gérer.

Avec la représentation ensembliste, la relation associée est un ensemble de

15 Jean-Claude Poupa, Statistique et calcul relationnel, Cahiers d 'Economie et Socio- logie Rurales, 1993,

(9)

S 850 980 quadruplets sur lequel on va calculer des classes d'équivalence au moyen de fonctions [)aramétrables.16

Ces deux modèles de données, l'un ensembliste et l'autre vectoriel, per- mettent de re[)résenter les mêmes objets du statisticien: la fonction de l'iu- formaticien est alors de formaliser les méthodes et de construire des algorithmes pou.r produire les iJllstrnm,enits qui vont permettre de choisir [a représentation adaptée .aux traitements à réaliser.

l.2.2 Modélisation de données historiques

Dans le contexte d'un projet de Démogra[)hie hjstorique, dit enquête TRA 17, I'INRA s'est eng~gé à apporter la logistique en matière d 'informa- tique et à fournir en conséquence à temps partiel le responsable informatique de haut niveau requ.is pour conduire le projet à son te[me.

La décision a été prise après pulblication d 'u1q rapport de faisabilité qui fixe les grandes lignes du projet iuformatique.18 La première étape défi- nit une grammaire formelle simple pour représenter l-es variables démogra- phiques élémentaires de façon non ambiguë: [es valeurs syntaxiquement nor- malisées sont affectées dans tes rdations d'une base de données dite d 'ar- chivage. La seconde étape modélise les opérations de calcul relationnel pour numériser les variables démographiques ,et rechercher [,es liens dans l'espace géographique et t·em.porel. La dernièr•e étape réalise les interfaces indispen- salbles [)Our piloter cmwenablerneiit les traitements.

Le coût informatiq11_e du projet est évalué à cinq années-homme.

1.2.3 Spécification et production d'instruments

L'ana.lyse fouctionnelle étant faite ,et validée, h démarche de construction relève de l'ingéniérie dassiqu.e. Les solutions retenues sont aussi génériques que possible et indépendantes des données.

16Dans cette forme relationnelle, 1.11t identifia111t de variable est 'Une valeur paramétrable, affectée dans un attribrm.t ,de refaüon: il n'est plus nécessaire de nommer explicitement la variable, la valeutr <le ce 1wm pouvant être cakulée par une fonction.

17L'enquête <TRA,-,, lancée en l980, a pour objectif de suivre jusqu'à nos jours la descendance d'un échantiUmi de 3000 couples représentatifs de la population française du dêbut du XI Xème sïècle. La Direcition du Département des Sciiences de l'Homme et de la Société dut CNRS a demandé en 1992 à Miche] Villac de réaliser un état des lieux sur ce pwjet afin de décider des conditions de sa poursuite.

18 Jean-Claude Po,upa,, Les procéd,ures et les moyens informatiques pour l'enqête sur les 3 000 familles TRA, Octobre il.993

(10)

.lli s'agit ici de projets de dimension modeste, mais qui mobilisent de fa- çon perm.anente les compétences habitue.Uement requises19 pour réaliser une application informatique. Bîen que les technologies soient en perpétuelle évo- lution, le recours à un langage de programmation classique demeure parfois nécessaire pour traduire certaines primitives.20

1.2.4 Uti.lisati.on des instruments

Pour reprendre l'exemple des achats de produits alimentaires cité plus haut, le passage de la relation qui contient l'ensemble noté m_liste des qua- drnplets (i,t,p,x) à la matrice de terme génér.ique xft enchaîne les actions suivantes:

1. contrôle d'unicité de la clé (i,t,p), qu.i désigne un terme de la. matrice;

2. construction du descripteur de lignes noté diste: liste ordonnée des valeurs distinctes du couple (t,i);

3. constrndion du descripteur de colonnes noté j_liste: liste ordonnée des variables qui correspondent aux valeurs distinctes de p;

4. exécution de la fonction de vedorisation V{Uiste,j_liste,m_liste) qui édite dans un fichier la valeur de x si (i, t,p,x) existe, 0 sinon;

5. lecture du fichier pr,écédent par le log.iciel statistique pour initialiser la matrice des achats.

Le pilotage manuel de cet algorithme nécessite de naviguer d'un logiciel à l'autre, et de contrôler le bon déroufom.efit des opérations, avec des tran- sactions longues. Son automatisation passe par la réalisation d'un logiciel qui assemble le.s fonctions de contrôles et efichaîne les actions, au moyen d'interfaces graphiques. 21

A défaut de disposer des moyens humains pou réaliser ces développe- ments, les équipes exécutent cet algorithme a.u pas à pas, avec les risques

l 9[l faut in fine concevoir les algorithmes et ies traduire dans un langage.

20Sur les projets cités, la taille des procédures les plus longues est inférieure au millier de lignes commentées, en langage C et embedded SQL.

21 La ;primitive de vectorisation est traduite en langage C et accède aux relations de la base par des requêtes SQL DYNAMIQUE. Les interfaces sont à développer dans l'environ- nement X/Windows sous UNIX, conformément aux standards des systèmes ouverts.

(11)

encourus.22 Le produit est néanmoins utilisé par plusieurs projets depuis 1991, mais il n'a pas encore été possible de dégager les quelques mois- homme indispensables pour produire et valoriser le logiciel.

2 Algorit h1niq ue et

sciences

sociales

Un algorithme est ·une suite finie et ordonnée de règles en vue de ré- s01.1dre une .classe de problèmes23 . La démarche algorithmique correspond à une logi.q:ue entierement formahsée reposant sur un système d'axiomes cohé- rents, dont les opérations portent excl:usfoement s11r des symboles totalement indépendants de la nature des réalités qu'ils sont censés traduire24 • Ces deux définitions soulignent le rôle fondamental de [a fo!l"malisation et rappellent que la théorie des algorithmes, élaborée par les logiciens du X X" siècle, constitue la base fondamentale de l'élahrnration des langages et des méthodes de programmation d 'aujour•d'hui.

2.1 Méthod,es formeUes et calculabilité

Cette logique symbolique semble relativement mécounue des équipes de rec!herdh.es e:n sciences sociales, tant à ['[NRA que dans d'autres Institutions de recherches. Dès fors que l'on s}éloigne .de Funivers numérique, l'empirisme s'installe et [es personnes bricolent25 des solutions pragmatiques, là où il serait facile de construi.re un algorithme qui permettrait de résoudre une dasse de problèmes en un temps mesurable.

La démarche est illustrée ci-après pour les deux projets déjà cités.

2.1.l Applications de la théorie de l'algèbre relationnelle

'fout logiciel en mesure de gérer des tables, et d'extraire des informations au moyen d'une requête de la forme <t: select * from ... where ... », est sou vent qualifié de relationnel. La popularité du modèle .relationnel fait que l'on

22Les conséque111ces des erreurn logiq11,es sont graves pour 'les autres utilisateurs: l'explo- sion combilil.atoîre consécutive au cakul imprévii d·'u.n produit cartésien se traduit par une consommation boulimique de ressources, voire l'effondr-ement du serveur.

23Pierre Lévy, La machine uniuers, éditions La Découverte, 1987.

24Georges Ifrah., Histoire unii•ers.elle des chiffres, chapitre 32: histoire du calcul arti- ficiel, éditio111.s Roibert Laffont, 1994.

25La démarche étonne parf~is dans un environnement scientifique, où l'on échange des programmes plutôt que des algorithmes.

(12)

confond souvent des outi[s empiriques de gestion de données et une méthode de calcul logique, avec ses objets abstraits et ses représentations symboliques.

JLa théori-e de l 'aigèbre relationnelle dé.finit ces ab jets et ces représenta- tions, et permet de formafü,ec des opérations de calcul ensembliste dans la logique des prédicats, sur des produits cartésiens d'ensembles appelés r-ela- t:ions. KI est ensuite possibl.e d'évaluer la complexité des calculs en fonction de la cardîn.afüé des opérandes : la fonction de complexité fournit un ordre de grandeur du nombre d'opérations éiémen taires à réaliser et permet d'estimer le temps d 'exérn tion sur une ma.chine, a:vec une technologie donnée.

Sur un plan pratique, avec les puissances de traitement aujourd'hui dis- ponibles sur les stations de travail, nous démontrons, et confirmons expé- rimentalement, q 1J1e le cakul relationnel est efficace avec comme opérandes des ensembles de plusieurs mïfüons de iignes.26

Nous pouvons aiusi conclure à la faisabilité de certains traitements.

Les exemples cités plus llitaut montrent néanmoins qu'en l'absence de logi- ciel, il faut spécifier explicitement les opérations relationne11es et fournir les directives pour optimiser les calculs27 .

2.1.2 Applications d,e la théorie des automates et des langages foril.ue.ls

Le calcul relationlilel n'est pas restreint aux algèbres numériques et les opérat.ions sont aussi ,définies pour des ensembles dont les éléments sont des chaines de caractères qui désignent des objets du monde réel. Les va.- leurs peuvent identifier des lieux ou des personmes, désigner des métiers, représenter des dates ... :Pour effectuer des comparaisons entre ces valeurs, il convient d'adopter une représentation graphique unique, l'usage autorisant

26Si n désigne la cardinalité de l'ensemble à ordonner, il existe des algorithmes de tri dont [a fonction de complexité est d'ordre nlog n. Avec n = 106(n ~ 220 ), ces algorithmes _produisent l'ensemble ordonné en vingt millions d'opérations, En revanche, un algorithme .avec une fonction dl..e complexité d'ordre n2 doit réaliser mille milliards d'opérations. Ce dernier algorithme pourrait par ailleurs être plus performant pour de petits ensembles ( n < UJ00): tout dépend du contexte app!licatif.

Û!R notera que les performances des grands systèmes relationnels du commerce sont prin- cipalement mesurées avec un critère dit transactionnel, qui sinm]e un grand nombre d'opé- rations simultanées sur de petites tables. L'efficacité dans un contexte où quelques utili- sateurs exécl'!tent des transadions longues est m•esurée par un critère dit décisionnel.

27Cette situation correspond à cel.le vécue pa.r le statisticien des années 70 qui devait construire ses formules et parfois écrire dies algoritmes numériques classiques, pour les traduire dans UR laRgage.

(13)

de fait des formes multiples (Ivry sur Seine, Jvry-svr-Seine, Ivry / Seine,

IVRY-SUR-SEINE ... ) avec en sus des esiPaces éla.stiqll.es ...

La théorie des langages forrnels permet de modéliser cette famille de problèmes, au moyen ,d'une grammaire générique décdte par des règles qui génèrent à partir d'un axiome et d'un alphabet tous les mots du langage. La construction du langage s'effectue en étroite relation avec l'équipe scienti- fique: i1 s'agit d'énumérer l'ensemble des formes syntaxiques admissibles.

Les langages sont regroupés en classes, selon la hiérarchie de Chomsky.28 La classe la plus simple est celle des langages rationnels, pour lesquels on démontre qu'ils sont reconnus par un algorithme dit au.tomate d 1états finis.

Le compilateur du fangage exécute cet algorithme : il reconnait les mots et il suffit de les restituer dans un. format unique préalaiblement défini. Les en- sembles de mots générés par le langage vont ensuite constituer les domaines de définition des attributs de relations.

La disponibifüé de ces méthodes, bien connues dans l'industrie du logi- ciel, nous permet de condure à la faisabilité de projets scientifiques, sous réserve évidemment d'affecter les ressources humaines néces- saires. Cette méthode est celle mise en œuvre pour l'enquête TRA.29

2.2 Production d'instruments et valorisation

Si l'utilisation des algorithmes décrits plus haut est, en Pabsence de lo- giciel, une affaire de spéciailiste, cette situation n'est pa.s propre à l'infor- matique. Les écorwmèir,es spéci.fi.,ent des modèles descriptifs ou de simulation qu'ils traduisent au m~yen d'outils logiciels. Le problème d'uti- lisation, et a forüori de diffusion, est illustré sur l'exemple d'une recherche de l'équipe Elilvirom1ement , Revenu des agr1icullteurs (IERA). Il s'agit d'évaluer les inefficacités en matière d'environnement liées aux activités de production agricole. 30

A l'heure actuelle, la solution adoptée transcrit explicitement le système linéaüe et les contraintes dans le langage d'un logiciel statistique. 31

Si l 'INRA choisit de diffuser ce type de méthode opérationnelle, u tins able pour tout facteur polluant, il faut construir,e un environnement pour

28Noam Chomsky, Stn;ctures syntaxiques, 1957, éditions du Seuil.

29 Jean-Claude !Poupa, Métlhod,es et instru m,e11ts pot.H lia poursuite de l'enquête TRA Définition ,d'un langage, codificatîon et organisat-i-on des données, octobre 1995

30Jsabelle Piot-Lepe.tit, Les excédents d·'intmnts polluants dus à des inefficacités des producteurs agrico/.es, Thèse pour le Doctorat en Sci-ences économiques, Mai 1995.

31 L'instrument a été réalisé avec le module Recherche opér:ationnelle du logiciel SAS.

(14)

générer dynamiquement le système linéaire et ses contraintes, le résoudre dynamiquement, avec des ,problèmes de mesure de complexité et d'optimisation.

L'informaticien intervient alors pour construire le logiciel: il doit maî- triser les algorithmes classiques d'ana.lyse num.érique32 , pour proposer un instrument suffisamment performant, indépendant de tout logiciel proprié- taire, et utilisable par les experts de la discipHne.

2 .. 3 Conception et réalisation des interfaces

Au-delà cl 'un certain degr,é de complexité, i[ devient impératif de ga- rantir l'intégrité des calculs33 et utiie d'automatiser les tâches ré- pétitives. lil convient alors de constrnire le poste de pilotage, sous forme aujourd'hui d'une interface graphique hGmme-machine normalisée.

Dans l'état actuel des tech:rwtogies, il est nécessaire de modéliser le comportement de l'utilisateur et de simuler toutes ses actions, logiques ou irrationnelles.34 Il faut aussi traduire les messages retournés par le système dans le langa:ge de ['utilisateur.

Ces développements s'appuient cette fois sm la logique évènementielle:

une action de l'utilisateur sur un corn posant graphique dit widget ( enfoncer un bouton, activer une option de menu, déplacer un curseur, entrer dans un champ ... ) déclenche un évènement. A tout évènement est associé un trai- tement spécifique.35 Les évènements sont gérés dans une file d'attente et traités séquenüe!Jleme:rilt: en conséquence un tel système ne réagit pas tant qu'un traitement est en coms.36

La conception ,et [a réalisation de ces inteTfaces pour des applications de discipline, avec des métl10des spéclfiques, un langage propre et des nsages admis, relèvent des compétences d'une équipe de développement.37

32La séparntiol'l des compétences e·ntre statistique et algorithmique est artificielle.

33Dans les systèmes de gestion. de bases de données relationnelles du commerce, la vérification des domaines de défirotion et des OOl[i[ditions 'application des opérateurs re- lationnds relève d,e la responsabilité du développeur, ou de 'utilisateur s'il interroge au moyen du langage SQL. En conséquence, les traitements effectués, qui rendent néanmoins des résuhat.s, ne relèvent pas nécessairemenit de l'algèbre relationnelle.

34 Cette oompétence relève typiq11ernent de l'e,rgorwm ie des clïa logues homme-machine.

35Formellement, c'est une applicat,ion swrjective et non ·injective de l'ensemble des évène- ments vers l'ensem:ble des traitements: tout traitement est activalble et un même traitement peut être déclenché par plu.sie11rs évènements.

36 Pour des a,ccès à des bases de données, l'existence de verrous pour gérer les transactions peut paralyser une irnterface.

37Pour reprendre l'exemple de.s t.rait,ements statisitiqlles, l'utilisateur ne devrait pas avoir

(15)

3 lnformatiqu.e et production scientifique

Üiil dénombre pour la BAf> Informatique dans le Département 2 chefs de projet, 14 a'nallystes, 7 techniciens, soit 19 agents au total. Des ingénieurs statisticiens rattachés à la BAP Sciences sociales assurent également l 'admi- nistration de serveurs d'unités.

Comment œs compétences sont-eUes être iden ti:fiées et gérées? Les fonc- tions de ['Informatique dans .le processus de Recherche sont ici réparties dans trois catégories: gestion des ressources, informatique de projet, algo- rithmiqne et production. de logiciels.

3.1 Gestion des équipements

Les moyens humains affectés à la logistique informatique de l'Institut et à la gestion des ressources ma.térieUes et logicielles collectives sont normale•

ment rattachés à la Direction de l'informatique. Cependant d'autres agents de !'INRA e:;,,:.e,rcent les mêmes fonctions, au sein d'unités rattachées à des Départements. Cette situation pose le problème de l'harmonisation de la gestion des ressourc,es hu.maines en informaïi.que.

iFant-iJ rattacher cette informatique de serv1ice à la Direction de l'informa- tique? !Les informaticiens seraient alors égaux en droits mais n'auraient plus la possibilité de collaborer aux projets de recherches de leurs disciplines d 'ac- cueil. Qua.nt aux ·projets scientifiques, ils perdraient de fait des ressources humaines qui leur étaient affectées.

Reste le prnblème des fonctiolils qui ne relèvent plus de la logistique générale. Les unités apprécient les compétences des agents aptes à gérer l'informatique av. quotidien et investissent volontiers dans des formations de reconversion ou mise à niveau. Com1nent ces services rendus aux personnes et aux équipes peuvent~ils êt!l"e !l"'econnus?

3.2 Informatique de projet

Les activités des informaticiens du Département s'exercent aussi pour des projets dans des équipes. Les moyens humains sont rattachés à des unités

à se soucier des représenitations formelles et physiques de ses données: c'est au système de détermiRer s'il utiEse la r,eprésent.ation tabulaire dassique pour stocker des termes xi;,

ou la représentation eus-emMiste avec les tuples (i, j, t, s, x ), en fonction du contexte. Les objets restitués à l'utilisateur sont néanmoins des vecteurs.

(16)

mais les procédur,es d'évaluation des compétences informatiques relèvent de fait de la seule Di.rection de l'faformatiq_ue38 .

3.2. il Informatique d'unité

Les logiciels scientifiques de la boîte à outils INRA et les logiciels spé- cialisés de disciplines sont utilisables par les chercheurs eux-mêmes. L'infor- maticien de projet est souvent conduit à réaliser les traitements statistiques dans leur intégralité pour une équipe: sa compétence rejoint alors celle du statisticien. La r•econnaissance des compétences39 s'effectue la plupart du temps à travers des cosignatures ,de publications.

Si certains traitements nécessitent la réalisation de développements spé- cifiques, avec trnduction du code dans un langage de programmation ou le langage d'un logiciel, l'informaticien d'unité reste cependant la plupart du temps un utilisateur de logiciels. Son activité s'exeroe sous la tutelle scien- tifique et administrative de son laboratoire.

3.2.2 Projets scientifiques à forte composante informatique

L'équipe Gestî,on de ll'E1!ltreprise et l1rnstrumentail:ion (GENEPI) a, une longue tradition de recherc!he sur la conception e,t l 'expédmentation de méthodes de gestion de ['entreprise (agricole et agro-industrielle) et la mise en œuvre de leur instrumentation.

La production des instruments utilise les méthodes dassiq_ues de conduite de projets informatiques et les techniques propres aux sciences de l'informa- tion. Ces instruments sont spécifiés et développés p.a.r une équipe affectée à cette activité. Les logiciels sont largement diffusés.

3.2.3 Développements informatiques spécifiques

La nécessité ,de développer apparaît quand le logiciel adapté n'est pas disponible sur le marc!hé, la plupart du temps p.arce que la demande est inexistante ou propr,e au monde de la Red~erche.

38Les informaticien.s d'unités sont mis en compétition avec les informaticiens respon- sables de la logistiq11e natio11a!le et des équipements de Centres.

39ll s'agit souve,m.t de profils d'ingénieurs d.e labo.ratoir,es affichés avec une double com- pétence Statistique et Informatique.

Références

Documents relatifs

RESSOURCES HUMAINES  Responsable : Béatrice

Par ailleurs, sous réserve de non cumul avec une autre aide du Pays ou de l'Etat, le paiement de votre bourse ne sera effectif qu'à la réception de votre engagement définitif et

n (CVCB et bandes es rues les plus es menant au centre. 09 590 € HT Projet double sen Projet zone 30 Projet voie partag Projet CVCB Projet bande cycl Projet piste cycla

Dans le cadre de la mise en œuvre du nouveau schéma directeur, le GCS e-Santé Bretagne s’est doté depuis le mois de septembre 2020 d’un département, piloté par Sophie

• , i en avril et en juillet i960, en se fondant sur des rapports du Secrétaire général et, dans sa résolution 768 (XXX), il a notamment déclaré que des efforts spéciaux

Par ailleurs, le relèvement des prix des produits du secteur tertiaire (+0,8%) est en liaison principalement avec l’augmentation de ceux de certains services liés

Prof Joseph Stiglitz, Columbia University, Nobel Prize winner of Economics ; Prof Chris Pissarides, London School of Economics, Nobel Prize winner of Economics ; Prof Charles

Mais o5r omet le plus souvent d'expliquer les raisons de cet écart relativemeni favorablè et qui sont essentielles pour toute réflexion prospective'dans un domaine où