HAL Id: hal-02794913
https://hal.inrae.fr/hal-02794913
Submitted on 5 Jun 2020
HAL is a multi-disciplinary open access archive for the deposit and dissemination of sci- entific research documents, whether they are pub- lished or not. The documents may come from teaching and research institutions in France or abroad, or from public or private research centers.
L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau recherche, publiés ou non, émanant des établissements d’enseignement et de recherche français ou étrangers, des laboratoires publics ou privés.
du multilinguisme
Diane Le Henaff
To cite this version:
Diane Le Henaff. L’accès libre aux ressources en Agroecologie : la question du multilinguisme. Col- loque international ”Libre accès et pays du Sud”, Association des Professionnels de l’Information et de la Documentation (ADBS). FRA., Mar 2015, Paris, France. 22 diapos. �hal-02794913�
1.
Le besoin d’information des pays du sud
2.
Comment rendre un portail multilingue
Diane Le Hénaff, INRA
Enseignants, agriculteurs, professionnels du secteur ont besoin de connaitre les techniques en agroecologie & les savoirs faire paysans d’autres pays/régions pour adapter leurs propres
pratiques
Besoin d’une information dans la langue parlée plutôt qu’en anglais (arabe, espagnol, portuguais, français..)
Diane Le Hénaff, INRA
Les organismes de recherche et universités : archives ouvertes
Les écoles ou entreprises : site web et modules pédagogiques
Diane Le Hénaff, INRA
Les coopératives, associations et réseaux professionnels : site web
Les ministères ou entités gouvernementales : site web
Diane Le Hénaff, INRA
Comment rassembler ces ressources pour les faire connaître ?
Comment rendre accessible l’information aux pays du sud en levant la barrière de la langue ?
-> c’est l’objet du projet Organic.Lingua
(projet financé par la commission européenne 2011-2014)
Un portail qui rassemble des ressources pédagogiques
Multilinguisme mis en place dans le cadre du projet Organic.Lingua
Intérêt démontré par la diversité des pays visiteurs
10 pays qui visitent le plus le portail sur 1 an
Somos españoles
Diane Le Hénaff, INRA
Les résultats ramènent :
• Les ressources dans la même langue
• D’autres ressources pour
lesquelles des métadonnées ont été traduites
Titre, description ou mots clés dans plusieurs langues (FR, EN, ES)
Les résultats ramènent :
• Les ressources dans la même langue
• Les ressources dans la langue des termes de recherche traduits
• D’autres ressources pour lesquelles des métadonnées ont été traduites
Titre, description ou mots clés dans plusieurs langues (FR, EN, ES)
Le moteur de recherche traduit les termes dans plusieurs langues
Diane Le Hénaff, INRA
Solution 2 : agir sur le contenu
Enrichissement manuel avec propositions (indexation et traduction)
Enrichissement automatique Traduction à la volée
Solution 1 : agir sur le moteur de recherche Identification de la langue Lemmatisation
Dictionnaire
-> c’est ce qui a été implémenté dans Organic.Edunet
Détection de la langue
Traduire la requête en plusieurs langues
Utiliser des dictionnaires, thesaurus, ontologies et la lemmatisation
(non spécifique aux CLIR)
Diane Le Hénaff, INRA
Niveau de confiance par langue
La fiabilité vient des dictionnaires utilisés et de la base de connaissance
Diane Le Hénaff, INRA
CLIR system:
Query Translation Task
pomodori e agricoltura biologica
Traduit les termes dans les langues supportées Peut également enrichir avec des synonymes et des concepts issus d’une ontologie
Translation Disambiguation
5 Reconstitue la structure grammaticale de la requête en prenant en compte le n°2
2
Query Analysis
IT
3
NamedEntities Recognition
1
Language Identification
- e CONJ
- agricoltura NOUN -biologico ADJ
- pomodoro NOUN - agricoltura NOUN -biologico ADJ
Dictionary 4
Translation
•Création de contenu
•Signalement de ressources
Ressources
Enrichissement :
• suggestion de traduction des termes au créateur
• indexation sur l’ontologie multilingue
Utilisateurs
résultats MT
Traduction à la demande
Création de contenu par un individu : permettre et faciliter l’enrichissement
Traduction à la demande par une machine (MT : machine translation)
p o r t a i l
On trouve des CMS open source pour créer des portails à moindre coût
Mais intégrer des composants multilingues nécessitent une technologie (CLIR + MT) et des experts (enrichissement et traduction)
CLIR en général sous licence (inclut les dictionnaires et la base de connaissance)
MT : licence ou possibilité d’utiliser Google Translate et Bing APIs (mais pas gratuit au delà d’un certain volume)
Diane Le Hénaff, INRA
POUR EN SAVOIR PLUS : Le Hénaff, D., Cebeci, Z. (2014). Agroecology for farmers:
the linguistic issue addressed. In: Agroecology and Global Change. Sustainable
Agriculture Reviews, 14. Berlin, DEU : Springer. http://prodinra.inra.fr/record/185036 RÉCUPÉRER LA PRÉSENTATION : http://prodinra.inra.fr/record/284180
auquel s’adressent les sites web et portails des universités, gouvernements, réseaux professionnels…
La question du coût financier et humain n’est pas anodin
Nécessite d’interroger les décisionnaires (question politique)