• Aucun résultat trouvé

VERA - Vidéo, Ethnotextes et Ressources Associées

N/A
N/A
Protected

Academic year: 2021

Partager "VERA - Vidéo, Ethnotextes et Ressources Associées"

Copied!
2
0
0

Texte intégral

(1)

HAL Id: hal-03136050

https://hal.archives-ouvertes.fr/hal-03136050

Submitted on 9 Feb 2021

HAL is a multi-disciplinary open access

archive for the deposit and dissemination of sci-entific research documents, whether they are pub-lished or not. The documents may come from teaching and research institutions in France or abroad, or from public or private research centers.

L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau recherche, publiés ou non, émanant des établissements d’enseignement et de recherche français ou étrangers, des laboratoires publics ou privés.

Distributed under a Creative Commons Attribution - NonCommercial - ShareAlike| 4.0 International License

VERA - Vidéo, Ethnotextes et Ressources Associées

Pierre-Aurélien Georges

To cite this version:

Pierre-Aurélien Georges. VERA - Vidéo, Ethnotextes et Ressources Associées. AG CORLI 2019, Jan 2019, Paris, France. �hal-03136050�

(2)

cepd-oc.fr!

2006 – 2017 :

+ de 100 enquêtes de terrain

Dialectes occitans et liguriens

de 75 localités (France & Italie)

5 questionnaires de phrases

totalisant 1200 questions

Archivage pérenne

et versement au Corpus de la Parole

Plateforme web dédiée

avec cartographie interactive

et fonctions d’exploration du corpus

Chaîne vidéo YouTube

permettant au grand public de découvrir tous nos discours libres

Interface de requête API REST

(interopérabilité, notamment avec les moteurs de recherche spécialisés)

Se a r c h En g i n e

432.765.765

162.54.79.56

https://bit.ly/thesOC

Bilan de ces 9 campagnes d’enquêtes :

+ de 120 locuteurs interviewés

58 ethnotextes récoltés

60 h de vidéos inédites à traiter

(et autant d’enregistrements audio)

env. 400 000 occurr. à lemmatiser

2) Segmentation

Repérage des tours de parole, Minutage phrase par phrase,

Numérotation des réponses aux questionnaires de phrases

(PHON.ca – XML PhonBank)

3) Transcriptions

en graphie et en Alphabet Phonétique International - ou - dans 2 graphies différentes, suivant les enquêtes.

1) Montage Vidéo

Normalisation du volume sonore, Synchronisation audio – vidéo,

Choix des séquences vidéos, Titres et logos.

(Adobe Premiere)

5) Annotations

Lemmatisation et étiquettes P.O.S.

(base MMS du Thesoc)

4) Traduction

alignée phrase par phrase, en français et parfois italien, avec commentaires et explication des termes opaques.

6) Encodage XML-TEI et géolocalisation

(métadonnées Dublin-Core et OLAC)

…consultables selon 4 modalités différentes…

…accompagnés de nouvelles ressources…

Des enregistrements inédits…

…avec de multiples applications possibles :

Industries de la Langue :

corpus d’entraînement en traduction automatique, Text2Speech, reconn. vocale, …

Enseignement des langues régionales :

support pédagogique pour les enseignants et étudiants

Linguistique :

lexique, phonologie, microvariation syntaxique, toponymie, …

Communication non verbale :

analyse de la gestuelle et expressions du visage

Histoire, sociologie, ethnologie

(ethnotextes aux contenus très variés)

Ressources linguistiques

sous licence LGPL-LR

Vidéos sous licence CC-BY-NC-ND

Li

vr

a

b

les

C

onte

xte

T

ra

itements

Exp

loi

ta

ti

ons

Question

Pierre-Aurélien Georges

pageorge@unice.fr!

VERA

Vidéos, Ethnotextes et Ressources Associées

http://thesaurus.unice.fr/vera!

Ce travail a bénéficié d'une aide du gouvernement français, gérée par l'Agence Nationale de la Recherche au titre du projet Investissements d’Avenir UCAJEDI portant la référence n° ANR-15-IDEX-01

Références

Documents relatifs

Later in the clinical course, measurement of newly established indicators of erythropoiesis disclosed in 2 patients with persistent anemia inappropriately low

Households’ livelihood and adaptive capacity in peri- urban interfaces : A case study on the city of Khon Kaen, Thailand.. Architecture,

3 Assez logiquement, cette double caractéristique se retrouve également chez la plupart des hommes peuplant la maison d’arrêt étudiée. 111-113) qu’est la surreprésentation

Et si, d’un côté, nous avons chez Carrier des contes plus construits, plus « littéraires », tendant vers la nouvelle (le titre le dit : jolis deuils. L’auteur fait d’une

la RCP n’est pas forcément utilisée comme elle devrait l’être, c'est-à-dire un lieu de coordination et de concertation mais elle peut être utilisée par certains comme un lieu

The change of sound attenuation at the separation line between the two zones, to- gether with the sound attenuation slopes, are equally well predicted by the room-acoustic diffusion

Si certains travaux ont abordé le sujet des dermatoses à l’officine sur un plan théorique, aucun n’a concerné, à notre connaissance, les demandes d’avis

Using the Fo¨rster formulation of FRET and combining the PM3 calculations of the dipole moments of the aromatic portions of the chromophores, docking process via BiGGER software,