• Aucun résultat trouvé

Un format pour la description thématique

Dans le document Le document audiovisuel. (Page 193-200)

9.1) Introduction

Après avoir passé en revue quelques principes régissant une description thématique, il nous reste à identifier un format que nous voulons aussi explicite et aussi systématique que possible, dont le rôle est de « normaliser » la tâche de description thématique elle-même. Autrement dit, nous pensons qu’il est nécessaire de spécifier un cadre à la fois théorique et méthodologique qui régisse les activités relatives à la description du contenu – activités qui sont centrales pour tout type d’application informatique ou non. Spécifier un format de description ne veut pas dire pour autant que ce format constituerait une sorte de dogme, de vérité à laquelle on ne pourrait plus toucher. Il nous paraît évident qu’un tel format est toujours susceptible d’être modifié, aménagé suivant d’une part les contraintes pratiques et technologiques et d’autre part les connaissances théoriques qui ne sont jamais, comme on le sait, définitives.

Ce chapitre est donc consacré à la spécification et mise en place d’un tel format pour la description thématique. Dans les sections 9.2 et 9.3, nous allons identifier un ensemble de critères qui nous semblent essentiels non seulement pour réaliser une description thématique mais aussi pour évaluer des descriptions existantes.

Dans la section 9.4, nous allons présenter et discuter un format de description qui nous semble être, pour le moment, le plus à même de satisfaire les tâches d’une description thématique.

Un format pour la description thématique 193

La section 9.5 est consacrée à une brève présentation de la description taxinomique de l’espace topique d’un taxème et de taxèmes eux-mêmes. Dans la section 9.6 nous présenterons d’une manière très succincte la description dite méréonymique (ou partonymique), c’est-à-dire de la description des « parties » composant l’espace topique au sens d’un « tout ». Enfin, dans la section 9.7, nous proposerons encore quelques éléments pour une description narrative de l’espace topique d’un taxème. Les descriptions taxinomique, méréonymique et narrative forment, à nos yeux, trois approches complémentaires dont on peut se servir pour mener à bien une description thématique approprié au contenu d’un corpus ou encore d’un fonds de documents (dans notre cas) audiovisuels.

9.2) Un point sur les descriptions thématiques

Dans la pratique, une description thématique peut prendre des allures très diverses.

C’est une conséquence de la conception d’une part de ce qu’est le thème et de la description thématique, et d’autre part des contextes et des objectifs poursuivis.

Répétons que la définition-description, la qualification d'un thème :

1) identifie un lieu de savoir et le nomme (elle le désigne soit à l'aide des termes soit à l'aide d'autres types d'expression – iconique, par exemple) ;

2) en propose une ou plusieurs définition(s) suivie(s) éventuellement d'une description, d'une exemplification voire d'une comparaison avec un autre (d'autres) lieu(x) de savoir ;

3) en propose le champ « notionnel » pertinent, i.e. le contexte d'un savoir (de connaissances) dans lequel ou par rapport auquel le lieu de savoir en question prend place, se profile ;

4) et explicite le statut structural, c’est-à-dire l’ « implémentation » spécifique d’un thème ou d’une configuration dans un document audiovisuel ou un corpus de documents audiovisuels.

Enfin, il faut également remarquer qu'une définition-description d'un thème (taxème) peut (doit ?) :

5) déterminer le statut d’un lieu de savoir dans la description elle-même ;

6) déterminer d'éventuelles conditions d’emploi ou d'utilisation d'un lieu de savoir ; 7) proposer des traductions des lieux de savoir nommés (ou désignés) dans d'autres langues (d'autres systèmes d'expression).

Un format pour la description thématique 194

Les sept points énumérés ci-dessus font partie des critères à prendre en considération pour évaluer la description du contenu d'un corpus de documents (audiovisuels). La description thématique d’un corpus de documents (audiovisuels) couvrant l’ensemble de ces sept critères est une entreprise lourde et difficile. On peut en effet constater que derrière tel ou tel outil, telle ou telle application concrète se trouvent des descriptions de contenu qui – selon les contraintes et objectifs pratiques – donnent une priorité à un sous-ensemble de critères énumérés ci-dessus au détriment d’autres critères pas ou peu pris en considération.

Le degré zéro d'une description thématique est formé par des listes de « mots » dits

« mots-clef » supposés représenter – à un certain niveau de généralité – le contenu d'un corpus. On peut trouver des descriptions du contenu, qui – pour des raisons pratiques – ne proposent des définitions que pour quelques thèmes (centraux, « stratégiques », etc.) mais pas pour tous les thèmes utilisés. D'autres descriptions thématiques réduisent le champ notionnel à quelques relations de classification bien connue (thèmes plus généraux, thèmes plus spécialisés, thèmes dits associés). Dans certaines descriptions plus sensibles aux « scénarios » d’action ou de processus, on s'efforce de développer le champ notionnel d’un thème en y intégrant, outre les rapports taxinomiques et méréonymiques, une « logique » narrative et rhétorique.

Certaines descriptions thématiques « enrégimentent » – au niveau lexico-syntaxique – les procédures de définition, voire des descriptions ouvrant ainsi la voie à un traitement automatique ultérieur desdites définitions (sous forme de traductions, de recherches

« plein texte », etc.). Certaines autres descriptions thématiques « enrégimentent » le positionnement d'un thème dans un champ notionnel en imposant (« à priori ») un ensemble de relations et de modèles (de type graphes conceptuels) à utiliser.

Certaines descriptions thématiques fournissent des indications plus précises dans le champ définitionnel d'un lieu de savoir en précisant, par exemple, un ensemble de contraintes pragmatiques : historicité du lieu de savoir, niveau de spécialisation de celui-ci, dépendance de celui-ci par rapport à d'autres lieux de savoir, degré d'acceptation de celui-ci par une communauté d’acteurs, degré de centralité de celui-ci pour un champ notionnel, etc. D’autres descriptions thématiques rendent explicites leur contexte de production (auteurs, objectifs, contexte, positionnement par rapport à l'existant, etc.) et donc la « perspectivité » inhérente à toute description du contenu.

Enfin, certaines descriptions « augmentent » la définition des champs notionnels d’un thème avec des critères permettant de tenir compte au moins de certains paramètres affectant le statut structural d’un thème dans un document audiovisuel dont,

Un format pour la description thématique 195

en premier lieu, les critères de l’endroit textuel dans lequel le thème apparaît, de la durée textuelle pendant laquelle un thème est traité, des formes syncrétiques de manifestation d’un thème dans un document ou un segment audiovisuel et des procédures de mise en scène visuelle (cadrage, mouvement de caméra, type de plans visuels, etc.).

Ces différences montrent seulement une chose très évidente et simple à comprendre : l'analyse thématique d'un corpus, i.e. l'analyse du contenu d'un corpus de documents (de tout type : textuel, audiovisuel, oral, gestuel, etc.) peut répondre à des objectifs très variés et s'effectue dans les contextes les plus divers, s’appuie sur des compétences et des savoir-faire qui varient fortement d’une description à une autre et doit se plier aussi à des contraintes qui lui sont externes : contraintes en termes de temps de réalisation, de facilité de gestion et de suivi, de ressources humaines, de limites des technologies utilisées.

9.3) Principaux paramètres déterminant une description thématique

La spécification d’un format de description thématique est un enjeu crucial à la fois pour les exploitations pratiques et les applications technologiques d’une telle description et pour la recherche elle-même. Spécifier un format général de description thématique est crucial :

– d’un point de vue pratique : il constitue un « standard » de facto pour normaliser et pour comparer différentes descriptions, pour gérer aussi des projets de description et des exploitations pratiques (sous forme de thesaurus ou d’ontologies, de procédures d’indexation, de spécifications d’interfaces de recherche et de navigation, de spécifications de scénarii de production, de réutilisation ou d’édition de documents audiovisuels ),

– d’un point de vue théorique : il explicite le niveau actuel et donc les limites de nos connaissances en matière de description thématique.

La description thématique est, contrairement à ce qu’on pourrait croire étant donné certaines utilisations assez simplistes, une entreprise très complexe. Le tableau de la figure 9.1 montre les principaux composants à prendre en considération pour développer, évaluer et gérer la place et le statut de la description d’un thème ou, plutôt, d’une configuration thématique, d’un réseau de thèmes :

Un format pour la description thématique 196

1) Tout en s’appuyant nécessairement sur un corpus de documents, elle se situe en amont d’une description à proprement parler de l’ « implémentation » d’un thème ou d’un réseau de thèmes dans un document audiovisuel.

2) Elle est elle-même dépendante d’un certain point de vue, de certaines

« assomptions » et ne peut être en aucun cas considérée comme la seule et unique description possible.

3) Elle est, comme nous l’avons déjà vu à plusieurs reprises (et notamment dans la section précédente), dépendante de contraintes pragmatiques en ce qui concerne aussi bien son « cycle de vie » que son état épistémique (de connaissances).

Figure 9.1 : Principaux composants à prendre en considération pour développer, évaluer et gérer une description thématique

Le premier point concerne le rapport particulier entre la description d’un thème et la description de la place particulière d’un thème dans un document audiovisuel. Il est représenté, dans la figure 8.1, par la flèche qui va de la boîte 1 à la boîte 2. Cette distinction entre la boîte 1 et la boîte 2 signifie simplement qu’aucune description thématique d’un corpus de documents à proprement parler n’est possible sans une description préalable des thèmes sollicités dans le corpus. Mais – comme déjà dit à plusieurs reprises – une description thématique en elle-même n’est pas encore une

3) Configurations analytiques et/ou génériques (« méta-standards »)

1) Format de description d’un thème/d’une configuration thématique 4) Statut

pragmatique de la description d’un thème

2) Statut structural d’un thème dans un composant textuel (audiovisuel)

Un format pour la description thématique 197

description de la « vie » d’un thème dans un document ou un corpus de documents. Il ne faut donc pas perdre de vue la distinction entre d’une part la description (l’identification, la qualification et la classification) d’un thème et d’autre part la description de la place d’un thème et de sa fonction dans un segment audiovisuel, dans un document ou dans un corpus de documents audiovisuels.

Par ailleurs, il faut distinguer également entre description et exemplification d’un thème à l’aide de quelques segments choisis dans lequel « apparaît » le thème en question. Nous le verrons ci-après, dans le format de description d’un thème (cf. figure 9.2), une ligne est réservée à exemples étant donné l’importance (didactique) de « bons » exemples. Mais « donner un exemple » d’un thème, d’un lieu de savoir provenant d’un corpus de documents de référence n’est naturellement pas une description à proprement parler du profil particulier du même thème dans un segment ou un document audiovisuel donné. En ce qui concerne plus particulièrement la description du statut structural d’un thème dans un segment ou un document audiovisuel, nous l’aborderons d’une manière aussi systématique que possible dans la quatrième partie de cet ouvrage.

Le deuxième point cité ci-dessus concerne le rapport entre configuration analytique et format de description d’un thème ou d’une configuration thématique. Il nous renvoie à la discussion du chapitre 7 (section 7.8) concernant le fait qu’un thème, une configuration thématique elle-même contient obligatoirement un point de vue, une certaine perspective. Ce point de vue dépend du choix (implicite ou explicite) d’un standard (d’un modèle) de référence à partir duquel est élaboré, i.e. défini et décrit le champ notionnel d’un thème ou d’une configuration thématique.

Le troisième point mentionné ci-dessus concerne enfin le statut pragmatique d’une description thématique et renvoie au fait qu’une description est un projet, que ce projet connaît des cycles de vie tels que ceux de l’analyse des besoins et de l’existant, de l’identification de listes de thèmes-candidats pouvant jouer le rôle de taxèmes, de la veille de ressources d’information pouvant aider à la description de thèmes, de la définition-description de thèmes, de l’échafaudage de procédures de tests, d’évaluation et de correction d’une description thématique, de sa réalisation définitive, de son édition et de sa conversion en un thesaurus, une ontologie, une base de connaissances ou un scénario.

Un format pour la description thématique 198

9.4) Un format pour la description d’un thème

La figure 9.2 présente donc d’une manière synthétique un format de description des thèmes (taxèmes) qui est suffisamment général mais aussi explicite pour être utilisé (tel quel ou moyennant certaines contraintes supplémentaires) pour la description du contenu d'un corpus de documents (audiovisuels mais aussi textuels à proprement parler).

Ce format est structuralement assez proche des formats standards de définition qu’on trouve dans le contexte de l’élaboration de thesaurus et d’ontologies. En effet, comme nous l’avons déjà vu dans le chapitre 3 consacré aux différentes exploitations pratiques de la description sémiotique d’un corpus de documents audiovisuels, on distingue parfois, dans le cas des thesaurus (à base de schémas fléchés et à facettes) et des ontologies :

– une partie déclaration de spécifieurs (i.e. réservée à la déclaration des thèmes permettant de spécifier le rôle et la place d'un taxème dans une ontologie ou dans un schéma fléché d’un thesaurus) ;

– une partie définition (i.e. comportant une définition assez improprement dite conceptuelle dans ce sens qu'elle est une simple reformulation en langage naturel des spécifieurs qualifiant un taxème, et une autre définition de nouveau assez improprement appelée encyclopédique dans ce sens qu'elle recouvre une diversité plus importante d'informations à propos du taxème en question).

Comme déjà expliqué dans les deux chapitres précédents, un des points les plus cruciaux pour une description thématique est l’identification d’une base de taxèmes organisant ensemble l’espace notionnel ou topique d’une telle description.

L’identification d’une telle base de taxèmes se fait à l’aide de plusieurs « stratégies dont nous avons présenté les trois suivantes : utilisation des thèmes-directeurs textuels comme candidats pour une telle base ; analyse comparative (à l’aide de modèles analytiques) de situations audiovisuelles appartenant (à titre d’hypothèse) à un même

« grand thème » ; identification interprétative des thèmes constitutifs sur la base desquels s’élabore et se réalise le propos d’un segment ou d’un document audiovisuel.

Critères : Contenu :

Numéro d'identification numéro

Entrée taxème

Qualification définition définition. du taxème

Un format pour la description thématique 199

restrictions éventuelles restrictions concernant la validité et la portée de la qualification

liens (éventuellement) lien(s) vers d’autres qualifications (dans le même projet, d’autres projets) du taxème

champ taxémique relations (liens) vers les autres taxèmes constituant une description

Exemples lien(s) vers un ou plusieurs: segment(s)

audiovisuel(s)

Espace topique « réseau » des spécifieurs organisant l'espace

conceptuel (topique) du taxème

Statut structural « implémentation » d’un taxème (thème) dans

un segment ou document audiovisuel (cf.

contexte et objectif contexte et objectifs d'application cycle de vie phase de la description et approbation

autre autres

Figure 9.2. : Format de description de l’espace topique d’un taxème ou d’un thème

Or, une fois la base (hypothétique et donc toujours révisable) de tels taxèmes identifiée, le travail le plus important consiste en l’explicitation des espaces topiques relatifs à chacun de ces taxèmes. Or, c’est la fonction du format représenté synthétiquement par la figure 9.2, de fournir un cadre explicite de référence pour cette tâche complexe.

Dans le document Le document audiovisuel. (Page 193-200)