• Aucun résultat trouvé

2. État de l’art sur l’annotation

2.2. Création et stockage d’annotation

2.2.4. Les modèles d’annotation existants

2.2.4.3. Annotation dans les technologies du Web

Une annotation d'un document Web est une annotation en ligne liée à une ressource du Web (typiquement une page Web). A travers l'utilisation d'un système d'annotation du Web, un utilisateur peut ajouter des commentaires sans

modifier le document source. L'annotation sur les ressources Web est une couche sur la ressource existante. N'importe quelle couche d'annotation peut être rendue visible aux utilisateurs qui partagent le même système d'annotation et cachée aux autres.

2.2.4.3.1. Les dispositions du Web

Dans le cas de l'annotation fondée sur un serveur, l'annotation est effectuée sur le serveur du Web avant qu'elle ne soit envoyée au client. Il n'y a pas beaucoup de systèmes connus dans cette catégorie car cette approche exige des documents source d'être prétraités à l'avance pour avoir les crochets et nœuds nécessaires pour les annotations, et par conséquent, ne peut être généralisée pour annoter les documents sur le Web. CoNote (Davis, 1995) et notes virtuelles (Geyer-Schulz, 1999) sont deux exemples dans cette catégorie.

Le modèle CoNote est fondé sur le concept d'un document de groupe, qui est un ensemble de personnes qui partagent une collection de documents. Chaque personne dans un groupe a un certain rôle en ce qui concerne les documents dans ce groupe avec les droits d'accès progressifs. Les rôles possibles sont «observateur», « lecteur », «utilisateur» et « auteur ». Un observateur peut afficher un document annoté, mais ne peut pas voir les annotations là-dessus. Un lecteur peut voir les annotations, mais ne peut pas ajouter quoi que ce soit sur le document. Un utilisateur peut lire et ajouter, et un auteur peut lire, ajouter, et supprimer les annotations.

Une personne peut avoir un rôle différent dans des groupes différents. Par exemple une personne pourrait avoir le rôle d'un auteur dans un groupe et être un lecteur dans un autre. Les groupes peuvent également définir un rôle par «défaut» qui fournit un certain niveau d'accès aux utilisateurs externes. S'il n'y a aucun rôle par défaut, alors les utilisateurs externes n'ont aucune autorisation d'accès aux documents ou aux annotations dans le groupe.

Bien que les annotations apparaissent à l'utilisateur en ligne dans le document, elles sont stockées dans une base de données séparée, et sont intégrées dans le document quand il est fourni à l'utilisateur. Ainsi le document lui-même n'est pas changé par les annotations. Ceci signifie que le même document peut apparaître dans plus d'un groupe de document, ou des groupes d’annotations peuvent apparaître dans un document.

Un groupe de document se compose d'un ensemble d'utilisateurs, chacun avec un rôle spécifié et d'un ensemble de documents. L'ensemble des utilisateurs est spécifié par une « définition de rôles ». La définition de rôle énumère chaque utilisateur et le rôle qu'il prend pour ce groupe de document. Les documents dans la collection sont spécifiés par une « définition de document », qui indique où les fichiers sont stockés. La définition du document peut énumérer les nœuds d'annotation dans le document.

Chaque document dans CoNote a un nom unique, le docid, qui est le nom composé du groupe du document et de la définition de document (Davis et Huttenlocher, 1995). De plus, chaque point d'annotation a un nom unique dans le document. L'auteur assigne ces noms en indiquant les emplacements potentiels pour l'annotation.

2.2.4.3.2. Présentation d’information

Dans le cas de ce genre de systèmes d'annotations, ils sont faits pour présenter l'information annotée dans un format spécifique. Le formatage est important en raison des contraintes fonctionnelles. Par exemple, la présentation d'annotation dans le domaine médical ne sera pas nécessairement la même qu'une représentation dans les systèmes aérospatiaux. Beaucoup de systèmes d'annotations développés pour des utilisations spécifiques dans des domaines spécifiques peuvent être classifiés dans cette catégorie. Nous notons que la majeure partie de ces types de système d'annotation repose sur un des modèles

tels que l’ontologie, la sémantique ou sur le modèle linguistique. Nous voulons seulement souligner que la présentation de l'annotation est d'une importance particulière dans la conception de son modèle.

Exemple

GOA (Gene Ontology Annotation)

Le GOA est un projet géré par l'institut européen de Bioinformatics qui vise à fournir des attributions des produits de gène à la ressource de Gene Ontology (GO) sous la forme d'annotations. Le but de «Gene Ontology Consortium» est de produire un vocabulaire contrôlé dynamiquement et qui peut être appliqué à toutes les organisations qui travaillent dans le domaine de la biotechnologie.

Quelleque outils d'annotation de domaine-spécifiques sont décrits dans la table en dessous:

Domaine Nom de projet Site internet

GOAT : Gene Ontology Annotation Tool http://goat.man.ac.uk/ Génétique Genetator http://www.fruitfly.org/~nomi/genotator/

Statistiques SAS Annotation http://www.math.yorku.ca/SCS/sssg/boxplot.html

Médicale LEADTOOLS

http://www.leadtools.com/sdk/medical/Medical-Addon-Annotations.htm

Multimédia VideoAnnEx http://www.research.ibm.com/VideoAnnEx/

SIG (GIS) Arc4You http://www.wlm.at/A4_Eng/A4anno.htm

Géologie GEM http://ess.nrcan.gc.ca/pubs/carto/downloads/adding

_and_editing_annotation_in_gems.doc

Linguistique

ATLAS (Architecture and Tools for

Linguistic Analysis

Systems)

http://www.nist.gov/speech/atlas/

Tableau 2.5 : La table des systèmes d’annotation spécifiques

2.2.4.3.3. Stockage d'information

Le stockage des informations est un des facteurs importants dans la modélisation des systèmes d'annotations. Comment les annotations sont-elles organisées et comment peut-on les stocker et où on peut-on les stocker. Nous avons trois méthodes utilisées pour les lieux de stockage des annotations : le stockage local et le stockage à distance.

Dans le cas du stockage local, les annotations sont stockées sur la machine d'un utilisateur. Dans le cas du stockage à distance, les annotations sont stockées par le serveur web.

Plusieurs suggestions et développements sont en cours de réalisation pour les stockages des annotations. Parmi les technologies du stockage adoptées au cours des années pour les stockages d'informations on cite : XSL, DBF, TXT et CSV. Ces denières sont associées avec les bases de données relationnelles. Dans le cas des bases de données liées avec les informations sur le Web, les technologies comme SGML, HTM, RDF, XML, HTML, TXT sont le plus utilisées.

Tableau 2.6 : Tableau des fichiers dans le stockage des informations DBF

DBase File. Format de fichier du SGBD dBase. Un des formats reconnus pour les bases de données relationnelles sur micro-ordinateur

CSV Comma Separated Values. Valeurs séparées par des virgules (et par

extension, par un caractère particulier). Il s'agit d'une forme très primitive, mais finalement très robuste, de base de données, où chaque ligne est un enregistrement où les champs sont séparés par un caractère prédéfini.

XLS eXceL Spreadsheet. feuille de calcul du tableur Excel de Microsoft

HTM HTM désigne en particulier un fichier contenant un document

formaté en HTML (normalement on devrait utiliser HTML comme extension de fichier)

SGML Standard Generalized Markup Language. Métalangage utilisé pour

définir de façon générale des langages définissant des documents hypertextes de toutes sortes, normalisé sous le nom d'ISO 8879. HTML en est un dérivé (très) simplifié, XML aussi (mais en moins

simplifié).

RTF Rich Text Format. Format de fichier strictement textuel (norme

ASCII ou ANSI), et contenant des codes de formatage du document. Ces codes sont aussi exprimés en ASCII ou ANSI. Le format RTF est utilisé par Microsoft comme code source des fichiers

Les formats utilisés pour le stockage des informations annotées dépendent la plupart du temps des annotations elles mêmes. Les facteurs peuvent inclure: comment accéder aux informations stockées ? Comment transmettre les annotations stockées pour son utilisation ? Quelle sera leur utilisation fondamentale ?

2.2.4.3.4. Partage d’information

Comme nous l'avons dit plus tôt dans section 1.3.6, l'annotation peut être utilisée pour évaluer ou récapituler l'information. Souvent le but des ces évaluations, ou sommaire, est le partage de l'information. Il y a des outils d'annotations qui ont été développés purement pour le partage de l'information. Quelques exemples de ces outils d'annotation incluent le commentaire dans Microsoft Word, NOTE dans LEXSYS et l'annotation dans la feuille de QuatroPro de Corel. Certains de ces outils ne favorisent pas le partage de l'annotation en temps réel. Ils sont faits de manière à ce que les annotations soient envoyées à un ou plusieurs récepteurs d'information par moyens électroniques. Nous décrivons le système d'annotation dans le logiciel LEXSYS.

LEXSYS (Legume Expert System) est un outil de partage d'information développé par l'institut international d'agriculture tropicale (IITA), Ibadan, Nigeria (Weber et al, 1997). Dans le système, il y a un outil d'annotation intégré nommé «NOTE» sous le menu d'option. L'essence de cette «NOTE» est de permettre aux chercheurs scientifiques dans le domaine agricole de partager les expériences par un envoi des notes ou des observations sur les traits ou sur des espèces spécifiques des plantes légumineuses. Des notes «note.DBF» et «note.FPT » faites par des utilisateurs sont communiquées au coordonnateur du projet par l'intermédiaire de courriel.

Figure 2.18 : Un exemple d'annotation partagée dans le système d’informations LEXSYS

L'une des utilisations de l'annotation dans ce système permet la collaboration entre les chercheurs dans le domaine d'agriculture. Par exemple, les utilisateurs en Italie peuvent envoyer leurs expériences aux utilisateurs de ce système au Brésil.

2.2.4.4. Problèmes liés aux outils d’annotation sur le Web