Annotation et visualisation interactives de documents hypermédias

Le développement du multimédia, des capacités de stockage et du matériel de numérisation permet de mettre à disposition sous une forme électronique un nombre toujours croissant de documents « matériels » (journaux, plans, cartes, peintures, partitions musicales, photographies, cahiers d’expérimentations, originaux d’œ uvres littéraires, rapports, notes et autres documents manuscrits, etc.). La numérisation, le stockage et la diffusion de ces matériaux sources   ont fait l’objet de nombreux travaux et ne posent aujourd’hui plus réellement problème. Toutefois, il semble que moins d’attention ait été portée à la conception et la réalisation d’environnements interactifs destinés à faciliter une intégration « forte » de ces matériaux en milieu informatique.

On observe en effet que la mise à disposition de documents sous forme électronique entraîne un accroissement considérable du nombre de documents papiers. Les utilisateurs impriment le plus souvent les documents qu’ils jugent intéressants avant de travailler avec. Cette pratique s’explique en grande partie par un manque d’outils logiciels qui permettraient aux utilisateurs de mettre à profit leurs habitudes de travail, acquises dans le « monde réel », afin de supporter la réalisation de leur activité documentaire.

Activité documentaire
Le concept d’activité documentaire [Schilit99] concerne la manière dont les gens consultent, manipulent et travaillent avec un ensemble varié de documents papiers en vue de l’accomplissement d’un ou plusieurs objectifs. Ce concept, qui sous sa forme la plus simple correspond à la lecture linéaire d’un document, regroupe un ensemble de tâches plus ou moins complexes qui sont souvent en étroites relations. Afin d’illustrer ceci, prenons l’exemple d’un enseignant en histoire qui souhaite préparer un cours sur un événement particulier. Cet enseignant devra d’abord trouver les documents relatifs à l’événement étudié (cartes, rapports, notes et observations d’époque, documentation connexe, etc.), les lire ou les survoler. Il sera ensuite amener à identifier les éléments pertinents, à les collecter et à les organiser afin de pouvoir les réutiliser, ce qui nécessitera de pouvoir les retrouver aisément par la suite. Il devra également analyser l’information trouvée afin de produire son cours. Cette phase s’accompagne souvent d’une prise de notes (soulignements, liens, schémas, commentaires, etc.), ce qui a pour effet de transformer le lecteur en « acteur ». Ce dernier s’approprie le document en y ajoutant des marques pour focaliser son attention sur certaines parties, pour faciliter l’assimilation des notions rencontrées, etc. La consultation d’un document se transforme alors en lecture active. C’est la réalisation de ces activités, qui nous paraît naturelle et assez simple sur documents papiers, qui s’avère non triviale dans un environnement informatique par manque de mécanismes appropriés. L’objectif de cette thèse consiste à faciliter l’intégration informatique de documents électroniques en facilitant l’activité documentaire des utilisateurs au moyen des capacités offertes par les systèmes hypermédias, l’interaction homme-machine et la visualisation d’information. Cette intégration peut être vue comme une dématérialisation des documents qui vise à réduire la rupture entre la mise à disposition et l’utilisation des documents .

Hypermédia
Le développement des systèmes hypermédias a permis de mettre à la disposition d’un large public de grandes quantités d’informations de nature variée (texte, image, son, etc.). Ces systèmes organisent les documents en termes de nœ uds et de liens, et proposent un paradigme intuitif d’accès à l’information [Nielsen90a], à savoir la navigation interactive qui s’effectue simplement par associations d’idées en suivant les liens rencontrés. Si les systèmes hypermédias fournissent une base solide à l’intégration informatique des documents grâce à leurs possibilités d’accès (proche de la nature associative de l’esprit humain) et de structuration, les mécanismes qu’ils proposent s’avèrent souvent insuffisants pour la gestion de l’activité documentaire. Au sein de tels systèmes, l’activité documentaire peut être rebaptisée activité hyperdocumentaire. Dans ce mémoire, nous montrerons comment faciliter la partie de cette activité hyper-documentaire liée à la manipulation et à la consultation des documents, que nous appelons exploration hyper-documentaire.

Trouver : cette activité consiste à accéder aux documents recherchés en fonction d’un objectif, d’un centre d’intérêt, etc. Cet accès peut s’effectuer par navigation en suivant les liens rencontrés, mais également au moyen de moteurs de recherche (comme s’est souvent le cas sur le Web par exemple), de tables d’index ou encore de vues qui montrent la structure des documents dans le système hypermédia.

Comprendre : cette activité consiste à analyser, comparer et interpréter le contenu des documents ainsi que les relations sémantiques et/ou structurelles qui associent ces documents. Par exemple, l’affichage d’une vue d’ensemble peut donner des informations sur l’organisation ou le nombre des documents, l’affichage simultané de deux documents dans des fenêtres différentes placées côte à côte peut aider à les comparer, etc.

Organiser : cette activité consiste à classer les documents jugés intéressants en vue d’une utilisation future. Elle nécessite de collecter les documents et de pouvoir en garder une trace. Les gestionnaires de fichiers traditionnels sont des exemples de systèmes qui permettent aux utilisateurs de gérer interactivement l’organisation de leurs données.

Retrouver : cette activité consiste à accéder une nouvelle fois à des documents préalablement consultés, sans repasser par les étapes de recherche (interrogation, navigation). Les bookmarks Web sont des exemples de mécanismes qui permettent ce type d’activité. Les icônes que l’on dispose sur le bureau de travail (MacOS, Windows) fournissent également un moyen de retrouver plus rapidement les documents qu’elles représentent.

Le terme hypertexte est apparu en 1965 dans un article de Theodor Nelson [Nelson65] pour désigner un ensemble d’écritures interconnectées de manière complexe ne pouvant pas être présentées efficacement sur un support papier. L’hypertexte s’est ensuite généralisé afin de représenter des morceaux de texte associés entre eux par des liens qui constituent un réseau à l’intérieur duquel il est possible d’effectuer des parcours non séquentiels.

Le concept d’hypermédia est une généralisation du concept d’hypertexte lorsque celui-ci est pris dans le sens restrictif d’écrit non linéaire. Il y a hypermédia dès lors que les unités d’information (les nœ uds) du réseau hypertexte ne se limitent plus à contenir du texte mais des graphiques, des schémas, des séquences audio ou vidéo, etc.

« un hypermédia est un ensemble d’informations appartenant à différents types de médias pouvant être lus, écoutés, suivant de multiples parcours de lectures, en utilisant également la possibilité du multi-fenêtrage. Ce qui différencie essentiellement l’hypermédia de l’hypertexte n’est ainsi que la nature symbolique des codages d’informations utilisés. Un hypermédia n’est rien d’autre qu’un hypertexte gérant des textes supportés par des médias divers » [Balpe90].

Le concept d’hypermédia est donc né de la rencontre de l’hypertexte et du multimédia. La réalisation informatique de systèmes hypermédias tire avantage du fait que, par nature, la numérisation permet de casser la séquentialité imposée par les supports traditionnels de communication (livre, film, disque, cassette audio).

Actuellement, les termes hypertexte et hypermédia tendent à désigner les mêmes choses. Dans la suite de ce mémoire nous emploierons donc indifféremment l’un et l’autre de ces deux termes (ainsi que le terme plus général d’hyperdocument) pour désigner tout document électronique accessible de manière non linéaire grâce à un cheminement sur un réseau de liens [Sandvad89]. Enfin, le terme hyperbase est utilisé pour désigner un espace informationnel structuré par un ensemble de liens.

En plus des entités structurelles sur lesquelles repose l’organisation des données (les nœuds d’information et les liens), les systèmes hypermédias contiennent également l’outillage nécessaire à la consultation de ces données et au déplacement de l’utilisateur dans le réseau de liens. Ils proposent un nouveau paradigme d’accès à l’information, appelé la navigation, plus intuitif que les techniques d’interrogation utilisées dans les bases de données documentaires (requêtes, filtrage, éléments pertinents) ou que les techniques de déduction et d’induction sur lesquelles s’appuient les systèmes experts. La navigation libre est un moyen original d’appréhender l’information en permettant des associations non nécessairement guidées par des nécessités déductives, de cause à effet ou de tout autre nature logique, mais par des nécessités purement intuitives ou d’associations d’idées. Comme nous le verrons dans la suite de ce mémoire, la navigation nécessite la mise en place de mécanismes adéquats qui peuvent tirer avantage de techniques d’interaction et de visualisation.

Table des matières

I. Introduction
II. Manipulation et représentation des documents
1. Systèmes hypermédias
1.1 Concepts et définitions
1.1.1 Les nœ uds
1.1.2 Les liens
1.2 Historique
1.2.1 Evolution du domaine (échelle de temps)
1.2.2 Pionniers et applications
1.2.2.1 Vannevar Bush: Memex (1945)
1.2.2.2 Theodor Nelson: Xanadu (1965)
1.2.2.3 Andy Van Dam: Hypertext Editing System (1967)
1.2.2.4 Douglas Engelbart: Augment: NLS (1968)
1.2.2.5 Robert Akscyn: ZOG & KMS (1975)
1.2.2.6 Alan Kay: Dynabook (1977)
1.2.2.7 Andrew Lippman: Aspen Movie Map (1978)
1.2.2.8 Ben Shneiderman: HyperTies (1983)
1.2.2.9 Janet Walker: Document Examiner (1985)
1.2.2.10 Norman Meyrowitz: Intermedia / IRIS (1985)
1.2.2.11 Peter Brown: Guide (1986)
1.2.2.12 Frank Halasz: NoteCards (1987)
1.2.2.13 Bill Atkinson: HyperCard (1987)
1.2.2.14 Le World Wide Web
1.3 Modèles
1.3.1 Architecture générale des systèmes hypertextes
1.3.2 Discussion
2. Augmentation interactive de documents électroniques
2.1 Introduction
2.1.1 Lecture Active
2.1.2 Objectifs
2.1.3 Illustration : le projet Philectre
2.2 Le poste de lecture active : principes de conception
2.2.1 Couplage fac-similé / annotation
2.2.2 Format de codage
2.2.3 Aide à la production de documents annotés
2.3 Couplage texte-image interactif
2.3.1 Transcription
2.3.2 Annotation
2.4 Codage XML/TEI
2.4.1 Codage de la transcription
2.4.2 Codage des annotations
2.4.3 Codage des associations
2.5 Modélisation
2.6 Rendu visuel des données XML
2.6.1 Conversion XSLT
2.6.2 Unification des représentations XML et graphique
2.7 Conclusion
III. Exploration interactive
3. Désorientation
3.1 Manque de structuration
3.2 Manque de mécanismes appropriés
4. Techniques d’aide à l’exploration
4.1 Présentation du contenu
4.1.1 Outils dérivés du livre traditionnel
4.1.2 Points de repères
4.1.3 Visite guidée
4.2 Suivi du parcours de navigation
4.2.1 Retour arrière
4.2.2 Historique de navigation
4.3 Personnalisation
4.3.1 Marquage et annotation
4.3.2 Marque-page (Bookmark)
4.4 Augmentation de la structuration
4.4.1 Typage des nœ uds et des liens
4.4.2 Transformations structurelles
4.5 Métaphore de la navigation spatiale
4.6 Conclusion
Conclusion Générale

Cours gratuitTélécharger le document complet

Télécharger aussi :

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *