Gestion de documents multimédias hétérogènes

Gestion de documents multimédias hétérogènes

La gestion des documents multimédia a été pour un bon moment sujet sur le quelle s’articule beaucoup de travaux, parmi ces travaux l’approche proposée dans [1]. Cette approche se base sur la modélisation et l’intégration des documents multimédia hétérogènes dans le but d’en faciliter leur exploitation. Ce qui concerne la modélisation, l’originalité du modèle de représentation des documents multimédia proposé dans [1] réside dans la dichotomie entre structure logique et structure des métadonnées, la dichotomie entre structure générique et structure spécifique. Ce modèle offre une certaine souplesse lors de l’exploitation mais nous avons remarqué qu’il pose un vrai problème en matière de droits d’utilisation, par exemple l’auteur d’un document ne peut pas tolérer ou ne pas tolérer la mise à jour de la description de son document par un autre utilisateur. En termes de gestion, la classification et l’exploitation sont assez performantes mais il est possible de leurs ajoutées d’autres fonctionnalités ou d’autres modes d’utilisation pour qu’ils donnent des meilleurs résultats. Notre travail d’adaptation consiste a réalisé des améliorations sur son modèle de représentation des documents multimédia pour permettre la gestion des droits d’utilisation, pour la démarche de classification nous avons vue qu’elle est suffisamment performante et nous l’avons pris tels quelle est, ce qui concerne l’exploitation nous avons ajouté une démarche pour rechercher les documents dans l’entrepôt de document selon différents critères (selon les modèles de description). Dans ce troisième chapitre, nous présentons nos travaux d’adaptation accompagnée d’exemples dans les trois phases de modélisation, classification et exploitation. III.2. Modélisation des documents multimédia Le modèle de représentation offre une séparation claire des informations relatives au contenu de celles relatives à la structure, aussi il regroupe les documents similaires qui sont représentés par des structures spécifiques au sein d’une même classe illustrée par une structure générique. Ce qui tolère la gestion des deux niveaux d’hétérogénéité documentaire: l’hétérogénéité intra-document, et l’hétérogénéité inter-documents.

Gestion de l’hétérogénéité intra-document

L’hétérogénéité intra-document est due à la diversité des éléments monomédia qui peuvent coexister dans le même document (textes, sons, images, vidéos), ces éléments ont des caractéristiques spécifiques et très diverses d’un media à un autre. C’est la séparation des informations relatives à la structure de celles relatives au contenu permet la gestion de l’hétérogénéité intra-document. Dans ce qui suit ces deux concepts seront utilisés : (1) le concept de structure logique pour décrire la composition globale d’un document multimédia, (2) le concept de structure des métadonnées pour pouvoir associer à la structure logique une ou plusieurs descriptions du contenu des différents éléments mono média.

Structure logique d’un document

La structure logique d’un document après son adaptation est représentée comme suit : La classe « EltSpe » représente un ensemble d’éléments logiques spécifiques, chaque élément spécifique représente un granule documentaire, qui peut être lui-même décomposé en sous granules. La classe « AttSpe » représente les attributs spécifiques qui permettent de décrire des éléments spécifiques. Page | 39 La classe « Documents » désigne un document particulier. La classe « Déclaration » permet de garder l’information concernant d’autres caractéristiques des documents comme le « numéro de version ». La classe « Auteur » représente l’auteur d’un document particulier (ici l’auteur n’est pas celui qui a créé le document mais celui qui la ajouter dans la base de données). Structure des métadonnées La structure des métadonnées représente le contenu des éléments, et peut servir également pour décrire le contenu d’un composant complexe. Cette structure est représentée dans la figure suivante : La classe « CompSpe » représente des composants spécifiques qui peuvent être imbriqués, chaque composant est annoté par des métadonnées. La classe « MtdSpe » représente des métadonnées spécifiques propres à chaque type de média. Structure sémantique La structure sémantique du document est formée par l’association entre la structure logique et la structure des métadonnées, il est possible de rattacher à une même structure logique plusieurs structures de métadonnées, La structure sémantique dans le cas du document « Présentation_Martyr » montre les éléments spécifiques qui appartiennent à ce document, ces éléments spécifiques représentent la classe « EltSpe ». Par exemple le document contient l’élément spécifique « Description » qui est composé des deux éléments spécifiques « D_Textuelle » et « D_Vidéo », ce dernier englobe l’attribut spécifique « Src » qui représente à son tour la classe « AttSpe ». L’élément « D_Vidéo » est rattaché à la structure des métadonnées « D_video_Présentation_Martyr « , car il est composé des deux composants spécifiques « Head » et « Body », le composant spécifique « Body » est composé d’autres composants spécifiques, parmi eux le composant « Audio » qui est rattaché à la structure de métadonnées « D_Audio_Présentation_Martyr ». « Audio » est alors un composant complexe. La cardinalité » » désigne un et un seul, « + » : un ou plusieurs, « * » : zéro ou plusieurs, « ? » : zéro ou un.

Gestion de l’hétérogénéité inter-documents

L’hétérogénéité inter-documents concerne les différences qui peuvent être détectées entre les contenus (domaines très divers, langues différentes) d’un ensemble de documents ou entre leurs formes de représentation (différences de structures, de formats, de standards ou normes), ces différences de contenu peuvent être dues à des variations autour d’un type de document, ou encore à des évolutions des versions d’un même document. Cela peut engendrer un grand nombre de structures documentaires qui sont relativement semblables. Le regroupement des documents similaires permet de gérer l’hétérogénéité inter-documents, il consiste à identifier des documents ayant des structures similaires ou identiques afin de les regrouper dans une même classe afin d’optimiser la recherche ultérieure de tel ou tel type de documents, chaque classe sera caractérisée par une « structure générique » qui représente une collection de « structures spécifiques ». Une structure spécifique caractérise l’organisation d’un document particulier, la liste des structures génériques peut être utilisée ainsi comme index pour diminuer le temps d’accès et de recherche dans les structures spécifiques. Ainsi, les utilisateurs de la base peuvent avoir un accès direct à une collection particulière qui répond à leurs besoins. Structure générique Une structure générique représente une classe ou une collection de structures spécifiques, les structures spécifiques ayant des structures similaires ou identiques serons regrouper dans une même classe. Les structures sémantiques génériques différentes peuvent avoir la même structure logique et/ou une ou plusieurs structures de métadonnées en commun. Afin de regrouper les structures spécifiques autour d’une structure générique, il s’avère nécessaire de rattacher les fragments spécifiques aux fragments génériques par un lien de conformité pour éviter la perte des noms des fragments, et éviter aussi le risque d’avoir des champs vides La classe « StrLGen » désigne la structure logique générique commune à un ensemble de documents.