Ontologie ou ressource Termino-Ontologique ?

Ontologie ou Ressource Termino-Ontologique ? 

La notion d’ontologie est utilisée dans le domaine de l’Intelligence Artificielle, et plus précisément dans la branche de l’Ingénierie des Connaissances, pour la conception des systèmes à base de connaissances.

Une définition consensuelle utilisée dans la littérature en Intelligence Artificielle est celle de (Gruber, 1993) : «Une ontologie est une spécification explicite d’une conceptualisation.» Le terme « conceptualisation » situe les ontologies au niveau sémantique. Elle pose ainsi le sens des termes utilisés et fortement corrélés au domaine considéré. La caractérisation du sens des termes dépend du contexte dans lequel ils apparaissent. En effet, la linguistique est concernée par la question des ontologies dans la mesure où les données dont on dispose pour élaborer les ontologies consistent en des expressions linguistiques de connaissances. Nous parlons alors d’ontologie élaborée pour une tâche donnée et dans un contexte de référence (Bachimont, 2000). L’expression « spécification explicite » fait des ontologies un objet syntaxique. La conceptualisation est faite dans un langage formel qui définit les concepts et les contraintes d’utilisation. On obtient un réseau sémantique et un ensemble de formules logiques sous-jacentes.

La construction du vocabulaire conceptuel standardisé est établie en définissant un ensemble de primitives de représentation pour modéliser le domaine. En OWL, les primitives d’une ontologie sont (Guarino et al., 2009) :

– les concepts de l’ontologie sous forme de owl :Class,
– les attributs de concepts sous forme de owl :DatatypeProperty,
– les relations binaires entre concepts sous forme de owl :ObjectProperty.

OWL a été élaboré dans l’optique de l’indexation de ressources sur le Web. Il permet donc de représenter le lexique sous la forme duquel un concept pourra apparaître dans un document. La modélisation des termes désignant le concept dans le langage OWL se fait par association du terme à la classe correspondante au moyen d’une propriété d’annotation, rdfs :label. Cette modélisation limitée pose plusieurs problématiques, en particulier pour le domaine de recherche s’intéressant à l’extraction et à l’annotation des données dans les documents textuels. En effet, un terme ainsi représenté n’a pas d’existence propre, on ne peut pas lui associer directement de propriétés, e.g. une étiquette grammaticale. Le terme est relié au concept qu’il désigne et de ce fait, la dissociation des informations conceptuelles et lexicales est impossible.

La nécessité de matérialiser la notion de terme, de manière à pouvoir la manier aussi aisément qu’un concept, est apparue à partir des travaux de (Reymonet et al., 2007; AussenacGilles et al., 2006) avec la naissance de la notion de Ressource Termino Ontologique (RTO). Dans cette nouvelle modélisation, la manifestation linguistique (le terme) est dissociée de la notion qu’elle dénote (le concept), en la représentant et en lui octroyant une existence propre et indépendante.

Ceci peut être fait en utilisant SKOS comme proposé dans les travaux de (Touhami et al., 2011). SKOS, Simple Knowledge Organisation System, est une recommandation du W3C 1 permettant de représenter les thésaurus, classifications et autres vocabulaires contrôlés. SKOS s’appuie sur le langage RDF afin de permettre la publication facile de vocabulaires structurés pour leur utilisation dans le cadre du web sémantique. La représentation s’établit sous forme de triplets RDF tels que la ressource de base est un skos :Concept. Plusieurs propriétés sont octroyées à un objet de type skos :Concept :

• des termes préférés (un maximum par langue) en utilisant le skos :prefLabel,
• des termes alternatifs qui vont représenter les synonymes ou les abréviations (plusieurs par langue) en utilisant le skos :altLabel,
• des termes cachés pour gérer les variantes correspondant à des fautes d’orthographe courantes en utilisant le skos :hiddenLabel,
• d’autres propriétés permettent de poser des définitions, des notes et des exemples.

Les instances de skos :Concept peuvent être reliées par des relations de spécialisation ou par des relations associatives, i.e. skos :related. SKOS-XL, SKOS eXtension for Labels, est une extension de SKOS qui permet de représenter plus finement les termes en proposant la représentation des relations entre les différentes formes lexicales, e.g. relation d’acronymie. Cette représentation est particulièrement intéressante, dans le cadre de la RTO, car elle permet de considérer les termes comme une ressource à part entière, avec la propriété skosxl :Label.

Dans le cadre de la thèse, le travail repose sur une modélisation en RTO dédiée à la représentation des relations n-aires, où composante conceptuelle et terminologique sont clairement dissociées. Cette RTO est présentée dans la section 2.2. Dans la suite du manuscrit, nous utilisons indifféremment les termes Ontologie et RTO en sous-entendant la notion de RTO.

Table des matières

1 Introduction
1.1 Cadre général
1.2 Contexte et problématiques identifiées
1.3 Contributions
1.4 Organisation du mémoire
2 Contexte d’étude
2.1 Ontologie ou Ressource Termino-Ontologique ?
2.2 Présentation des RTO de domaine
2.2.1 La composante conceptuelle
2.2.2 La composante terminologique
2.2.3 Représentation des données d’intérêt en relation n-aire
2.3 Définitions et hypothèses de travail
2.3.1 Sélection d’un descripteur pertinent au contexte
2.3.2 La phrase pivot
2.3.3 Sélection d’une fenêtre textuelle
3 Extraction des unités de mesure
3.1 Introduction
3.2 État de l’art
3.3 Localisation des unités de mesure
3.3.1 Méthodologie
3.3.1.1 Contexte et processus global
3.3.1.2 Représentation des données textuelles adaptée au contexte d’étude
3.3.1.3 Prédiction des localisations par apprentissage supervisé
3.3.2 Expérimentations
3.3.2.1 Protocole expérimental
3.3.2.2 Résultats
3.3.2.3 Discussion
3.4 Identification des unités de mesure
3.4.1 Les mesures de similarité
3.4.2 Comparer des unités de mesure
3.4.3 Nouvelle mesure d’identification adaptée aux unités de mesure
3.4.4 Expérimentations
3.4.4.1 Protocole expérimental
3.4.4.2 Résultats et discussion
3.5 Conclusion
4 Localisation et extraction des arguments de relations n-aires
4.1 Introduction
4.2 Extraction d’arguments corrélés
4.2.1 Introduction
4.2.2 Principaux algorithmes de fouille données
4.2.2.1 Quelques définitions utiles
4.2.2.2 Présentation générale de quelques algorithmes de fouille de données
4.2.2.3 Choix des algorithmes pour les expérimentations
4.2.3 Nouvelles représentations des données textuelles guidée par la Ressource Termino-Ontologique
4.2.3.1 Représentations des données
4.2.3.2 Constitution de la base d’objets
4.2.3.3 Constitution de la base d’attributs
4.2.3.4 Paramètrer les nouvelles représentations
4.2.3.5 Critères de sélection et d’évaluation
4.2.4 Expérimentations
4.2.4.1 Protocole expérimental
4.2.4.2 Résultats
4.2.4.3 Discussion
4.2.4.4 Conclusion
4.3 Vers une nouvelle approche hybride fondée sur l’analyse syntaxique
4.3.1 Introduction
4.3.2 Analyse syntaxique non guidée
4.3.3 Combinaison des MS et RS
4.3.3.1 Analyse syntaxique guidée par la RTO
4.3.3.2 Une nouvelle fonction de rang
4.3.3.3 Extension des MS par les RS
4.3.4 Expérimentations et résultats
4.3.4.1 Résultats de l’analyse syntaxique guidée par la RTO
4.3.4.2 Résultats de l’approche hybride
4.3.5 Conclusion
5 Conclusion

Cours gratuitTélécharger le document complet

Télécharger aussi :

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *