LE MODELE ENSEMBLISTE POUR LA RECONNAISSANCE DES FORMES

LE MODELE ENSEMBLISTE POUR LA RECONNAISSANCE DES FORMES

Le principe qui sous-tend le modèle est que tout processus de reconnaissance met en jeu trois ensembles et deux applications que nous représentons suivant le schéma suivant : O : ensemble des objets à reconnaître R : ensemble des représentations de ces objets Ω : ensemble des formes (ou des étiquettes ) ψ : fonction de représentation : c’est une application qui, à chaque objet de O, associe un nombre de descripteurs (ou de caractéristiques) dont la nature dépendra de la structure de l’ensemble des représentations R. Dans la suite nous supposerons que cette application est surjective pour ne pas restreindre à chaque fois l’ensemble R à ψ(O). ξ : fonction d’identification ou d’interprétation : une forme ω sera dite significative (ou signifiante) pour un objet o, (o sera dit signifié par ω ) si o admet au moins une représentation x telle que ξ (x) = ω . La construction d’une structure sur les ensembles utilisés dans le modèle de reconnaissance doit passer par une «transmissibilité du caractère de voisin quand on va d’un espace à un autre… Voisinages et continuité (nous) incitent naturellement à la recherche d’un modèle de nature topologique » [Emptoz-83]. Ce modèle respecte les principes généraux de la Reconnaissance des Formes, à savoir : 1- l’ensemble d’apprentissage T est assez représentatif de l’ensemble des représentations, c’est-à-dire il est possible de définir des ressemblances ( ou des similarités ) entre les représentations n’appartenant pas à T et celles appartenant à T, de telle sorte que la généralisation de ξ à R tout entier soit possible, 2- toutes les formes de Ω sont utilisées au moins une fois dans l’interprétation des éléments de T, c’est-à-dire que la fonction ξ|T doit être surjective, et dans le cas contraire l’ensemble Ω sera réduit à ξ|T (T).De plus, les hypothèses suivantes sont faites tant sur les objets que sur les formes : R O Ψ ξ Ω Figure VII.1 : Le modèle ensembliste de la Reconnaissance des Formes Chapitre VII . H1 Les éléments de Ω sont tous bien distincts. H2 Tout objet de O a une étiquette unique… H3 Tout objet de O fait partie d’une collection de parties de O. H4 Il existe au moins une structure prétopologique sur O, celle définie par la relation qui associe à chaque objet ceux qui ont le même nom que lui. Le cœur du problème de la Reconnaissance de Formes consiste en la construction de l’application d’interprétation ξ, elle se déroule en deux phases : – la phase d’apprentissage : lors de cette phase il s’agit de déterminer la fonction ξ sur un sous-ensemble T de R (appelé ensemble d’apprentissage ) de deux manières différentes : – soit par une démarche supervisée qui consiste à construire explicitement avec l’aide d’un ou de plusieurs experts l’application ξ de T dans R, – soit par une démarche non supervisée, qui consiste à déterminer implicitement la fonction ξ en essayant de partitionner, d’une manière adéquate, l’ensemble T en des sous-ensembles appelés classes et à affecter à chaque classe ainsi obtenue une ( ou plusieurs ) forme(s) dans Ω, – la phase de classement (ou de reconnaissance) : lors de cette phase il s’agit de généraliser cette construction à l’ensemble R des représentations tout entier. Pour caractériser d’une manière prétopologique le modèle proposé, l’espace des représentations R est supposé muni d’une structure prétopologique adR et ψ est continue de O vers Ω. La fonction d’interprétation ξ étant parfaitement connue sur l’ensemble d’apprentissage T, les parties Ti = ξ|T -1(ωi) sont deux à deux disjointes et forment une partition de T. La généralisation de l’application ξ à R tout entier se fait grâce à l’hypothèse supplémentaire suivante : H5 les ensembles Ri = adR(Ti) forment une partition de R car elle est nécessaire et suffisante pour donner un sens au principe de généralisation de ξ suivant : ∀ ωi ∈ Ω , ξ-1(ωi) = Ri ce qui signifie que pour tout élément x de R non encore reconnu, d’après l’hypothèse H5, il existe un Ti tel que x ∈ adR(Ti) et ξ(x) = ωi .

LES LIMITES DU MODELE ENSEMBLISTE

Ce modèle est particulièrement adapté à des processus de reconnaissance de formes « guidés par les données », et formalise des situations de décision déterministes. Il correspond à l’approche classique de la classification automatique. Dans ce cadre, les processus aboutissent à l’établissement d’une connaissance catégorielle unidimensionnelle de type « juxtaposition » de classes disjointes. Ceci ne permet qu’une approche réduite des liens entre objets et formes, via une interprétation unique, et n’offre pas la possibilité d’explicitation des liens entre les formes. Ces constations sont des conséquences des deux hypothèses H1 et H2. En effet, la première hypothèse assujettit le modèle à ne prendre en compte qu’une classification partitionnée sans recouvrement possible. La seconde hypothèse renforce ce résultat en interdisant toute relation entre formes. Une autre conséquence directe de ces deux hypothèses est l’interprétation de la notion de continuité du processus d’identification. La seule interprétation possible de deux objets très proches ne pouvaient être qu’une étiquette commune. De plus, le fait de considérer les formes comme de simples éléments d’un ensemble quelconque, au sens mathématique, c’est à dire sans structure empêche toute notion de structure interne pour la forme. Tous ces résultats sont toutefois en oppositions avec certaines démarches utilisées en Reconnaissance des Formes résumées dans les sous paragraphes suivants.

L’ensemble des formes est structuré

L’un des principes centraux de la classification artificielle est que les formes manipulées (ou les classes) bien qu’apparaissent diversifiées en nature partagent la propriété d’être intrinsèquement catégorisables. Alors, une préoccupation cruciale des chercheurs en Reconnaissance des Formes est de « bien » représenter l’ensemble de ces formes. On est alors confronté au problème de trouver un juste équilibre entre la réduction de la variabilité intraclasse et l’accentuation de la variabilité inter-classes. Ce qui nous intéresse ici est le fait de pouvoir calculer la variabilité inter-classes qui fait référence à une structuration de l’ensemble des formes. Nous trouvons aussi dans les méthodes de classement proprement dites l’idée de structure de l’espace des formes. Ainsi, dans les méthodes de classification hiérarchiques cette idée est clairement relatée à travers le calcul de proximité entre classes à un niveau donné en vue de les fusionner pour passer au niveau supérieur [Faure-90].De même, ce concept est présent dans les méthodes utilisant des distances entre nuages de points telles que la méthodes des nuées dynamique de Diday [Diday-79]. Dans cette démarche on procède à la comparaison entre classes obtenues lors d’une première phase de coalescence pour améliorer la classification. D’autre part, dans les méthodes structurelles utilisant les systèmes à base de connaissances ou les frames, les formes sont structurées entre elles grâce à des relations et des propriétés telles que, par exemple, les propriétés d’héritage [Haton-88].

La structure d’une forme

Dans l’approche statistique de la reconnaissance la représentation d’une forme se résume, en général, à un vecteur dans un espace structuré de dimension n. Cette représentation occulte certains aspects structurés de la forme, en particulier, tout ce qui est position relative interne de certains composants de la forme vis-à-vis des autres composants. C’est à la fin des années 60 nous avons assisté à l’avènement des méthodes syntaxiques et structurelles qui proposent une représentation structurée de la forme. Une première utilisation d’une telle représentation de la forme a été celle faite par M. PAVEL pour l’élaboration de son modèle de Reconnaissance des Formes en 1969 [Pavel-69]. De même, dans le modèle de G. PERENNOU nous trouvons proposer une représentation d’une forme composée de formes simples ou partielles, ce qui reflète aussi l’idée d’une structuration interne de la forme. Rappelons aussi que dans le traitement des formes complexes telles que les scènes ou les documents, la considération de la structuration interne de la forme s’impose d’une manière naturelle.

La dualité : processus ascendant – processus descendant

L’avènement des démarches syntaxiques et structurelles en reconnaissance a en quelque sorte changé les mentalités des chercheurs dans la conception des représentations des exemplaires et des formes et aussi des processus. Avec les formes structurées les processus de la reconnaissance tiennent automatiquement compte des connaissances structurelles et contextuelles des formes. Ce sont des connaissances qui ne proviennent pas nécessairement des données acquises, mais qui sont liées à la structure des formes apprises (segment de droite, forme circulaire, …). On réalise ainsi une sorte de couplage entre l’aspect percept matérialisé par les données et l’aspect concept représenté par la forme, c’est la notion de dualité entre les processus guidés par les données et les processus guidées par les formes. Cette importance donnée aux processus descendants pour ainsi avantager en quelque sorte la connaissance humaine est plus évidente dans les systèmes de Reconnaissance des Formes entièrement dédiés à une seule tâche, par exemple, la lecture automatique des codes postaux des lettres. Ici le contexte de la reconnaissance est limité à l’ensemble des chiffres. Dans ce genre de système tous les mots reconnus sont automatiquement corrigés grâce à un dictionnaire spécifique. C’est un processus de reconnaissance de type descendant. Ici aussi la reconnaissance s’effectue grâce à la dualité processus ascendant – processus descendant.

Télécharger le document complet