Les types de segmentation

Approximation d’une forme volumique par un ensemble optimal de formes primitives par morceaux boules, cylindre, cônes

Le sol, peut être vu comme l’union de deux parties : La partie solide, constituée de différents matériaux (roche, argile, etc.) et la partie vide (espace poral) par où peuvent s’écouler des fluides. Une connaissance précise de la structure 3D de la partie vide devrait permettre une meilleure compréhension des phénomènes d’écoulement, voire même une prévision des propriétés hydriques de ces matériaux. Les progrès récents dans le domaine d’acquisition d’image rendent de plus en plus abordable l’obtention d’images volumiques de sol, notamment grâce à la tomographie à rayon X. Mon travail consiste à développer un programme qui, à partir d’un fichier de boules maximales dont les centres représentent la squelette d’un espace poral, visualise la forme volumique, regroupe les boules en sous ensembles simplement connexes et dont les centres sont alignés et en fin améliore la modélisation de départ par la substitution de ces regroupements de boules par des cylindres et cônes pour mieux représenter les propriétés géométriques de l’espace porale en question. Ce travail s’inscrit dans le cadre de la vision par ordinateur et concerne plus précisément la reconstruction volumique.

Vision par ordinateur

La vision naturelle est un phénomène merveilleux et complexe, elle a suscité l’intérêt de nombreux scientifiques et philosophes depuis déjà très longtemps. Son étude concerne un vaste ensemble de disciplines indépendantes (optique, physiologie, neurologie, psychologie, … etc.). Lorsque l’on demande à une personne de décrire les objets qui l’entoure elle n’éprouve aucune difficulté : table, chaise, stylo…etc., pourtant l’information disponible à la rétine (dans l’image) n’est qu’une collection de point (environ un million) ni plus ni moins. En chaque point ou pixel (picture element) il y’a tout simplement une information qui donne une indication quant à la quantité de lumière et la couleur qui proviennent de l’espace environnant et qui ont été projetées à cet endroit de la rétine. Guidé à la fois par l’information codée dans l’image (ou la rétine) et par ses propres connaissances le processus visuel construit des percepts. La reconnaissance des objets vus est le résultat final d’un processus d’interprétation qui fait partie intégrante du system de vision. Avec la naissance de machines de calcul de plus en plus sophistiquées un certain nombre de scientifiques se sont attaquées au problème de la vision d’un point de vue quantitatif : est-il possible de construire un modèle computationnel pour la perception visuelle ? Attention il ne s’agit pas de fournir une explication de comment marche la vision biologique mais de créer un modèle qui vu de l’extérieur possède des propriétés semblables. ORDINATEUR » un domaine actif de recherche depuis 40 ans environ, elle se réfère aux algorithmes variés pour restaurer ou interpréter les images numériques. Voici comment la vision par ordinateur peut s’énoncer brièvement. « La vision est un processus de traitement de l’information. Elle utilise des stratégies bien définies afin d’atteindre ses buts. L’entrée d’un système de vision est constituée par une séquence d’images. Le système lui-même apporte un certain nombre de connaissances qui interviennent à tous les niveaux. La sortie est une description de l’entrée en termes d’objets et de relations entre ces objets. »

Les types de segmentation

La recherche des contours dans une image numérique est un des problèmes les plus étudiés depuis l’origine des travaux sur l’imagerie numérique. Ceci est en grande partie dû à la nature très intuitive du contour qui apparaît très naturellement comme l’indice visuel idéal dans la plus grande partie des situations. Très schématiquement, les contours sont les lieux de variations significatives de l’information niveaux de gris (il n’est pas question ici des travaux sur les contours dans les images couleurs ou multispectrales). Dans cette approche, on suppose que l’image est une mosaïque de régions parfaitement homogènes. C’est à dire que les contours recherchés sont de type créneaux. De plus, la transition étant stricte, un contour doit être une chaîne de pixels d’épaisseur 1. Cette restriction sur la nature du contour a été imposée dans un premier temps pour des raisons de formalisation mathématique. Il est possible de construire des processus capables d’extraire d’autres types de contours comme par exemple des vallées ou des toits. Cependant, il n’existe pas à l’heure actuelle de processus complet et général qui pourrait extraire tous les types de contour. La notion de contour étant reliée à celle de variation, il est évident qu’une telle définition nous amène tout naturellement vers une évaluation de la variation en chaque pixel. Une variation existera si le gradient est localement maximum ou si la dérivée seconde (à définir dans un espace bi-dimensionnel) présente un passage par zéro. Les principaux algorithmes connus (Sobel, Prewitt, Kirsh, Canny, Dériche, …) se focalisent sur ce premier aspect du contour. Il existe moins de travaux sur la formalisation de la deuxième partie consistant à passer d’une mesure locale de variations à des chaines de points d’épaisseur 1. C’est pourtant cette deuxième partie qui fait souvent la différence et la qualité visuelle d’un résultat. Nous allons d’abord présenter les méthodes d’extraction de points de contour, par des techniques de filtrage gradient ou laplacien. Puis nous verons quelques techniques de chaînage de ces points (suivi de contour) et de représentation des contours finaux ainsi obtenus Cette approche présente comme principal inconvénient le fait que la direction peut prendre n’importe quelle valeur réelle. Ceci n’est pas en accord avec la nature discrète d’une image. Que représente une frontière orientée à 17° sur une grille ? C’est pourquoi on peut adopter un schéma différent adapté à la nature discrète de l’image. Il s’agit alors de calculer le gradient, non plus dans deux directions, mais dans toutes les directions possibles de l’image : 0°, 45°, 90°, 135°. On peut se contenter de ces 4 directions.

Cours gratuitTélécharger le document complet

Télécharger aussi :

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *