Caractérisation de la forme d’un ob jet inconnu et exploration par vision active

Caractérisation de la forme d’un ob jet inconnu et exploration par vision active

Dans cette thèse, nous nous plaçons dans le cadre d’une approche multi-vues. La littérature trai- tant de la reconstruction 3D d’objets et de scènes à partir d’informations visuelles est très fournie. Des résultats remarquables ont été obtenus dans le domaine de la reconstruction 3D volumique de scènes statiques ou dynamiques. Par exemple, en détectant la silhouette d’un objet placé sur un fond uniforme (Visual hull ), par exemple [Franco 06], ou en supposant la scène Lambertienne et en recons- truisant l’objet sous la forme d’un volume discret dont les éléments sont creusés ou conservés selon leur photo-consistance [Steven 97, Kutulakos 99]. Même si des tentatives ont été faites pour proposer des versions temps-réel de ces méthodes, par exemple, en proposant des approches pyramidales pour les reconstructions voxellique [Prock 98] ou une parallélisation des calculs pour les méthodes basées silhouette, les méthodes de reconstruction volumique sont assez lourdes à manipuler et gourmandes en temps de calcul. En ce sens, ces méthodes sont bien adaptées pour des applications où les calculs peuvent être faits hors ligne. Le niveau de détail obtenu avec une résolution voxellique importante permet d’envisager la création de personnages pour les jeux vidéos ou encore la reconstruction 3D de sculptures pour sauvegarder une trace du patrimoine conservé dans les musées. Il est cependant légitime de se demander si une reconstruction 3D aussi précise de l’objet est nécessaire à sa saisie, surtout lorsque l’outil de préhension est une pince simple à deux doigts.

Pour saisir un objet générique à partir d’informations calculées en ligne, une première straté-gie de saisie consiste à utiliser une reconstruction précise de l’objet et calculer ensuite les meilleurs points de saisie physique [Saut 07, Michel 06]. Une autre voie d’étude tente de mimer les prises qu’au- raient adopté un humain, par exemple, en repérant sur l’objet l’emplacement de poignées, manches et anses [Edsinger 06, ElKhoury 07]. D’autres approches consistent à approximer la forme de l’objet par un ensemble de primitives géométriques et à calculer les orientations de saisie possibles sur cette forme simpliée [Huebner 08a, Speth 08]. La motivation de cette thèse est de proposer une méthode de saisie reposant sur le calcul de primitives simples. L’idée sous-jacente est qu’il n’est pas nécessaire de recourir à des méthodes de reconstruction 3D nes pour parvenir à la saisie de la plupart des objets. De la modélisation de l’objet retenue pour la saisie dépend la méthode d’acquisition des données : pour obtenir une reconstruction exhaustive d’un objet, le système de perception doit être étalonné et considéré comme peu bruité. À l’inverse, si seule la forme générale de l’objet est recherchée, quelques erreurs d’étalonnage peuvent être tolérées. Dans le cadre de l’utilisation d’un système de vision, la stratégie de saisie a également un impact sur le choix des primitives à extraire dans les images : pointsproblème du positionnement optimal des caméras. En eet, si les positions sont bien choisies, alors les caractéristiques de l’objet sont calculées sans ambiguïtés. À l’inverse, il est possible que les informations calculées soient erronées. En particulier lorsque deux vues sont proches, l’information sur la dimension en profondeur de l’objet est évidemment mal dénie. Dans ce cas, l’idéal est d’ajouter une autre vue perpendiculaire aux premières pour ajouter un maximum d’information sur les caractéristiques de l’objet.

Dans le premier chapitre de cette partie, la stratégie globale de saisie choisie dans le cadre de notre application sera présentée. Il s’agit d’approximer la forme des objets par des fonctions quadratiques. Le second chapitre rappelle les propriétés de base de ces fonctions paramétriques et le troisième chapitre présente une méthode de reconstruction d’une quadrique à partir de ses projections dans un ensemble de vues. Nous montrerons aussi que le choix des vues inuence la reconstruction. En conséquence, le chapitre suivante présentera une méthode de vision active permettant de sélectionner les meilleures vues selon un critère relatif à l’information qu’elles contiennent. Finalement des résultats de reconstructions avec un choix des vues par vision active seront présentés. Enn, au plus bas niveau, le dernièr chapitre présente une méthode permettant d’extraire les contours des objets dans des images réelles et les résultats de reconstruction obtenus pour des objets réels.

Cours gratuitTélécharger le document complet

Télécharger aussi :

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *