Surface representation by linear forms aimed at a statistical study applied to cerebral imaging

Surface representation by linear forms aimed at a
statistical study applied to cerebral imaging

Motivations pour l’analyse statistique de surfaces

Les surfaces sont les objets idéaux pour modéliser les données tridimensionnelles. Ainsi, en raison du développement croissant des méthodes d’imagerie 3-D, ces objets ont pris une place importante dans la littérature mathématique associée au traitement du signal. Dans cette optique, on a actuellement à traiter, dans de nombreux champs d’application, de grandes quantités de données représentées sous formes de surfaces. Ceci est particulièrement vrai en ce qui concerne le domaine de l’imagerie médicale, où se posent, de fait, des problèmes de nature statistique sur des ensembles de surfaces : définir et déterminer des caractères moyens et/ou des modes de variation, exhiber des régularités, établir des groupes. . .De ces problématiques émerge la première motivation de notre étude : construire un cadre statistique rigoureux adapté à l’analyse de surfaces. Les surfaces sont au cœur du sujet majeur de ce manuscrit ; de ce fait, il est nécessaire de s’accorder de façon précise sur une définition pour cette notion, afin de garantir la cohérence du propos. On prend le parti d’utiliser à ce dessein les sous-variétés différentielles. Définition 1 (Surface). On appelle surface toute variété différentielle de dimension 2 plongée dans R 3 . En d’autres termes, une surface est un sous-ensemble S de R 3 tel que, pour tout x de S, il existe un voisinage W de x dans R 3 , un ouvert U de R 2 et une bijection de classe C 1 reliant U et S ∩ W. En tant que sous-variétés différentielles, les surfaces ne constituent pas un espace vectoriel : on ne dispose pas d’opérateurs de somme interne ni de produit externe ; les calculs de distances, de moyennes, etc. ne font donc a priori pas sens sur ces objets. On ne peut donc pas leur appliquer les méthodes statistiques les plus usuelles, qui reposent en général sur une structure d’espace Euclidien. Il convient alors de développer une méthode innovante, spécifiquement adaptée au cas des surfaces. 

Difficultés liées à l’analyse statistique de surfaces, solutions envisagées

Caractère riemannien des surfaces 

Les outils usuels de l’analyse statistique, tels que les méthodes d’estimation classiques, paramétriques ou non paramétriques, sont conçus pour être opérants sur des espaces vectoriels. En effet, ils nécessitent de pouvoir définir et calculer des sommes, des différences, des produits par les éléments d’un corps de scalaires ou encore des moyennes… Le cadre idéal pour les mettre en oeuvre étant, bien entendu, un espace normé de type euclidien ou hermitien, sur lequel on dispose d’une distance et d’un produit scalaire. Les échantillons de données expérimentales qui peuvent être traités via ces outils sont ceux que l’on peut modéliser par des éléments de tels espaces ; malheureusement, ce n’est pas le cas des surfaces à première vue. Les surfaces, en effet, sont des variétés riemanniennes différentiables bidimensionnelles de R 3 ; elles ne sont éléments d’aucun espace vectoriel et, par conséquent, ne sont pas analysables au moyen de méthodes statistiques usuelles. Ainsi, l’analyse statistique de surfaces nécessite le développement de réponses spécifiques en matière de représentation de données ou d’algorithmes statistiques. Dans la littérature, il existe de nombreux articles liés à notre thématique principale. De ces ressources, il émerge deux grandes catégories de solutions pour pallier notre problème. La première consiste en le développement de méthodes statistiques spécifiquement adaptées aux variétés riemanniennes  . La deuxième repose sur le fait de plonger les surfaces dans un espace euclidien via un procédé de représentation de ces dernières par des éléments d’un espace vectoriel puis de mener une étude indirecte sur les représentants. On opte pour la seconde manière. Pour représenter les surfaces dans un espace vectoriel, on adopte le point de vue initié par J.Glaunès et M.Vaillant en 2005   et prolongé, deux ans plus tard, par S.Durrleman [10, 9] : associer aux surfaces discrétisées des courants sur un espace fonctionnel de type Hilbert. On développe ensuite une approche statistique originale dans ce cadre. Suivant une démarche analogue, étant donné un ensemble de surfaces continument différentiables Θ et un espace de Hilbert V , on représentera une surface S ∈ Θ par une forme linéaire s sur V . Sous des hypothèses raisonnables, S est un élément du dual topologique V ∗ de V . On représente ainsi les surfaces par des éléments d’un espace de Hilbert de dimension infinie. On étendra cette représentation par formes linéaires aux surfaces discrètes, à partir du modèle continu. 

Représentation aléatoire des formes linéaires

 Pour établir un cadre statistique avec un modèle d’observation, il faudra prendre en compte les variations aléatoires des surfaces en les rendant visibles à travers leurs représentants. Ces représentants étant des courants, i.e. des formes linéaires continues sur un espace de Hilbert, il est particulièrement difficile d’en établir une modélisation probabiliste. On surmontera cette difficulté en utilisant des formes linéaires aléatoires, 13 concept défini à partir d’éléments empruntés à la théorie des processus stochastiques généralisés, telle que développée par Itô [20, 21], Fernique [12] et surtout Gel’fand et Vilenkin [15] ou Yaglom [35]. Sur ce cadre aléatoire, il deviendra possible d’attribuer de manière rigoureuse des lois de probabilité aux représentants des surfaces, construire un modèle d’observation décrivant ces derniers, puis appliquer des outils statistiques usuels, afin de construire des estimateurs pour le représentant moyen ainsi que pour les principaux modes de variation d’un échantillon. 

Traitement de la dimension infinie

 Comme il a été mentionné plus haut, on représente les surfaces, lisses ou discrétisées, par des éléments d’un espace de dimension infinie. Les représentants dépendent donc d’une infinité de paramètres. Il est donc nécessaire, pour pouvoir effectuer sur ces derniers des calculs numériques, de mettre en place une procédure d’approximation. Pour ce faire, on utilisera un sous-espace vectoriel de dimension finie de l’espace des représentants et on approximera toute forme linéaire par sa projection orthogonale sur ce sous-espace ; on obtiendra ainsi des représentants approximés dépendant d’un nombre de paramètres fini et fixé. Ce point constitue une autre originalité par rapport aux travaux de Glaunès, dans lesquels les approximations dépendent de la discrétisation des surfaces.

Table des matières

I Cadre consistant pour l’analyse statistique de surfaces représentées par des courants
1 Introduction
1.1 Motivations
1.2 Difficultés liées à l’analyse statistique de surfaces, solutions envisagées
1.2.1 Caractère riemannien des surfaces
1.2.2 Représentation aléatoire des formes linéaires
1.2.3 Traitement de la dimension infinie
1.3 Objectifs
1.3.1 Contributions
1.3.2 Contenus de cette partie
2 État de l’art
2.1 Représentation des surfaces par des courants
2.1.1 Pourquoi utiliser des courants ?
2.1.2 Cadre de représentation de Glaunès et Vaillant
2.1.3 Cadre de représentation de Durrleman
2.1.4 Contributions de notre étude par rapport aux cadres originaux de Glaunès et Durrleman
2.2 Espaces de Hilbert à noyau reproduisant
2.2.1 Théorie des espaces de Hilbert à noyau reproduisant
2.2.2 Exemples de RKHS
2.3 Processus stochastiques généralisés
2.3.1 Fonctionnelles aléatoires, concept de processus généralisé
2.3.2 Moments d’un processus aléatoire généralisé
2.3.3 Processus gaussiens
3 Modèle d’observation : du modèle continu au modèle discret
3.1 Objectifs
3.2 Modèle statistique
3.2.1 Cadre déterministe de représentation des surfaces
3.2.2 Formes linéaires aléatoires
3.2.3 Modèle de variation
3.3 Discrétisation et modèle d’observation
4 Estimation (dans le cadre d’un modèle de bruit blanc)
4.1 Objectifs
4.2 Approximation
4.3 Construction des estimateurs
4.3.1 Estimateurs dans le modèle de variation
4.3.2 Estimateurs dans le modèle d’observation .
4.4 Consistance
4.4.1 Estimateur du représentant moyen
4.4.2 Estimateur de la variance du bruit
5 Estimation (dans le cadre d’un modèle général de bruit gaussien)
5.1 Objectifs
5.2 Formes bilinéaires aléatoires
5.2.1 Définitions
5.2.2 Structure d’espace de Banach
5.3 Construction des estimateurs
5.3.1 Notations
5.3.2 Estimation du représentant moyen
5.3.3 Estimateur de l’opérateur d’autocovariance
5.4 Consistance
6 Expériences de validation
6.1 Objectifs
6.2 Simulation d’échantillons
6.2.1 Surfaces à creux et bosses
6.2.2 Surfaces « Browniennes »
6.3 Espace des représentants
6.3.1 Espace de champs de vecteurs
6.3.2 Espaces d’approximation
6.4 Recherche de la dimension optimale de l’espace d’approximation
6.4.1 Protocole
6.4.2 Résultats
6.5 Convergence numérique de l’estimateur du représentant moyen
6.5.1 Protocole
6.5.2 Résultats
7 Discussion
7.1 Bilan
7.2 Perspectives
7.2.1 Perspectives immédiates
7.2.2 Perspectives ultérieures .
II Application à la classification de surfaces
8 Introduction
8.1 Motivations et difficultés
8.2 Objectifs
8.2.1 Contributions
8.2.2 Contenus de cette partie
9 Structure d’espace métrique sur l’ensemble des surfaces
9.1 Distance sur les surfaces
9.1.1 Choix des ensembles
9.1.2 Injectivité de la fonction Ψ
9.1.3 Extension de la distance aux surfaces discrétisées
9.2 Propriétés de l’espace métrique des surfaces
9.2.1 Question de l’homéomorphisme entre Θ et V
9.2.2 Question du caractère complet de Θ
10 Méthode de classification Bayésienne adaptée aux surfaces
10.1 Principe
10.1.1 Classification : pose du problème
10.1.2 Classification Bayésienne
10.2 Algorithme
10.2.1 Cas général
10.2.2 Cas particulier de l’autocovariance diagonale
11 Application à l’imagerie cérébrale
11.1 Objectifs
11.2 Protocole
11.2.1 Échantillon de surfaces
11.2.2 Choix des paramètres
11.2.3 Procédure de validation croisée
11.3 Résultats
12 Discussion
12.1 Bilan
12.2 Perspectives .
12.2.1 Espace des surfaces
12.2.2 Classification
A Calcul explicite du représentant d’une surface dans une base de Fourier
A.1 Objectifs
A.2 Méthode de calcul
A.3 Résultats
B Élements sur la notion de surface moyenne
B.1 Définitions
B.1.1 Dans un cadre déterministe
B.1.2 Dans un cadre probabiliste, moyenne théorique et moyenne empirique
B.2 Éléments sur l’estimation de la surface moyenne
B.2.1 Objectifs et notations
B.2.2 Estimation par la méthode du plus proche représentant

projet fin d'etude

Télécharger le document complet

Télécharger aussi :

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *