Utilisation du logiciel libre R sur des données de présence

Utilisation du logiciel libre R sur des données de présence

En phytoécologie, on cherche généralement à mettre en évidence des associations entre espèces (notion de communautés végétales) ou bien à faire des groupes écologiques de relevés (notion de typologies de station). De manière intuitive, cela revient à regrouper les espèces et les relevés qui se ressemblent, soit en associant les espèces présentent dans les mêmes relevés, ou bien en regroupant les relevés ayant des profils floristiques similaires. Effectuer ce travail à la main, dés l’instant où l’on dispose d’un nombre important de données, représente un travail long et fastidieux. Le recours à l’outil statistique permet d’automatiser une procédure de tri par agrégations des espèces qui vont ensemble et des relevés qui se ressemblent. En ce sens, l’Analyse Factorielle des Correspondances (AFC) d’un tableau floristique est une méthode semi-automatique permettant de représenter géométriquement, dans un espace à plusieurs dimensions, les « distances écologiques » qui séparent les espèces suivant leurs dispositions dans les relevés ainsi que pour les relevés, suivant la composition de leurs profils floristiques. La difficulté associée à cette méthode d’ordination réside dans la représentation que l’on se fait d’un espace à plusieurs dimensions (autant que d’espèces ou de relevés). Néanmoins, il est possible de simplifier cet espace par projection sur une, deux ou trois dimensions afin de mieux « voir » les distances qui séparent chaque espèce ou chaque relevés. Le jeu consiste à bien choisir la projection la plus pertinente de cet espace à plusieurs dimensions dans un espace réduit à un plan, ou un axe, de façon à résumer au mieux la variabilité, ou inertie du nuage des espèces (resp. des relevés). Par analogie, si l’on veut décrire un chameau à quelqu’un qui n’a jamais vu l’animal, le message le plus explicite sera de dessiner sur le papier une représentation de profil, c’est le plan factoriel qui décrit le mieux l’animal en question. L’objectif de l’AFC appliquée au tableau floristique est identique à celui de vouloir expliquer par le dessin ce que l’on a retenu de l’allure générale du chameau (simplification de notre réalité tridimensionnelle sur une feuille de papier plane). En définitive, l’AFC permet d’analyser un espace multidimensionnel, afin d’y trouver un axe ou bien un plan dit « factoriel » qui maximise simultanément la correspondance entre les espèces et les relevés.

L’AFC a été conçu au départ comme une méthode de statistique descriptive destinée à étudier les relations entre deux variables qualitatives à partir d’un « tableau de contingence ». Cette table de contingence correspond au croisement des différentes modalités qui composent chacune des deux variables qualitatives : à chaque case du tableau est affecté l’effectif des individus présentant les modalités considérées. Par exemple, soit une variable peuplement à trois modalités, et une variable humus à trois modalités. On effectue l’AFC sur la table de contingence suivante : Si en phytoécologie, l’objectif de l’AFC est l’étude de la correspondance entre les espèces, alors il faut attribuer à chaque espèce du tableau floristique un rôle de variable qualitative à deux modalités (présence ou absence) et à chaque relevé le rôle d’individu. Par analogie avec l’AFC classique, cela reviendrait à construire une table de contingence très complexe sur un nombre important de variables bimodales. Pour retombé dans le cas de l’AFC classique, il faudrait que sur l’ensemble des relevés étudiés, le nombre total d’espèces atteigne deux (cas très simple, non rencontré dans la réalité). Dans ce cas très simplifié, on pourrait transformer le tableau floristique en une table de contingence du type :  Pour trois espèces, on peut aussi représenter la table de contingence dans un cube à deux modalités par côté. Au delà de trois, la représentation de la table de contingence est impossible. Néanmoins, lorsque le nombre de variables qualitatives est supérieur à deux, il est possible d’effectuer une AFC non plus sur la table de contingence, mais sur un « tableau disjonctif complet ». Il s’agit d’effectuer ce que l’on appel un codage disjonctif des variables. Reprenons l’exemple de l’AFC classique sur les variables Humus/Peuplement : dans ce cas, chaque variable dispose de trois modalités.

 

Cours gratuitTélécharger le cours complet

Télécharger aussi :

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *