Etude des rares et nouvelles variantes dans le génome des échantillons de Plasmodium falciparum

Etude des rares et nouvelles variantes dans le génome des échantillons de Plasmodium falciparum

Les nouvelles variantes

Variation du nombre de nouvelles variantes par rapport à 1984

En 1984, la chloroquine fut introduite pour traiter les cas de paludisme dans beaucoup de pays du monde et notamment en Afrique sub-saharienne. Cette molécule a permis d’avoir beaucoup de succès dans la lutte contre la malaria. Cependant, le parasite a su développé un mécanisme interne qui lui a donné une capacité à résister contre la chloroquine. C’est le début de l’intensification des recherches pour identifier les mutations responsables de cette résistance. En considérant 1984 comme année de référence, nous avons déterminé l’ensemble des nouvelles variantes comparées à chacune des autres années de collecte. Les résultats obtenus attestent qu’il n’y a pas de nouvelles variantes en 1990 et en 2000 comparé à 1984. Pour les autres années, le nombre de nouveaux SNPs et INDELs compare à 1984 est plus élevé en 2008, 2014 et 2015 (figure 7A). Pour chacune des années comparées à 1984, le pourcentage de nouvelles bSNPs reste presque deux fois plus grand que celui des mSNPs et indels (figure 7B). Pour chaque SNPs ou INDELs, nous avons calculé la fréquence de l’allèle alternatif dans le but de suivre leur évolution au cours du temps. Même s’ils sont moins nombreux que les bSNPs, la fréquence des INDELs et les mSNPs est majoritairement plus élevée (figure 7C, 7D et 7E). Figure 7. Variation de la fréquence des nouvelles variantes au cours du temps. A) pourcentages de nouvelles variantes comparées à 1984. B) variation du pourcentage de nouvelles bSNPs, mSNPs et indels au cours de chacune des années. C), D) et E) heatmap de la fréquence de l’allèle alternatif des nouvelles bSNPs, mSNPs et indels respectivement par rapport à 1984. La fréquence de l’allèle alternatif de certains SNPs et INDELs est supérieure à 0.95 au cours du temps. Dans ce cas on dit que cet allèle s’est fixé dans la population. D’autres variantes ont un allèle alternatif dont la fréquence augmente d’une année à l’autre. Cette augmentation se produit généralement soit à partir de 2001_2007 ou soit en 2011 (pour les mSNPs) ou bien en 2014. Nous avons également identifiés des SNPs et indels dont la fréquence de l’allèle alternatif fluctue au cours des années. D’ailleurs la majorité des variantes que nous avons étudiées font partie de cette dernière catégorie (voir figure s3). D’un autre côté, nous avons aussi noté que certains gènes impliqués dans la résistance ont des SNPs/INDELs dont la fréquence de l’allèle alternatif est supérieure à 0.95 (figure 7A). Concernant les variantes dont la fréquence de l’allèle alternatif augmente au cours du temps, seul le Pfcrt possède des SNPs dont leurs fréquences augmentent. Contrairement aux bSNPs, l’ensemble des 07 gènes d’intérêts ont des INDELs dont la fréquence de l’allèle alternatif augmente au cours des années (figure 8B). Par ailleurs, tous les 07 gènes de la résistance ont des SNPs et indels dont l’allèle alternatif fluctue au cours du temps (7C). Toutefois, le Pfcrt et le Pfmdr1 englobent plus de SNPs et indels dont la fréquence de l’allèle alternatif varie au cours du temps.  Figure 8. Nouvelles variantes et gènes de la résistance. A1-3) pourcentage des variantes avec une fréquence de l’allele alternatif > 0.95 pour chaque gène de la résistance. B1-3) pourcentage des variantes avec une fréquence de l’allèle alternatif augmente au cours du temps pour chaque gène de la résistance. C1-3) pourcentage des variantes avec une fréquence de l’allèle alternatif fluctue au cours du temps pour chacun des 07 gènes de la résistance. III.1.4.2 Les rares et nouvelles variantes comparées à 1984 sur chaque chromosome Parmi les nouvelles variantes comparées à 1984, certains d’entre eux sont aussi des variantes rares. Ainsi, nous avons pu montrer que le nombre de rares et nouvelles variantes par chromosome suit la même évolution au cours des années. Ils augmentent entre 2000 et 2001_2007, puis deviennent constants entre 2001_2007 et 2014 avant d’augmenter à nouveau entre 2014 et 2015 (figure 9). De plus, on observe que le nombre de ces variantes pour chaque année est proportionnel à la longueur du chromosome en question. C’est-à-dire que plus le chromosome est large, plus on a de rares et nouvelles variantes. Force est de noter que ces rares et nouvelles variantes existent uniquement dans les échantillons de Thiès, Brikama, Basse et Vélingara (figure S4). Figure 9. Evolution du nombre de rares et nouvelles variantes par chromosome au cours du temps. Chaque chromosome est représenté par une ligne avec une couleur différente.

Variation du nombre de nouvelles variantes pour chaque paire d’années consécutives

Pour chaque pair d’année consécutive, nous avons identifié les nouvelles variantes qui ont émergé dans le génome du parasite. Ceci permet d’identifier notamment l’année à laquelle certaines mutations ont été découvertes. Les résultats montrent que d’une part, il n’y a pas de nouvelles variantes entre les paires d’années qui suivent : 1984-1990, 2009-2011 et 2014-2015 (figure 10A). D’autre part, on note une forte augmentation des ces nouvelles variantes en 2001_2007 comparé à 2000 et 2014 comparé à 2011. Même si le nombre de nouvelles variantes augmente fortement entre 2011 et 2014, la fréquence de leurs allèles alternatifs est si faible qu’on l’est observé à peine sur les heatmap des fréquences (figure 10B). Ceci n’est pas le cas entre 2000 et 2001_2007 où on observe les fréquences des allèles alternatifs des nouvelles variantes sont les plus élevées. A B C D Figure 10. Nouvelles variantes (SNPs/INDELs) entre chaque paire des années consécutives. A) pourcentage des nouvelles variantes pour chaque pair d’années consécutives. Entre 2008 et 2011, les valeurs sont si faibles qu’elles sont assimilables à 0. B), C) et D) : 2014 variation de la fréquence de l’allèle alternatif des nouvelles bSNPs, mSNPs et indels de chaque paire d’années consécutives.

Étude de la génétique des populations

La génétique de la population est l’étude de la distribution, c’est-à-dire comment est structuré la population du point de vu génétique, des changements de la fréquence des versions d’un gène ou Master Bioinformatique-Biomathématique Année 2018-2019 23 allèle ainsi que les mécanismes déterminant la variabilité génétique (appelée aussi diversité génétique) sous l’influence des facteurs naturels ou artificiel dans une population (Morgan, 2006). 

Structure des populations

Filtrage des données manquantes

Il est connu que la présence de données manquantes peut influencer sur la fiabilité et la qualité des résultats qui peuvent émaner de l’analyse des données correspondantes. C’est pour cette raison qu’il est nécessaire de filtrer les données manquantes le plus que possibles afin de minimiser leur impact. Les variantes, aussi bien que les échantillons doivent être filtrés afin d’éliminer ceux qui présentent un certain taux de données manquantes. Ainsi, nous avons retenu uniquement les locus et échantillons ayant un pourcentage de données manquantes inférieur ou égal à 20% (figure 11). Avant filtrage Apres filtrage A B C D Figure 11. Distribution de la fréquence des données manquantes sur les locus / échantillons. Pourcentage de données manquantes avant filtrage (A et C) et après filtrage (B et D) chez les locus et les échantillons respectivement. A l’issue de ce filtrage, 2 échantillons de Brikama, 5 échantillons de Farafenni et 2 échantillons de Basse ont été retirés des données initiales. Cependant, plus de la moitié (67,15%.) des bSNPs a été supprimée des données (Tableau III).

Table des matières

Introduction
Chapitre i : Synthèse bibliographique
I.1. Paludisme : historique et chimiorésistance
I.2. Description de l’agent pathogène du Plasmodium
I.3. Cycle
I.4. Diagnostics moleculaire du paludisme
I.5. Définition
I.6. Structure des données
Chapitre II : Matériels & Méthodes
II.1. Lieu de collection des échantillon
II.2. Les Rares variantes
III.2.1. Définition
III.2.2. Extraction des rares variantes
III.2.3. Vérification de la qualité de séquençage
III.2.4. Distribution des mSNPs et Indels sur le génome
III.2.5. Proportion des variantes sur les différents gènes
II.3. Les nouvelles variantes
II.3.1 Définition
II.3.2 Les nouvelles variantes : comparées à 1984
II.3.3 Les SNPs/INDELs qui sont en même temps rares et nouvelles au cours de temps comparées à 1984
II.3.4 Les nouvelles variantes : pour chaque paire d’années consécutives.
II.4. Étude de la génétique des populations
II.4.1 Imputation des données manquantes et phasing
II.4.2 Structure des populations
II.4.3 Diversité génétique des populations
Chapitre III : Résultats & discussion
III.1 Résultats
III.1.1 Période d’étude
III.1.2 Les Rares variantes
III.1.3 Les nouvelles variantes
III.1.4 Étude de la génétique des populations
III.2 Discussions
Conclusion et perspective.
RÉFÉRENCE bibliographique
ANNEXE

projet fin d'etudeTélécharger le document complet

Télécharger aussi :

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *