Sélection des parasites porteurs de mutations associées à la résistance aux antipaludiques recommandés par l’OMS

Sélection des parasites porteurs de mutations associées à la résistance aux antipaludiques recommandés par l’OMS

Le séquençage à haut débit 

 Histoire du séquençage 

Le séquençage d’ADN consiste en la détermination de la séquence nucléotidique d’une portion ou de la totalité de l’ADN présent dans chaque cellule d’un organisme donné. De très nombreux génomes, dont celui de l’être humain, ont été déjà séquencés, et beaucoup d’autres sont en cours de séquençage. Plusieurs laboratoires (publics et privés), participent (parfois de façon concurrente) à cet énorme effort qui révolutionne aussi bien la biologie fondamentale que les biotechnologies. Et pourtant, l’histoire et les fondements du séquençage de l’ADN sont relativement récents au regard de l’histoire de l’humanité en général et de celle du paludisme en particulier. Allan Maxam, Walter Gilbert (USA) et Frederick Sanger (Royaume-Uni), furent les pionniers de la conquête de la séquence. Tout en mettant au point deux méthodes très différentes, ils sont parvenus à accéder à la lecture de la séquence. Maxam et Gilbert exploitèrent des stratégies de dégradation chimique sélective alors que Sanger choisit une stratégie de synthèse enzymatique sélective80. Ces découvertes valurent à Gilbert et Sanger d’être récompensés en 1980 par le prix Nobel de chimie. Cependant, l’histoire ne retiendra que Sanger, puisque sa stratégie a bénéficié de l’invention de la PCR (invention de Kary Mullis publiée en 1986, lui aussi nobélisé par le prix de chimie en 1993) et du développement de l’électrophorèse capillaire, permettant de simplifier la partie séparative et analytique. Le séquençage du génome est en général d’autant plus difficile que le génome étudié est grand et riche en séquences répétées. Ce qui nécessite des technologies beaucoup plus avancées. Aussi, à partir de 2005, on assiste à l’arrivée de nouvelles méthodes de séquençage à haut débit. Ces méthodes de séquençage font appel aux techniques de clonage et d’amplification moléculaire ; leur spécificité relevant de leur stratégie de lecture. Une certaine frénésie s’est emparée du monde de la biologie moléculaire en 2007, avec la disponibilité d’un très grand nombre de machines de séquençage que l’on qualifie tour à tour de NGS 29 (Next Generation Sequencing), HTS (High Throughput Sequencing), ou encore de manière plus appropriée séquençage multi-parallélisé, et qui évoluent vers le plus de profondeur de lecture, et/ou vers le moindre coût, rendant obsolètes les versions précédentes.

Séquençage de première, deuxième et troisième génération 

Entre 1977 et aujourd’hui, la technologie du séquençage a connu de très grandes avancées. Et, il semble nécessaire de hiérarchiser ces nouvelles technologies. Cependant, dans la suite de notre manuscrit, nous ne nous attarderons que sur les méthodes que nous avons utilisées durant cette thèse (méthode de Sanger et Illumina).

 Séquençage de première génération Le séquençage de première génération prend en compte le séquençage par la méthode de Maxam et Gilbert et celle de Sanger. La première n’a plus guère qu’un intérêt historique, tandis que la méthode de Sanger a été automatisée et a largement contribué au séquençage du génome humain en 2001. 

La méthode de Maxam et Gilbert 

Dans cette méthode, l’ADN marqué par une radioactivité terminale est clivé chimiquement au niveau de la guanine (G), de la guanine + adénine (G+A), de la cytosine (C) et de la cytosine + thymine (C+T), produisant des fragments radioactifs de longueur égale à la position de clivage à partir de l’extrémité marquée. La concentration des produits chimiques utilisés est contrôlée de sorte à introduire approximativement une modification par molécule, lesquelles sont séparées par un gel d’électrophorèse. Les fragments d’ADN marqués produits à partir des quatre réactions sont séparés par électrophorèse sur des gels d’acrylamide à haute résolution. La séquence est déduite à partir des bandes sombres indiquant la position des nucléotides marqués83 . Cette méthode a été largement acceptée comme méthode de séquençage, en raison de sa capacité à séquencer directement l’ADN purifié. Sa capacité de séquençage était d’environ 500 paires de base (pb). Cependant, elle avait pour inconvénients la complexité de la méthode, l’utilisation de produits chimiques 30 dangereux, la génération de fragments courts (que nous appellerons reads) et la difficulté à différencier les bandes sur gel. 

La méthode de Sanger Frederick 

Sanger, a mis au point la méthode de séquençage de l’ADN en 1977 en se basant sur des inhibiteurs de l’ADN polymérase au niveau de résidus spécifiques84. Cette méthode, encore appelée la méthode des didésoxy, a gagné en popularité entre les années 1980 et 2000, car elle nécessitait moins de produits chimiques et des niveaux de radioactivité plus faibles85. Cette méthode de séquençage utilise de l’ADN simple brin, une amorce d’ADN, de l’ADN polymérase 1, des désoxynucléosides triphosphates (dNTPs ; dATPs, dTTPs, dCTPs et dGTPs), et des di-déoxynucléosides triphosphates (ddNTPs ; ddATPs, ddTTPs, ddCTPs et ddGTPs). Dans cette méthode, quatre réactions de séquençage différentes sont mises en place pour détecter les quatre nucléotides A, T, C et G. Pour chaque réaction, on utilise de l’ADN (5′ -> 3′), de l’ADN polymérase, des dNTPs et un seul des ddNTPs est ajouté. L’ADN polymérase incorpore les dNTPs complémentaires au brin d’ADN cible et s’arrête lorsqu’elle rencontre un ddNTP, car aucun groupe hydroxyle libre n’est disponible pour réagir avec l’ADN polymérase. Par conséquent, des fragments avec des tailles différentes et la même amorce à l’extrémité 5′ sont produits pour chacune des quatre réactions. Les fragments provenant des quatre réactions sont séparés par électrophorèse sur gel et les bandes sombres sur le gel indiquent la position du nucléotide dans la séquence. Cette méthode fournit des résultats très précis pour les fragments courts uniquement et peut produire des lectures de séquence de 600 nucléotides en moyenne. Les principaux inconvénients de cette méthode sont la liaison non spécifique des amorces et la faible longueur de lecture. Pour pallier à cette limite, c’est-à-dire pour effectuer le séquençage de séquences d’ADN plus longues, une extension de cette méthode connue sous le nom de méthode de séquençage shotgun a été développée

Séquençage de deuxième génération 

A partir de 2005, le parc technologique des séquenceurs s’est diversifié avec l’émergence des séquenceurs de seconde génération. L’arrivée des méthodes de séquençage de cette nouvelle génération a révolutionné le monde de la recherche. Trois technologies de séquençage dominent actuellement le 31 marché et se démarquent les unes des autres par les chimies qui les constituent. Cependant, toutes se décomposent en quatre grandes étapes principales : 1ère étape : la préparation des librairies qui contient une étape d’amplification par PCR ; 2ème étape : les cycles de réactions de séquençage ; 3ème étape : la prise d’image après chacun de ces cycles pour déterminer le nucléotide correspondant ; et enfin, 4 ème étape : Analyse des données. L’avantage de ces nouvelles générations de machines se trouve dans leur capacité à analyser de grands génomes à haute résolution grâce à la parallélisation des réactions. Les trois grands leaders du séquençage sont : 454/Roche, Solexa/Illumina, SOLiD. Seule, la plateforme Illumina sera décrite car elle a été celle utilisée pour les travaux de séquençage menés au cours de la présente thèse. 

 Solexa/Illumina 

La technologie illumina repose sur une amplification en pont (bridge PCR) des fragments à séquencer. Cette amplification se fait sur une surface de verre appelée flow cell (FC), similaire à une lame de microscope et divisée en huit lignes. Des adaptateurs sont insérés à l’extrémité des fragments de la librairie à séquencer. Ceux-ci vont permettre la fixation aléatoire des fragments sur la FC en s’hybridant sur les amorces qui en couvrent la surface. Un nouveau brin est alors synthétisé par une polymérase: il est fixé de façon covalente à la FC. Le brin d’origine est alors éliminé par dénaturation et l’extrémité libre du brin restant s’hybride à une amorce adjacente pour former un pont. La polymérase synthétise à nouveau le brin complémentaire pour former un pont d’ADN double brin puis les deux copies sont libérées par dénaturation. Le cycle d’amplification en pont recommence pour former à terme un regroupement d’ADN clonal en une zone appelée cluster. Les brins anti-sens sont ensuite clivés : c’est la linéarisation. L’extrémité 3′ libre des fragments d’ADN est bloquée et l’amorce de séquençage s’y hybride. Le séquençage s’effectue sur des centaines de millions de clusters simultanément, grâce à une chimie de terminateurs réversibles ; c’est à dire que des nucléotides bloqués marqués par fluorescence sont ajoutés, et quand l’un d’entre eux est incorporé, la fluorescence émise est relevée. Puis le fluorophore et le 32 bloqueur sont clivés permettant l’ajout d’un nouveau nucléotide. A chaque cycle d’incorporation, une base peut être déterminée82,87,88 . Cette chimie a pour avantage de séquencer correctement les homopolymères. Elle a cependant pour inconvénient de lire peu de bases (36 à ses débuts, jusqu’à 150 bases aujourd’hui), ce qui la rend toutefois appropriée à l’analyse de génomes dont on a une bonne annotation. L’amplification par PCR est la principale source d’erreurs. Des efforts ont été faits pour améliorer les résultats en modulant les techniques de préparation des bibliothèques89 . Pour le séquençage du génome de P. falciparum, de meilleurs résultats ont été obtenus avec des conditions de PCR sélectives (polymérase spécifique et enzymes améliorées) dans la préparation des librairies Illumina générant des résultats non biaisés et une plus grande couverture des régions riches en AT89. Des efforts continus sont déployés pour éliminer les erreurs et optimiser le processus de séquençage pour faciliter la détection précise des polymorphismes nucléotidiques ou single nucleotide polymorphism (SNP). 

Séquençage de troisième génération 

Les techniques de séquençage NGS de 2ème génération, bien qu’offrant des débits de lecture largement plus élevés que celles de première génération, ont toutes en commun d’avoir des reads relativement courts (moins de 1 kb). Or le génome comprend beaucoup d’éléments complexes comme les régions fortement répétées et les variations de structure (VS), dont la taille est supérieure à la longueur de ces reads. Les reads d’une région répétée sont difficiles à aligner correctement aussi bien sur le génome de référence que sur la reconstruction de novo si leur taille ne permet pas un empiétement sur une région adjacente aidant à les localiser. La détection de variations de structure (VS) de grande taille est délicate avec des reads courts qui ne chevauchent pas forcément ce réarrangement génétique90 . De plus, les régions riches en bases G et C sont difficiles à amplifier par PCR du fait de la formation possible de structures secondaires. Avec le séquençage de 2ème génération, une amplification clonale par PCR est nécessaire avant l’étape de séquençage afin d’augmenter le signal détecté ; le séquençage de ces régions n’est donc pas optimum. La phase d’amplification clonale par PCR dans le séquençage de 2ème génération est aussi source de biais si une erreur est amplifiée lors de la PCR. Afin de pallier ces limites, il est rapidement apparu qu’il était nécessaire de développer d’autres méthodes de séquençage de l’ADN ; d’où la mise sur le marché des séquenceurs de 3ème génération. Ces 33 séquenceurs sont capables de générer de très longs reads sans avoir besoin de cloner les fragments pour amplifier le signal. C’est pour cette raison qu’on les appelle aussi « Single molecule sequencing ». Les deux leaders de cette troisième génération des séquenceurs sont :  Pacific Biosciences (PacBio), commercialisée en 2011, a pour principe le séquençage de molécules uniques, avec observation en temps réel de l’incorporation de nucléotides fluorescents (Single Molecule Real Time™ (SMRT) sequencing).  Oxford Nanopore Technologies (MinION™), mis sur le marché en 2014, il a pour principe le séquençage par nanopore. Cette technologie consiste à séquencer sans préamplification une molécule d’ADN en hydrolysant les nucléotides élémentaires, qui passeront dans des pores. Ces pores seront couplés à des capteurs saisissant la signature singulière de chaque base constitutive de la molécule à séquencer.

Table des matières

Résumé
Abstract
Remerciements
Liste des abréviations
Liste des figures
Liste des tableaux
Introduction
Partie I – Revue Bibliographique sur le paludisme et le séquençage à haut-débit .
1.1. Généralités sur le paludisme
1. Historique, espèces pathogènes et distribution géographique
1.1.1.1. Historique
1.1.1.2. Espèces pathogènes
1.1.1.3. Distribution géographique
1.1.2. Cycle de vie de P. falciparum
1.1.3. Physiopathologie du paludisme à P. falciparum
1.1.3.1. La protéine VAR2CSA
1.1.. Stratégie de lutte contre le paludisme
1.1..1. Paludisme et Prévention
1.1..1.1. Lutte antivectorielle
1.1..2. Paludisme: Diagnostic et prise en charge
1.1..2.1. Diagnostic
1.1..2.2. Prise en charge et traitement
1.1..3. Menaces biologiques liées à la prise en charge du paludisme
1.1..3.1. Délétion des gènes pfhrp2/3 du parasite
1.1..3.2. Résistance aux antipaludiques
1.1..3.3. Caractérisation de la résistance à l’artémisinine et la découverte d’un déterminant
moléculaire de la résistance aux dérivés d’artémisinine : le gène pfk
1.1… Vaccins antipaludiques
1.2. Le séquençage à haut débit
1.2.2. Séquençage de première, deuxième et troisième génération
1.2.2.1. Séquençage de première génération
1.2.2.1.1. La méthode de Maxam et Gilbert
1.2.2.1.2. La méthode de Sanger
1.2.2.2. Séquençage de deuxième génération
1.2.2.2.1. Solexa/Illumina
1.2.2.3. Séquençage de troisième génération
1.2.3. Intérêt et coût du séquençage
1.2.. Séquençage en pratique et Changement d’échelle pour les analyses en laboratoire
1.2..1. Séquençage en pratique
1.2..1.1. Construction des librairies
1.2..1.2. Séquençage des librairies
1.2..1.3. Traitement informatique des données brutes
1.2..1.. Profondeur et couverture, les deux paramètres clés du NGS
1.2..1.. Interprétation biologique des données
1.2..2. Séquençage et Génome de P. falciparum .
1.2..3. Ressources génomiques de Plasmodium
1.2..3.1. PlasmoDB
1.2… Changement d’échelle pour les analyses en laboratoire : Identification des moléculaires
associés à la résistance à quelques antipaludiques
1.2… Taux de mutation des gènes d’intérêt
1.2…1. Concept de la sélection par pression médicamenteuse .
Partie II-Relation, contexte et objectif de la thèse
Partie III-Paludisme dans la zone Afrique de l’Ouest : Cas du Ghana et du Bénin
Organisation de la thèse en alternance
Chapitre 1-Paludisme au Ghana: Cas pratique du projet MAHEVA
3.1.1. Justification du choix du Ghana
3.1.1.1. Paludisme au Ghana
3.1.1.1.1. Système sanitaire du Ghana
3.1.1.1.2. Prise en charge du paludisme au Ghana
3.1.1.2. Cas pratique du projet MAHEVA
3.1.1.2.1. Description du Projet MAHEVA
3.1.1.2.2. Echantillonnage
3.1.1.2.3. Génotypage des isolats ghanéens
3.1.1.3. Résultats
3.1.1.. Difficultés rencontrées
Chapitre 2- Paludisme au Bénin: Cas pratique du projet BIOCER
3.2.1.1. Paludisme au Bénin
3.2.1.1.1. Système sanitaire du Bénin
3.2.1.1.2. Prise en charge du paludisme au Bénin
3.2.2.2. Cas pratique du projet BIOCER
3.2.1.2.1. Description du Projet
3.2.1.2.2. Déroulement de l’étude
3.2.2.3. Résultats
Partie IV: Discussion générale et conclusion
Références bibliographiques

projet fin d'etudeTélécharger le document complet

Télécharger aussi :

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *