Application pour les myopathies et les encéphalopathies épileptiques précoces

Application pour les myopathies et les encéphalopathies épileptiques précoces

Développement du séquençage à haut débit

Pendant les années 1980, les laboratoires de biologie moléculaire utilisaient principalement la technique de séquençage type Sanger.(3) Cette approche de séquençage « gène par gène » pour laquelle le coût et le débit de séquences générées sont des facteurs limitants entrainait très souvent un délai important pour le rendu du diagnostic moléculaire.(3) A partir de 2005, le développement du NGS a modifié complètement les possibilités diagnostiques. Cette technique permet de générer de très importantes quantités de données de séquences (jusqu’à plus d’un million de fois supérieur par expérience, par rapport au séquençage Sanger).(3) Le principe repose sur l’incorporation successive de nucléotides complémentaires à la séquence d’intérêt, dans une expérience comportant des étapes d’amplification clonale en parallèle de millions de molécules. A chaque ajout d’un nucléotide, il y a émission d’un signal, qui est ensuite converti en information de séquence.(3) Actuellement il existe deux techniques majeures de NGS : la première, le séquençage avec incorporation de nucléotides modifiés fluorescents d’Illumina, la seconde, le séquençage par mesure de variation de pH lors de l’incorporation de nucléotide de Thermo Fisher.(5) Les grandes étapes du NGS sont communes à ces deux technologies. La figure 1 décrit les différentes étapes du NGS. La première étape du NGS, commence d’abord par l’extraction d’ADN (Acide Désoxyribonucléique) à partir d’un échantillon de sang qui sera ensuite fragmenté en petits morceaux.(4) Enfin vient l’étape d’amplification clonale des régions d’intérêt si l’étude se porte sur un panel de gènes ou sur l’exome.(4) Il existe différentes méthodes pour enrichir ces régions telles que la capture de séquences avec des sondes spécifiques, et la PCR-multiplex.(4) Figure 1 A l’inverse, le séquençage entier du génome amplifie et détermine la séquence de tout l’ADN y compris les parties non codantes telles que les introns et les régions intergéniques.(4) – 4 – Figure 1 : Étapes générales du séquençage nouvelle génération. 1)L’ADN génomique est extrait des globules blancs du patient et est fragmenté à l’aide de différentes méthodes technologiques. 2) Tous les fragments génomiques sont séquencés lors de séquençage du génome entier, tandis que seuls les fragments sélectionnés sont séquencés dans des approches ciblées, telles que le séquençage de l’exome ou le séquençage de panel de gènes. Cette étape produit un grand nombre de séquences courtes appelées reads. 3) Les reads sont ensuite ordonnés en les alignant sur une séquence génomique de référence. Les différences entre la séquence génomique du patient et la séquence de référence sont identifiées à l’aide de programmes « d’appel de variants » (« variant calling »), générant une liste de positions et de modifications de nucléotides, ou de variants. 4) L’étape d’annotation correspond à la compilation d’informations disponibles concernant chacun des variants identifiés (type de variant, fréquence du variant dans différentes bases de données, analyse prédictive bioinformatique de pathogénénicité, etc.). 5) Etape de corrélation entre les données mutationnelles obtenues et la présentation clinique du patient, afin de déterminer l’implication de variant(s) dans la pathologie que présente le patient. Après cette première étape d’enrichissement, vient l’étape de séquençage.(6) Figure 1 Cette deuxième étape consiste à générer et à détecter l’émission de signaux successifs.(6) Ces signaux sont générés par l’incorporation successive de nucléotides complémentaires des régions d’intérêts qui vont former des fragments que l’on appelle reads.(6) La nature de ces signaux dépend de la technique de séquençage utilisée. Il existe trois approches pour la génération de ces signaux : la photoluminescence, la fluorescence et la variation de pH.(6) Les reads sont ensuite lus. En fonction de la technique de séquençage utilisée, la longueur des reads lus sera d’une dizaine à quelques centaines de bases.(6) On appelle cette étape de lecture le « base calling » (6) La troisième étape consiste à analyser l’ensemble des reads générés par le séquençage en utilisant des outils bioinformatiques. Tout d’abord la qualité des reads est étudiée afin de filtrer les séquences dont la qualité est inférieure à celle du seuil décidé.(6) Après la filtration les reads restants sont alignés par rapport à un génome de référence. C’est l’alignement. Figure 1 Vient ensuite la quatrième étape : l’annotation des variants. Elle compile les informations obtenues sur chaque variant identifié (nom du gène, type de variant, sa localisation (exonique / intronique), sa fréquence dans les bases de données, ses prédictions bioinformatiques prédisant son score de pathogénicité, etc.). Figure 1 L’ensemble de ce recueil d’informations permet ensuite d’appliquer des filtres afin de ne garder que les variants considérés comme délétères ou probablement délétères. (6) La cinquième et dernière étape permet de faire la corrélation entre les données mutationnelles obtenues avec le séquençage et la présentation clinique du patient afin de déterminer l’implication du ou des variants retenus, dans la pathologie du patient.(6) Figure 1 Le développement de ces nouvelles technologies a révolutionné le milieu de la génétique et principalement celui du diagnostic, notamment grâce à une augmentation majeure des capacités de génération de données de séquences, associée à une diminution progressive des coûts.

Implication du séquençage à haut débit dans le diagnostic

Depuis plusieurs années, l’utilisation du NGS en diagnostic est devenue une technique incontournable dans l’exploration des pathologies présentant une hétérogénéité génétique.(6) Cette nouvelle possibilité permet d’explorer en même temps l’ensemble des gènes impliqués dans une pathologie, tout en augmentant le rendement diagnostic de 25 à 50%. Ceci permet ainsi de réduire l’errance diagnostic (pouvant s’étendre de plusieurs mois à plusieurs années) que l’on trouve dans une approche « gène par gène ».(3,6) C’est le cas par exemple, dans les myopathies où il existe une très grande hétérogénéité génétique et clinique.(3) Toutefois, les discussions clinico-biologiques pour la validation d’un variant dans une pathologie sont également importantes, la conclusion n’étant pas toujours évidente à poser malgré l’utilisation des filtres et des bases de données.(3) Pour rechercher ces variants il existe trois approches de séquençage différentes. La première approche est une stratégie intitulée « panel de gènes ». C’est la plus utilisée actuellement en routine diagnostique.(3) Elle consiste à analyser simultanément les séquences d’une dizaine voire d’une centaine de gènes connus pour être impliqués dans une pathologie donnée en ciblant l’analyse sur les régions exoniques et les bornes introniques flanquantes.(3) La deuxième approche est celle du séquençage de « l’exome ». Elle permet d’analyser en même temps toutes les régions codantes et bornes introniques flanquantes de tous les gènes du génome, ce qui équivaux à environ 1% du génome soit environ 20000 gènes. Cette approche se développe de plus en plus.(1,7) La troisième approche est celle du séquençage du génome entier, comprenant les séquences codantes et non codantes.(3) La quantité d’informations générée est 100 fois plus importante que celle obtenue pour « l’exome », soit environ 3 millions de variants.(6) – 7 – L’analyse de génome entier est en pleine expansion au niveau mondial. Trois grandes puissances mondiales (le Royaume-Uni, les Etats-Unis et la Chine) ont mis en place des plans nationaux permettant de créer des partenariats ambitieux avec des industriels tels que Illumina, Amazone ou des industries pharmaceutiques, mais également avec des géants de l’informatique et de la gestion de données massives : les GAFAMS (Google, Apple, Facebook, Amazon, Microsoft et Samsung).(7) Ces partenariats leur permettent de réaliser des dizaines de milliers d’analyses génomiques par an et en font une industrie à forte valeur ajoutée économique, stratégique, scientifique et médicale. (7) En Europe, de nombreux pays commencent à intégrer la médecine génomique dans leur système de santé. C’est le cas du Royaume-Uni avec le plan « 100 000 génomes », l’Allemagne, les Pays-Bas, l’Estonie et la Slovénie.(7) Afin de rester compétitive dans ce domaine la France a mis en place en 2015, le plan « France Médecine Génomique 2025 ». Initié en 2015, ce plan prévoit de placer la France dans les pays les plus engagés dans la médecine personnalisée de précision et d’intégrer la médecine génomique dans le parcours de soins et la prise en charge des pathologies communes avec pour objectif un séquençage de 235 000 génomes par an en 2020.(7) Ce plan est constitué de trois axes. Le premier axe, concerne les maladies rares, son objectif est de diminuer l’errance diagnostique. Le deuxième axe cible la cancérologie, le but est de réduire les coûts thérapeutiques (thérapies ciblées) et l’impact socio-économique du cancer (augmentation de l’espérance de vie). Enfin le troisième axe, s’oriente sur les maladies communautaires avec comme objectif la diminution des coûts qu’elles engendrent et la réduction de leur morbi-mortalité. (7) A l’heure actuelle, deux plates-formes ont été choisies et sont en cours de mise en production de données de séquences : la première SeqOIA de l’Assistance Publique Hôpitaux de Paris, l’Institut Curie et Gustave Roussy et la seconde AURAGEN des Hospices Civils de Lyon, des CHU de Grenoble, Saint-Etienne et Clermont-Ferrand, le Centre Léon Bérard, le Centre Jean Perrin et l’Institut de cancérologie de la Loire.(8) Malgré l’ouverture de ces plates-formes de séquençage à très haut débit, les indications pour y inclure les échantillons de patients restent encore très limitées. Il faut noter également que l’analyse du génome entier génère de très nombreux variants dont l’interprétation est difficile et – 8 – chronophage.(6) De plus les fichiers générés nécessitent des capacités de stockage importantes et sécurisées, du fait de la taille et de la confidentialité des données.

Table des matières

I Introduction
1) Développement du séquençage à haut débit
2) Implication du séquençage à haut débit dans le diagnostic
3) L’importance d’un diagnostic génétique précis
4) Les gènes où le diagnostic change la prise en charge
a) Définitions : gènes actionnables, données primaires et découvertes non sollicitées
b) Listes de gènes actionnables ACMG
c) Classification ClinGen
5) Implication dans deux thématiques : les Encéphalopathies épileptiques néonatales et les
Myopathies
II Scoring des gènes actionnables avec la classification ClinGen pour les Encéphalopathies épileptiques précoces et les Myopathies
1) Matériel et méthode
a) Gènes d’encéphalopathies épileptiques néonatales
b) Gènes de myopathies
c) Classification ClinGen
d) Outils retenus pour l’analyse des résultats
2) Résultats
a) Comparaison de l’actionnabilité clinique des gènes d’encéphalopathies épileptiques néonatales avec les scores obtenus par le ClinGen’s Actionability Working Group pour les gènes AGMG
b) Détail des score d’actionnabilité clinique des 10 gènes d’encéphalopathies épileptiques néonatales
c) Comparaison de l’actionnabilité clinique des gènes de myopathies avec les scores obtenus
par le ClinGen’s Actionability Working Group pour les gènes AGMG
d) Scores d’actionnabilité clinique des 13 catégories de myopathies
e) Comparaison des scores d’actionnabilité clinique de couples « gènepathologie » de myopathies avec le traitement actuel et avec les thérapeutiques futures
f) Cas particulier de la dystrophie musculaire de Duchenne
g) Comparaison globale de l’actionnabilité clinique des gènes d’encéphalopathie épileptique néonatale, des myopathies et des gènes faisant partie de la liste des gènes actionnables publiée par l’ACMG
III Discussion
1) Difficultés rencontrées avec la classification ClinGen
2) Actionnabilité et encéphalopathies épileptiques néonatales
3) Actionnabilité et myopathies
4) Actionnabilité et essais cliniques
5) L’actionnabilité en France et perspectives d’avenir
a) Plan France Médecine Génomique
b) Etude FIND .
c) Actualité du CCNE
d) Lobbying sur cette thématique dans les gènes actionnables
V Conclusion
VI Bibliographie
VII Annexes
1) Annexe 1: Liste de genes PAGEM
2) Annexe 2: Liste de 59 gènes actionnables publiés par l’ACMG