Maintien de la diversité génétique du chromosome Y et du génome mitochondrial

Génotypage

Le génotypage sur les puces à ADN peut se révéler difficile pour les variants rares ou sans possibilité d’hétérozygotie. A Labogena, les signaux d’hybridation des marqueurs sont captés par un scanner et analysés par le logiciel Genome Studio. Les résultats de chaque marqueur sont ensuite interprétés selon leurs regroupements ou « cluster ». Dans une situation classique, les trois génotypes A1A1, A1A2 et A2A2 sont répartis sur trois nuages de points distincts (cf. figure 33). Figure 33 : Interprétation des génotypes par le logiciel Genome Studio (Michot, P. 2017) 143 (expression des signaux d’hybridation en coordonnées polaires)
Les points localisés en dehors des clusters formés automatiquement sont catégorisés comme génotypages indéterminés ou manquants. Lorsque les nuages de points ne sont pas suffisamment distincts, il est impossible d’interpréter les résultats de l’ensemble des génotypages à ce marqueur.
Dans sa thèse réalisée au sein de notre équipe, Pauline Michot (2017) avait placé 785 marqueurs de variants rares sur la puce EuroG10k. Parmi ces marqueurs, 239 marqueurs ont été éliminés à cause de leur manque de fiabilité : 59 marqueurs pour lesquels les clusters n’ont pas pu être définis et 180 marqueurs avec un call rate8 inférieur à 95%. Le taux de chute des variants rares est donc relativement élevé.
La bonne définition des clusters est importante pour pouvoir définir au mieux le génotype. Dans le cas de nos études sur le chromosome X, nous avons étudié des variants à fréquence rare, pour lesquels une éventuelle mauvaise définition des clusters pourrait artificiellement créer des hétérozygotes. Concernant les marqueurs du chromosome Y et du génome mitochondrial dont le génotype devrait systématiquement être homozygote, une fréquence relativement faible d’hétérozygotes a été parfois observé. Par exemple en race Montbéliarde, sur les 563 marqueurs mitochondriaux placés sur la puce EuroGMD, 210 présentent des hétérozygotes avec cependant une fréquence très faible (en moyenne 0,000322 avec un écart-type de 0,0017). Afin d’améliorer le génotypage de ces individus atypiques, nous pourrions retravailler avec Labogena sur la définition des clusters et mettre en place, par exemple, une séparation entre mâles et femelles pour les marqueurs du chromosome X afin de déterminer plus précisément le génotype des mâles.

Séquençage

Au cours de cette thèse, nous avons utilisé deux méthodes différentes pour séquencer le génome mitochondrial. Dans le cadre des 384 génomes mitochondriaux séquencés dans l’étude 1 du chapitre 2, nous avons amplifié l’ADNmt en trois fois, avec des PCR long-range et un séquençage NGS a été effectué par nos collaborateurs de Munich. Pour des raisons logistiques, le séquençage des échantillons non-T a été réalisé par amplification de 11 segments (chacun réalisé deux fois) suivi d’un séquençage Sanger. De par le nombre de segments amplifiés, cette seconde méthode augmente considérablement le temps passé à produire une seule séquence complète d’ADNmt. Après l’amplification, il faut encore contrôler la qualité des séquences produites, réaliser les alignements pour fusionner ensuite les séquences partielles et recréer la séquence du génome mitochondrial. En multipliant le nombre d’amplifications, on augmente également le risque d’erreurs de pipetage et d’interversion d’échantillons. Cette seconde méthode nécessite aussi une quantité d’ADN plus élevée.
Le génotypage dans le cadre de la sélection génomique représente pour nous une base d’ADN très précieuse qui nous permet de récupérer les échantillons biologiques grâce à Labogena. Cela représente des gains de temps et d’énergie importants en évitant de demander des prélèvements sanguins ou biopsies à des dizaines de techniciens différents dans les élevages et de réaliser l’extraction nous-mêmes. Cependant, cela limite aussi la quantité d’ADN que nous pouvons récupérer par ce biais puisque nous récupérons le reste d’ADN après génotypage. Cette limite s’est fait particulièrement ressentir avec l’approche de séquençage Sanger.
L’amplification de certains couples échantillon – amorce n’a pas pu aboutir malgré plusieurs essais et tentatives d’amélioration de notre protocole d’amplification, nous contraignant à demander des nombre de génotypages déterminés / nombre total de génotypages, exprimé en pourcentage échantillons d’ADN supplémentaires pour compléter le panel d’individus. Ce phénomène a été encore plus marqué lors du séquençage mitochondrial des animaux porteurs d’haplotypes non-T en 22 amplifications différentes. La qualité et la quantité d’ADN que nous avions à disposition ne nous a pas permis d’amplifier l’ensemble des fragments pour tous les individus, ce qui explique pourquoi les analyses ont porté sur 13 065 bp au lieu de l’intégralité des séquences mitochondriales (16 338 bp).

Pedigree

L’exactitude des informations de pedigree et la prise en compte de l’apparentement entre les animaux sont importantes pour assurer la précision des évaluations génétiques. Dans les évaluations génétiques basées sur le BLUP, une matrice de parenté est construite sur la base des informations généalogiques enregistrées. Cependant, les erreurs de pedigree sont courantes, avec des taux d’erreurs significatifs (Banos et al., 2001). Au Royaume-Uni, le taux global d’erreurs de pedigree a été estimé à 10% et Visscher et al. (2002) ont estimé que cela entraînerait une perte de réponse à la sélection de 2 à 3 %. Banos et al. (2001) ont montré qu’avec 11 % d’erreurs de pedigree, il y avait une réduction de 11 à 18 % de la moyenne des index (calculé sur la quantité de lait, matières grasses et protéiques).
Même si la perspective d’une généalogie faussée peut être un sujet d’inquiétude concernant la justesse des liens de parentés dans les évaluations génétiques, il faut noter que les erreurs de pedigrees que nous avons identifiées sont relativement anciennes. Or, plus les erreurs de pedigree sont anciennes, moins elles ont d’impact sur les évaluations des animaux récents. En évaluation génétique, les parentés les plus proches ont un effet prépondérant, limitant l’impact des erreurs anciennes de pedigree, puisque la covariance entre apparentés (pour les autosomes) est divisée par deux à chaque génération. Ce risque est donc négligeable dans le contexte des évaluations génétiques partir de cinq générations (1/2n ~0,03), et ce d’autant plus que les races sont consanguines (principalement les races laitières) et que l’ancêtre réel et l’ancêtre affiché sont forcément apparentés de près ou de loin. Le problème de la justesse des généalogies anciennes est davantage un frein pour l’étude des transmissions uniparentales, telles que conduites dans cette thèse.
Pour améliorer la précision du pedigree, des méthodes de vérification de la parenté ont été mises en place. Jusqu’à récemment, les marqueurs microsatellites constituaient l’approche standard de la
vérification de la filiation. Avec l’introduction des polymorphismes à nucléotide unique (SNP) et de la sélection génomique, les méthodes de filiation basées sur les SNP deviennent désormais l’approche standard. La norme internationale a tout d‘abord été d’utiliser l’ensemble de SNP proposés par l’ISAG (ISAG100 ou ISAG200) ; cependant, McClure et al. (2015) ont suggéré qu’un panel avec un minimum de 500 SNP est plus approprié pour la vérification et surtout la prédiction (ou assignation) de la filiation mais le gain est relativement réduit. Lorsque le test génétique n’est réalisé que pour le contrôle de filiation, le panel de 200 marqueurs est généralement techniquement suffisant et constitue un bon rapport qualité-prix en conditions bovines (Barbotte et al., 2012)(Barbotte et al., 2012)(Barbotte et al., 2012)(Barbotte et al., 2012)(Barbotte et al., 2012)(Barbotte et al., 2012)(Barbotte et al., 2012)(Barbotte et al., 2012)(Barbotte et al., 2012)(Barbotte et al., 2012)(Barbotte et al., 2012)(Barbotte et al., 2012)(Barbotte et al., 2012). Ces données sont aussi facilement échangeables entre pays. Si le test génétique est réalisé à des fins de sélection génomique, alors le nombre de marqueurs disponibles est important et on peut en utiliser plus que 200 sans surcoût. En France, les tests officiels des vérifications de parenté se basent sur le panel officiel ISAG200 mais la chaine d’évaluation génomique en considère 500. Les SNP complémentaires ont été choisis parmi les marqueurs déjà présents sur la plupart des puces Illumina selon leur répartition sur les 29 autosomes bovins et leur informativité (communication personnelle, Sébastien Fritz).
Jusqu’à la mise en place de la sélection génomique à la fin des années 2000, la vérification de la parenté concernait uniquement les individus appartenant à des schémas de sélection ou inscrits à des livres généalogiques. Depuis lors, cette vérification est faite en routine pour tous les animaux génotypés dont les parents sont génotypés, ce qui est le cas pour la quasi-totalité des pères et augmente progressivement pour les mères. Grâce aux nombreux marqueurs mitochondriaux placés sur la puce EuroGMD, nous avons pu retracer les erreurs de pedigree. Nous avons également discuté la possibilité d’erreurs de pedigree en nous basant sur l’étude de variants du chromosome Y en race Holstein. L’étude des voies de transmission uni-parentale n’est pas exhaustive mais permettrait de corriger des erreurs relativement anciennes. D’un point de vue pragmatique, nous ne pourrions pas corriger officiellement les pedigrees. Le risque de déclassification d’animaux ou de contentieux avec les éleveurs est trop élevé. Cependant cette correction nous permettrait d’améliorer la fiabilité des pedigrees dans le cadre des études menées sur les voies de transmission uniparentale.

Perspectives et suites

Effets sur les caractères de production

A court-terme, notre objectif est de combiner dans un même article l’étude de la diversité génétique des séquences mitochondriales produites au cours de cette thèse et de nouvelles études d’association après l’accumulation de nouveaux génotypages. Nous ne sommes pas la seule équipe à étudier l’impact du génome mitochondrial sur les caractères de production. En effet, Le projet MitoTAUROmics » (2014-2018) financé par l’université de Zagreb en Croatie à des objectifs similaires aux nôtres : analyser la diversité du génome mitochondrial chez les bovins modernes et étudier son impact fonctionnel sur les caractères de production bovins (Curik et al., 2017). Le projet est fini depuis 2018 mais aucune étude d’association n’a encore été publiée à ce jour sur ce thème chez le bovin d’après une recherche bibliographique dans la base de données « Entrez pubmed » (https://www.ncbi.nlm.nih.gov/pubmed, dernier accès le 06/04/2020). De plus, la mise en évidence d’un taux non négligeable d’erreurs de filiations sur la voie maternelle remettrait en cause un certain nombre d’études antérieures portant sur l’étude de l’effet de lignées maternelles (à partir d’informations de pedigree) sur des caractères phénotypiques. Cet article serait donc particulièrement intéressant et novateur pour la communauté scientifique de la génétique animale. Concernant l’étude du chromosome X, j’ai réalisé de premières études d’association sur des caractères de production laitière et de fertilité femelle (résultats non présentés) qui nécessitent d’être poursuivies en collaboration avec mes collègues de l’équipe G2B en charge des détections de QTL. Une première étape consistera à vérifier la qualité des imputations réalisées des génotypes du chromosome X, qui ont été mises en place très récemment suite au changement d’assemblage du génome bovin de référence (cf. partie 4.1). Il serait intéressant de réaliser une étude à la fois sur la fertilité femelle et mâle car des QTL liés à ces deux caractères ont été identifiés sur le chromosome X chez le bovin (Fortes et al., 2013).
Nous avons démontré la faible diversité des LP, avec une fixation de l’un ou l’autre des haplogroupe Y1 et Y2 dans la majorité des races et une forte dérive liée à l’utilisation d’un nombre limité de pères taureaux génération après génération. Ce manque de variabilité du chromosome Y au sein de chaque race limite grandement son intérêt en sélection. Il serait intéressant de suivre la transmission de la lignée paternel.

Formation et coursTélécharger le document complet

Télécharger aussi :

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *