Médecine génomique personnalisée SSV3U15 2024 PDF
Document Details
Uploaded by Deleted User
Aix-Marseille Université
Jacques van Helden
Tags
Summary
This document provides an introduction to personalized genomics, including the concept of studying human genomes and genetic diseases. It discusses bioinformatics, and introduces the techniques used in personalized medicine, highlighting the potential implications.
Full Transcript
Chapitre 6. Médecine génomique personnalisée Introduction à la bioinformatique (SSV3U15, L2 SV AMU) Jacques van Helden Aix-Marseille Université orcid.org/0000-0002-8799-8584 Plan du cours Maladies génétiques Du gène au génome humain aux génomes individuels Découverte des gènes d’i...
Chapitre 6. Médecine génomique personnalisée Introduction à la bioinformatique (SSV3U15, L2 SV AMU) Jacques van Helden Aix-Marseille Université orcid.org/0000-0002-8799-8584 Plan du cours Maladies génétiques Du gène au génome humain aux génomes individuels Découverte des gènes d’intérêt pour la santé Vers une médecine prédictive Utilité clinique Enjeux économiques, éthiques et juridiques 2 Projet 1000 génomes Projet 2008-2015 Séquençage génomique + génotypage par biopuces En fin de projet, 2500 individus Échantillonnage visant à couvrir tous les continents Nombre total de variations détectées 88 millions de SNPs 3,6 millions de délétions/insertions courtes 60.000 variants structurels Variations inter-individuelles moyennes ~3 millions de différences entre 2 individus pris au hasard → 1 différence / 1000 bp ~4 millions de différences entre un individu et le génome moyen (calculé en retenant pour chaque variation l’allèle majoritaire) Répartition géographique des variations La majorité des variants se retrouvent sur tous les continents (gris foncé), ou dans plusieurs (gris clair) Certains variants sont spécifiques d’un continent (couleur claire) ou d’une population (couleur foncée) Le nombre de variations par individu est beaucoup plus élevé en Afrique que dans les autres continents. Ceci reflète l’histoire des migrations durant la préhistoire The 1000 Genomes Project Consortium et al. A global reference for human genetic 3 variation. Nature 526, 68–74 (2015). https://doi.org/10.1038/nature15393 Grands projets de génomique des populations (à des fins de médecine génomique) Stark, Z. et al. Integrating Genomics into Healthcare: A Global Responsibility. Am J Hum Genet 104, 13–20 (2019). https://doi.org/10.1016/j.ajhg.2018.11.014 4 The Genome Aggregation Database (gnomAD) Short variants Total SNVs: 786,500,648 Total InDels: 122,583,462 Variant type* counts ○ Synonymous: 9,643,254 ○ Missense: 16,412,219 ○ Nonsense: 726,924 ○ Frameshift: 1,186,588 ○ Canonical splice site: 542,514 *This is only a subset of commonly asked for variant types from the dataset. Structural variants 1,199,117 genome SVs ○ 627,947 Deletions ○ 258,882 Duplications ○ 711 CNVs ○ 296,184 Insertions ○ 2,185 Inversions ○ 13,116 Complex ○ 92 Canonical reciprocal translocations 66,903 rare (95 contiennent une mutation ponctuelle (substitution d’un seul acide aminé). Une substitution particulière d’un acide glutamique en valine au 6ème résidu de l’hémoglobine beta provoque l’anémie falciforme (également appelée drépanocytose). Mécanisme moléculaire : cette mutation modifie complètement la structure de la protéine, en favorisant sa polymérisation, qui entraîne la formation de fibres. Ces fibres déforment les globules rouges en leur donnant une forme de faucille (d’où provient le nom de la maladie). La mutation a peu d’effet à l’état hétérozygote, mais provoque de gros problèmes sanguins à l’état homozygote. Les globules rouges déformés gênent la circulation sanguine en bloquant les vaisseaux capillaires. Cet exemple montre l’impact potentiel d’une simple Les hétérozygote AS ont une sensibilité réduite mutation ponctuelle sur la structure d’une protéine, et les au paludisme (malaria), ce qui explique la conséquences fonctionnelles. correspondance frappante entre zones endémiques pour le paludisme (gauche) et la drépanocytose (droite). http://www.ens-lyon.fr/DSM/magistere/projets_biblio/2002/cmichel/hbS.htm 10 Prédisposition au cancer du sein ▪ BRCA1 pour « Breath cancer 1 », gène associé au cancer http://www.rcsb.org/pdb/explore/jmol.do?structureId=1JM7 du sein n°1, précoce. ▪ Fonction de la protéine: réparation des dommages à l’ADN, régulation transcriptionnelle. ▪ Forte association entre certaines mutations et le cancer du sein. 11 La détection de prédisposition aux maladies En caractérisant votre génome, on peut prédire vos prédisposition à développer une maladie. Exemple Alpha-1-antitrypsine ❑ Une mutation dans le gène codant pour l’alpha-1-antitrypsine suscite l’emphysème (AAT) pulmonaire Une mutation ponctuelle provoque ❑ La mutation est déjà présente chez l’embryon, mais la maladie peut se déclarer chez la propension à développer l’adulte, ou même ne jamais se déclarer l’emphysème pulmonaire http://www.rcsb.org/pdb/explore. ❑ Dans les populations européennes, 1 personne sur 20 est hétérozygote; 1 personne sur do?structureId=3CWM 400 est homozygote Conséquences positives du test génétique ❑ Prévention: éviter à tout prix de fumer, car le tabagisme favorise le déclenchement de la maladie. ❑ Suivi: on peut faire des tests réguliers pour détecter les premières phases de la maladie (particulièrement utile dans le cas de cancers). ❑ Curation: (perspectives) de thérapie génique dans un futur plus ou moins proche. Risques liés au test ❑ Protection de la vie privée: ces données doivent-elles être communiquées aux assurances (très demandeuses), qui pourraient vous refuser des assurances-vie ou des garanties hypothécaires ? aux employeurs, qui préfèrent éviter d’embaucher un employé « à risque » ? ❑ Gestion psychologique du risque: vivre sa vie dans l’expectative d’une maladie ? ❑ Eugénisme: élimination des embryons homozygotes (pour éviter la maladie) ? Elimination des embryons hétérozygotes (pour éliminer l’allèle mutant de la population humaine) ? Jusqu’où peut-on pousser cela ? 12 Maladies complexes (polygéniques, multifactorielles) Maladie complexe (multifactorielle): maladie causée par des variants génétiques multiples (polygénique), des interactions entre ces variants, et des interactions entre variants et facteurs de l’environnement (Hunter et al., 2008). Précisions ❑ Polygénique: fait référence à l’intervention de facteurs génétiques multiples. ❑ Facteurs environnementaux: style de vie (nutrition, consommation de tabac, …) ou extérieurs (stress, pollution). ❑ Complexité: on parle de complexité quand l’effet d’une combinaison est différente de la somme des effets. Exemples: maladies cardio-vasculaires, diabète. Héritabilité ❑ Difficile à établir en cas de maladies complexes: Généralement, chaque facteur individuel joue un rôle modeste dans la susceptibilité à présenter les symptômes cliniques (les tests d’association sont donc faiblement significatifs). L’impact du style de vie et de l’environnement complique la caractérisation des risques transmis génétiquement. ❑ Quelques maladies psychiatriques présentent un certain taux d’héritabilité génétique, des études récentes ont permis de détecter des gènes associés à ces maladies. Les mécanismes sous-jacents à la pathologie ne sont néanmoins pas encore élucidés. 13 Études d’association à l'échelle génomique Genome-wide association studies (GWAS) SSV3U15 – Introduction à la bioinformatique (Jacques van Helden) 14 Chapitre 6 - Médecine génomique Etudes d’association de type « cas - contrôle » Principe des études d’association Génotype aa aA AA Total ○ Études cas-contrôles : on caractérise le profil génétique d’un groupe Cas (patients) X1 X2 X3 X patients souffrant d’une maladie donnée (les « cas »), et d’un groupe de personnes saines (les « contrôles »). Contrôle Y1 Y2 Y3 Y ○ On analyse ensuite chaque marqueur, en comparant la fréquence Total T1 T2 T3 T des différents génotypes dans les deux groupes. ○ Ceci permet de délimiter des régions génomiques associées à la maladie. Attention, corrélation n’est pas raison ○ Les études d’associations révèlent uniquement la corrélation entre un trait génotypique et une maladie, mais ne constituent pas un élément suffisant pour établir une relation de causalité L’association peut provenir d’effets de stratification ○ Si la maladie est plus fréquente dans une sous-population donnée, et que cette sous-population est caractérisée par un marqueur, on observera une corrélation fortuite. ○ On risque donc de confondre les traits génétiques associés aux McCarthy et al. Genome-wide association studies for complex traits: patients et ceux de la sous-population. consensus, uncertainty and challenges. Nat Rev Genet (2008) vol. 9 (5) ○ Il existe des méthodes statistiques pour éviter ce piège de la pp. 356-69 stratification. L’axe horizontal représente un fragment de chromosome. Chaque point noir ou gris représente un marqueur génétique (un site polymorphique), et la hauteur du point reflète la significativité de l’association entre ce site chromosomique et un trait phénotypique particulier. Sur cette figure, on observe une forte association entre le trait phénotypique et les Wellcome Trust Case Control Consortium (2007). Genome-wide association study of marqueurs génétiques situés dans dans la région A-B. 14,000 cases of seven common diseases and 3,000 shared controls. Nature 447, 661-78. McCarthy et al. Genome-wide association studies for complex traits: consensus, 15 uncertainty and challenges. Nat Rev Genet (2008) vol. 9 (5) pp. 356-69. Études d’associations à l’échelle du génome complet Une étude a été menée sur 17.000 personnes afin d’identifier les régions génomiques associées à 7 maladies (2.000 patients par maladie) par rapport à un groupe de contrôle (3.000 personnes). La figure synthétise les résultats, en indiquant (en vert) les SNPs associés de façon significative à l’une des maladies. Les zones bleues représentent les chromosomes. Chaque point vert représente un SNP, et sa la hauteur indique la significativité. Wellcome Trust Case Control Consortium (2007). Genome-wide association study of 14,000 cases of seven common diseases and 3,000 shared controls. Nature 447, 661-78. 16 Genetics and cognitive ability Depuis plusieurs décennies, des chercheurs ont tenté de détecter les gènes associés à des capacités cognitives spécifiques, ou générales (« intelligence »). En 2008, l’équipe de Richard Plomin a testé les capacités générales de 7000 enfants en leur faisant passer des tests cognitifs, dont les résultats sont synthétisés au moyen d’un score unique (le facteur « g »). Ils ont sélectionné les 1500 enfants ayant le meilleur score et les 1500 ayant le moins bon score, et caractérisé leur génotype au moyen de biopuces à 500.000 SNPs. Aucun des SNPs n’a montré d’association significative avec le facteur g. Les 47 SNPs les plus significatifs (marqués par des croix vertes) ne passent pas le seuil qu’il faut appliquer quand on teste 500.000 hypothèses simultanées (correction de tests multiples). Butcher et al. (2008), Figure 2: A scatter plot showing the 47 Remarques top-ranked SNPs (crosses) against the background of unselected Le facteur g est un outil rudimentaire pour mesurer l’intelligence. Lire La SNPs com- paring allele frequencies for the low g group (x-axis) and the high g group (y-axis). malmesure de l’homme (S.J. Gould, 1981) pour une critique du facteur “g”. En dépit des résultats négatifs de leur étude, les auteurs sont convaincus qu’une étude plus approfondie (avec plus de SNPs et des cohortes plus grandes) permettrait de prédire les risques génétiques et d’investiguer les effets fonctionnels des gènes sur le cerveau et le comportement. Ils n’envisagent à aucun moment que les capacités cognitives pourraient être indépendantes des gènes. Butcher et al. Genome-wide quantitative trait locus association scan of general cognitive ability using pooled DNA and 500K single nucleotide polymorphism microarrays. Genes Brain Behav (2008) vol. 7 (4) pp. 435-46. 17 Gould, S. J. (1997). La mal-mesure de l'homme. Editions Odile Jacob Méta-analyses Agrégation de données pour 5 troubles psychiatriques. 32.332 cas + 27.888 contrôles. Identification de plusieurs loci (positions génomiques) très significatives, qui étaient faiblement significatives dans chacune des maladies étudiées séparément. Certains gènes étaient préalablement ressortis séparément des études de schizophrénie et trouble bipolaire. Cross-Disorder Group of the Psychiatric Genomics Consortium (2013). Identification of risk loci with shared effects on five major psychiatric disorders: a genome-wide analysis. Lancet. 2013 Apr 20;381(9875):1371-9. Erratum in: Lancet. 2013 Apr 20;381(9875):1360. Cross-Disorder Group of the Psychiatric Genomics Consortium (2013). Identification of risk loci with shared effects on five major psychiatric disorders: a genome-wide analysis. 18 Lancet. 2013 Apr 20;381(9875):1371-9. Erratum in: Lancet. 2013 Apr 20;381(9875):1360. Une étude à très large échelle pour la schizophrénie 2014: une étude génomique d’association basée sur 40.000 cas de Elles ne permettent cependant pas de prédire les risques pour un schizophrénie et 113.000 contrôles révèle 108 loci fortement individu de devenir schizophrène. significatifs. Pourcentage de schizophrénie dans la population générale: 1%. 25 déjà détectés dans des études précédentes, mais à des niveaux Chez les porteurs d’allèles associés à la maladie : 1.7%, ce qui de significativité limite. laisse 98.3% de chances de ne pas être schizophrène si on a le « 83 nouveaux loci mauvais » allèle. Quelques candidats notables NOTCH4. Récepteur transmembranaire impliqué dans des voies de signalisation (communications entre cellules voisines par liaison d'une protéine-signal au récepteur). Schizophrenia Working Group of the Psychiatric Genomics Protéine à doigt de Zinc (ZNF804A), facteur transcriptionnel Consortium (2014) Nature, 511, 421–427. exprimé dans le cortex, hippocampe et cervelet, fonction 36.989 cas + 113.075 contrôles méconnue. 108 loci significatifs CACNA1C, CACNB2, CACNA11: famille de protéines canaux à ions calcium Ces associations permettent ensuite de mener des études moléculaires pour comprendre la fonction de ces gènes et leur éventuelle implication dans la pathologie. Schizophrenia Working Group of the Psychiatric Genomics Consortium (2014) Biological insights from 108 schizophrenia-associated genetic loci. Nature, 511, 421–427. 19 Pouvoir prédictif et utilité clinique de la génomique personnelle SSV3U15 – Introduction à la bioinformatique (Jacques van Helden) 20 Chapitre 6 - Médecine génomique Association et prédictibilité Pour un bon nombre de maladies humaines on a pu détecter un ou des gènes associés (études d'association). A partir du profil génomique d'un individu, peut-on établir son état de santé et agir dessus ? ○ déclenchement effectif de la maladie ? ○ susceptibilité à la maladie ? ○ pronostic ? ○ réponse personnelle à un traitement) ? Validité analytique : validité des résultats techniques (pour la génomique, taux de fiabilité du séquençage) Validité clinique: capacité d'un test à détecter ou prédire la pathologie associée (Hunter et al., 2008). ○ Peut-on utiliser les profils génomiques pour prédire, sur base du génome d'un individu, la probabilité qu'il a de déclencher une maladie ? ○ L'estimation de la validité clinique repose sur une série de paramètre apportant des informations complémentaires: sensibilité, spécificité, valeur prédictive positive (PPV), valeur prédictive négative (NPV). Utilité clinique: équilibre entre les risques et les bénéfices si un test doit être mis en pratique. ○ Par exemple, s'il n'existe aucun traitement, la connaissance d'une prédisposition peut nuire à la qualité de la vie sans apporter de bénéfice évident. Hunter et al. (2008) and Evans et al. (2010) soulignent ○ l’absence actuelle de données à propos de la validité clinique, ○ leur scepticisme concernant l'utilité clinique. Hunter et al. Letting the genome out of the bottle--will we get our wish?. N Engl J Med (2008) vol. 358 (2) pp. 105-7. doi.org/10.1056/NEJMp0708162 Evans et al. The rules remain the same for genomic medicine: the case against "reverse genetic exceptionalism". Genet Med (2010) vol. 12 (6) pp. 342-3. doi.org/10.1097/GIM.0b013e3181deb308 Goddard, K. A. B., Lee, K., Buchanan, A. H., Powell, B. C. & Hunter, J. E. Establishing the Medical Actionability of Genomic Variants. Annu. Rev. Genom. Hum. Genet. 23, 173–192 (2022). 21 doi.org/10.1146/annurev-genom-111021-032401 Validité analytique La validité analytique est elle-même restreinte: ○ Toutes les méthodes (biopuces à SNP, séquençage de génome complet) impliquent un certain taux d'erreurs technologiques. ○ Même si ce taux est faible, des erreurs peuvent occasionnellement affecter les marqueurs utilisés pour prédire un risque, ce qui amène à de fausses prédictions pour l’individu concerné. Hunter et al. Letting the genome out of the bottle--will we get our wish?. N Engl J Med (2008) vol. 358 (2) pp. 105-7. 22 Prévalence et pénétrance Prévalence ○ Proportion des individus d’une population donnée qui présentent un attribut particulier (par exemple une maladie ou un trait génotypique). On peut calculer la prévalence ponctuelle (à un moment donné) ou pendant un intervalle de temps (prévalence d’intervalle) ou tout au long de la vie. ○ Exemples Prévalence du cancer du sein : 1.7% des femmes en vie aux Etats-Unis en 2012 avaient été diagnostiquée d’un cancer du sein à un moment de leur vie. Prévalence de la mutation BRCA1 ~0.1% dans la population américaine ~6% chez les femmes diagnostiquées d’un cancer du sein avant 35 ans Pénétrance ○ Proportion, parmi les individus ayant un type particulier de génotype, de ceux qui exprimeront le phénotype de la maladie associée pendant une période de temps déterminée. ○ Exemple: 65% des femmes porteuses de l’allèle de BRCA1 déclarent un cancer du sein avant l’âge de 70 ans 23 Valeur prédictive Hunter et al. (2008) développent une série de raisons pour rester sceptiques quant à l'utilité immédiate des profils génomiques. Valeur prédictive positive (PPV) : proportion des personnes étant effectivement affectées par la pathologie parmi celles déclarées positives Valeur prédictive négative (NPV) : proportion de personnes qui ne sont effectivement pas affectées par la pathologie parmi celles déclarées négatives La valeur prédictive de marqueurs génétiques individuels peut s'avérer très faible. ○ Pour les maladies polygéniques, les marqueurs individuels peuvent avoir un intérêt réduit. Quelle est l'utilité de prédire un risque de 1.5%? ○ Pour les maladies complexes, les facteurs environnementaux rendent les prédictions encore moins fiables. Hunter et al. Letting the genome out of the bottle--will we get our wish?. N Engl J Med (2008) vol. 358 (2) pp. 105-7. 24 Scores polygéniques de risques Pour les maladies polygéniques et multifactorielles (polygéniques + facteurs d’environnement), les GWAS détectent des centaines de SNPs significatifs, mais la valeur prédictive de chacun est marginale. Une approche pour prédire les risques de maladies polygéniques sur base du génotypage consiste à calculer le score polygénique de risque (Polygenic Risk Score, PRS). d’un individu. Ce score prend en compte une série de SNPs ressortis d’une GWAS, avec une pondération qui tient en compte la significativité statistique de l’association de chaque SNP. Amélioration de la valeur prédictive par rapport à une approche “SNP unique”, mais cette valeur prédictive reste faible. La prise en compte de facteurs additionnels (âge, sexe, environnement familial et social) permet d’améliorer la valeur prédictive. Shendure, J., Findlay, G. M. & Snyder, M. W. Genomic Medicine–Progress, Pitfalls, and Promise. Cell 177, 45–57 (2019). https://doi.org/10.1016/j.cell.2019.02.003 25 Restrictions à la validité clinique Validité clinique: capacité d'un test à détecter ou prédire la pathologie associée (Hunter et al., 2008). ○ L'estimation de la validité clinique repose sur une série de paramètres apportant des informations complémentaires: sensibilité, spécificité, valeur prédictive positive (PPV), valeur prédictive négative (NPV). La validité clinique des études d'association à échelle génomique sera restreinte aux maladies présentant les caractéristiques suivantes. Facteurs causaux agissant indépendamment ou interagissant de façon simple (effets additifs). Prévalence suffisante: ○ Les études requièrent une représentation suffisante de l'allèle mineur pour détecter son effet. Pénétrance suffisante ○ La proportion de personnes présentant les symptômes parmi celles qui portent l'allèle associé au risque. 26 Actionnabilité médicale Capacité à agir sur les risques associés au génotype, une fois qu’on les a détectés Voies envisageables ○ Prévention ○ Traitement médicamenteux ○ Thérapie génique 27 Thérapie génique SSV3U15 – Introduction à la bioinformatique (Jacques van Helden) 28 Chapitre 6 - Médecine génomique Première tentative de thérapie génique La thérapie génique consiste à corriger un problème génétique en insérant dans les cellules une copie fonctionnelle du gène. La première étude clinique de thérapie génique a porté sur des « enfants-bulles ». Cette métaphore désigne des individus qui souffrent d’une déficience innée du système immunitaire, et ne peuvent survivre que dans un milieu complètement aseptisé (une « bulle » isolée du monde des microbes). Cette déficience provient d’une mutation d’un seul gène codant pour l’adénosine déaminase. Au début des années 2000 on a traité une vingtaine d’enfants-bulles en insérant dans le gène fonctionnel dans des cellules-souches hématopoiétique (ces cellules produisent les globules blancs). La méthode d’insertion reposait sur l’utilisation d’un virus. Du point de vue immunitaire, le traitement a donné les résultats escomptés : les enfants traités ont développé une réponse immunitaire. Cependant, une partie d’entre eux ont ensuite développé des leucémies, qui résultaient vraisemblablement de perturbations des gènes de contrôle du cycle cellulaire, liées au point d’insertion du gène dans le génome. Suite à cet échec, les essais cliniques ont été temporairement suspendus de 2002 à 2004. Ils ont ensuite été repris en se basant sur d’autres vecteurs pour transporter l’ADN dans les cellules (par exemple des liposomes). 29 L’édition génomique – CRISPR-Cas9 La technologie CRISPR-Cas9, développée en 2012, permet de modifier la séquence d’un gène in situ, c’est-à-dire dans le génome même. On parle donc d’édition génomique. En principe, elle permet donc non seulement d’apporter une copie fonctionnelle d’un gène pour pallier à une déficience, mais également de corriger des mutations dominantes (par exemple l’anémie falciforme). Cette technologie ouvre donc des perspectives sans précédent pour la thérapie génique. La principale limitation est le ciblage cellulaire et tissulaire : on peut appliquer la technologie à des cellules isolées du corps (par exemple des cellules-souches) mais on ne dispose pas de moyens pour corriger le génome des cellules déjà différenciées qui composent les tissus d’un organisme. 30 Application de thérapie génique La thérapie génique est déjà utilisée pour traiter certaines maladies. Exemples d’applications récentes ○ drépanocytose ○ mucoviscidose ○ dystrophie musculaire Méthodes ○ Vecteur adénovirus ○ Edition génomique via CRISPR-Cas9 Il s’agit toujours de maladies monogéniques. L’application à des maladies multifactorielles semble a priori plus complexe, à la fois parce que les gènes potentiellement impliqués sont nombreux, et parce que la maladie dépend également de facteurs non-génétiques (environnement). Shendure, J., Findlay, G. M. & Snyder, M. W. Genomic Medicine–Progress, Pitfalls, and Promise. Cell 177, 45–57 (2019). https://doi.org/10.1016/j.cell.2019.02.003 31 Thérapie génique sur les lignées germinales En décembre 2018, le chercheur chinois He Jankui annonce à la presse qu’il a utilisé la technologie CRISPR-Cas9 pour modifier le génome de cellules-souches embryonnaires, et leur conférer la résistance au virus HIV (responsable du SIDA). Ceci contrevient à un consensus déontologique selon lequel il est admissible d’effectuer des modifications génétiques sur les cellules somatiques (celles qui composent le corps mais ne participent pas à la transmission héréditaire) mais pas sur les lignées germinales (lignées cellulaires qui donneront des gamètes). ❑ Les cellules souches embryonnaires donnent naissance à l’ensemble des cellules de l’individu, et donc ses cellules germinales et somatiques. L’affaire suscite un fort émoi médiatique et dans la communauté scientifique. 32 Enjeux économiques SSV3U15 – Introduction à la bioinformatique (Jacques van Helden) 33 Chapitre 6 - Médecine génomique Les projets public et privé de séquençage Parallèlement au projet public de séquençage, une firme privée, appelée Celera et dirigée par Craig Venter, a annoncé qu'elle aurait séquencé l'ensemble du génome humain en 2001, soit trois ans avant la fin prévue pour le projet public. ❑ Le but du projet privé de séquençage du génome humain était de séquencer rapidement le plus grand nombre de gènes possible, afin de déposer des brevets sur ces gènes. Il existait une différence de qualité de séquençage entre les deux projets ❑ La firme Celera avait opté pour une stratégie "shotgun", qui produit rapidement un très grand nombre de petits fragments de séquence. Cette méthode rapide fournit un résultat incomplet et de mauvaise qualité (un brouillon). ❑ Le projet public avait opté pour une approche progressive: obtenir une séquence de haute qualité pour le chromosome 22 (le plus petit chromosome du génome humain), afin de pouvoir commencer son interprétation biologique pendant le séquençage des autres chromosomes. 34 Le brevetage des séquences La directive européenne 98/44/CE du 6 juillet 1998 relative à la protection juridique des inventions biotechnologiques fait l'objet de nombreux débats. ❑ http://eur-lex.europa.eu/legal-content/FR/TXT/?uri=CELEX%3A31998L0044 L'article 5 de cette directive contient une contradiction interne ❑ Le corps humain, aux différents stades de sa constitution et de son développement, ainsi que la simple découverte d'un de ses éléments, y compris la séquence ou la séquence partielle d'un gène, ne peuvent constituer des inventions brevetables. ❑ Un élément isolé du corps humain ou autrement produit par un procédé technique, y compris la séquence ou la séquence partielle d'un gène, peut constituer une invention brevetable, même si la structure de cet élément est identique à celle d'un élément naturel. ❑ L'application industrielle d'une séquence ou d'une séquence partielle d'un gène doit être concrètement exposée dans la demande de brevet. 35 La compétition entre projet public et projet privé Un des problèmes du brevetage est que les laboratoires académiques hésitent à entamer un travail de caractérisation d'un gène sur lequel existe un brevet, car ils devront ensuite négocier les applications éventuelles de leurs découvertes avec le possesseur du brevet. Le brevetage d'une partie des gènes constitue donc un frein à la découverte de leur fonction. Chaque gène identifié dans le projet Celera faisait l'objet de demandes de brevets, tandis que ceux du projet public étaient mis en public. Les responsables du projet public de séquençage se sont rapidement rendus compte que la plupart des gènes auraient été brevetés par Celera avant d'avoir été identifiés par la stratégie de séquençage de haute qualité du projet public. Ils ont donc complètement changé de stratégie en cours de projet, et décidé d'obtenir un brouillon le plus rapidement possible, pour revenir dans un deuxième temps au séquençage de qualité. Une étude de 2005 révèle que 20% des gènes humains font l’objet d’un brevet ❑ 63% de ces brevets appartiennent à des firmes privées ❑ 28% à des universités ❑ Source: Jensen & Murray (2005). Intellectual Property Landscape of the Human Genome. Science, 310: 239 - 240. 36 Les brevets sur les gènes BRCA1 et BRCA2 Les gènes BRCA1 et BRCA2 sont associés à certains types de cancer du sein. Séquençage: 1994/1995 1998: la compagnie Myriad dépose un brevet sur l’utilisation de ces gènes comme indicateurs de risques pour le cancer du sein et de l’ovaire. Le test coûtait initialement 1600$ US. En 2009 son prix avait doublé. En 2009, ce brevet représente l’essentiel des revenus annuels (326 M$/an) de la compagnie. Kesselheim and Mello. Gene patenting--is the pendulum swinging back?. N Engl J Med 37 (2010) vol. 362 (20) pp. 1855-8. Les brevets sur les gènes BRCA1 et BRCA2 2010: le brevet de la compagnie Myriad est annulé. Le caractère inventif du test est contesté par le bureau européen des brevets. Le séquençage ne constitue pas une invention, mais une découverte. D’après la cour, les «produits naturels et propriétés naturelles des objets vivants sont légalement distincts d’objets manufacturés en usant d’une ingéniosité substantielle ». La méthode se limite à comparer une séquence de l’échantillon à une séquence de référence, et n’est pas brevetable en soi. Le brevet, portant sur la séquence, empêche d’autres compagnies de développer des tests alternatifs utilisant les mêmes gènes. En 2013, ○ La cour suprême des Etats-Unis confirme l’annulation du brevet pour Myriad. ○ La cour fédérale d’Australie reconnaît la validité du brevet. Octobre 2015: suite à un appel, la cour fédérale d’Australie prend à l’unanmiité la décision inverse : "the high court found that an isolated nucleic acid, coding for a BRCA1 protein, with specific variations from the norm that are indicative of susceptibility to breast cancer and ovarian cancer was not a 'patentable invention.” Kesselheim and Mello. Gene patenting--is the pendulum swinging back?. N Engl J Med 38 (2010) vol. 362 (20) pp. 1855-8. Le service direct au “consommateur” SSV3U15 – Introduction à la bioinformatique (Jacques van Helden) 39 Chapitre 6 - Médecine génomique Profils génomiques : 600.000 SNPs pour une poignée de dollars La compagnie 23andMe vend des profils génomiques constitué de 580.000 marqueurs polymorphiques. Prix: 79 $US (2022). Financement: Google Services offerts ❑ Santé: prédiction des risques de développer des maladies. ❑ Généalogie : tests de parenté, origines géographiques ❑ Réseaux « sociaux » (plutôt génétiques): 23andme propose de créer des communautés d’affinités sur http://www.23andme.com/ base des gènes (« Facebook » génétique). ❑ Recherche: le fait de disposer d’une base de données regroupant les profils de milliers d’individus permet de découvrir les marqueurs génétiques associés à certaines maladies. Ces services posent de grandes questions éthiques et juridiques, qui seront discutés au cours. 40 Génomique personnalisée et médecine Estimation des risques pour des maladies à terrain génétique. Traitements personnalisés. Ceci ouvre énormément de questionnements déontologiques et juridiques Service direct au “consommateur” (direct to consumer service) pour des diagnostics médicaux Interprétation des résultats par les patients Protection des données personnelles 41 Prévention La compagnie met également en avant les perspectives d’utiliser la connaissance du génome pour prévenir les risques (notamment pour les maladies multifactorielles). 42 Choix d’un traitement individualisé 43 Le soutien à la recherche 23andme propose à tous ceux qui le désirent de contribuer à la recherche médicale, en fournissant des données sur leur santé : maladies, conditions générales de santé, traitements médicaux, parcours de soin, … La participation est récompensée par des bonus (accès illimité aux services de génomique personnelle, alertes sur les facteurs de risque trouvés dans son propre génome, information sur les nouvelles découvertes, …) Ces données seront ensuite utilisées pour effectuer des recherches concernant les liens entre données génomiques et santé. Remarques Les bases de données qui apparient les séquences génomiques et les données de santé représentent un marché économique phénoménal. Le statut juridique de ces données a été mis en cause. En particulier, manque de clarté sur ce qui leur adviendrait en cas de rachat de la compagnie, fusion, faillite, … Il existe aussi des risques concrets de piratage des données, avec un incident important en 2023 (voir diapo suivante) 44 Piratage des données de 23andme Octobre 2023: en piratant les mots de passe de ~14.000 d’usagers, des hackers pu obtenir ○ les données complètes de ces 14.000 personnes ○ des informations concernant les profils génomiques, origines ethniques et les liens de parenté concernant 6.9 millions de clients de 23andme (sur un total de 14 millions). La propagation de l’impact (de 14.000 à 6.9 millions) a été possible grâce à l’option “DNA relatives”, qui permet de partager son profil avec toutes les personnes présentant des caractéristiques génétiques similaires pour certaines parties de chromosomes. Suite à cet incident, la compagnie a temporairement inactivé cette option, et ensuite renforcé la la sécurité de l’accès (double identification). https://en.wikipedia.org/wiki/23andMe_data_leak 45 Protection des données à caractère personnel (“privacy protection” en anglais) SSV3U15 – Introduction à la bioinformatique (Jacques van Helden) 46 Chapitre 6 - Médecine génomique Protection des données à caractère personnel Méthodes classiques pour assurer la protection des Contrôle de l’accès aux données pour les chercheurs données à caractère personnel (dé-identification) Demandes motivées à adresser à un comité Pseudonymisation : remplacer les données d’accès aux données (spécifique à chaque identifiantes (nom, prénom, date et lieu de ensemble de données) naissance) par un code non-explicite, en assurant Les autorisation d’accès sont limitées au la confidentialité et la sécurité du “dictionnaire” sous-ensemble de cas et aux champ d’information (fichier qui établit les correspondances entre les nécessaires pour le projet de recherche qui données d’identification et le pseudonyme. motive la demande Anonymisation : suppression de toute Avant d’accéder aux données le chercheur doit information permettant directement ou signer un accord de confidentialité indirectement de ré-identifier la personne à (non-rediffusion des données, destruction de sa l’origine d’un échantillon. copie au terme du projet de recherche) Dégradation des données : ajout de bruit L’analyse doit être menée dans des Agrégation des données : on ne donne pas accès environnements informatiques certifiés pour aux données individuelles mais à des statistiques l’hébergement des données de santé (HDS), (tableaux de comptages, moyennes, écarts-types, hyper-sécurisés et contrôlés …) calculées sur l’ensemble des individus. Note : ces mesures sont inopérantes pour les données génomiques (voir diapo suivante) 47 Les profils génomiques sont intrinsèquement identifiants Une particularité des données génomiques individuelles est que la donnée est intrinsèquement identifiante ○ Police scientifique : un jeu de 30 à 80 marqueurs suffit pour identifier une personne sans ambiguïté ○ Les profils génomiques actuels contiennent des millions de SNPs → même les données dégradées restent identifiantes La séquence génomique est rattachable à des données de santé ○ gènes de susceptibilité, facteurs de risques pour des maladies Le génome d’un individu concerne également les personnes apparentées ○ 50% d’allèles partagés avec enfants, parents, frères et soeurs ○ 100% du chromosome Y partagés via la lignée paternelle ○ 100% du chromosome mitochondrial partagés via la lignée maternelle ○ 1/8 d’allèles partagés avec les grands-parents et cousins Identification indirecte ○ Traçage des origines géographiques ○ Recoupements avec autres informations associées aux données (“métadonnées”) : âge, ville d’origine, statut familial, … 48 U.S. Genetic Information Nondiscrimination Act (GINA) Loi fédérale aux Etats-Unis sur la non-discrimination en matière d'information génétique Protège les citoyens contre la discrimination basée sur l’information génétique, en matière d'assurance maladie et de décisions d'emploi. Les compagnies d'assurance et les plans de santé n’ont pas le droit ○ de consulter les informations génétiques prédictives avant d’établir un contrat d’assurance ○ de demander ou d'exiger que l’assuré ou les membres de sa famille passent un test génétique ○ de restreindre l'adhésion à une assurance sur la base d'informations génétiques ○ de modifier les primes sur la base d'informations génétiques. La GINA interdit également aux employeurs américains (y compris les agences pour l'emploi, les organisations syndicales et les programmes de formation) ○ de discriminer les personnes qu'ils embauchent ou le montant de leur salaire sur la base d'informations génétiques ; ○ de demander ou d'exiger que l’employé ou les les membres de sa famille passent un test génétique ; ○ de divulguer les informations génétiques en leur possession, sauf dans des circonstances spécifiques et spécialement contrôlées. 49 Qui lira notre avenir dans nos gènes ? Enjeux médicaux, sociaux et économiques de la génomique personnelle SSV3U15 – Introduction à la bioinformatique (Jacques van Helden) 50 Chapitre 6 - Médecine génomique Enjeux sociétaux de la génomique personnelle Applications médicales Tests de parenté : établissement des liens de parenté entre ❑ Études d’association à échelle génomique (GWAS): individus (test de paternité, de maternité, liens plus éloignés). identification d’allèles (formes spécifiques d’un gène) ❑ Usage privé (tests de paternité). associés à des maladies, prédisposition à certains types ❑ Usage juridique : preuves de filiation (abandons de cancer, maladie de Huntington,... d’enfants, contestation de paternité). ❑ Diagnostic : détection chez l’individu des causes d’une ❑ Usage étatique : exigence de tests de parenté pour le maladie regroupement familial d’immigrés ❑ Pronostic : évaluation des risques individuels, Identification génétique en criminalistique (empreintes notamment pronostic anténatal (discuter la relation génétiques) avec l’eugénisme) ❑ Identification de criminels à partir de traces ❑ Médecine personnalisée : choix d’un traitement corporelles. médical en tenant compte des spécificités génétiques. ❑ Identification des victimes par comparaison d’ ❑ Thérapie génique : modification (« réparation ») des échantillons de cadavres avec les profils génétiques de gènes responsables d’une maladie. membres de la famille. Applications privées Origines géographiques ❑ Assurances et banques : estimation de risques ❑ Au niveau des individus: retraçage des origines médicaux avant d’établir des contrats d’assurance ou ethniques. des prêts. ❑ Au niveau des populations: hypothèses concernant les ❑ Employeurs : estimation des risques médicaux à migrations de populations humaines.. l’embauche, prévention d’accidents du travail. 51 Points de discussion Demain, le séquençage du génome sera incontournable dans les parcours de soin ❑ Avantages ? ❑ Risques ? Questions ❑ Protection des données ❑ Partage des données ❑ Découvertes incidentes ❑ Consentement éclairé ❑ Eugénisme individuel ou d’Etat ❑ Utilisation à des fins non-médicales ❑ … 52 Compléments d’information (pas vus au cours) SSV3U15 – Introduction à la bioinformatique (Jacques van Helden) 53 Chapitre 6 - Médecine génomique Maladies dominantes Certaines maladies se transmettent au sein des familles selon un mode de transmission dominant (par exemple maladie de Huntington). Dominance: les individus qui héritent d’une copie mutée manifestent le phénotype, indépendamment du génotype de l’autre chromosome. Une transmission génétique est dite ❑ autosomique si elle est liée à un chromosome non-sexuel (chromosomes 1 à 22 chez l’humain, pour lequel tous les individus sont diploïdes) -> la transmission ne dépend pas du genre. ❑ hétérosomique (ou allosomique) si elle est liée à un chromosome sexuel (X ou Y). La transmission dépend alors du genre. Le schéma ci-dessous illustre l’hérédité 54 Une maladie liée à un changement de conformation protéique Un cas plus complexe: le syndrome de Kreusfeld-Jacob est un cas très particulier, car la maladie ne provient pas d’une modification du gène, mais d’un changement dans la conformation (la forme tri-dimensionnelle) de la protéine. Cependant, certains allèles prédisposent au développement d'un syndrome de Kreusfeld-Jacob. Prion: une mauvaise conformation cause le syndrome de Kreusfeld-Jacob http://www.valleyhealth.com/images/image_popup/r7_prion.jpg 55 Exemples de loci associés à des maladies, détectés par des études à échelle génomique Topol et al. The genomics gold rush. JAMA (2007) vol. 298 (2) pp. 218-21 56