Introduction à la génomique PDF - Université Batna 2
Document Details
Uploaded by Deleted User
Université Batna 2
2023
Dr. LAANANI.I
Tags
Summary
This document provides an introduction to genomics, covering historical aspects, definitions, and key objectives. It details the branches of genomics, including structural and functional genomics, and explains their roles in understanding biological processes. The document includes a table of contents and a historical overview, setting the stage for further study.
Full Transcript
Université Batna 2 Faculté des sciences de la nature et de la vie Département de biologie des organismes Cours de Génomique et protéomique fonctionnelle M2BMC Dr. LAANANI.I 2022-2023 Table des matières 1. Historique :.........................
Université Batna 2 Faculté des sciences de la nature et de la vie Département de biologie des organismes Cours de Génomique et protéomique fonctionnelle M2BMC Dr. LAANANI.I 2022-2023 Table des matières 1. Historique :...................................................................................................................1 2.Définition :.....................................................................................................................1 3.Les principaux buts de la génomique :.........................................................................2 a. L'assemblage de cartes physiques et génétique des génomes :........................................ 2 b. La production et l’assemblage de séquences génomiques et de séquences transcrites:............................................................................................................................ 2 c. L'identification et l'annotation de l'ensemble des gènes du génome :............................. 3 d. La collecte de données fonctionnelles sur les aspects biochimiques et sur l'action phénotypique des gènes :...................................................................................................... 4 e. L'évaluation de la variabilité de la séquence d'ADN au sein d'une même espèce :........ 4 f. La mise en place d’une banque de donnée intégrée disponible sur le Web avec une interface de recherche sur les données :....................................................................... 4 Génomique et protéomique fonctionnelle Introduction à la génomique M2BMC 1. Historique : Un bref regard en arrière souligne la vitesse avec laquelle notre connaissance des génomes s’est développée, ce qui peut laisser penser que les progrès futurs seront tout aussi spectaculaires. 1953 : Watson et Crick découvrent la structure en double hélice de l’ADN 1973 : Date approximative des premières opérations de génie génétique en laboratoire 1977 : F Sanger met au point le séquençage de l’ADN 1984 : Séquençage du premier génome, le virus Epstein-Barr 1990 : Lancement officiel du programme international du séquençage du génome humain 1995 : Séquençage du premier génome procaryote, la bactérie Haemophilus influenzae 1996 : Séquençage du premier génome eucaryote, la levure Saccharomyces cerevisiae 1997 : Séquençage du génome de la bactérie Escherichia coli 1998 : Séquençage du génome du nématode Caenorhabditis elegans 2000 : Séquençage des génomes de la drosophile, de la souris et de la plante Arabidopsis 2001 : Premières données sur le séquençage complet du génome humain 2003 : Séquençage du génome humain est achevé 2.Définition : La génomique est la science qui a pour objet l’étude des génomes. Elle vise à comprendre comment ils se sont formés, se sont maintenus, et quelles sont leurs fonctions. Elle met en œuvre un ensemble d’approches allant du séquençage proprement dit à l’identification des éléments qui les constituent (gènes, motifs,…) et à l’analyse de leur expression (ARN, protéines,..). La génomique se divise en deux branches : La génomique structurale analyse la structure des gènes et autres parties du génome (localisation des gènes, nombre d’exons, d’introns, polymorphismes, …). La génomique fonctionnelle analyse la fonction des gènes et autres parties du génome. Elle s’intéresse à la fonction et à l'expression des gènes sous formes de transcrits (transcriptomique) et de protéines (protéomique). La transcriptomique est l'étude de l'ensemble des ARN messagers transcrits à partir d'un génome. La protéomique permet d'analyser des ensembles de protéines : leur rôle, leur structure, leur localisation, et leurs interactions. Le protéome est l'ensemble des protéines traduites à partir de ce génome. La métabolomique concerne les produits issus des réactions métaboliques induites par les protéines dans une cellule, un tissu, un organe 1 Génomique et protéomique fonctionnelle Introduction à la génomique M2BMC ou même un organisme. La génomique, la transcriptomique et la protéomique sont des approches complémentaires. Le "matériau" de base de la génomique est l'ensemble des séquences d'acides nucléiques et de séquences polypeptidiques obtenues par différentes méthodes de séquençage. Ces séquences et d'autres types d'informations qui découlent de leur analyse sont stockés dans des bases de données. L'accès aux bases de données s'effectue via le Web et Internet. Enfin, l'analyse de l'ensemble de ces données nécessite des méthodes bioinformatiques. Figure1 : Echelle des approches « omiques » 3.Les principaux buts de la génomique : a. L'assemblage de cartes physiques et génétique des génomes : La position des gènes dans un génome peut être définie soit par une distance physique, soit par une position relative basée sur des fréquences de recombinaison entre ces gènes. Cette information est capitale si l'on veut comparer les génomes d'espèces voisines ou établir le lien entre données phénotypiques et génotypiques. Les cartes génétiques décrivent l'ordre relatif des marqueurs génétiques au sein d'un groupe de liaison. Les marqueurs peuvent être de différentes natures : gènes, microsatellites, SNP, EST, STS, RFLP... Les cartes génétiques sont utilisées en recherche fondamentale mais aussi pour l'amélioration des espèces animales et végétales. b. La production et l’assemblage de séquences génomiques et de séquences transcrites: Initialement (dans les années 80 - 90), la méthode de séquençage développée par Frédéric Sanger a été utilisée puis très largement automatisée tant pour les réactions de séquençage que pour la lecture des séquences. Il y a 2 démarches pour le séquençage de 2 Génomique et protéomique fonctionnelle Introduction à la génomique M2BMC génomes entiers : la méthode ordonnée ou hiérarchique, "top-down" et la méthode en vrac, "shot-gun". Par ailleurs, la plus grande partie d'un génome Eucaryote étant constitué d'ADN non codant, le séquençage porte aussi sur des clones d'ADNc qui contiennent des séquences issues de la transcription inverse d'ARN messagers. Le séquençage d'une des extrémités d'un ADNc suffit en principe pour identifier un clone d'ADNc et l'on appelle ces petits fragments de séquences des marqueurs de séquences exprimées ou EST ("Expressed Sequence Tags"). c. L'identification et l'annotation de l'ensemble des gènes du génome : Après avoir séquencé un génome, il faut identifier les gènes qu'il contient en combinant les résultats expérimentaux et les approches bioinformatiques. Des logiciels bioinformatiques sont nécessaires pour l'étude de la structure des gènes, Par exemple : BLAST (Basic Local Alignement Search Tool) qui permet d'aligner la séquence du génome avec les séquences d'ADNc ou rechercher des similarités entre ce génome et d'autres génomes déjà connus et annotés. ORF Finder (ORF: Open Reading Frame, Cadre de lecture ouvert), c’est un logiciel de rechercher de gènes qui reconnaissent les caractéristiques dans l’ADN que l’on sait liées à la présence d’un gène. Une fois un gène identifié, il faut l'annoter, c'est- à-dire le relier aux maximum de données biologiques (par exemple données de génétique concernant sa fonction, son expression et les variations phénotypiques des mutants pour la protéine codée,...). Après avoir localisé les gènes, il s'agit de prédire leur fonction. Certains gènes avaient déjà été isolés expérimentalement avant le séquençage du génome, mais ceci concerne une minorité des gènes. Pour la majorité des gènes, on essaie donc de prédire la fonction, en se basant sur la similarité entre la séquence du gène nouvellement séquencé et des gènes déjà connus. Pour cela, on compare la séquence inconnue à une base de données de séquences connues. Des bases de données regroupent l'ensemble des données biologiques informatives quant à la structure et la fonction des gènes et elles permettent leur annotation : GenBank Gene Ontology Annotation (GOA) Database Rice Genome Annotation Project Vertebrate Genome Annotation (VEGA) database Ensembl Genome browser Bien sûr, l'ensemble de ces données sont intégrées dans les grandes bases de données biologiques mondiales qui sont : 3 Génomique et protéomique fonctionnelle Introduction à la génomique M2BMC NCBI (National Center for Biotechnology Information) EMBL - EBI (European Molecular Biology Library-European Bioinformatics Institute). UniProt d. La collecte de données fonctionnelles sur les aspects biochimiques et sur l'action phénotypique des gènes : La génomique fonctionnelle inclut des approches qui permettent de vérifier les propriétés biochimiques et les rôles cellulaires du produit de chaque gène. Parmi les différentes approches possibles la génétique inverse. La protéomique, qui occupe une place centrale dans la génomique fonctionnelle, comporte un ensemble de méthode pour détecter l’expression des protéines et les interactions entre protéines. e. L'évaluation de la variabilité de la séquence d'ADN au sein d'une même espèce : Les génomes sont polymorphes, c'est-à-dire que 2 ou plusieurs variants de séquences différentes peuvent co-exister au sein d'une population naturelle. Le polymorphisme d'un seul nucléotide ou SNP ("Single nucléotide polymorphism") ou le polymorphisme d'insertion ou de délétion de nucléotides ont une part essentielle dans la variabilité génétique. Connaître la répartition des SNP est donc capital pour établir les associations entre ces variations SNP et les variations phénotypiques. f. La mise en place d’une banque de donnée intégrée disponible sur le Web avec une interface de recherche sur les données : Les interfaces Web sont en constante évolution pour faciliter l’accès aux énormes quantités de données générées par la recherche sur le génome. En plus d’être un lieu de stockage de séquences, la plupart des sites actuels comportent de nombreux logiciels innovants pour la recherche sur les données et une analyse en ligne. 4