L'expression du patrimoine génétique
Comment une simple molécule d'ADN, invisible à l'œil nu, peut-elle dicter la couleur de vos yeux ou la forme de vos protéines ?
Introduction
Chaque cellule de votre corps contient le même patrimoine génétique, pourtant une cellule de peau et une neurone sont radicalement différentes. Cette spécialisation repose sur l'expression différentielle des gènes. Seuls certains gènes, parmi les milliers présents, sont « lus » et « utilisés » dans une cellule donnée pour fabriquer les protéines dont elle a besoin. Ce processus de lecture et d'utilisation s'appelle l'expression génétique.
Si toutes nos cellules ont le même ADN, pourquoi une cellule musculaire se contracte-t-elle alors qu'une cellule pancréatique sécrète de l'insuline ?
1🧬 Du gène à l'ARN messager : la transcription
L'ADN, support de l'information, reste confiné dans le noyau. La première étape pour l'utiliser est de recopier l'information d'un gène en une molécule intermédiaire capable de sortir du noyau : l'ARN messager (ARNm). Ce processus s'appelle la transcription.
Synthèse d'une molécule d'ARN complémentaire d'une séquence d'ADN (un gène), catalysée par une ARN polymérase.
La transcription se déroule en trois phases :
- Initiation : L'ARN polymérase se fixe sur une région promotrice spécifique en amont du gène et sépare les deux brins d'ADN.
- Élongation : L'enzyme progresse le long du brin matrice d'ADN et assemble des ribonucléotides complémentaires (A avec T, U avec A, G avec C, C avec G). L'ARN naissant se détache au fur et à mesure.
- Terminaison : Lorsque l'ARN polymérase rencontre un signal de fin, elle se détache, libérant le pré-ARNm et l'ADN se réapparie.
L'ARNm est un brin simple et utilise l'uracile (U) à la place de la thymine (T). Il est complémentaire du brin matrice d'ADN et identique (avec U à la place de T) au brin codant.
2🔤 Le code génétique : un langage universel
L'information portée par l'ARNm doit être traduite en une séquence d'acides aminés pour former une protéine. Cette traduction repose sur le code génétique.
Correspondance entre la séquence de nucléotides de l'ARNm (sous forme de triplets appelés codons) et la séquence d'acides aminés d'une protéine. Il est universel, redondant et non chevauchant.
Ses principales caractéristiques sont :
- Universalité : Le même codon code pour le même acide aminé chez (presque) tous les êtres vivants, preuve d'une origine commune.
- Dégénérescence (redondance) : Les 64 codons possibles codent pour seulement 20 acides aminés. Plusieurs codons différents peuvent donc coder pour le même acide aminé (exemple : UCU, UCC, UCA, UCG = Sérine).
- Codons d'initiation et de terminaison : Le codon AUG code pour la méthionine et signale le début de la traduction. Les codons UAA, UAG, UGA sont des codons stop qui arrêtent la synthèse.
La séquence d'ARNm AUG-UCU-GGU-UAA sera traduite en : Méthionine (start) - Sérine - Glycine - (stop).
Table à double entrée permettant de trouver l'acide aminé correspondant à un codon d'ARNm donné. La première base du codon est en ligne, la seconde en colonne, la troisième dans un tableau intérieur.
- 1. Première base du codon (5')
- 2. Deuxième base du codon
- 3. Troisième base du codon (3')
- 4. Acide aminé correspondant
3🏭 De l'ARNm à la protéine : la traduction
La traduction est la synthèse d'une chaîne polypeptidique à partir de l'information portée par l'ARNm. Elle a lieu dans le cytoplasme, au niveau des ribosomes.
Processus de synthèse protéique au cours duquel la séquence de nucléotides d'un ARNm est décodée par un ribosome pour assembler une séquence spécifique d'acides aminés.
Les acteurs moléculaires clés sont :
- L'ARNm : matrice à décoder.
- Les ARN de transfert (ARNt) : molécules « adaptatrices » qui portent un acide aminé spécifique à une extrémité et possèdent à l'autre extrémité un anticodon complémentaire d'un codon de l'ARNm.
- Le ribosome : complexe ribonucléoprotéique constitué de deux sous-unités. Il possède trois sites : A (aminoacyl), P (peptidyl) et E (exit).
Le mécanisme se déroule en trois étapes :
1. Initiation : Le ribosome se fixe sur le codon start AUG de l'ARNm. Le premier ARNt (portant la méthionine) s'insère dans le site P.
2. Élongation : Cycle répété : a) Un ARNt chargé entre dans le site A si son anticodon est complémentaire du codon exposé. b) Une liaison peptidique se forme entre les acides aminés des sites P et A. c) Le ribosome se translocate d'un codon, déplaçant les ARNt (celui du site P vers E, celui du site A vers P).
3. Terminaison : Lorsqu'un codon stop entre dans le site A, un facteur de terminaison provoque la libération du polypeptide fini et la dissociation du ribosome.
La traduction est un processus coûtant en énergie (GTP, ATP). La séquence des acides aminés (structure primaire) déterminera le repliement et donc la fonction de la protéine.
4🎛️ Régulation de l'expression génétique
Tous les gènes ne sont pas exprimés en permanence et avec la même intensité. La régulation permet à la cellule de répondre à son environnement et de se spécialiser. Elle peut intervenir à toutes les étapes.
Ensemble des mécanismes qui contrôlent le moment, la durée et le niveau d'expression d'un gène, permettant une adaptation cellulaire.
Niveau transcriptionnel : C'est le principal niveau de contrôle.
• Facteurs de transcription : Protéines qui se lient à des séquences spécifiques de l'ADN (promoteur, enhancer) pour activer ou réprimer la transcription.
• Modifications épigénétiques : Comme la méthylation de l'ADN ou les modifications des histones, qui modifient l'accessibilité de l'ADN sans changer sa séquence.
Niveau post-transcriptionnel :
• Épissage alternatif : Un même gène peut donner plusieurs ARNm (et donc plusieurs protéines) différents selon les exons conservés.
• Stabilité de l'ARNm : La durée de vie de l'ARNm dans le cytoplasme influence la quantité de protéine produite.
Niveau traductionnel et post-traductionnel : La disponibilité des ARNt, l'activité des ribosomes, ou encore les modifications chimiques des protéines (phosphorylation, glycosylation) après leur synthèse permettent un contrôle fin de l'activité protéique.
Chez les bactéries, l'opéron lactose chez E. coli est un modèle classique : en absence de lactose, un répresseur se fixe sur l'ADN et bloque la transcription des gènes de dégradation du lactose. En présence de lactose, celui-ci inactive le répresseur, permettant la transcription et la production des enzymes nécessaires.
Vocabulaire
Synthèse d'un ARN complémentaire d'une séquence d'ADN.
Ex: La transcription du gène de l'insuline produit un ARNm spécifique.
Molécule d'ARN simple brin, transcrit d'un gène, qui porte l'information génétique du noyau vers le cytoplasme pour être traduite.
Ex: L'ARNm de l'hémoglobine est traduit en globine dans les précurseurs des globules rouges.
Correspondance universelle entre les triplets de nucléotides (codons) de l'ARNm et les acides aminés des protéines.
Ex: Le codon AUG code toujours pour la méthionine et signale le début de la traduction.
Triplet de nucléotides sur l'ARNm qui spécifie un acide aminé ou un signal (start/stop).
Ex: UUC est un codon qui spécifie la phénylalanine.
Processus de synthèse d'une chaîne polypeptidique sur un ribosome, à partir de l'information d'un ARNm.
Ex: La traduction de l'ARNm viral par les ribosomes de la cellule hôte produit les protéines du virus.
Petit ARN en forme de trèfle qui transporte un acide aminé spécifique jusqu'au ribosome et possède un anticodon complémentaire d'un codon de l'ARNm.
Ex: L'ARNt portant la sérine a pour anticodon AGA, complémentaire du codon UCU.
Complexe ribonucléoprotéique constitué de deux sous-unités, site de la traduction des ARNm en protéines.
Ex: Les antibiotiques comme la streptomycine bloquent la fonction des ribosomes bactériens.
Contrôle de l'expression d'un gène (activation/inhibition) en réponse à des signaux internes ou externes.
Ex: La régulation du gène p53 intervient dans le contrôle du cycle cellulaire et la réparation de l'ADN.
