Il codice genetico è l'insieme delle regole con le quali viene tradotta l'informazione codificata nei nucleotidi costituenti i geni per la sintesi di proteine nelle cellule.
La decodifica biologica viene effettuata da un particolare RNA nel ribosoma, il quale assembla una serie di amminoacidi secondo un ordine specificato dall'mRNA. Ciò avviene utilizzando l'RNA transfer (tRNA), che trasporta gli amminoacidi e che legge l'mRNA tre nucleotidi alla volta, più specificamente la loro tripletta di basi, o codone. Un codone corrisponde a un singolo amminoacido.
Poiché la maggior parte dei geni si esprime secondo lo stesso codice, questo viene spesso indicato come "codice genetico canonico" o "standard", o semplicemente "il codice genetico", anche se in realtà alcune versioni si sono con il tempo evolute. Ad esempio, la sintesi proteica che avviene nei mitocondri umani si basa su un codice genetico leggermente diverso da quello standard.
Le basi dell'RNA sono quattro: adenina, guanina, citosina ed uracile (nel DNA l'uracile è sostituito dalla timina). Esistono quindi 43 = 64 codoni possibili. 61 di essi codificano gli amminoacidi, mentre i restanti tre (UAA, UAG, UGA) codificano segnali di stop (stabiliscono, cioè, a che punto deve interrompersi l'assemblamento della catena polipeptidica). Poiché gli amminoacidi che concorrono alla formazione delle proteine sono 20 e i codoni 64, essi in generale sono codificati da più di un codone (con l'eccezione di triptofano e metionina) pertanto il codice genetico viene definito "degenere". Codoni distinti che codificano il medesimo amminoacido sono detti sinonimi.
Il codice genetico viene letto "senza punteggiatura" ossia linearmente di tre basi in tre basi e non è in genere sovrapponibile (ad esempio l'ultima base di un codone non può essere letta come la prima base del codone successivo, tuttavia nei virus i geni possono essere sovrapposti).
Scoperta
Seri sforzi per capire come le proteine venissero codificate sono iniziati in seguito alla scoperta della struttura del DNA, avvenuta nel 1953. George Gamow postulò che gruppi di tre basi dovevano essere impiegati per codificare i 20 amminoacidi standard utilizzati dalle cellule viventi per costruire le proprie proteine. Avendo a disposizione quattro nucleotidi diversi, un codice costituito da 2 nucleotidi consentirebbe solo un massimo di 42 = 16 aminoacidi. Diversamente, un codice con 3 nucleotidi può codificare fino a 43 = 64 aminoacidi.
Nel 1961, l'esperimento di Crick, Brenner, Barnett, Watts-Tobin fu il primo a dimostrare che i codoni consistono in tre basi di DNA; nello stesso anno Marshall Nirenberg e Heinrich Matthaei furono, invece, i primi a chiarire la natura di un codone, presso il National Institutes of Health. Essi utilizzarono un per tradurre una sequenza di RNA poli-uracile (ovvero: UUUUUU....) e così scoprirono che il polipeptide che avevano sintetizzato consisteva di sola fenilalanina (un amminoacido). Essi quindi dedussero che il codone UUU fosse specifico per quel dato amminoacido. A ciò seguirono esperimenti nel laboratorio di Severo Ochoa che portarono alla dimostrazione che la sequenza RNA poli-adenina (AAAAA...) codificava il polipeptide poli-lisina e che la sequenza RNA pol-citosina (CCCCC...) codificava il polipeptide poli-prolina. Pertanto il codone AAA specificava la lisina e il codone CCC specificava la prolina. Utilizzando diversi copolimeri, la maggior parte dei rimanenti codoni furono quindi determinati. Il lavoro successivo svolto da Har Gobind Khorana portarono ad identificare il resto del codice genetico. Poco dopo, Robert W. Holley determinò la struttura dell'RNA transfer (tRNA), la molecola adattatore che facilita il processo di traduzione dell'RNA in proteina. Questo lavoro si basò sugli studi precedenti di Severo Ochoa, il quale ricevette il Premio Nobel per la medicina nel 1959 per il suo lavoro sulla enzimologia della sintesi dell'RNA.
Estendendo questo lavoro, Nirenberg e Philip Leder dimostrarono la natura a tripletta del codice genetico e decifrarono i codoni del codice genetico standard. In questi esperimenti, varie combinazioni di mRNA furono fatte passare attraverso un filtro che conteneva ribosomi, gli organuli contenuti nelle cellule che realizzano la traduzione dell'RNA in proteina. Triplette univoche promuovono il legame di specifici tRNA al ribosoma. Leder e Nirenberg, grazie ai loro esperimenti, furono in grado di determinare le sequenze di 54 dei 64 codoni. Nel 1968, Khorana, Holley e Nirenberg ricevettero il Premio Nobel per la medicina per il loro lavoro.
Importanti caratteristiche
Quadro di lettura
Un codone viene definito dal nucleotide di partenza da cui inizia traduzione. Ad esempio, la stringa GGGAAACCC, se letta dalla prima posizione, contiene i codoni GGG, AAA, e CCC; se viene letto dalla seconda posizione, contiene i codoni GGA e AAC; se letto a partire dalla terza posizione, GAA e ACC. Ogni sequenza può, pertanto, essere letta in tre diverse fasi, ciascuna delle quali produrrà una sequenza amminoacidica diversa (nell'esempio dato, Gly-Lys-Pro, Gly-Asn, Glu-Thr, rispettivamente). Nella doppia elica del DNA, vi sono sei possibili "quadri di lettura", tre che indicano un orientamento in avanti su un capo del filamento e tre nella direzione inversa sull'altro filamento.
Codoni di inizio e di stop
La traduzione inizia in corrispondenza di un codone di inizio ma, a differenza del codone di termine, questi non è sufficiente per avviare il processo di sintesi; in prossimità del codone di avvio devono infatti anche trovarsi alcune sequenze tipiche che permettono all'mRNA di legarsi ai ribosomi. Particolari sequenze, come la sequenza di Shine-Dalgarno nell'Escherichia coli e , sono inoltre necessari per avviare la traduzione. Il codone di inizio più comune è AUG, che codifica anche la metionina o, nei batteri, la . A seconda dell'organismo, codoni alternativi di inizio possono essere GUG o UUG; questi codoni normalmente rappresentano, rispettivamente, la valina e la leucina, ma come codoni di inizio sono tradotti in metionina o formilmetionina. Altri codoni di inizio sono CUG, UUG e, nei procarioti, GUG e AUU.
Ai tre codoni di stop sono stati assegnati dei nomi: UAG o codone Ambra, UAA o codone Ocra, e UGA o codone Opale. Il codone Ambra è stato chiamato così, dagli scopritori Richard Epstein e Charles Steinberg, in onore di che lo ha scoperto ed il cui cognome significa ambra in tedesco. Gli altri due codoni di terminazione sono stati chiamati in modo da rimanere nel tema dei colori (rispettivamente ocra e opale). I codoni di stop vengono anche chiamati codoni di "cessazione" o codoni "nonsense". Il loro scopo è di far sì che vi sia il rilascio del polipeptide nascente dal ribosoma e questo avviene poiché non vi è un tRNA affine che possieda anticodoni complementari a queste sequenze di stop, e quindi nel ribosoma viene a legarsi un .
Effetto delle mutazioni
Durante il processo di replicazione del DNA, occasionalmente possono verificarsi degli errori nella polimerizzazione del secondo filamento. Questi errori, chiamati mutazioni, possono avere un impatto sul fenotipo (ovvero le caratteristiche osservabili) di un organismo, specialmente se esse si verificano all'interno della sequenza del gene codificante una proteina. I tassi di errore sono solitamente molto bassi, stimabili i 1 errore ogni 10-100 milioni di basi, grazie alla capacità di "revisione" della DNA polimerasi.
Le (mutazioni missenso) e le (mutazioni nonsenso) sono esempi di mutazioni puntiformi, che possono causare malattie genetiche come l'anemia falciforme e la talassemia, rispettivamente. Le mutazioni missenso generalmente sono clinicamente importanti poiché comportano la modifica delle proprietà dell'amminoacido codificato tra cui se è essenziale, acido, polare o non polare, mentre le mutazioni nonsense comportano la formazione di un codone di stop.
Le mutazioni frameshift sono dovute a delezione o inserzioni (indel) di un numero di nucleotidi non divisibile per 3, comportando lo spostamento del quadro lettura a valle della mutazione e quindi la codificazione di una sequenza amminoacidica non corrispondente a quella del trascritto originario. La conseguenza è la produzione di proteine anomale o la mancata esportazione o traduzione dell'mRNA mutato. L'ereditarietà delle mutazioni frameshift è rara, poiché la conseguente assenza di una proteina funzionale può causare la prematura morte dell'organismo. Una grave malattia dovuta ad una mutazione di questo tipo è la malattia di Tay-Sachs.
Sebbene la maggior parte delle mutazioni che comportano il cambiamento nelle sequenze proteiche sono dannose o, al limite, neutre, alcune possono comportare un effetto benefico su di un organismo consentendogli di resistere a particolari stress ambientali meglio degli organismi wild type (dotati di geni più comuni), o di riprodursi più rapidamente. In questi casi, la mutazione tenderà a diventare sempre più comune nella popolazione attraverso la selezione naturale. I virus che utilizzano l'RNA come materiale genetico, hanno tassi di mutazione molto rapidi, e ciò può essere per loro un vantaggio, dal momento che si evolveranno costantemente e rapidamente e quindi poter eludere le risposte difensive del sistema immunitario umano. Nelle grandi popolazioni composti da organismi a riproduzione asessuata, ad esempio nell'Escherichiacoli coli, possono coesistere molteplici mutazioni benefiche. Questo fenomeno è chiamato e comporta competizioni tra le mutazioni.
Degenerazione
Per degenerazione si intende la ridondanza del codice genetico, cioè due o più codoni corrispondono allo stesso amminoacido. Il codice genetico è ridondante, ma, tuttavia, non vi è alcuna ambiguità in esso (vedi le tabelle sottostanti). Ad esempio, sia il codone GAA che GAG specificano l'acido glutammico (ridondanza), ma nessuno dei due specifica qualsiasi altro amminoacido (assenza di ambiguità). I codoni che codificano un aminoacido possono differire in una delle loro tre posizioni. Per esempio la leucina è specificata dai codoni YUR o CUN (UUA, UUG, CUU, CUC, CUA, o CUG), con differenze nella prima o terza posizione, mentre l'amminoacido serina viene specificato dai codoni UCN o AGY (UCA, UCG, UCC, UCU, AGU, o AGC), con differenza nella prima, seconda o terza posizione).
Un codone è detto "quattro volte degenere" se qualsiasi nucleotide nella sua terza posizione codifica lo stesso amminoacido (ad esempio, UCA, UCC, UCG e UCU, tutti corrispondenti alla serina); è detto "due volte degenere" se solo due delle quattro basi nella sua terza posizione codificano lo stesso amminoacido (ad esempio AAA ed AAG, corrispondenti alla lisina). Nei codoni due volte degeneri, i nucleotidi equivalenti nella terza posizione sono sempre o due purine (A/G) o due pirimidine (C/U).
La ridondanza rende il codice genetico meno vulnerabile alle mutazioni causali. Un codone quattro volte ridondante può subire qualsiasi mutazione alla sua terza posizione ed un codone due volte ridondante può subire una delle tre possibili mutazioni alla sua terza posizione senza che l'amminoacido da esso espresso - e quindi la struttura della proteina in cui l'amminoacido verrà inserito - cambi. Inoltre, dato che le mutazioni per transizione (da una purina all'altra o da una pirimidina all'altra) sono più probabili delle mutazioni per transversione (da purina a pirimidina o viceversa), l'equivalenza tra purine o tra pirimidine nei codoni due volte degeneri aggiunge un'ulteriore resistenza. Infatti, gli eventuali errori posti nella terza posizione di una tripletta causano soltanto una mutazione silente o un errore, senza che la proteina venga pregiudicata, poiché l'idrofilia o l'idrofobia viene mantenuta dalla sostituzione equivalente degli amminoacidi; per esempio, un codone di NUN (dove N è un qualsiasi nucleotide) tende a codificare aminoacidi idrofobici; NAN codifica residui idrofili di medie dimensioni. Il codice genetico è così ben strutturato per l'idropatia che una analisi matematica (decomposizione ai valori singolari) di 12 variabili (4 nucleotidi x 3 posizioni) produce una correlazione notevole (C=0,95) per la predizione dell'idropatia dell'amminoacido codificato direttamente dalla sequenza nucleotidica, senza la traduzione. Come si vede dalla tabella sottostante, otto amminoacidi non sono interessati da eventuali mutazioni nella terza posizione del codone, mentre una mutazione nella seconda posizione rischia di provocare un cambiamento radicale nelle proprietà fisico-chimiche dell'aminoacido codificato.
Trasferimento di informazioni attraverso il codice genetico
Il genoma di un organismo si trova nel DNA o, nel caso di alcuni virus, nell'RNA. La porzione del genoma che codifica una o più catene polipeptidiche o per l'RNA è chiamato gene. I geni che codificano le proteine sono composti da unità di tre nucleotidi chiamati codoni, di cui ciascuna di esse codifica un singolo amminoacido. Ogni nucleotide consiste di un fosfato, di uno zucchero deossiribosio e di una delle quattro basi azotate. La basi puriniche, adenina (A) e guanina (G), sono le più grandi e sono costituite da due anelli aromatici. Le basi pirimidiniche, citosina (C) e timina (T), sono più piccole e consistono di un solo anello aromatico. Nella configurazione a doppia elica, i due filamenti di DNA sono uniti tra loro da legami idrogeno in una forma nota come coppia di basi. Questi legami si formano quasi sempre tra la base adenina su un filamento e una base timina sull'altro, oppure tra una base citosina e una base guanina. Ciò significa che, in un determinato filamento a doppia elica, il numero di basi A e T sarà lo stesso, così come il numero di basi G e C. Nell'RNA, la timina (T) è sostituita dall'uracile (U) e il desossiribosio è sostituito dal ribosio.
Ogni gene codificante proteine viene trascritto in una molecola del polimero RNA. Nei procarioti, questo RNA funziona come RNA messaggero o mRNA; negli eucarioti, la trascrizione deve essere elaborata per produrre un m-RNA maturo. L'm-RNA interagisce nel citoplasma con l'R-RNA. A questo punto il T-RNA che porta con sé un amminoacido specifico si lega all'M-RNA permettendo la formazione di una catena amminoacidica. L’interazione avviene mediante il riconoscimento della prima base dell’anticodone presente sul T-RNA con l’ultima base del codone posto sull' M-RNA: legame complementare e antiparallelo.
Vi sono 43=64 possibili diverse combinazioni di codoni formati da tre nucleotidi; tutti i 64 codoni corrispondono ad un amminoacido o ad un segnale di stop. Se, per esempio, viene considerata una sequenza di RNA UUUAAACCC e il quadro di lettura inizia con il primo U (per convenzione, 5' a 3'), vi sono tre codoni, ovvero UUU, AAA, e CCC, ciascuno dei quali specifica un amminoacido. Pertanto, questa sequenza di RNA a 9 basi sarà tradotta in una sequenza di tre amminoacidi. Un dato aminoacido può essere codificato da una a sei diverse sequenze di codone.
Il codice genetico standard viene mostrato nelle seguenti tabelle. La tabella 1 mostra quale aminoacido viene codificato da ciascuno dei 64 codoni. La tabella 2 mostra quali codoni specificano i 20 amminoacidi standard coinvolti nella traduzione. Ad esempio, il codone "AAU" rappresenta l'aminoacido asparagina, e "UGU" e "UGC" rappresentano la cisteina (nella denominazioni standard a tre lettere standard, Asn e Cys, rispettivamente).
Tabella codifica codoni nel DNA
apolare | polare | basico | acido | codone di stop |
Prima base | Seconda base | Terza base | |||||||
---|---|---|---|---|---|---|---|---|---|
T | C | A | G | ||||||
T | TTT | (Phe/F) Fenilalanina | TCT | (Ser/S) Serina | TAT | (Tyr/Y) Tirosina | TGT | (Cys/C) Cisteina | T |
TTC | TCC | TAC | TGC | C | |||||
TTA | (Leu/L) Leucina | TCA | TAA | Stop (Ocra) | TGA | Stop (Opale) | A | ||
TTG | TCG | TAG | Stop (Ambra) | TGG | (Trp/W) Triptofano | G | |||
C | CTT | CCT | (Pro/P) Prolina | CAT | (His/H) Istidina | CGT | (Arg/R) Arginina | T | |
CTC | CCC | CAC | CGC | C | |||||
CTA | CCA | CAA | (Gln/Q) Glutammina | CGA | A | ||||
CTG | CCG | CAG | CGG | G | |||||
A | ATT | (Ile/I) Isoleucina | ACT | (Thr/T) Treonina | AAT | (Asn/N) Asparagina | AGT | (Ser/S) Serina | T |
ATC | ACC | AAC | AGC | C | |||||
ATA | ACA | AAA | (Lys/K) Lisina | AGA | (Arg/R) Arginina | A | |||
ATG | (Met/M) Metionina | ACG | AAG | AGG | G | ||||
G | GTT | (Val/V) Valina | GCT | (Ala/A) Alanina | GAT | (Asp/D) Acido aspartico | GGT | (Gly/G) Glicina | T |
GTC | GCC | GAC | GGC | C | |||||
GTA | GCA | GAA | (Glu/E) Acido glutammico | GGA | A | ||||
GTG | GCG | GAG | GGG | G |
La tabella codone RNA è essenzialmente identica a quella per il DNA, ma con T sostituito da U.
Codifica inversa
Ala | A | GCU, GCC, GCA, GCG | Leu | L | UUA, UUG, CUU, CUC, CUA, CUG |
Arg | R | CGU, CGC, CGA, CGG, AGA, AGG | Lys | K | AAA, AAG |
Asn | N | AAU, AAC | Met | M | AUG |
Asp | D | GAU, GAC | Phe | F | UUU, UUC |
Cys | C | UGU, UGC | Pro | P | CCU, CCC, CCA, CCG |
Gln | Q | CAA, CAG | Ser | S | UCU, UCC, UCA, UCG, AGU, AGC |
Glu | E | GAA, GAG | Thr | T | ACU, ACC, ACA, ACG |
Gly | G | GGU, GGC, GGA, GGG | Trp | W | UGG |
His | H | CAU, CAC | Tyr | Y | UAU, UAC |
Ile | I | AUU, AUC, AUA | Val | V | GUU, GUC, GUA, GUG |
start | AUG, GUG | stop | UAG, UGA, UAA |
Variazioni al codice genetico standard
Sebbene lievi variazioni del codice standard erano state previste fin dall'inizio, esse non sono state scoperte fino al 1979 quando i ricercatori che studiavano i geni mitocondriali umani scoprirono che essi utilizzavano un codice alternativo. Molte altre piccole varianti sono state scoperte da allora, tra cui vari codici mitocondriali alternativi e piccole varianti come la traduzione del codone UGA a triptofano nelle specie di Mycoplasma e la traduzione di CUG come una serina piuttosto che una leucina nei lieviti del "clade CTG" (la Candida albicans fa parte di questo gruppo). Poiché i virus devono utilizzare lo stesso codice genetico dei loro ospiti, le modifiche al codice genetico standard potrebbe interferire con la sintesi o il funzionamento delle proteine virali. Tuttavia, alcuni virus (come i ) hanno adattato il codice alle modifiche genetiche dell'ospite. Nei batteri e negli archeobatteri, GUG e UUG sono comuni codoni di inizio, ma in rari casi, alcune proteine possono utilizzare codoni di inizio alternativi non normalmente utilizzate da tali specie.
Anche i protozoi ciliati presentano qualche modifica: in loro (come anche in alcune specie di alga verde) UAG e, spesso, UAA codificano la glutammina e UGA codifica la cisteina. In alcune specie di lievito, CUG codifica la serina. In altre specie di batteri ed archeobatteri i codoni di arresto codificano invece amminoacidi non comuni: UGA codifica la selenocisteina e UAG la pirrolisina. È possibile che vi siano altri amminoacidi non-standard la cui codifica è ancora ignota. Inoltre si possono avere diversissime variazioni anche del codice genetico mitocondriale, che inoltre ha tassi di evoluzione maggiore a seguito dell'inefficienza dei meccanismi di riparazione del DNA. Ad esempio, oltre ai già citati vertebrati (CGM 2), anche gruppi filogeneticamente vicini a noi, come ad esempio le Ascidie, hanno un codice genetico mitocondriale particolare.
In certe proteine, gli amminoacidi non standard sono sostituiti da codoni di stop, a seconda delle sequenze di segnali associati a dell'RNA messaggero. Ad esempio, UGA può codificare selenocisteina e UAG può codificare pirrolisina. La selenocisteina è classificato come l'amminoacido 21 e la pirrolisina come il 22. A differenza della selenocisteina, la pirrolisina codificata UAG viene tradotta grazie alla partecipazione di un apposito tRNA sintetasi. Sia la selenocisteina che la pirrolisina possono essere presenti nello stesso organismo. Anche se il codice genetico in un organismo è normalmente immutabile, in alcuni casi ciò può non essere vero: ad esempio l'archeobatterio acetohalobium arabaticum può espandere il suo codice genetico da 20 a 21 amminoacidi (aggiungendo la pirrolisina) quando si riscontrano alcune condizioni di crescita.
Nonostante queste differenze, tutti i codici genetici noti presenti nelle forme di vita della Terra sono molto simili meccanismo di codifica è lo stesso per tutti gli organismi: codoni di tre basi, tRNA, ribosomi, lettura del codice nella stessa direzione e traduzione del codice a tre lettere in sequenze di amminoacidi. Dato che i codici genetici possibili e potenzialmente adatti alla vita sono molti, la teoria dell'evoluzione fa pensare che questo codice genetico sia andato a definirsi molto presto nella storia della vita su questo pianeta. Le pressioni che poi possono aver portato all'evoluzione di codici genetici non canonici sono state sicuramente secondarie, in particolare si pensa legate a fenomeni di resistenza al trasferimento genico o all'attacco virale.
Espansione del codice genetico
Dal 2001, 40 amminoacidi non naturali sono stati aggiunti alle proteine creando un codone unico (ricodifica) ed un corrispondente RNA transfer. Ciò ha permesso di studiare proprietà fisico-chimiche e biologiche diverse e per esplorare la struttura delle proteine, la loro funzione o per crearne di nuove o migliore quelle già esistenti.
H. Murakami e M. Sisido hanno esteso alcuni codoni portandoli a quattro e cinque basi. Steven A. Benner sintetizzò un 65° codone funzionale (in vivo).
Origine
Se gli aminoacidi fossero stati assegnati in modo casuale ai codoni, allora ci sarebbero 1.5 x 1084 possibili codici genetici tra cui scegliere. Questo numero è individuato calcolando quanti modi vi sono per posizionare 21 elementi (20 aminoacidi più uno di stop) in 64 posizioni, in cui ciascun elemento è utilizzato almeno una volta. Il codice genetico usato da tutte le forme di vita conosciute è quasi universale, con solo qualche piccola variante. Ci si potrebbe quindi chiedere se tutte le forme di vita presenti sulla Terra discendano da un unico antenato che è andato incontro a mutazioni che abbiano ottimizzato il codice genetico. Sono state formulate diverse ipotesi sulle origini e sull'evoluzione del codice genetico.
Le tante ipotesi possono essere raggruppate in quattro temi principali riguardanti l'evoluzione del codice genetico:
- Principi chimici governano le specifiche interazione dell'RNA con gli aminoacidi. Esperimenti condotti su aptameri hanno dimostrato che alcuni aminoacidi hanno una affinità chimica selettiva per la tripletta di basi che li codifica. Recenti esperimenti mostrano che degli 8 aminoacidi testati, 6 mostrano alcune associazioni tripletta-amminoacido.
- Espansione biosintetica. Il codice genetico standard moderno è il risultato dell'evoluzione di un codice precedente più semplice grazie ad un processo di "espansione biosintetica". Da qui l'idea che la vita primordiale abbia "scoperto" nuovi amminoacidi (ad esempio come sottoprodotti del metabolismo) che poi sono stati inglobati nel meccanismo della codifica genetica. Anche se molte prove circostanziali hanno suggerito che un minor numero di differenti aminoacidi furono utilizzati in passato rispetto ad oggi, ipotesi precise e dettagliate su quali aminoacidi siano entrati nel codice si sono rivelate molto più controverso.
- La selezione naturale ha portato alle assegnazioni del codone del codice genetico tali da minimizzare gli effetti delle mutazioni. Un'ipotesi recente suggerisce che il codice a tripletta sia derivato da altri codici più lunghi (come i codoni quaternari). Un sistema di codifica più lungo di una tripletta garantirebbe un maggior grado di ridondanza al codone e sarebbe più resistente agli errori. Questa caratteristica avrebbe consentito una decodifica accurata in assenza di sistemi altamente complessi come il ribosoma di cui le prime cellule erano prive.
- Canali di informazione: il modello della teoria dell'informazione consiste nella traduzione del codice genetico in corrispondenti amminoacidi come un canale informativo incline all'errore. Il rumore intrinseco (cioè l'errore) nei canali pone la domanda di come sia possibile che il codice genetico possa tollerare l'influenza del rumore riuscendo a tradurre in modo accurato ed efficiente le informazioni. I modelli suggeriscono che il codice genetico sia nato come il risultato dell'interazione di tre forze evolutive contrastanti: le esigenze dei diversi aminoacidi, la tolleranza agli errori e il minimo dispendio di risorse.
Le molecole di RNA transfer sembrano essersi sviluppate prima delle moderne amminoacil-tRNA sintetasi, per cui quest'ultima non può essere parte della spiegazione dei vari modelli proposti.
Inoltre, sono stati esplorati modelli comprendenti aspetti che sommano due o più dei suddetti temi. Ad esempio, i modelli basati sul gioco di segnalazione combinano elementi della teoria dei giochi, la selezione naturale e la teoria dell'informazione. Tali modelli sono stati utilizzati per suggerire che i primi polipeptidi fossero probabilmente brevi e possedessero alcune funzioni diverse da quella enzimatica. Modelli teorici hanno anche suggerito che l'organizzazione nelle cellule di stringhe di RNA potevano essere necessari per evitare l'uso "ingannevole" del codice genetico, cioè impedendo all'equivalente ancestrale del virus di stravolgere la sequenza dell'RNA.
La distribuzione delle assegnazioni del codone nel codice genetico non è casuale. Per esempio, determinati gruppi di codice genetico codificano determinati aminoacidi. Quelli che condividono la stessa via biosintetica tendono ad avere nei loro codoni la prima base uguale. Gli aminoacidi con proprietà fisiche simili tendono ad avere codoni simili, al fine di ridurre i problemi causati dalle mutazioni puntiformi e da errori di traduzione. Un'ipotesi coerente per spiegare l'origine del codice genetico dovrebbe anche affrontare o prevedere le seguenti caratteristiche:
- assenza di codoni per (D-amminoacidi)
- modelli di codoni secondari per alcuni aminoacidi
- confinamento di posizioni sinonimo per la terza posizione
- limitazione a 20 aminoacidi invece di un numero più vicino a 64
- relazione tra i modelli di codoni di stop con i modelli di codifica di aminoacidi
Note
- ^ Jukes TH, Osawa S, The genetic code in mitochondria and chloroplasts, in Experientia, vol. 46, n. 11-12, 1990, pp. 1117-26, PMID 2253709.
- ^ (EN) NCBI, Genetic Code page in the NCBI Taxonomy section, su ncbi.nlm.nih.gov. URL consultato il 2 settembre 2015.
- ^ Turanov AA, Lobanov AV, Fomenko DE, Morrison HG, Sogin ML, Klobutcher LA, Hatfield DL, Gladyshev VN, Genetic code supports targeted insertion of two amino acids by one codon, in Science, vol. 323, n. 5911, 2009, pp. 259-61, DOI:10.1126/science.1164748, PMC 3088105, PMID 19131629.
- ^ Crick, Francis, Chapter 8: The genetic code, in What mad pursuit: a personal view of scientific discovery, New York, Basic Books, 1988, pp. 89-101, ISBN 0-465-09138-5.
- ^ Nirenberg MW e Matthaei JH, The dependence of cell-free protein synthesis in E. coli upon naturally occurring or synthetic polyribonucleotides, in Proc. Natl. Acad. Sci. USA, vol. 47, n. 10, ottobre 1961, pp. 1588-1602, DOI:10.1073/pnas.47.10.1588, PMC 223178, PMID 14479932.
- ^ Gardner RS, Wahba AJ, Basilio C, Miller RS, Lengyel P e Speyer JF, Synthetic polynucleotides and the amino acid code. VII, in Proc. Natl. Acad. Sci. USA, vol. 48, n. 12, dicembre 1962, pp. 2087-94, Bibcode:1962PNAS...48.2087G, DOI:10.1073/pnas.48.12.2087, PMC 221128, PMID 13946552.
- ^ Wahba AJ, Gardner RS, Basilio C, Miller RS, Speyer JF e Lengyel P, Synthetic polynucleotides and the amino acid code. VIII, in Proc. Natl. Acad. Sci. USA, vol. 49, n. 1, gennaio 1963, pp. 116-22, Bibcode:1963PNAS...49..116W, DOI:10.1073/pnas.49.1.116, PMC 300638, PMID 13998282.
- ^ The Nobel Prize in Physiology or Medicine 1959, su nobelprize.org, The Royal Swedish Academy of Science, 1959. URL consultato il 27 febbraio 2010.«The Nobel Prize in Physiology or Medicine 1959 was awarded jointly to Severo Ochoa and Arthur Kornberg 'for their discovery of the mechanisms in the biological synthesis of ribonucleic acid and deoxyribonucleic acid'.»
- ^ Nirenberg M, Leder P, Bernfield M, Brimacombe R, Trupin J, Rottman F e O'Neal C, RNA codewords and protein synthesis, VII. On the general nature of the RNA code, in Proc. Natl. Acad. Sci. USA, vol. 53, n. 5, maggio 1965, pp. 1161-8, Bibcode:1965PNAS...53.1161N, DOI:10.1073/pnas.53.5.1161, PMC 301388, PMID 5330357.
- ^ The Nobel Prize in Physiology or Medicine 1968, su nobelprize.org, The Royal Swedish Academy of Science, 1968. URL consultato il 27 febbraio 2010.«The Nobel Prize in Physiology or Medicine 1968 was awarded jointly to Robert W. Holley, Har Gobind Khorana and Marshall W. Nirenberg 'for their interpretation of the genetic code and its function in protein synthesis'.»
- Pamela K. Mulligan, King, Robert C. e Stansfield, William D., A dictionary of genetics, Oxford [Oxfordshire], Oxford University Press, 2006, p. 608, ISBN 0-19-530761-5.
- ^ Touriol C, Bornes S, Bonnal S, Audigier S, Prats H, Prats AC e Vagner S, Generation of protein isoform diversity by alternative initiation of translation at non-AUG codons, in Biol. Cell, vol. 95, 3–4, 2003, pp. 169-78, DOI:10.1016/S0248-4900(03)00033-9, PMID 12867081.
- ^ (EN) Wei J, Zhang Y, Ivanov IP, Sachs MS, The stringency of start codon selection in the filamentous fungus Neurospora crassa, in J. Biol. Chem., vol. 288, n. 13, 2013, pp. 9549-62, DOI:10.1074/jbc.M112.447177, PMC 3611022, PMID 23396971. URL consultato il 21 ottobre 2022 (archiviato dall'url originale il 2 settembre 2015).
- ^ Edgar B, The genome of bacteriophage T4: an archeological dig, in Genetics, vol. 168, n. 2, 2004, pp. 575-82, PMC 1448817, PMID 15514035.
- ^ Maloy S, How nonsense mutations got their names, su Microbial Genetics Course, San Diego State University, 29 novembre 2003. URL consultato il 10 marzo 2010.
- ^ Anthony J. F. Griffiths, Jeffrey H. Miller, David T. Suzuki, Richard C. Lewontin e Gelbart (a cura di), Spontaneous mutations, in An Introduction to Genetic Analysis, 7th, New York, W. H. Freeman, 2000, ISBN 0-7167-3520-2.
- ^ Freisinger E, Grollman AP, Miller H e Kisker C, Lesion (in)tolerance reveals insights into DNA replication fidelity, in The EMBO Journal, vol. 23, n. 7, 2004, pp. 1494-505, DOI:10.1038/sj.emboj.7600158, PMC 391067, PMID 15057282.
- ^ Boillée, 2006, p. 39.
- ^ Chang JC e Kan YW, beta 0 thalassemia, a nonsense mutation in man, in Proc. Natl. Acad. Sci. U.S.A., vol. 76, n. 6, giugno 1979, pp. 2886-9, Bibcode:1979PNAS...76.2886C, DOI:10.1073/pnas.76.6.2886, PMC 383714, PMID 88735.
- ^ Boillée S, Vande Velde C e Cleveland DW, ALS: a disease of motor neurons and their nonneuronal neighbors, in Neuron, vol. 52, n. 1, ottobre 2006, pp. 39-59, DOI:10.1016/j.neuron.2006.09.018, PMID 17015226.
- ^ Isbrandt D, Hopwood JJ, von Figura K e Peters C, <361::AID-HUMU12>3.0.CO;2-0 Two novel frameshift mutations causing premature stop codons in a patient with the severe form of Maroteaux-Lamy syndrome, in Hum. Mutat., vol. 7, n. 4, 1996, pp. 361-3, DOI:10.1002/(SICI)1098-1004(1996)7:4<361::AID-HUMU12>3.0.CO;2-0, PMID 8723688.
- ^ Crow JF, How much do we know about spontaneous human mutation rates?, in Environ. Mol. Mutagen., vol. 21, n. 2, 1993, pp. 122-9, DOI:10.1002/em.2850210205, PMID 8444142.
- ^ Lewis, Ricki, Human Genetics: Concepts and Applications, 6th, Boston, Mass, McGraw Hill, 2005, pp. 227-228, ISBN 0-07-111156-5.
- ^ Sawyer SA, Parsch J, Zhang Z e Hartl DL, Prevalence of positive selection among nearly neutral amino acid replacements in Drosophila, in Proc. Natl. Acad. Sci. U.S.A., vol. 104, n. 16, 2007, pp. 6504-10, Bibcode:2007PNAS..104.6504S, DOI:10.1073/pnas.0701572104, PMC 1871816, PMID 17409186.
- ^ Bridges KR, Malaria and the Red Cell, in Harvard, 2002 (archiviato dall'url originale il 27 novembre 2011).
- ^ Drake JW e Holland JJ, Mutation rates among RNA viruses, in Proc. Natl. Acad. Sci. U.S.A., vol. 96, n. 24, 1999, pp. 13910-3, Bibcode:1999PNAS...9613910D, DOI:10.1073/pnas.96.24.13910, PMC 24164, PMID 10570172.
- ^ Holland J, Spindler K, Horodyski F, Grabau E, Nichol S e VandePol S, Rapid evolution of RNA genomes, in Science, vol. 215, n. 4540, 1982, pp. 1577-85, Bibcode:1982Sci...215.1577H, DOI:10.1126/science.7041255, PMID 7041255.
- ^ de Visser JA e Rozen DE, Clonal Interference and the Periodic Selection of New Beneficial Mutations in Escherichia coli, in Genetics, the Genetics Society of America, vol. 172, n. 4, 2006, pp. 2093-2100, DOI:10.1534/genetics.105.052373, PMC 1456385, PMID 16489229.
- Watson JD, Baker TA, Bell SP, Gann A, Levine M e Oosick R., Molecular Biology of the Gene, San Francisco, Pearson/Benjamin Cummings, 2008, ISBN 0-8053-9592-X.
- ^ Yang et al. (1990) in Michel-Beyerle, M. E., ed. Reaction centers of photosynthetic bacteria: Feldafing-II-Meeting 6. Berlin: Springer-Verlag. pp. 209–18. ISBN 3-540-53420-2.
- ^ Füllen G, Youvan DC (1994). "Genetic Algorithms and Recursive Ensemble Mutagenesis in Protein Engineering". Complexity International 1.
- ^ Crick FHC e Orgel LE, Directed panspermia, in Icarus, vol. 19, n. 3, 1973, pp. 341–6, 344, Bibcode:1973Icar...19..341C, DOI:10.1016/0019-1035(73)90110-3.«It is a little surprising that organisms with somewhat different codes do not coexist.»(Further discussion)
- Elzanowski A e Ostell J, The Genetic Codes, su ncbi.nlm.nih.gov, National Center for Biotechnology Information (NCBI), 7 aprile 2008. URL consultato il 10 marzo 2010.
- ^ Jukes TH e Osawa S, The genetic code in mitochondria and chloroplasts, in Experientia, vol. 46, 11–12, dicembre 1990, pp. 1117-26, DOI:10.1007/BF01936921, PMID 2253709.
- ^ Fitzpatrick DA, Logue ME, Stajich JE e Butler G, A fungal phylogeny based on 42 complete genomes derived from supertree and combined gene analysis, in BMC Evolutionary Biology, vol. 6, 1º gennaio 2006, p. 99, DOI:10.1186/1471-2148-6-99, PMC 1679813, PMID 17121679.
- ^ Santos MA e M.F. Tuite, The CUG codon is decoded in vivo as serine and not leucine in Candida albicans, in Nucleic Acids Research, vol. 23, n. 9, 1995, pp. 1481-6, DOI:10.1093/nar/23.9.1481, PMC 306886, PMID 7784200.
- ^ Butler G, Rasmussen MD, Lin MF, Santos MA, Sakthikumar S, Munro CA, Rheinbay E, Grabherr M, Forche A, Reedy JL, Agrafioti I, Arnaud MB, Bates S, Brown AJ, Brunke S, Costanzo MC, Fitzpatrick DA, de Groot PW, Harris D, Hoyer LL, Hube B, Klis FM, Kodira C, Lennard N, Logue ME, Martin R, Neiman AM, Nikolaou E, Quail MA, Quinn J, Santos MC, Schmitzberger FF, Sherlock G, Shah P, Silverstein KA, Skrzypek MS, Soll D, Staggs R, Stansfield I, Stumpf MP, Sudbery PE, Srikantha T, Zeng Q, Berman J, Berriman M, Heitman J, Gow NA, Lorenz MC, Birren BW, Kellis M, Cuomo CA, Evolution of pathogenicity and sexual reproduction in eight Candida genomes, in Nature, vol. 459, n. 7247, 2009, pp. 657-62, DOI:10.1038/nature08064, PMC 2834264, PMID 19465905.
- ^ Taylor DJ, Ballinger MJ, Bowman SM e Bruenn JA, Virus-host co-evolution under a modified nuclear genetic code, in PeerJ, vol. 1, 2013, pp. e50, DOI:10.7717/peerj.50, PMC 3628385, PMID 23638388.
- ^ Krzycki JA, The direct genetic encoding of pyrrolysine, in Current Opinion in Microbiology, vol. 8, n. 6, 2005, pp. 706-712, DOI:10.1016/j.mib.2005.10.009, PMID 16256420.
- ^ Zhang Y, Baranov PV, Atkins JF e Gladyshev VN, Pyrrolysine and Selenocysteine Use Dissimilar Decoding Strategies, in Journal of Biological Chemistry, vol. 280, n. 21, 2005, pp. 20740-20751, DOI:10.1074/jbc.M501458200, PMID 15788401.
- ^ Prat L, Heinemann IU, Aerni HR, Rinehart J, O'Donoghue P e Söll D, Carbon source-dependent expansion of the genetic code in bacteria, in Proceedings of the National Academy of Sciences, vol. 109, n. 51, 2012, pp. 21070-21075, DOI:10.1073/pnas.1218613110, PMC 3529041, PMID 23185002.
- ^ Xie J e Schultz PG, Adding amino acids to the genetic repertoire, in Current Opinion in Chemical Biology, vol. 9, n. 6, dicembre 2005, pp. 548-54, DOI:10.1016/j.cbpa.2005.10.011, PMID 16260173.
- ^ Wang Q, Parrish AR e Wang L, Expanding the genetic code for biological studies, in Chem. Biol., vol. 16, n. 3, marzo 2009, pp. 323-36, DOI:10.1016/j.chembiol.2009.03.001, PMC 2696486, PMID 19318213.
- ^ Simon M, Emergent computation: emphasizing bioinformatics, New York, AIP Press/Springer Science+Business Media, 2005, pp. 105-106, ISBN 0-387-22046-1.
- Yarus M, Life from an RNA World: The Ancestor Within, Cambridge, Harvard University Press, 2010, p. 163, ISBN 0-674-05075-4.
- ^ Knight RD, Freeland SJ e Landweber LF, Selection, history and chemistry: the three faces of the genetic code, in Trends Biochem. Sci., vol. 24, n. 6, giugno 1999, pp. 241-7, DOI:10.1016/S0968-0004(99)01392-4, PMID 10366854.
- ^ Knight RD e Landweber LF, Rhyme or reason: RNA-arginine interactions and the genetic code, in Chem. Biol., vol. 5, n. 9, settembre 1998, pp. R215–20, DOI:10.1016/S1074-5521(98)90001-1, PMID 9751648.
- ^ Yarus M, Widmann JJ e Knight R, RNA-amino acid binding: a stereochemical era for the genetic code, in J. Mol. Evol., vol. 69, n. 5, novembre 2009, pp. 406-29, DOI:10.1007/s00239-009-9270-1, PMID 19795157.
- ^ Brooks DJ, Fresco JR, Lesk AM e Singh M, Evolution of amino acid frequencies in proteins over deep time: inferred order of introduction of amino acids into the genetic code, in Mol. Biol. Evol., vol. 19, n. 10, ottobre 2002, pp. 1645-55, DOI:10.1093/oxfordjournals.molbev.a003988, PMID 12270892.
- ^ Amirnovin R, An analysis of the metabolic theory of the origin of the genetic code, in J. Mol. Evol., vol. 44, n. 5, maggio 1997, pp. 473-6, DOI:10.1007/PL00006170, PMID 9115171.
- ^ Ronneberg TA, Landweber LF e Freeland SJ, Testing a biosynthetic theory of the genetic code: fact or artifact?, in Proc. Natl. Acad. Sci. U.S.A., vol. 97, n. 25, dicembre 2000, pp. 13690-5, Bibcode:2000PNAS...9713690R, DOI:10.1073/pnas.250403097, PMC 17637, PMID 11087835.
- Freeland SJ, Wu T e Keulmann N, The case for an error minimizing standard genetic code, in Orig Life Evol Biosph, vol. 33, 4–5, ottobre 2003, pp. 457-77, DOI:10.1023/A:1025771327614, PMID 14604186.
- ^ Baranov PV, Venin M e Provan G, Codon size reduction as the origin of the triplet genetic code, in Neil John (a cura di), PLoS ONE, vol. 4, n. 5, 2009, pp. e5708, Bibcode:2009PLoSO...4.5708B, DOI:10.1371/journal.pone.0005708, PMC 2682656, PMID 19479032.
- ^ Tlusty T, A model for the emergence of the genetic code as a transition in a noisy information channel, in J Theor Biol, vol. 249, n. 2, Nov 2007, pp. 331-42, DOI:10.1016/j.jtbi.2007.07.029, PMID 17826800.
- ^ Sonneborn TM, Evolving genes and proteins, a cura di Bryson, V. e Vogel, H., New York, Academic Press, 1965, pp. 377-397.
- ^ Tlusty T, Rate-distortion scenario for the emergence and evolution of noisy molecular codes, in Phys. Rev. Lett., vol. 100, n. 4, Feb 2008, p. 048101, Bibcode:2008PhRvL.100d8101T, DOI:10.1103/PhysRevLett.100.048101, PMID 18352335, arXiv:1007.4149.
- ^ Sella G e Ardell DH, The coevolution of genes and genetic codes: Crick's frozen accident revisited, in J. Mol. Evol., vol. 63, n. 3, Jul 2006, pp. 297-313, DOI:10.1007/s00239-004-0176-7, PMID 16838217.
- ^ Ribas de Pouplana L, Turner RJ, Steer BA e Schimmel P, Genetic code origins: tRNAs older than their synthetases?, in Proc. Natl. Acad. Sci. U.S.A., vol. 95, n. 19, settembre 1998, pp. 11295-300, Bibcode:1998PNAS...9511295D, DOI:10.1073/pnas.95.19.11295, PMC 21636, PMID 9736730.
- ^ Jee J, Sundstrom A, Massey SE e Mishra B, What can information-asymmetric games tell us about the context of Crick's "Frozen Accident?", in J R Soc Interface, vol. 10, n. 88, 2013, p. 20130614, DOI:10.1098/rsif.2013.0614, PMC 3785830, PMID 23985735.
- Freeland SJ e Hurst LD, The genetic code is one in a million, in J. Mol. Evol., vol. 47, n. 3, settembre 1998, pp. 238-48, DOI:10.1007/PL00006381, PMID 9732450.
- ^ Taylor FJ e Coates D, The code within the codons, in BioSystems, vol. 22, n. 3, 1989, pp. 177-87, DOI:10.1016/0303-2647(89)90059-2, PMID 2650752.
- ^ Di Giulio M, The extension reached by the minimization of the polarity distances during the evolution of the genetic code, in J. Mol. Evol., vol. 29, n. 4, ottobre 1989, pp. 288-93, DOI:10.1007/BF02103616, PMID 2514270.
- ^ Wong JT, Role of minimization of chemical distances between amino acids in the evolution of the genetic code, in Proc. Natl. Acad. Sci. U.S.A., vol. 77, n. 2, febbraio 1980, pp. 1083-6, Bibcode:1980PNAS...77.1083W, DOI:10.1073/pnas.77.2.1083, PMC 348428, PMID 6928661.
- ^ Erives A, A Model of Proto-Anti-Codon RNA Enzymes Requiring L-Amino Acid Homochirality, in J Molecular Evolution, vol. 73, 1–2, 2011, pp. 10-22, DOI:10.1007/s00239-011-9453-4, PMC 3223571, PMID 21779963.
Bibliografia
- (EN) Crick, Francis, Chapter 8: The genetic code, in What mad pursuit: a personal view of scientific discovery, New York, Basic Books, 1988, pp. 89-101, ISBN 0-465-09138-5.
- (EN) Anthony J. F. Griffiths, Jeffrey H. Miller, David T. Suzuki, Richard C. Lewontin e Gelbart (a cura di), Spontaneous mutations, in An Introduction to Genetic Analysis, 7th, New York, W. H. Freeman, 2000, ISBN 0-7167-3520-2.
- (EN) Pamela K. Mulligan, King, Robert C. e Stansfield, William D., A dictionary of genetics, Oxford [Oxfordshire], Oxford University Press, 2006, p. 608, ISBN 0-19-530761-5.
- (EN) Lewis, Ricki, Human Genetics: Concepts and Applications, 6th, Boston, Mass, McGraw Hill, 2005, pp. 227-228, ISBN 0-07-111156-5.
- (EN) Yang et al. (1990) in Michel-Beyerle, M. E., ed. Reaction centers of photosynthetic bacteria: Feldafing-II-Meeting 6. Berlin: Springer-Verlag. pp. 209–18. ISBN 3-540-53420-2.
- (EN) Watson JD, Baker TA, Bell SP, Gann A, Levine M e Oosick R., Molecular Biology of the Gene, San Francisco, Pearson/Benjamin Cummings, 2008, ISBN 0-8053-9592-X.
- (EN) Simon M, Emergent computation: emphasizing bioinformatics, New York, AIP Press/Springer Science+Business Media, 2005, pp. 105-106, ISBN 0-387-22046-1.
- (EN) Yarus M, Life from an RNA World: The Ancestor Within, Cambridge, Harvard University Press, 2010, p. 163, ISBN 0-674-05075-4.
- (EN) Crick, Francis, Chapter 8: The genetic code, in What mad pursuit: a personal view of scientific discovery, New York, Basic Books, 1988, pp. 89-101, ISBN 0-465-09138-5.
- (EN) Anthony J. F. Griffiths, Jeffrey H. Miller, David T. Suzuki, Richard C. Lewontin e Gelbart (a cura di), Spontaneous mutations, in An Introduction to Genetic Analysis, 7th, New York, W. H. Freeman, 2000, ISBN 0-7167-3520-2.
Voci correlate
Altri progetti
- Wikimedia Commons contiene immagini o altri file su codice genetico
Collegamenti esterni
- Online DNA → Convertitore on-line di sequenze di DNA in sequenze di amminoacidi, su geneseo.edu. URL consultato il 12 febbraio 2005 (archiviato dall'url originale il 12 febbraio 2005).
Controllo di autorità | LCCN (EN) sh85053852 · GND (DE) 4156624-5 · J9U (EN, HE) 987007562693305171 |
---|
wikipedia, wiki, libro, libri, biblioteca, articolo, lettura, download, scarica, gratuito, download gratuito, mp3, video, mp4, 3gp, jpg, jpeg, gif, png, immagine, musica, canzone, film, libro, gioco, giochi, mobile, telefono, Android, iOS, Apple, cellulare, Samsung, iPhone, Xiomi, Xiaomi, Redmi, Honor, Oppo, Nokia, Sonya, MI, PC, Web, computer