codone
L’unità d’informazione del codice genetico costituita da una tripletta di nucleotidi adiacenti che codifica un amminoacido o che rappresenta un segnale di terminazione della traduzione. Ad ogni c. situato sull’RNA messaggero corrisponde un anticodone, una sequenza di tre basi consecutive presente in una molecola di RNA transfer (tRNA), che si appaia in modo specifico alla sequenza di un c. complementare e che consente l’inserimento di un relativo amminoacido, durante la sintesi proteica.
Ogni diverso tRNA trasporta un proprio amminoacido, legato covalentemente al suo braccio accettore. La specificità necessaria per l’interpretazione del codice genetico deriva dall’appaiamento corretto fra c. e anticodone: perché un amminoacido sia inserito nella catena polipeptidica in crescita, il corrispondente c. nella molecola dell’mRNA deve essere riconosciuto attraverso l’appaiamento di basi con l’anticodone complementare su un’appropriata molecola di tRNA. A causa della degenerazione del codice genetico (➔), un anticodone può riconoscere più c. in quanto, secondo la ‘teoria del vacillamento’, una volta appaiate correttamente le prime due coppie di basi, la terza (estremità 5′) può appaiarsi con quasi tutte le basi in posizione 3′ del codone. La sequenza nucleotidica dell’mRNA viene decifrata a partire da un sito di inizio della traduzione, di solito caratterizzato dalla sequenza AUG, che specifica per l’amminoacido metionina. Il processo continua decodificando in successione i c. che specificano i singoli amminoacidi, detti anche c. di senso, finché nello schema di lettura non viene raggiunto un c. di terminazione UAG, UAA o UGA, che indica la terminazione di un polipeptide e viene anche detto c. non senso.
In linea di principio, una sequenza nucleotidica di mRNA può essere tradotta in ognuno dei tre possibili schemi di lettura (open reading frame) che derivano dal diverso punto di inizio del processo di decodificazione; tranne per rare eccezioni, solo uno dei tre possibili schemi di lettura codifica la proteina richiesta, secondo un sistema di segnali che definiscono il corretto open reading frame all’inizio della sintesi proteica. Nei batteri e nei virus si verifica di frequente che una data sequenza di DNA sia multifunzionale, cioè che possano coesistere sulla stessa sequenza più messaggi, che vengono letti mediante uno spostamento del modulo di lettura dei c.; un gene può quindi venire a trovarsi in parte o completamente all’interno della sequenza che specifica un altro gene. Questo meccanismo sembra essere il risultato evolutivo della necessità dei Procarioti di sfruttare al massimo il contenuto informativo del genoma. Occasionalmente negli Eucarioti si possono trovare geni sovrapposti, per la traduzione dei quali vengono utilizzate fasi di lettura differenti. Il recente sequenziamento completo di molti genomi, compreso quello umano, consente la ricerca sistematica degli open reading frame con metodi informatici. Si è potuto osservare che anche nei mammiferi esistono geni la cui trascrizione è sovrapposta.