Unità ereditaria localizzata nei cromosomi, che attraverso l’interazione con ambiente interno ed esterno controlla lo sviluppo di un carattere o fenotipo. Può autoreplicarsi ed essere trasmesso ai discendenti. Il termine è stato introdotto nel 1909 dal botanico e genetista danese W.L. Johannsen.
Ogni g. controlla uno o più caratteri, come il colore degli occhi e dei capelli, la velocità di coagulazione del sangue ecc. Secondo la teoria classica del g., esso era considerato come un’unità strutturale, funzionale e di mutazione; da questa teoria conseguiva che due variazioni alleliche (cioè due forme diverse) dello stesso g. non potevano ricombinare tra loro. Alcuni esperimenti in Drosophila dimostrarono però che talvolta g. mutanti allelici davano luogo a ricombinazione. Negli anni tra il 1940 e il 1950 si osservò che molte mutazioni, alleliche in senso funzionale, non lo erano in senso strutturale. Il test per individuare questo tipo di alleli è quello del cis-trans effettuato da S. Benzer (1955) sui geni rIIA e rIIB del batteriofago T4. Egli provò che ciascun g. era composto da qualche centinaio di siti mutabili disposti linearmente e scambiabili per ricombinazione. L’unità funzionale definita da Benzer prende il nome di cistrone.
Contemporaneamente andavano sviluppandosi le ricerche sulla natura, la struttura e il funzionamento dei geni. Un immediato successo delle ricerche rivolte a questo scopo fu la scoperta da parte di O.T. Avery, A.D. Hershey e M. Chase di macromolecole presenti nei cromosomi che portavano l’informazione genetica: l’acido desossiribonucleico (DNA) e l’acido ribonucleico (RNA). Il successivo modello di struttura del DNA proposto da J.D. Watson e F.H.C. Crick (1953) definì il gene come unità chimica.
L’informazione genetica è scritta sul DNA secondo un codice a triplette basato sulla sequenza delle 4 basi (➔ codice). L’espressione del g. non avviene direttamente, ma attraverso un processo molecolare i cui punti fondamentali sono: trascrizione dell’informazione del DNA in una molecola di RNA nucleare; modificazione, negli eucarioti, di questi RNA nucleari (trascritti primari) in mRNA maturi, citoplasmatici; traduzione della sequenza nucleotidica degli mRNA nelle sequenze amminoacidiche delle proteine che essi codificano. Oltre alle sequenze di DNA che codificano la struttura primaria della proteina (e sono pertanto detti g. strutturali), esistono altre sequenze di DNA, dette g. regolatori, responsabili della regolazione dell’espressione dell’informazione contenuta nel g. strutturale. G. strutturali e g. regolatori costituiscono un insieme funzionale detto operone; i g. facenti parte di un operone sono situati sul cromosoma in posizioni distinte ma adiacenti.
Ricerche recenti hanno messo in luce che i g. posseggono alcune sequenze di basi in eccesso rispetto a quelle necessarie per codificare la struttura primaria delle proteine; tali sequenze si trovano sia a lato sia all’interno dei singoli geni strutturali e vengono trascritte nelle molecole di RNA nucleare precursore dell’RNA citoplasmatico maturo; in quest’ultimo le extrasequenze vengono rimosse con diverse modalità mediante un processo detto splicing. Il g. ha quindi struttura frazionata, composta da introni (le sequenze di DNA che si trovano tra le sequenze codificanti) ed esoni, che corrispondono alle sequenze di mRNA maturo.
Negli eucarioti sono presenti famiglie di geni. I g. che codificano gli istoni, per es., presentano sequenze pressoché identiche, sono disposti in tandem, in successione, nel cromosoma e funzionano simultaneamente. Altri g., come quelli che codificano le globine, sono simili, ma non identici, e funzionano in momenti diversi dello sviluppo. La globina embrionale è prodotta precocemente, seguita dalla sintesi di globina fetale, sostituita poi dalle globine dell’adulto dopo la nascita. I g. relativi sono attivati e disattivati singolarmente e sono disposti nel cromosoma nello stesso ordine in cui si esprimono durante lo sviluppo. Comprese nel gruppo vi sono alcune sequenze globinosimili non più funzionali chiamate pseudogeni. Esse rappresentano presumibilmente vestigia evolutive di g. un tempo funzionali.
Man mano che le ricerche proseguono si fanno sempre più ampie le conoscenze sugli elementi di controllo dei g.: nei batteri le sequenze di inserzione (IS) si inseriscono in alcuni loci del cromosoma provocando inattivazione dei g. o interferendo nella loro espressione. Sempre nei batteri sequenze di DNA più lunghe rispetto a quelle d’inserzione, dette trasposoni, sono portatrici dei g. per la resistenza ai farmaci e possono legare qualsiasi DNA non omologo.