Genetica delle popolazioni umane
La genetica delle popolazioni si occupa di come le leggi di Mendel e gli altri principi della genetica si applichino a intere popolazioni di organismi interfecondi. Per lo studio delle popolazioni naturali essa consiste nell'analisi del fenomeno del polimorfismo genetico (presenza di più forme alleliche in una stessa posizione del genoma o locus genetico), che è alla base della biodiversità genetica spontaneamente presente in pressoché tutte le specie. Per quanto riguarda la specie umana, fra gli oggetti di studio di questa disciplina vi è quello delle popolazioni contemporanee su diversa scala, dalle piccole tribù a interi gruppi continentali, lo studio delle affinità genetiche fra gruppi, e i motivi delle differenze nell'incidenza di malattie ereditarie e di altri caratteri. Soltanto recentemente sono stati eseguiti studi su reperti archeologici e siti cimiteriali che hanno prodotto dati sperimentali relativi a popolazioni del passato, incluso l'uomo di Neanderthal.
Gli studi popolazionistici in genetica umana risalgono al 1918, con la descrizione della eterogeneità della frequenza dei gruppi sanguigni ABO. Successivamente, il contributo offerto alla genetica di popolazioni in generale è stato notevole: dalla descrizione dei primi esempi convincenti di polimorfismi bilanciati (a partire dal 1948), alla possibilità di individuare numerosi loci polimorfici mediante tecniche elettroforetiche e immunologiche (anni 1950-1970), all'inizio delle caratterizzazioni genetiche mirate direttamente al DNA (a partire dal 1980), fino alla determinazione della sequenza dell'intero genoma umano (2001) e all'avvio della catalogazione dei suoi punti di variazione interindividuale (2002-2005). Gli aspetti principali della g. delle p. u. sono tre: quello descrittivo, quello interpretativo e, infine, quello applicativo. Parallelamente si è andato sviluppando un imponente impianto teorico che si è avvalso degli avanzamenti della genetica generale, della biologia molecolare e della genetica delle popolazioni di altre specie. I dati e le elaborazioni relative alla specie umana hanno così portato contributi sostanziali alla conoscenza di fenomeni a livello di popolazione di validità generale.
In virtù del fatto che si occupa delle proprietà genetiche e della loro trasmissione in gruppi di individui, la g. delle p. u., e più in generale la genetica delle popolazioni, è la disciplina che per eccellenza osserva e analizza i cambiamenti elementari alla base del processo di evoluzione. In g. delle p. u. l'insieme dei genomi di individui fra loro interfecondi a diversi livelli di raggruppamento (per es., comunità locali, popolazioni regionali, popolazioni continentali, intera specie) costituisce un pool genetico (insieme di geni) all'interno del quale è presente una notevole quota di variabilità genetica, a causa dell'esistenza di forme varianti (alleliche) in pressoché ogni tratto di DNA (e quindi anche nei geni) e perfino di piccole variazioni strutturali. In questo quadro l'evoluzione viene considerata un processo interamente variazionale in base al quale non si verifica una graduale trasformazione del singolo da una condizione a un'altra (come nel concetto di evoluzione trasformazionale), bensì si modifica la composizione del gruppo a cui la sua discendenza appartiene, e quindi la composizione del pool genetico attraverso le generazioni. Sono quindi i fenomeni a livello di popolazione che costituiscono i cambiamenti elementari alla base della diversificazione fra gruppi ed è la progressiva diversificazione che può condurre, insieme ad altri fattori di tipo geografico, comportamentale, sociale ecc., a un isolamento riproduttivo di grado variabile.
Fra i più rilevanti avanzamenti teorici recenti in g. delle p. u. vi è il concetto di coalescenza, che si applica a ogni gene o, per estensione, a ogni tratto di DNA in cui l'impatto della ricombinazione può essere considerato trascurabile. La teoria della coalescenza discende dalla considerazione che, delle 2n copie geniche presenti fra gli n individui della popolazione, alcune non saranno ulteriormente trasmesse alle generazioni successive, per es., perché alcuni dei soggetti che ne sono portatori non hanno figli. Il risultato di questa estinzione di linee di discendenza, ripetuta per un certo numero di generazioni, consiste nel fatto che alla fine tutte le copie presenti saranno discendenti di uno solo fra gli esemplari ancestrali, indicato come antenato comune più recente o MRCA (Most Recent Common Ancestor). Durante tale processo solo il fenomeno della mutazione può generare nuove forme alleliche, contribuendo così a ripristinare la variabilità perduta. La teoria della coalescenza analizza il processo partendo dalla variabilità osservata nel presente fino a risalire al MRCA. Essa consente di calcolare, fra l'altro, l'attesa statistica del tempo necessario al completamento del processo, e della ripartizione delle diverse varianti in gruppi di individui i quali si sono separati nel corso del processo. Essa ha pertanto aperto due interessanti prospettive. La prima è quella di poter ottenere 'datazioni genetiche', ossia stime dell'antichità di alcune varianti genetiche che possono trovarsi in alcune popolazioni ma non in altre; ciò è di grandissima utilità, per es., per raffronti con dati di tipo etnografico, ecologico o archeologico, al fine di ricostruire la storia delle popolazioni umane. La seconda è quella di poter tenere in debito conto la 'storia demografica', in base alla quale alcune popolazioni sono andate incontro a diminuzione numerica nel passato, mentre altre hanno subito aumenti numerici che le hanno portate a conquistare nuove aree geografiche eventualmente scalzando o assorbendo le popolazioni preesistenti. Sono state così ottenute stime riguardo a fenomeni di questo tipo su diverse scale temporali, dalle valutazioni della popolazione che partecipò alla migrazione Out of Africa (v. oltre) e dell'aumento della numerosità associato alla transizione dalla caccia-raccolta all'agricoltura, alla ricostruzione delle affinità in linea maschile all'interno dei Cohanim Askenaziti o fra i discendenti del clan di Gengis Khan.
Questo metodo segue la 'genealogia del gene', vale a dire che analizza le modificazioni subite da uno stesso segmento di DNA durante le numerose generazioni in cui esso è stato replicato e trasmesso nei gruppi che ne sono portatori. È implicito nella teoria che ogni singolo segmento segua una diversa realizzazione del percorso evolutivo, abbia cioè un diverso MRCA che si colloca in un diverso momento del passato. Ciò equivale ad affermare che il pool genetico di un gruppo di individui è composto da geni che provengono da numerosi ascendenti differenti e hanno quindi risentito di proprie dinamiche demografiche ed eventualmente di propri vantaggi o svantaggi a causa della selezione naturale. Queste considerazioni hanno condotto quindi allo sviluppo della cosiddetta genomica di popolazione in cui si prospetta un confronto fra popolazioni esteso all'intero genoma al fine di ricostruire tali particolarità.
Fino alla metà degli anni Novanta del secolo scorso gli studi sulla variabilità genetica nelle popolazioni di tutti i continenti hanno preso in esame prevalentemente marcatori genetici polimorfici di tipo proteico oppure immunologico. I dati, che sono stati elaborati con metodiche volte a evidenziare le tendenze generali della variabilità, mostrano un andamento lungo la direttrice sudovest-nordest nel vecchio mondo (dall'Africa alla Beringia), nord-sud nelle Americhe, e un quadro molto distintivo in Australia e Nuova Guinea. Un impulso ulteriore è stato offerto inoltre dalla possibilità di analizzare variazioni polimorfiche direttamente nel DNA. La loro individuazione è stata sistematizzata con la creazione di una banca dati che si propone di effettuare la catalogazione di tutti i polimorfismi per singola sostituzione nucleotidica (SNP, Single Nucleotide Polymorphism) del genoma umano. Nel 2005 il progetto internazionale HapMap ha portato a termine la tipizzazione di più di un milione di questi in 4 gruppi di individui in rappresentanza di Africa, Europa e Asia.
L'analisi diretta del DNA introduce due importanti informazioni supplementari. La prima riguarda lo stato ancestrale (plesiomorfo) o lo stato derivato (apomorfo) delle diverse forme alleliche per ogni posizione polimorfica. Tali stati vengono generalmente determinati per comparazione (normalmente con lo scimpanzé): se questa specie condivide uno degli alleli polimorfici umani, si può concludere che questo sia stato l'allele ancestrale umano e che gli altri siano alleli derivati. Ciò offre la possibilità di considerare le distribuzioni spaziali della variabilità tenendo conto della direzionalità della/e mutazione/i alla base del polimorfismo. La seconda informazione di notevole importanza è quella riguardante la grande quota di variabilità che risiede nelle porzioni del DNA le quali non hanno un corrispettivo in modificazioni proteiche. Peraltro, la teoria dell'evoluzione neutrale (v. evoluzione) permette di prevedere la dinamica delle variazioni di questo tipo nel tempo, poiché questa dinamica non risente del vantaggio o dello svantaggio degli individuiche sono portatori delle diverse forme alleliche, bensì è determinata dalla casualità della trasmissione ereditaria, cioè un fenomeno che ha un comportamento medio prevedibile.
In virtù di queste stesse considerazioni, gli studi che hanno utilizzato la variabilità del DNA hanno permesso di giungere a una valutazione assai più obiettiva, rispetto al passato, delle quote di variabilità intra- e interpopolazione, in quanto queste possono essere valutate in porzioni rappresentative dell'intero genoma, incluse quelle la cui diversificazione non è stata indotta dalle necessità di adattamento ai diversi ambienti. La prima misura il grado di diversità genetica fra individui della stessa popolazione, la seconda misura il contributo ulteriore che si ottiene confrontando individui di popolazioni diverse. Le conclusioni di studi in questo campo, che hanno interessato popolazioni di tutti i continenti, possono essere così riassunte: a) la variabilità intrapopolazione rappresenta la quota di gran lunga preponderante dell'intera variabilità genetica umana; b) considerando porzioni del DNA rappresentative di tutto il genoma la stima della variabilità interpopolazione subisce un'ulteriore diminuzione rispetto ai valori precedenti, attestandosi attorno a pochi punti percentuali del totale.
Attualmente questi risultati costituiscono il dato più conclusivo, fra quelli scientificamente fondati, a sostegno dell'impossibilità di riconoscere, nella specie Homo sapiens, raggruppamenti aventi il valore tassonomico di razza. Tale conclusione non deve tuttavia essere intesa come assenza di identificabilità. Studi mirati e i notevoli sviluppi in ambito forense (v. oltre) dimostrano infatti che la tipizzazione estesa a numerosi punti di variazione nel DNA permette di rivelare con buon grado di approssimazione l'appartenenza di un individuo a una popolazione con origine geografica in un determinato continente o, in alcuni casi, anche in una regione più limitata. Ciò è legato all'esistenza di combinazioni genotipiche peculiari che, in alcuni casi, risultano estremamente diagnostiche. Esse permettono di riconoscere che gli individui di un gruppo condividono un antenato comune esistito in un passato relativamente recente, il quale era già portatore della variante in questione e, limitatamente alla porzione del DNA in cui la variante risiede, può essere considerato 'fondatore' di quel gruppo.
Tale fenomeno si è rivelato essere relativamente comune e si ritiene che esso rifletta il fatto che popolazioni oppure frammenti di popolazioni socialmente o culturalmente distinti siano stati effettivamente fondati a partire da un esiguo numero di individui e successivamente siano rimasti in condizioni di isolamento. In questo contesto il ruolo sociale dei fondatori, soprattutto se di sesso maschile, assume una rilevanza particolare. Sono infatti documentati casi di singoli maschi di rango elevato che hanno avuto un numero molto alto di discendenti i quali, assumendo a loro volta posizioni di rango elevato, hanno ulteriormente diffuso i propri geni. Non è quindi sorprendente che le tracce genetiche di questi fenomeni si riscontrino nei quadri di variazione del cromosoma Y, ossia dell'unica porzione del genoma trasmessa per via esclusivamente paterna. Esempi macroscopici giungono dallo studio di popolazioni asiatiche, ove sono rilevabili tracce genetiche delle conquiste mongole e della dinastia Qing.
Per quanto riguarda le interpretazioni offerte dalla g. delle p. u. circa le modalità con cui la variabilità genetica su scala globale è venuta ad assumere il quadro odierno, queste riguardano fenomeni di tipo storico contingente e fenomeni di tipo funzionale e sistematico. Tra i fenomeni del primo tipo rientrano le migrazioni spontanee o forzose che sono indotte da necessità ecologiche o da spinte etnico-culturali, le fluttuazioni nella numerosità della popolazione (per es., a causa di carestie, epidemie o conflitti) con il conseguente aumento dell'importanza delle oscillazioni casuali nella composizione del pool genetico, il mescolamento fra popolazioni differenziate, i fenomeni di fondazione a partire da pochi individui. Tra i fenomeni del secondo tipo rientrano gli specifici adattamenti a fattori quali condizioni climatiche, carenze alimentari o specifici composti assunti con l'alimentazione (per es., latte fresco), fattori patogeni di tipo biologico e non. È qui da tener presente che, a priori, ogni popolazione è ed è stata soggetta a fenomeni di entrambi i tipi e, dato un certo insieme di dati genetici, è di frequente difficile ricostruire quale delle due categorie di fenomeni abbia avuto un ruolo predominanterispetto all'altra. La questione ripropone, a un livello microevolutivo, il dualismo fra evoluzione neutrale ed evoluzione darwiniana (v. evoluzione).
Le regioni del genoma finora più studiate, vale a dire il DNA mitocondriale e il cromosoma Y, forniscono uno schema di riferimento comune. I dati accumulati, compreso il confronto con specie affini, concordano nell'indicare che in ambedue i casi le forme molecolari varianti ricadono in due raggruppamenti, che si distinguono per un alto grado di diversificazione, e il cui MRCA può essere collocato approssimativamente a 200.000 anni fa per il DNA mitocondriale e a 100.000 per il cromosoma Y. In entrambi i casi i varianti di uno di questi raggruppamenti sono confinati in Africa, mentre i varianti dell'altro sono presenti in Africa e anche negli altri continenti. Tali risultati hanno condotto al cosiddetto modello Out of Africa per la dispersione dell'uomo anatomicamente moderno. Secondo questo modello vi sono stati uno o più episodi di migrazione dall'Africa all'Asia (e da qui agli altri continenti) a opera di popolazioni che portavano con sé solo un sottoinsieme della diversità già presente in Africa in quel momento. L'origine di queste popolazioni è collocata nel settore centro-orientale del continente africano.
All'interno di questo modello sono ampiamente dibattuti alcuni dettagli, che riguardano le quote di diversità trasferite fuori dall'Africa e, successivamente, dall'Asia nelle diverse direzioni (verso l'Europa, l'Oceania e le Americhe), la quota di nuova diversità prodottasi successivamente al primo popolamento dell'Eurasia, il numero di episodi migratori soprattutto nei tratti Africa-Asia e Asia-America, le rotte migratorie soprattutto internamente all'Asia e dall'Asia all'Europa, e i tempi delle diverse colonizzazioni. Questo modello fornisce di conseguenza un'interpretazione per il primo popolamento dei continenti extra africani. Lo stesso insieme dei dati indica, inoltre, che importanti fenomeni migratori e demografici hanno contribuito a rimodellare la distribuzione geografica della variabilità genetica in periodi successivi. Si ritiene che i più rilevanti fra questi siano stati i fenomeni indotti dall'acquisizione delle diverse forme di agricoltura, che ha consentito un notevolissimo aumento della densità demografica.
Il modello suddetto costituisce quindi il quadro di riferimento contro cui confrontare la distribuzione della diversità per ogni singola porzione del resto del genoma. Infatti, porzioni con un quadro di variabilità particolare possono dare indicazioni sulle particolari condizioni di selezione naturale o storia demografica che lo hanno prodotto, eventualmente rivelando lo specifico valore adattativo di alcune varianti. In questo contesto si inseriscono le interpretazioni circa il contributo dato dalla variabilità genetica alla comparsa di patologie che contribuiscono notevolmente alla morbilità e alla mortalità generale, soprattutto nei Paesi sviluppati. Tali patologie, che hanno indiscutibilmente una componente ereditaria, vengono considerate in GdPU come caratteri multifattoriali, ossia che ricevono un contributo da varianti a più loci genetici nonché da molteplici fattori ambientali. La quantificazione del contributo di ciascun variante a questi caratteri, e quindi la determinazione del rischio associato, sono di dominio esclusivo della g. delle p. u., in quanto possono essere determinati solo a livello di popolazione, per es., mediante confronti casi-controlli. Sono in corso numerose ricerche tese a identificare i loci implicati nei diversi caratteri multifattoriali, molte delle quali si avvalgono di SNP e dei risultati del progetto HapMap.
Secondo la ben accreditata ipotesi CD/CV (common disease/common variant), per ognuna di queste patologie il numero dei loci implicati sarebbe molto grande, i varianti comuni e l'effetto di ciascun variante molto lieve. Ciascun individuo sarebbe quindi portatore di varianti le quali agiscono da fattori di predisposizione, e che porterebbero alla manifestazione della malattia soltanto nel caso in cui il loro numero sia grande e l'accumulo dei loro effetti superi una determinata soglia. Anche in questo caso l'alta frequenza di ciascun variante predisponente all'interno della popolazione è spiegabile in base alle due modalità di evoluzione neutrale ed evoluzione darwiniana. La prima è giustificata dal fatto che, individualmente, ciascun variante ha un effetto pressoché trascurabile tanto sulla sopravvivenza quanto sul successo riproduttivo dell'individuo. Nel secondo caso, invece, appare necessario ammettere che un determinato variante eserciti effetti multipli (pleiotropismo), risultando predisponente per una data malattia ma vantaggioso per altri aspetti della vita dell'individuo, e abbia raggiunto delle frequenze apprezzabili nella popolazione come conseguenza di quest'ultimo vantaggio. Ancora in questo secondo caso rientra inoltre la possibilità che tale selezione a favore si sia esplicata nel passato, quando le condizioni, soprattutto quelle nutrizionali, erano molto differenti. Secondo l'ipotesi del genotipo thrifty (morigerato) molti varianti sarebbero stati selezionati positivamente in quanto favorivano lo sfruttamento ottimale delle poche risorse disponibili. Con l'enorme aumento dall'apporto calorico, tipico soprattutto delle società moderne, tali varianti avrebbero ora effetti negativi.
Sono incluse fra le varianti pleiotropiche quelle che determinano malattie mendeliane (vale a dire con contributo pressoché totale di un singolo locus), ma determinano resistenza, almeno parziale, a patologie di altro tipo. I casi maggiormente documentati riguardano varianti che in alcuni assetti genotipici portano alla comparsa di patologie assai gravi, che spesso determinano alta mortalità nel periodo preriproduttivo, ma che in altri assetti conferiscono resistenza totale oppure parziale alle differenti forme di malaria. Queste varianti raggiungono notevoli frequenze nelle regioni ove la malaria è oppure è stata endemica poiché, in virtù dei loro opposti effetti in queste condizioni, si diffondono nella popolazione come polimorfismi bilanciati. Successivamente permangono anche dopo l'eradicazione della malaria. I motivi della loro esistenza furono ipotizzati per la prima volta allo scopo di spiegare l'altissima similitudine fra le loro distribuzioni geografiche e quella della endemia malarica, e successivamente convalidati sperimentalmente. Nel corso degli anni l'elenco dei geni per i quali è stato ipotizzato un meccanismo simile in risposta ad altre patologie (tubercolosi) si è notevolmente espanso. Si ritiene che nel nostro Paese le alte frequenze (soprattutto in Sardegna, nel Ferrarese e in alcune zone del Meridione) di un insieme di forme alleliche che determina anemia mediterranea e favismo siano da attribuire a questi meccanismi.
La g. delle p. u. è stata e promette ancora di essere di grande aiuto anche nell'identificazione di geni responsabili di malattie genetiche mendeliane. Il metodo seguito in questo caso è quello dello studio degli isolati genetici, cioè gruppi di individui che per motivi geografici, culturali o religiosi hanno praticato per lungo tempo l'endogamia, o riproduzione fra membri interni al gruppo. Questo limitato o assente flusso genico con popolazioni esterne consente l'accumulo di forme alleliche deleterie, spesso recessive. Poiché in questo caso specifico le diverse copie di ciascun allele deleterio sono uguali per discesa, esse condivideranno anche tutte le variazioni del DNA entro una certa distanza (fenomeno del linkage disequilibrium). L'identificazione di queste regioni di alta similitudine in isolati genetici è un utile indizio, in aggiunta alle classiche analisi di associazione, per delimitare la porzione del genoma candidata a contenere il gene responsabile del carattere. Fra gli isolati oggetti di studi di questo tipo ricordiamo quelli della Sardegna e della Finlandia.
La g. delle p. u. ha prodotto anche dati estremamente importanti in farmacogenetica, a proposito della refrattarietà, eccessiva risposta o reazione avversa ad alcuni farmaci su base genetica. È stato infatti abbondantemente documentato che differenze interindividuali in particolari loci genetici determinano capacità diverse di metabolizzare composti attivi particolari o intere classi chimiche di composti attivi. A queste si aggiungono, in numerosi casi, notevoli differenze interpopolazione. Fra gli obiettivi di questo tipo di studi rientra il riconoscimento di particolari popolazioni a rischio e la definizione di terapie e dosaggi più idonei al particolare genotipo. È importante notare che molti degli stessi geni partecipano al metabolismo, oltreché dei farmaci, di sostanze tossiche prodotte naturalmente nell'organismo o con cui esso viene a contatto. Questi geni contribuiscono così alla diversità (intra- e interpopolazione) nella comparsa di patologie che sono legate all'azione di tali sostanze, rientrando quindi tra i fattori di predisposizione a caratteri multifattoriali (v. sopra).
Un ultimo aspetto applicativo assai rilevante della g. delle p. u. è quello legato alla genetica forense. Infatti, la probabilità con cui un dato campione di DNA può essere assegnato a un preciso individuo, o a una particolare popolazione, o la probabilità di accertamento o esclusione della paternità crescono al crescere del grado di polimorfismo dei loci genetici analizzati e all'aumentare della diversificazione delle loro frequenze fra le varie popolazioni. Sono state quindi istituite banche di dati orientate alla raccolta di dati genetici specifici per gruppi catalogati per provenienza geografica, appartenenza etnica o nazionale ecc., da utilizzarsi in questo ambito, ma che si sono rivelate estremamente utili anche per una descrizione particolareggiata della diversità genetica e per la ricostruzione dei fenomeni che ne sono stati alla base.
bibliografia
L.L. Cavalli-Sforza, P. Menozzi, A. Piazza, Storia e geografia dei geni umani, Milano 2000.
N.A. Rosenberg, J.K. Pritchard, J.L. Weber et al., Genetic structure of human populations, in Science, 2002, 298, pp. 2381-85.
L.L. Cavalli-Sforza, M.W. Feldman, The application of molecular genetic approaches to the study of human evolution, in Nature genetics, 2003, 266, pp. 266-75.
M.A. Jobling, M.E. Hurles, C. Tyler-Smith, Human evolutionary genetics: origins, peoples & disease, New York 2003.
The International HapMap Consortium, A haplotype map of the human genome, in Nature, 2005, 437, pp. 1299-320.
Si possono inoltre consultare i seguenti siti web: http://alfred.med.yale.edu/; http://hpgl.stanford.edu/; http://www.hapmap.org/; http://www.ncbi.nlm.nih.gov/SNP; http://www.ystr.org/.