Polymerase chain reaction
La Polymerase chain reaction, PCR, è una metodologia, introdotta verso la metà degli anni Ottanta del secolo scorso, che permette l’amplificazione esponenziale di sequenze di DNA attraverso una reazione enzimatica ciclica in vitro che utilizza l’enzima DNA polimerasi (da cui il nome reazione a catena della polimerasi). Per una serie di sue caratteristiche quali la versatilità, la semplicità, la rapidità, l’economicità, la capacità di amplificare anche quantità minime di DNA (in linea di principio anche da una singola molecola) e anche a partire da preparazioni non particolarmente integre o pure, la PCR ha avuto un successo difficilmente sovrastimabile e ha trovato applicazioni in campi disparati. La PCR è utilizzata per la diagnostica molecolare, le biotecnologie legate alla biologia molecolare, la medicina forense, lo studio molecolare dell’evoluzione, lo studio dell’espressione genica, la dissezione molecolare delle interazioni tra DNA e proteine che regolano la trascrizione e altre ancora. Non sorprendentemente, il giro di affari legato all’utilizzo della PCR viene calcolato in miliardi di dollari e introducendo la parola PCR nel motore di ricerca di PubMed (il sito delle pubblicazioni scientifiche in medicina gestito dagli istituti nazionali della salute degli Stati Uniti) vengono richiamati più di 300.000 articoli. Ciò che è impressionante della PCR è la semplicità del suo principio, cosicché questa tecnica è un vero e proprio ‘uovo di Colombo’. Non a caso l’invenzione della PCR non è la conseguenza di approfonditi studi di un team di scienziati, ma, come raccontato dal suo inventore Kary B. Mullis nel suo discorso di accettazione del premio Nobel, deriva da un’idea venutagli in mente durante un viaggio notturno in auto tra le colline della California. È pur vero che la PCR nasce in quel periodo ricco di entusiasmi e di inventiva nel campo della biologia molecolare, quando si affacciavano sul mercato le prime compagnie biotecnologiche. Al tempo dell’invenzione della PCR, infatti, Mullis era impiegato presso la Cetus Corporation a Berkley, California.
Il principio della PCR si basa sul fatto che il DNA è composto di due filamenti complementari e che a ogni ciclo di sintesi da parte della DNA polimerasi si raddoppia il numero di copie di sequenza disponibili per il successivo ciclo di reazione. Di conseguenza, in condizioni ottimali, la quantità di DNA prodotto da una reazione di PCR è 2n volte la quantità iniziale dove n è il numero di cicli. In altre parole, dopo 30 cicli di PCR, che corrispondono in condizioni standard a meno di 2 ore di reazione, si è prodotta una quantità di DNA pari a circa 1 miliardo di volte la quantità iniziale. Se è vero che nelle sue condizioni più elementari la PCR richiede pochissima tecnologia, al limite solo tre bagnetti termostatati, è pur vero che la PCR è stata motivo di stimolo per innovazioni tecnologiche che vanno dalla produzione e purificazione di DNA polimerasi termostabili (con diverse caratteristiche di processività e fedeltà al disegno), alla produzione di termociclatori sempre più rapidi e precisi. La produzione di apparecchi per la PCR quantitativa (con la relativa messa a punto della tecnologia necessaria per la determinazione della sintesi dei prodotti di PCR in tempo reale), la messa a punto dei software utilizzati per il trattamento dei dati e la sintesi dei reagenti necessari rappresentano, al momento, la frontiera dell’innovazione tecnologica nel campo della PCR.
Sono frequenti le circostanze in cui, per determinati approcci sperimentali, può essere importante introdurre mutazioni in un gene e studiare le conseguenze funzionali di questa alterazione. Un esempio tipico è quello rappresentato dal tentativo di modificare la sequenza del DNA in modo tale da ottenere che la proteina da esso codificata abbia un amminoacido al posto di un altro. La PCR offre una maniera rapida ed efficace per una tale mutagenesi. Basterà amplificare la regione di DNA che interessa con due primer, uno dei quali contenga la mutazione desiderata. Naturalmente sarà necessario utilizzare condizioni di anealing che permettono l’appaiamento tra il primer, e il DNA bersaglio nonostante la piccola differenza tra le due sequenze. Alla fine della PCR il frammento amplificato conterrà la mutazione introdotta nella sequenza dell’oligonucleotide.
Il DNA fingerprinting (ovvero prendere le impronte digitali del DNA), chiamato anche AP-PCR (Arbitrary primed-PCR), è una tecnica pubblicata nel 1990, contemporaneamente da due gruppi di ricerca − John Welsh e Michael McClelland; John G. K. Williams, Anne R. Kubelik, Kenneth J. Livak, J. Antoni Rafalski e Scott V. Tingey − che permette di mettere in evidenza differenze tra due o più campioni di DNA. Questo metodo non richiede la conoscenza preliminare della sequenza di un bersaglio da amplificare, proprio perché fa uso di uno o più oligonucleotidi di sequenza arbitraria. Il metodo si basa sulla esecuzione di pochi cicli della PCR utilizzando una temperatura di anealing bassa, tipicamente 40 °C, seguiti da una PCR in condizioni standard. Se il campio-ne iniziale di DNA è sufficientemente complesso, cioè se contiene un gran numero di sequenze diverse, il primer troverà molti siti a cui legarsi durante i primi cicli a temperatura bassa, perché a 40 °C sono sufficienti una decina di basi di complementarità per un anealing efficiente. Alcune di queste sequenze saranno a distanza di qualche centinaio di basi tra loro, su eliche opposte del DNA e in direzione convergente, in altre parole soddisfano alle condizioni per essere amplificabili con efficienza in una PCR. Ne consegue che la Taq polimerasi, nei primi cicli a bassa temperatura, sintetizzerà un certo numero di mo-lecole che corrispondono a quelle porzioni del DNA nel campione di partenza comprese tra due regioni di relativa omologia con il primer arbitrario. Queste sequenze saranno poi amplificabili durante i cicli successivi, in condizioni standard di PCR, in quanto i frammenti prodotti nei primi cicli sono stati fatti allungando il primer e quindi ora hanno alle estremità una omologia al 100% con esso. È importante tenere presente che, col procedere della reazione di PCR, i diversi prodotti dell’amplificazione competono tra loro in quanto utilizzano gli stessi primer e quindi, tra tutte le sequenze inizialmente prodotte, ne verranno selezionate il sottoinsieme di quelle che si amplificano con maggiore efficienza. Alla fine i prodotti di reazione vengono separati tra loro con metodi standard che distinguono i frammenti di DNA a seconda della loro lunghezza (generalmente elettroforesi su gel di acrilammide o di agarosio). Il repertorio di bande che si ottiene è caratteristico del campione originale di DNA, perché differenze anche di un solo nucleotide possono distruggere o creare un bersaglio per il legame del primer e inserzioni e delezioni alterano la lunghezza dei prodotti di amplificazione e modificano la loro resa nella reazione. Il DNA fingerprinting, quindi, permette di determinare se e quanto due o più campioni differiscano tra loro. Nel lavoro originario di Welsh e McClelland, per esempio, venivano identificati ceppi diversi di stafilococco dimostrando il grande valore diagnostico della tecnica. Spesso il DNA fingerprinting è stato utilizzato per mettere in evidenza le differenze genomiche delle cellule tumorali rispetto alle cellule normali e, in particolare, la o l’aneuploidia che caratterizzano certe neoplasie. Probabilmente il risultato più importante dell’utilizzazione del DNA fingerprinting nel campo oncologico è stata la dimostrazione, nel 1993, da parte di Yurij Ionov, Miguel A. Peinado, Sergei Malkhosyan, Darryl K. Shibata e Manuel Perucho, del fatto che alcuni tumori, in particolare quelli del colon, presentano un (in inglese si dice che hanno un mutator phenotype), ipotesi avanzata quasi vent’anni prima da Lawrence A. Loeb, Clark F. Springgate e Narayana Battula. È interessante notare che una nuova metodologia, sempre basata sulla PCR, nel 2005 ha permesso allo stesso Loeb di dimostrare che in molti tumori la frequenza di (cioè mutazioni di una singola base) è di circa 200 volte superiore ai corrispettivi tessuti normali. Una naturale evoluzione del DNA fingerprinting è costituita dall’RNA fingerprinting, tecnica in cui a essere sottoposto ad amplificazione è un campione di DNA a singola elica (cDNA) ottenuto a partire dalla dell’RNA. Generalmente questa metodica è stata applicata per mettere in evidenza differenze nell’espressione genica in cellule dello stesso tipo, sottoposte a differenti trattamenti sperimentali. Tuttavia, negli anni più recenti l’RNA fingerprinting come tecnica per lo studio dell’espressione genica ha perso di popolarità a seguito dello sviluppo della tecnologia del DNA microarray che permette una determinazione quantitativamente più precisa, e, soprattutto, permette di misurare contemporaneamente i livelli di espressione di tutti i geni trascritti in una determinata cellula.
Uno dei principali svantaggi della PCR classica consiste nel fatto che male si presta a un’analisi quantitativa delle sequenze inizialmente presenti nel campione da esaminare. In effetti, la quantità di prodotto ottenuto in una reazione di PCR, dopo una crescita esponenziale, raggiunge un livello di saturazione che dipende essenzialmente dalla quantità dei primer e dei nucleotidi presenti nella reazione e non dal numero di copie di DNA bersaglio presente nel campione. Alcuni protocolli per un’analisi semiquantitativa sono stati messi a punto nel corso degli anni e si basano sull’esame dei prodotti dell’amplificazione durante la fase di crescita esponenziale. Tuttavia è difficile definire a priori un numero di cicli che sia sufficiente per produrre una quantità rilevabile di amplificato e, nello stesso tempo, non così grande da far sì che la reazione raggiunga la saturazione. Quindi, questi protocolli, in genere, richiedono prelievi a cicli diversi e, per aumentare la sensibilità con cui si rivela il prodotto di amplificazione, utilizzano nucleotidi radioattivi di cui si misura l’incorporazione nel DNA. Questi inconvenienti sono stati superati con la messa a punto di una procedura conosciuta con il nome di Real-time PCR (RT-PCR), ovvero PCR in tempo reale, che permette di monitorare ciclo per ciclo la sintesi di DNA durante la reazione di PCR. La RT-PCR si basa sul fatto che la quantità di prodotto formato viene misurata durante il processo di amplificazione utilizzando una molecola che cambia di fluorescenza proporzionatamente alla quantità di DNA a doppia elica che viene sintetizzato. Vi sono essenzialmente due tipi di indicatori fluorescenti che vengono utilizzati nella RT-PCR: quelli ‘non sequenza specifici’ e quelli ‘sequenza specifici’. I primi sono piccole molecole che cambiano di emissione quando si intercalano al DNA a doppia elica; i secondi sono oligonucleotidi complementari al DNA da amplificare, detti reporter. Questi si legano alle sequenze di DNA sintetizzato, in una regione diversa, da dove si legano i primer di amplificazione e quindi senza competere con questi ultimi. I reporter sono chimicamente modificati e hanno legato un fluoroforo che emette luce in maniera differente a seconda se il reporter è libero in soluzione o, viceversa, se è legato al DNA sintetizzato. I principali vantaggi dei reporter rispetto agli intercalanti, sono una maggior specificità e la possibilità di esaminare contemporaneamente, nella stessa reazione, più prodotti di amplificazione diversi utilizzando fluorofori che emettono a lunghezze d’onda differenti. I reporter, però, sono più costosi e richiedono la conoscenza della sequenza da amplificare anche nella regione interna rispetto ai primer. All’inizio di una reazione di RT-PCR lo strumento misura solamente un rumore di fondo, mano a mano che più molecole di DNA sono sintetizzate, la fluorescenza aumenta fino a superare un livello-soglia, dopo di che viene rilevata come un segnale che cresce esponenzialmente per un certo numero di cicli per poi andare in saturazione. Il ciclo di amplificazione in cui il segnale supera il livello-soglia (detto CT dall’inglese Treshold cycle) permette una misura comparativa del numero di copie iniziali di sequenza presenti nel campione. Infatti, consideriamo due sequenze, A e B, il cui numero di copie inizialmente presenti nel campione sono rispettivamente N0A e N0B,: quando entrambe hanno raggiunto il livello-soglia, si-gnifica che c’è la stessa quantità di prodotto amplificato per ciascuna di loro. Assumendo che la reazione di PCR avvenga in condizioni ottimali, per cui a ogni ciclo la quantità di DNA raddoppia, possiamo scrivere che il numero di molecole di A=B ovvero (N0A ×2CTA)=(N0B ×2CTB) dove N0A e N0B sono il numero di copie di cia-scuna sequenza inizialmente presenti nel campione. Da qui N0A/N0B = 2CTB−CTA, da cui si può calcolare la quantità relativa delle due sequenze misurando CTA e CTB. Con uno standard interno, quindi, si può misurare la quantità assoluta di una sequenza. Nella realtà, la PCR funziona con una efficienza minore del 100%, per cui la produzione di DNA non raddoppia esattamente a ogni ciclo. Dato che la reazione viene comunque monitorata ciclo per ciclo, è possibile determinare l’efficienza con cui il DNA viene copiato e apportare opportune correzioni ai calcoli. La RT-PCR è diventata in molti campi la metodologia principe per l’analisi quantitativa del DNA e per estensione dell’RNA dopo retrotrascrizione. La RT-PCR dopo retrotrascrizione viene spesso utilizzata per confermare dati ottenuti tramite DNA microarray, ma il suo impiego per determinare il profilo di espressione di tutti gli mRNA presenti in un tipo cellulare (gene profiling) è limitata dalla necessità di sintetizzare almeno una coppia di oligonucleotidi per ogni messaggero; ciò corrisponde, per una tipica cellula di animale superiore, a parecchie decine di migliaia di oligonucleotidi. In alternativa alla RT-PCR, per la misura quantitativa dell’mRNA espresso, esiste una seconda procedura basata anch’essa sulla PCR. Questa metodologia è stata identificata con la sigla SAGE (Serial analysis of gene expression), ovvero analisi seriale dell’espressione genica.
Si tratta di un metodo piuttosto laborioso di cui tralasceremo la spiegazione dettagliata. In breve, la procedura richiede: (a) di retrotrascrivere l’mRNA; (b) di isolare piccoli frammenti lunghi 10÷14 basi di cDNA provenienti dalla porzione 3′ delle varie molecole di mRNA (queste sequenze, dette tag, in generale sono in grado di identificare in maniera univoca l’mRNA da cui provengono; infatti, una specifica sequenza di 10 basi compare in teoria con una probabilità di (1/4)10 rendendo estremamente improbabile che due mRNA diversi abbiano lo stesso tag); (c) attraverso una serie di reazioni enzimatiche, tra cui essenziale è un’amplificazione tramite PCR, di concatenare diversi tag tra loro; (d) di clonare i tag concatenati e sequenziarli. Il livello di espressione di un mRNA viene calcolato contando la frequenza con cui il tag corrispondente viene trovato nel processo di sequenziato. Per avere un quadro affidabile del profilo di espressione, in media occorre sequenziare circa 50.000 tag: il che significa che per un mRNA re-lativamente raro, pari allo 0,01% del totale, si troverà il suo tag in media 5 volte. Sequenziare 50.000 tag corrisponde a sequenziare circa 500.000 basi; un compito che attualmente è possibile realizzare in pochi in giorni a un costo di circa 10.000÷20.000 € (sia il tempo ne-cessario sia la spesa sono destinati comunque a calare sostanzialmente nel prossimo futuro). Tutto considerato, SAGE e microarray si equivalgono come convenienza per esperimenti di gene profiling: se il primo richiede più lavoro presenta però il vantaggio di essere applicabile anche quando non è nota la sequenza degli RNA di cui si vuole esaminare il livello di espressione. È quindi possibile applicare la SAGE anche a organismi di cui non si sia sequenziato il genoma.
Nel corso degli ultimi anni si è andata sempre più affermando una tecnica chiamata immunoprecipitazione della o ChIP (Chromatin immunoprecipitation), che permette di studiare le interazioni tra proteine e DNA. Questa metodologia richiede l’utilizzo della PCR per l’analisi finale della sequenze di DNA cui risulta essere legata la proteina di interesse. Generalmente la ChIP viene adoperata nello studio dell’azione dei fattori di trascrizione in vivo. I fattori di trascrizione sono proteine che si legano a sequenze specifiche nelle regioni regolatrici dei geni e, reclutando la RNA polimerasi, regolano l’espressione genica. Mettendo insieme i dati di gene profiling e di interazione tra fattori di trascrizione e DNA, si è cominciato a comprendere meccanismi fondamentali che regolano l’espressione genica nella fisiologia e nelle patologie. In breve la ChIP richiede: (a) di utilizzare un reagente chimico, generalmente la formaldeide, per legare covalentemente al DNA proteine che stanno interagendo in modo reversibile con il DNA stesso; (b) di estrarre dalle cellule il DNA e frammentarlo in pezzi di circa un migliaio di basi (per fare ciò si usa generalmente una sonicazione); (c) di isolare i frammenti di DNA cui è legato il fattore trascrizionale di interesse utilizzando anticorpi specifici diretti contro di esso; (d) di revertire il legame covalente tra fattore di trascrizione e DNA e utilizzare la PCR per amplificare quest’ultimo. Da questa sommaria descrizione, si comprende come la ChIP permetta di ve-rificare o meno il legame di un fattore di trascrizione alle regioni regolatrici di un gene la cui sequenza è nota. Infatti, occorre avere a priori le informazioni necessarie per disegnare gli oligonucleotidi da utilizzarsi nella reazione di amplificazione con PCR. In questa versione della ChIP, quindi, non è possibile un’analisi globale, che prescinda da dati già noti, di tutte quelle sequenze cui un certo fattore di trascrizione si lega. Un’evoluzione recente della ChIP, chiamata, ChIP on chip, ovvia a questa limitazione del metodo. La ChIP on chip prevede l’analisi del DNA immunoprecipitato tramite microarray (detti anche DNA chip da cui il nome ChIP on chip). Generalmente la quantità di DNA che si ottiene dopo immunoprecipitazione è molto bassa, tipicamente qualche nanogrammo (mi-liardesimo di grammo). È quindi necessario amplificare i frammenti precipitati tramite PCR prima dell’analisi su microarray. Per fare ciò si ricorre all’artificio di legare oligonucleotidi a doppia elica alle estremità di frammenti di DNA immunoprecipitato utilizzando un enzima chiamato DNA ligasi. Si può procedere, quindi, alla PCR utilizzando primer complementari agli oligonucleotidi legati. Oltre che per lo studio globale delle sequenze legate a determinati fattori di trascrizione, la tecnica della ChIP on chip è attualmente molto utilizzata per lo studio dell’organizzazione della cromatina, ossia di quell’insieme di DNA genomico e proteine la cui funzione è di mantenere, in una forma compatta, il DNA all’interno del nucleo di una cellula. I principali componenti proteici della cromatina sono gli istoni, proteine cariche positivamente che interagiscono tramite un legame ionico con il DNA carico negativamente. L’interazione tra il DNA e gli istoni, modulando l’accessibilità del DNA ad altri fattori, regola processi fondamentali quali la trascrizione, la replicazione e il riparo di eventuali danni. A sua volta, la forza di interazione tra DNA e istoni è regolata da una serie di modificazioni postraduzionali quali fosforilazioni, metilazioni, acetilazioni e altre. Anche modificazioni chimiche dello stesso DNA, in primis la metilazione del nucleotide C, contribuiscono a modulare l’organizzazione della cromatina. Le modificazioni degli istoni e la metilazione del DNA – insieme ad altri vari meccanismi – contribuiscono a stabilire un che, senza modificare la sequenza del DNA, controlla come viene letta l’informazione genica. La cromatina, quindi, gioca un ruolo fondamentale nel differenziamento cellulare e non sorprendentemente risulta spesso alterata nelle neoplasie (in particolare, molti tumori hanno una diminuzione globale della metilazione in citosina, ma nel contempo un locale aumento di metilazione in particolari geni). Ultimamente sono stati sviluppati anticorpi specifici che riconoscono alcune delle modificazioni postraduzionali degli istoni e lo stato di metilazione del DNA permettendo un uso sistematico della ChIP on chip per lo studio della organizzazione globale della cromatina. Questi studi stanno portando preziose informazioni relative a problemi fondamentali della biologia cellulare quali staminalità, differenziamento e trasformazione.
Bielas 2006: Bielas, Jason H. e altri, Human cancers express a mutator phenotype, “Proceedings of the National Academy of Sciences USA”, 103, 2006, pp. 18238-18242.
Bielas, Loeb 2005: Bielas, Jason H. - Loeb, Lawrence A., Quantification of random genomic mutations, “Nature methods”, 4, 2005, pp. 285-290.
Feinberg 2006: Feinberg, Andrew - Ohlsson, Rolf - Henikoff, Steven, The epigenetic progenitor origin of human cancer, “Nature reviews. Genetics”, 7, 2006, pp. 21-33.
Higuchi 1992: Higuchi, Russell e altri, Simultaneous amplification and detection of specific DNA-sequences, “Bio/Technology”, 10, 1992, pp. 413-417.
Ionov 1993: Ionov, Yurij e altri, Ubiquitous somatic mutations in simple repeated sequences reveal a new mechanism for colonic carcinogenesis, “Nature”, 363, 1993, pp. 558-561.
Loeb 1974: Loeb, Lawrence A. e altri, Errors in DNA replication as a basis of malignant changes, “Cancer research”, 34, 1974, pp. 2311-2321.
Saiki 1985: Saiki, Randall K. e altri, Science enzymatic amplification of beta-globin genomic sequences and restriction site analysis for diagnosis of sickle cell anemia, “Science”, 230, 1985, pp. 1350-1354.
Saiki 1988: Saiki, Randall K. e altri, Primer-directed enzyma-tic amplification of DNA with a thermostable DNA polymerase, “Science”, 239, 1988, pp. 487-491.
Velculescu 1995: Velculescu, Victor E. e altri, Serial analysis of gene expression, “Science”, 270, 1995, pp. 484-487.
Welsh, McClelland 1990: Welsh, John - McClelland, Michael, Fingerprinting genomes using PCR with arbitrary primers, “Nucleic acids research”, 18, 1990, pp. 7213-7218.
Williams 1990: Williams, John G.K. e altri, DNA polymorphisms amplified by arbitrary primers are useful as genetic markers, “Nucleic acids research”, 18, 1990, pp. 6531-6535.