Il
Progetto Genoma Umano
u
Cos'è il Genoma?
Il
Genoma è il
manuale per la costruzione di ogni organismo vivente, sia esso piccolo
come un virus o complesso come l'uomo. E' evidente che ognuno di noi
vorrebbe conoscere le istruzioni con cui il suo organismo è costruito. Ma
per secoli questo obiettivo ci è stato precluso dalla nostra profonda
ignoranza: non sapevamo neanche dove dovessimo cercarlo. Negli ultimi 50
anni tuttavia le nostre conoscenze sulla genetica si sono ampliate fino a
comprendere che la base dell'ereditarietà coincideva con la base del
funzionamento del nostro stesso organismo: oggi sappiamo che il DNA è la sede di tutte le istruzioni necessarie per il funzionamento di ogni
organismo e che sono solamente queste complesse istruzioni che vengono
tramandate di padre in figlio (in senso lato: da ogni vivente ad altri
viventi da lui generati).
Fino a metà degli anni Ottanta l'idea di conoscere nei dettagli queste
istruzioni per la specie umana sembrava estremamente remota. Il problema
non era teorico, ma solamente pratico (tecnico). Le istruzioni sono
contenute in una serie di tre miliardi di molecole che ad ogni effetto
possono rappresentare tre miliardi di lettere, che potrebbero essere
contenute in 1 milione di pagine da tremila.
Il termine sequenza indica appunto la serie di caratteri uno dopo l'altro.
In una pagina di un libro, i caratteri formano una sequenza, che consente
di formare parole, frasi, paragrafi, capitoli e così via. Qualcosa di
simile avviene anche nel DNA, dove troviamo una serie di
nucleotidi
(o basi), che può formare delle frasi, o per meglio dire, trasmettere
delle istruzioni.
Il problema era tuttavia ricostruire questo libro con 3 miliardi di
caratteri. Purtroppo per questioni tecniche, la situazione per il
genetista che voleva sequenziare il genoma umano era paragonabile a un
archeologo che avesse qualche migliaia di poemi come l'Iliade o l'Odissea
a pezzettini di 300 lettere e dovesse ricostruirli tutti sistemando un
pezzettino di fianco al suo successivo.
u
Le difficoltà della ricostruzione delle "pagine"
Il genoma
Vediamo di comprendere il perchè di questa situazione. Verso la fine degli
anni Settanta erano stati messi a punto metodi che consentivano di leggere
pezzi di DNA di circa 300 basi. Tuttavia questi pezzettini non erano in
fila uno dopo l'altro nell'ordine in cui si trovano nel libro. Erano
sparsi qua e là. Al ricercatore rimanevano due vie: o cominciare da un
pezzettino e cercare quello che veniva dopo, oppure tirare su dei pezzi a
caso e sperare che ad un certo punto questi cominciassero ad andare a
posto da soli, sfruttando il fatto che due pezzi prelevati dalla stessa
regione della sequenza possono essere in parte sovrapposti e avere delle
parole in comune.
Essendo il genoma umano di 3 × 109 basi,
sarebbero necessarie 107 sequenze
di 3 × 102 basi
per avere tutto il genoma. In realtà ne sono necessarie molte di più,
perchè le sequenze devono sovrapporsi tra loro. Tuttavia il processo di
trovare ogni volta quella che viene subito dopo è estremamente lungo e
faticoso. Pertanto l'idea di scegliere il secondo approccio, quello di
sequenziare i pezzettini a caso, poteva sembrare attraente. Ma allora il
numero di sequenze da effettuare diventa altissimo, perchè la probabilità
di pescare cloni identici o simili diventa elevata: è quello che succede
ai bambini quando, arrivati al 60-70% dei loro album di figurine, si
accorgono che cominciano a pescare soprattutto figurine doppie (e non c'è
nessuno con cui scambiarle). Inoltre, alcune figurine potrebbero essere
rarissime o addirittura non essere state messe in commercio, e quindi
avremo difficoltà a trovarle. Ma vi è poi un'altra difficoltà: come in un
poema, o in un manuale, alcune frasi potrebbero essere così simili o
identiche da non potersi stabilire dove effettivamente stiano.
Nell'Odissea ad esempio troviamo spesso la descrizione del sorgere
dell'Aurora (rwdodaktulos
eos),
e se troviamo un pezzo che comincia o finisce con questa frase, non
sapremmo come collegarla con le altre: e questo purtroppo si verifica
spesso nel genoma umano, a causa della presenza di quelle che vengono
chiamate "sequenze
ripetute"
che sono presenti anche in milioni di copie (magari non identiche, ma
estremamente simili e spesso consecutive). Pertanto, quando ci si imbatte
in una di queste sequenze, può succedere che non si riesca a capire in
quale punto del genoma esse siamo veramente.
u
I due approcci
Craig Venter
Il genoma umano, come quello di quasi tutti i vertebrati, è un genoma
complesso dell'ordine di qualche miliardo di nucleotidi. Tuttavia vi sono
genomi più semplici. I virus ad esempio possono essere anche più piccoli
di 10.000 nucleotidi. Il genoma della maggior parte dei batteri è di
qualche milione di basi, mentre il genoma del lievito, che differisce dai
batteri perchè appartiene alla classe di cellule che hanno un nucleo
(cellule eucariote, in opposizione ai batteri che sono detti procarioti),
è intorno ai 12 milioni di basi. Il genoma del C. elegans, un
nematode (piccolo verme), è di circa 100 milioni di basi, quello della
Drosophila melanogaster, poco di più.
Sembrò abbastanza logico testare questi due approcci su questi organismi.
A questo punto tuttavia la comunità scientifica venne scossa
dall'improvvisa entrata in scena di un nuovo protagonista non previsto.
Craig Venter, che aveva precedentemente lavorato all'NIH, gli Istituti
Nazionali per la Salute di Bethesda, come responsabile di progetti di
sequenziamento, aveva deciso di fondare una ditta privata per lo studio
dei genomi: egli era un convinto sostenitore della grande importanza dei
progetti di sequenziamento ed era persuaso di poter portare a termine con
relativa facilità il sequenziamento di genomi semplici e moderatamente
complessi, dell'ordine di centinaia di milioni di basi. E in effetti
Venter riuscì a determinare la sequenza completa di numerosi genomi di
batteri e si accinse a studiare il genoma della Drosophila, che è
solo un decimo di quello dell'uomo.
I propositi di Venter scossero profondamente la comunità scientifica e una
gran parte dell'opinione pubblica: Venter lavorava per una compagnia che
era a scopo di lucro e avrebbe poi venduto i suoi dati. Era un problema
non solo economico, perchè la società americana è assolutamente favorevole
all'iniziativa privata e al profitto basato sulle capacità individuali e
le idee nuove. Ma in qualche modo si riteneva che il genoma umano fosse un
patrimonio dell'umanità: esso rappresentava la stessa natura umana, il
segreto della nostra vita, l'essenza della nostra umanità. Inoltre, ci si
poteva aspettare che le nuove conoscenze del genoma avessero una grande
ricaduta sulla salute e l'idea che le scoperte mediche potessero essere
rallentate se qualcuno avesse potuto avere una sorta di brevetto sulla
sequenza del genoma umano non era facilmente accettata negli Stati Uniti e
tanto meno in Europa.
u
La corsa all'oro
Le banche dati genetiche
A questo punto la competizione con i ricercatori finanziati dalle agenzie
governative o da fondazioni private divenne acerrima. Vari tentativi di
sanare le divergenze fallirono, ed era logico che fallissero, perchè
Venter, per attirare i capitali per la sua azienda, era costretto a dare
le sue sequenze a pagamento, mentre i suoi avversari insistevano per
renderle assolutamente pubbliche: sull'argomento non era possibile trovare
un accordo. E così si giunse al giugno del 2000, in cui il mondo intero,
che peraltro non si era molto interessato del problema, ascoltò stupito
Bill Clinton e Tony Blair annunciare che sotto il loro governo il genoma
umano era stato sequenziato non una ma due volte. Quello che dieci anni
prima sembrava un compito tecnicamente impossibile era stato compiuto
addirittura due volte. Pochi mesi dopo, nel febbraio 2001, le due sequenze
indipendentemente venivano pubblicate, in mezzo a furenti polemiche, su
due riviste scientifiche di grande prestigio, quali Science e Nature. Per
precisione, va comunque detto che la competizione ha costretto i duellanti
a fare le cose di fretta e la sequenza stessa era in realtà lungi
dall'essere completata quando fu pubblicata.
A complicare le cose c'era anche il fatto che i due gruppi rivali avevano
seguito due approcci differenti: Venter si era basato sul sequenziamento
di cloni pescati a caso, il consorzio pubblico sul sequenziamento, per
così dire, ordinato. Ma il consorzio pubblico rilasciava le sue sequenze
appena le aveva effettuate, mentre quello privato se le teneva per sè,
mentre poteva utilizzare quelle pubbliche che erano accessibili a tutti.
Oggi sappiamo che la compagnia di Venter si è basata in maniera
sostanziale sui dati del consorzio pubblico, tanto che non possiamo ancora
capire se il suo approccio "casuale" sia effettivamente valido per genomi
complessi. E' probabile pertanto che i risultati della compagnia privata
siano stati eccessivamente enfatizzati dai media. Al di là di questo,
rimane il fatto che un'impresa ritenuta estremamente difficile sia giunta
a compimento anni prima di quello che anche i suoi sostenitori più
ottimisti avevano pensato.
|