Il Progetto Genoma Umano
 

u Cos'è il Genoma?

Il Genoma è il manuale per la costruzione di ogni organismo vivente, sia esso piccolo come un virus o complesso come l'uomo. E' evidente che ognuno di noi vorrebbe conoscere le istruzioni con cui il suo organismo è costruito. Ma per secoli questo obiettivo ci è stato precluso dalla nostra profonda ignoranza: non sapevamo neanche dove dovessimo cercarlo. Negli ultimi 50 anni tuttavia le nostre conoscenze sulla genetica si sono ampliate fino a comprendere che la base dell'ereditarietà coincideva con la base del funzionamento del nostro stesso organismo: oggi sappiamo che il DNA è la sede di tutte le istruzioni necessarie per il funzionamento di ogni organismo e che sono solamente queste complesse istruzioni che vengono tramandate di padre in figlio (in senso lato: da ogni vivente ad altri viventi da lui generati).

Fino a metà degli anni Ottanta l'idea di conoscere nei dettagli queste istruzioni per la specie umana sembrava estremamente remota. Il problema non era teorico, ma solamente pratico (tecnico). Le istruzioni sono contenute in una serie di tre miliardi di molecole che ad ogni effetto possono rappresentare tre miliardi di lettere, che potrebbero essere contenute in 1 milione di pagine da tremila.

Il termine sequenza indica appunto la serie di caratteri uno dopo l'altro. In una pagina di un libro, i caratteri formano una sequenza, che consente di formare parole, frasi, paragrafi, capitoli e così via. Qualcosa di simile avviene anche nel DNA, dove troviamo una serie di nucleotidi (o basi), che può formare delle frasi, o per meglio dire, trasmettere delle istruzioni.

Il problema era tuttavia ricostruire questo libro con 3 miliardi di caratteri. Purtroppo per questioni tecniche, la situazione per il genetista che voleva sequenziare il genoma umano era paragonabile a un archeologo che avesse qualche migliaia di poemi come l'Iliade o l'Odissea a pezzettini di 300 lettere e dovesse ricostruirli tutti sistemando un pezzettino di fianco al suo successivo.

 

u Le difficoltà della ricostruzione delle "pagine"

Il genoma

Vediamo di comprendere il perchè di questa situazione. Verso la fine degli anni Settanta erano stati messi a punto metodi che consentivano di leggere pezzi di DNA di circa 300 basi. Tuttavia questi pezzettini non erano in fila uno dopo l'altro nell'ordine in cui si trovano nel libro. Erano sparsi qua e là. Al ricercatore rimanevano due vie: o cominciare da un pezzettino e cercare quello che veniva dopo, oppure tirare su dei pezzi a caso e sperare che ad un certo punto questi cominciassero ad andare a posto da soli, sfruttando il fatto che due pezzi prelevati dalla stessa regione della sequenza possono essere in parte sovrapposti e avere delle parole in comune.

Essendo il genoma umano di 3 × 109 basi, sarebbero necessarie 107 sequenze di 3 × 102 basi per avere tutto il genoma. In realtà ne sono necessarie molte di più, perchè le sequenze devono sovrapporsi tra loro. Tuttavia il processo di trovare ogni volta quella che viene subito dopo è estremamente lungo e faticoso. Pertanto l'idea di scegliere il secondo approccio, quello di sequenziare i pezzettini a caso, poteva sembrare attraente. Ma allora il numero di sequenze da effettuare diventa altissimo, perchè la probabilità di pescare cloni identici o simili diventa elevata: è quello che succede ai bambini quando, arrivati al 60-70% dei loro album di figurine, si accorgono che cominciano a pescare soprattutto figurine doppie (e non c'è nessuno con cui scambiarle). Inoltre, alcune figurine potrebbero essere rarissime o addirittura non essere state messe in commercio, e quindi avremo difficoltà a trovarle. Ma vi è poi un'altra difficoltà: come in un poema, o in un manuale, alcune frasi potrebbero essere così simili o identiche da non potersi stabilire dove effettivamente stiano. Nell'Odissea ad esempio troviamo spesso la descrizione del sorgere dell'Aurora (rwdodaktulos eos), e se troviamo un pezzo che comincia o finisce con questa frase, non sapremmo come collegarla con le altre: e questo purtroppo si verifica spesso nel genoma umano, a causa della presenza di quelle che vengono chiamate "sequenze ripetute" che sono presenti anche in milioni di copie (magari non identiche, ma estremamente simili e spesso consecutive). Pertanto, quando ci si imbatte in una di queste sequenze, può succedere che non si riesca a capire in quale punto del genoma esse siamo veramente.

 

u I due approcci

Craig Venter

Il genoma umano, come quello di quasi tutti i vertebrati, è un genoma complesso dell'ordine di qualche miliardo di nucleotidi. Tuttavia vi sono genomi più semplici. I virus ad esempio possono essere anche più piccoli di 10.000 nucleotidi. Il genoma della maggior parte dei batteri è di qualche milione di basi, mentre il genoma del lievito, che differisce dai batteri perchè appartiene alla classe di cellule che hanno un nucleo (cellule eucariote, in opposizione ai batteri che sono detti procarioti), è intorno ai 12 milioni di basi. Il genoma del C. elegans, un nematode (piccolo verme), è di circa 100 milioni di basi, quello della Drosophila melanogaster, poco di più.

Sembrò abbastanza logico testare questi due approcci su questi organismi.

A questo punto tuttavia la comunità scientifica venne scossa dall'improvvisa entrata in scena di un nuovo protagonista non previsto. Craig Venter, che aveva precedentemente lavorato all'NIH, gli Istituti Nazionali per la Salute di Bethesda, come responsabile di progetti di sequenziamento, aveva deciso di fondare una ditta privata per lo studio dei genomi: egli era un convinto sostenitore della grande importanza dei progetti di sequenziamento ed era persuaso di poter portare a termine con relativa facilità il sequenziamento di genomi semplici e moderatamente complessi, dell'ordine di centinaia di milioni di basi. E in effetti Venter riuscì a determinare la sequenza completa di numerosi genomi di batteri e si accinse a studiare il genoma della Drosophila, che è solo un decimo di quello dell'uomo.

I propositi di Venter scossero profondamente la comunità scientifica e una gran parte dell'opinione pubblica: Venter lavorava per una compagnia che era a scopo di lucro e avrebbe poi venduto i suoi dati. Era un problema non solo economico, perchè la società americana è assolutamente favorevole all'iniziativa privata e al profitto basato sulle capacità individuali e le idee nuove. Ma in qualche modo si riteneva che il genoma umano fosse un patrimonio dell'umanità: esso rappresentava la stessa natura umana, il segreto della nostra vita, l'essenza della nostra umanità. Inoltre, ci si poteva aspettare che le nuove conoscenze del genoma avessero una grande ricaduta sulla salute e l'idea che le scoperte mediche potessero essere rallentate se qualcuno avesse potuto avere una sorta di brevetto sulla sequenza del genoma umano non era facilmente accettata negli Stati Uniti e tanto meno in Europa.

 

u La corsa all'oro

Le banche dati genetiche

A questo punto la competizione con i ricercatori finanziati dalle agenzie governative o da fondazioni private divenne acerrima. Vari tentativi di sanare le divergenze fallirono, ed era logico che fallissero, perchè Venter, per attirare i capitali per la sua azienda, era costretto a dare le sue sequenze a pagamento, mentre i suoi avversari insistevano per renderle assolutamente pubbliche: sull'argomento non era possibile trovare un accordo. E così si giunse al giugno del 2000, in cui il mondo intero, che peraltro non si era molto interessato del problema, ascoltò stupito Bill Clinton e Tony Blair annunciare che sotto il loro governo il genoma umano era stato sequenziato non una ma due volte. Quello che dieci anni prima sembrava un compito tecnicamente impossibile era stato compiuto addirittura due volte. Pochi mesi dopo, nel febbraio 2001, le due sequenze indipendentemente venivano pubblicate, in mezzo a furenti polemiche, su due riviste scientifiche di grande prestigio, quali Science e Nature. Per precisione, va comunque detto che la competizione ha costretto i duellanti a fare le cose di fretta e la sequenza stessa era in realtà lungi dall'essere completata quando fu pubblicata.

A complicare le cose c'era anche il fatto che i due gruppi rivali avevano seguito due approcci differenti: Venter si era basato sul sequenziamento di cloni pescati a caso, il consorzio pubblico sul sequenziamento, per così dire, ordinato. Ma il consorzio pubblico rilasciava le sue sequenze appena le aveva effettuate, mentre quello privato se le teneva per sè, mentre poteva utilizzare quelle pubbliche che erano accessibili a tutti. Oggi sappiamo che la compagnia di Venter si è basata in maniera sostanziale sui dati del consorzio pubblico, tanto che non possiamo ancora capire se il suo approccio "casuale" sia effettivamente valido per genomi complessi. E' probabile pertanto che i risultati della compagnia privata siano stati eccessivamente enfatizzati dai media. Al di là di questo, rimane il fatto che un'impresa ritenuta estremamente difficile sia giunta a compimento anni prima di quello che anche i suoi sostenitori più ottimisti avevano pensato.