Il genoma: il funzionamento e il ruolo delle proteine

u Come funziona un genoma

Per comprendere come funziona il genoma bisogna conoscere quali siano i costituenti fisici della cellula e come questi vengano prodotti e assemblati secondo le istruzioni contenute nel DNA.

Vi sono genomi di diverse dimensioni e di diversa complessità. Generalmente, ma non sempre, dimensioni e complessità vanno d'accordo, ma vi sono casi frequenti in cui non è così. Se prendiamo un virus come l'HIV, questo ha anch'esso un suo acido nucleico e quindi un genoma, in cui sono scritte (codificate) alcune istruzioni, pochissime in verità, e questo si traduce in un genoma dell'ordine delle diecimila basi (o nucleotidi). Altri virus possono avere dimensioni maggiori, ma sempre più piccole di quelle delle più piccole cellule, che sono dell'ordine di milioni di basi. Si passa poi alle centinaia di milioni di basi di un piccolo verme come il C. elegans o del moscerino della frutta (D. melanogaster), mentre il genoma di mammiferi come il topo e l'uomo ha circa tre miliardi di nucelotidi.

Forse più rilevante delle dimensioni del genoma potrebbe essere il numero di geni che ognuno contiene. E qui abbiamo la prima sorpresa. Se esaminiamo i geni di un virus notiamo che essi sono ben impacchettati nel breve tratto di acido nucleico (DNA o RNA) che forma il virus: alcuni addirittura sono uno sopra l'altro o dentro l'altro. Se poi esaminiamo quello di un batterio come l'E. coli, notiamo che essi sono più o meno uno dopo l'altro, e che c'è poco spazio tra l'uno e l'altro, e che anche queste parti intergeniche sono comunque importanti per il funzionamento dei geni in quanto contengono regioni regolatrici. Ma le sorprese cominciano quando andiamo ad esaminare i genomi di organismi complessi come i mammiferi. Due sono le cose curiose. La prima è che i geni sono a pezzi; la seconda che vi è un sacco di DNA ripetuto, la cui funzione è ignota: potrebbe essere DNA inutile, un relitto dell'evoluzione, oppure addirittura DNA egoista, cioè DNA che non fa altro che riprodurre se stesso senza contribuire al funzionamento dell'organismo in cui è riuscito ad "annidarsi". Il fatto che i geni siano a pezzi è una cosa veramente difficile da immaginare, perchè questa organizzazione richiede poi un meccanismo che cuce assieme questi pezzi tra loro, e anche oggi, a distanza di tanti anni da quando il fenomeno fu scoperto, non sappiamo ancora come questo avvenga.

u Geni accesi e geni spenti

Per capire parzialmente come un gene a pezzi possa funzionare, è necessario introdurre il concetto di espressione genica. Tutte le cellule dello stesso organismo contengono (con la sola eccezione dei linfociti) assolutamente lo stesso DNA. Questo, che anni or sono poteva sembrare un assunto non provato, oggi è stato clamorosamente confermato dalla clonazione di animali interi a partire da cellule adulte. Evidentemente anche in una cellula adulta sono contenute tutte le istruzioni necessarie per produrre un nuovo organismo, anche se le cellule dell'adulto sono molto diverse tra loro. Come mai? Si ritiene che questo sia dovuto al fatto che ogni cellula attiva soltanto alcune delle istruzioni del genoma. Si capisce facilmente che le combinazioni possibili sono praticamente infinite. Si dice che la cellula esprime un determinato set di geni.

Esprimere il gene vuol dire produrre la proteina corrispondente (vi sono alcune eccezioni a questa equivalenza, in quanto alcuni geni non producono proteine). La proteina tuttavia non viene prodotta direttamente dal DNA, ma necessita di un intermediario, l'RNA o acido ribonucleico, che per questa sua funzione viene detto appunto messaggero (mRNA). Anche l'RNA è composto di quattro basi, le stesse del DNA con l'eccezione della timina, al cui posto è presente l'uracile (U). L'mRNA viene prodotto sintetizzando il nucleotide complementare a quello presente nella catena del DNA, pertanto la sua sequenza dipende da quella della porzione di DNA da cui è stato copiato e di cui pertanto risulta copia fedele. Ad ogni gene pertanto corrisponderà un mRNA con una sequenza ben precisa. Ma essendo il gene a pezzi, durante la sua produzione l'mRNA viene processato in maniera tale che solamente le parti che codificano la proteina (esoni) vengono assemblate, mentre le parti in mezzo (denominate introni) vengono eliminate mediante un meccanismo che viene detto di splicing, che non comprendiamo ancora nei dettagli. E' interessante notare che questo assemblamento può non essere univoco: è cioè possibile che vengano prodotti diversi mRNA a partire dallo stesso gene, a seconda di quali e quanti pezzi di DNA vengono assemblati nell'mRNA finale. Ne consegue che da uno stesso gene possono anche venir prodotte proteine diverse che, in alcuni casi, hanno delle parti in comune tra loro e, in altri, sono totalmente differenti. Pertanto, il vecchio detto "un gene, una proteina" non è più tanto vero, e potrebbe essere sostituito da "un gene, varie proteine".

u Quanti geni abbiamo?

Questa scoperta può forse spiegare il paradosso recentemente scoperto relativo al numero di geni presenti nel genoma della nostra specie. Oggi, in seguito al Progetto Genoma Umano, sono noti quasi tutta la sequenza del Genoma Umano e quasi tutti i geni che esso contiene. Dal momento che negli ultimi 8 anni sono stati sequenziati anche i genomi di altre specie, è facile confrontare il genoma umano con quello di specie meno complesse della nostra. Questa analisi ha portato alla sorprendente scoperta che il numero di geni non è proporzionato nè alle dimensioni del genoma nè alla complessità dell'organismo. Si stima che nell'uomo siano presenti circa trenta o quarantamila geni, mentre nel lievito ce ne sono circa 6000, nel C. elegans, un microscopico verme, 19.000, nella D. melanogaster circa 14.000, nella A. thaliana, una pianticella, circa 26.000. Le spiegazioni di questo apparente paradosso possono essere almeno due: negli organismi pił complessi, come abbiamo visto, possono venir prodotte diverse proteine a partire dallo stesso gene e quindi ci sono in realtà molte più proteine che nelle specie meno complesse; oppure la regolazione di questi geni è molto più sofisticata negli organismi più complessi rispetto a quelli più semplici. E' però assai poco probabile che queste due spiegazioni possano valere nel caso del confronto tra uomo e altri mammiferi. Si stima che il topo (M. musculus), ad esempio, abbia lo stesso numero di geni che abbiamo noi. La diversità tra uomo e topo giace presumibilmente non in una regolazione genica più sofisticata, bensì semplicemente in una regolazione differente fra le due specie. Questa interpretazione può sembrare strana ma ha un'alta probabilità di essere vera.

Si capisce pertanto come il fatto di conoscere tutta la sequenza del DNA della nostra specie non significa aver compreso tutto del suo funzionamento. Siamo molto lontani dall'avere una mappa completa dell'effetto dei geni sul nostro organismo o sul nostro comportamento. Certo, senza sequenza non potremmo spingerci molto oltre nelle nostre conoscenze, ma essa è solamente il punto di partenza della nostra analisi. Conoscere i geni vuole ora dire che dobbiamo focalizzare la nostra attenzione sui loro prodotti, e cioè le proteine, cercando di determinarne la funzione a livello della singola cellula e dell'intero organismo. Non si tratta di un compito semplice, perchè bisogna non solo comprendere come esse funzionino singolarmente ma soprattutto come esse possano interagire fra loro. Questa analisi è appena iniziata e per indicare questa difficile impresa, per analogia con il genoma, è stato coniato il termine proteoma.

u La prossima sfida: il proteoma

Ogni proteina è composta da una sequenza di un numero variabile di aminoacidi che possono essere di 20 tipi differenti. La struttura primaria della proteina è data semplicemente dalla sequenza di questi aminoacidi, e può essere automaticamente dedotta dalla sequenza dell'mRNA che la codifica (questo è possibile dato che conosciamo il codice genetico). Tuttavia non è possibile, partendo solo dalla struttura primaria, dedurre tutte le caratteristiche della proteina stessa, in particolare la sua conformazione tridimensionale. La conformazione delle proteine è estremamente importante per apprezzarne ruolo e funzione, perchè esse formano delle strutture, come le membrane, i mitocondri ecc., sulla base della forma che assumono nello spazio. Non solo, ma esse devono interagire tra loro e con altre proteine e anche questa interazione dipende dalla loro forma. Addirittura certe proteine possono assumere, una volta separatesi dall'mRNA che le codifica più di una conformazione spaziale, e la loro funzione varia a seconda della struttura che assumono, perchè solo in una determinata conformazione possono interagire con altre proteine. In molti casi una proteina in una conformazione può risultare bloccata, mentre in un'altra risulta attivata e può scatenare una serie di risposte cellulari.

Purtroppo non sono ancora state formulate delle regole che possano venir utilizzate per predire la struttura tridimensionale delle proteine. In teoria queste regole dovrebbero esistere, ma di fatto sinora non le conosciamo. D'altro canto, la conformazione delle proteine può variare a seconda dell'ambiente in cui si trovano e può essere ulteriormente modificata dalle altre molecole situate nelle vicinanze. Per ora la conformazione di ogni proteina va determinata attraverso complicate analisi.

Funzione e struttura delle proteine occuperanno i ricercatori per lunghi anni. Non è facile predire quanto a lungo. Da un lato è possibile che avanzamenti tecnologici improvvisi, quali sovente si verificano in campo scientifico, possano semplificare problemi che oggi a noi sembrano di estrema difficoltà. Sicuramente in questo compito i computer avranno un ruolo decisivo: si tratta di una nuova branca denominata bioinformatica, che originatasi inizialmente per analizzare sequenze di DNA si sta estendendo a permeare tutti campi della biologia. Dall'altro, la sfida pare a volte senza fine. Francois Jacob, premio Nobel per i suoi studi sulla regolazione genica, nel suo libro "La logica del vivente", ha usato la metafora delle bamboline russe per illustrare il nostro rapporto con la realtà. Quando noi riusciamo a comprendere la realtà ad un certo livello non facciamo altro che scoprire la nuova bambolina che stava dentro all'altra, solamente per poi renderci conto che essa ne contiene un'altra e poi un'altra. In biologia si incontra sovente questo commento: "questa scoperta apre più problemi di quelli che ha risolto". Questa frase non viene usata per sminuire l'importanza della scoperta: al contrario capita sovente che la misura della scoperta sia data dal numero di nuovi campi che essa apre. Per dirla con Popper, "la ricerca non ha fine" e non sappiamo se un giorno apriremo l'ultima delle bamboline russe o se ce ne sarà sempre un'altra da scoprire.