È passato oltre un secolo dalla scoperta dei cromosomi: corpuscoli intriganti, chiamati con quel nome perché nella cellula pronta a replicarsi apparivano ben connotati dal colorante, e a lungo sorvegliati speciali allo scopo di comprenderne natura e comportamento. Fino alla svolta, l’intuizione critica che dovevano essere proprio quei corpuscoli i depositari dell’informazione genetica, seguita da anni di studio della loro struttura e della loro dinamica nell’intento di decifrarne i misteri funzionali. Poi, con la scoperta del DNA quale vettore genetico chiave, il focus della ricerca si è spostato su questo nuovo soggetto, dando impulso a nuovi studi, mirati a comprendere il codice con il quale l’informazione è scritta nella sua sequenza, e culminati nel sequenziamento del genoma umano.
Un punto d’arrivo, o non piuttosto il punto di partenza di un ritorno alle origini? Già, perché i “genomisti” si sono presto resi conto che per capire come funziona il genoma è sì indispensabile conoscere l’informazione codificata dalla sua sequenza, ma bisogna poi individuare in che modo questa sequenza va ad organizzarsi proprio nei cromosomi. Basti pensare che il genoma è un oggetto fisico essenzialmente monodimensionale, lungo circa 1 metro, che si trova raggomitolato dentro un nucleo il cui asse maggiore è qualche centinaio di migliaia di volte più corto di lui: una costrizione nello spazio drammatica, tale come minimo da impedire che i cromosomi si muovano nuotando in libertà all’interno del nucleo. Dunque il genoma, per svolgere efficientemente il suo ruolo di regista super-multitasking nella vita dell’individuo, deve compattarsi a 3D non a caso ma secondo una gerarchia davvero ben organizzata, multilivello e multiscala, finemente e molto flessibilmente coordinata. Delineare un quadro preciso di questa organizzazione gerarchica e soprattutto individuare il codice con cui dà luogo alla regolazione dell’espressione genica è, forse, la prossima grande sfida della genomica.
Gomitoli complessi
Per cominciare, si è visto che anche per il genoma, in modo analogo alla struttura delle proteine, si può grosso modo classificare la gerarchia spaziale con cui si raggomitola la sua collana di perle – si chiamano basi – in tre livelli: struttura primaria, secondaria, terziaria. Questo a seconda della scala di lunghezza del tratto strutturato, conteggiata in numero di basi: qualche decina o al massimo poche centinaia, e poi parecchie centinaia fino a qualche migliaio, da ultimo centinaia di migliaia per arrivare a parecchi milioni. Non solo: fin che a ripiegarsi è un tratto piccolo, anche le interazioni tra i pezzetti che lo compongono sono ravvicinate e circoscritte, come incontrarsi per le scale tra i condomini di un palazzo. Ma a mano a mano che tratti di struttura primaria si ripiegano o riavvolgono gli uni sugli altri, e che gomitoli di struttura secondaria a loro volta si compattano in varia maniera, anche pezzetti di genoma lontani o lontanissimi in sequenza potranno ritrovarsi accostati e interagire. Tutto questo inoltre avviene con la complicità di un’ampia gamma di proteine, dinamicamente associate al DNA, e capaci sia di fare da ponte tra blocchi strutturali guidandoli a coordinarsi, sia di favorire, o viceversa ostacolare, la trascrizione in RNA dei pezzetti di genoma coinvolti, collaborando dunque in modo essenziale a regolare l’espressione genica.
Nello studio dell’organizzazione dei cromosomi, per un secolo la microscopia è stata protagonista assoluta, con approcci sempre più raffinati e ad alta risoluzione. Al microscopio sono stati dapprima individuati i cosiddetti “territori cromosomici” – CT è l’acronimo inglese –, grosse unità organizzative, distribuite in parte nella zona centrale del nucleo in parte più verso la sua periferia, in cui tendono a raggrupparsi i cromosomi corti e ad alta concentrazione di geni o viceversa più lunghi e meno ricchi di geni. E recentemente, nel 2010, la microscopia ha rivelato che i CT a loro volta contengono unità molto più piccole ma strutturalmente ben definite, a cui è stato dato il nome di dominii cromosomici, in breve CD: si presentano come gnocchetti di cromatina, sono inanellati tutt’intorno lungo i bordi dei CT e ognuno espone un guscio ricco di geni, disposti nello spazio in modo da interfacciarsi tra loro.
Arriva la 3C
Negli ultimi dieci anni alla microscopia si è affiancata una gamma di approcci molecolari basati su una tecnologia chiave, la chromosome conformation capture – in sigla 3C –, che in combinazione con metodi di modellizzazione virtuale e interpretazione computerizzata dei dati ha rivoluzionato l’analisi della conformazione del genoma. Il primo passaggio della 3C è una reazione chimica che impiega la formaldeide, una piccola molecola molto reattiva adatta a convertire le interazioni fisiche tra siti vicinali in legami stabili, ed è mirata a “congelare” i cromosomi e ottenerne una sorta di istantanea tridimensionale d’insieme; poi si frammenta questa impronta 3D con enzimi specifici, e da ultimo la si ricompone in modo controllato, così che tutte le coppie di pezzetti inizialmente vicini tra loro risultano alla fine singoli tratti di DNA, che vengono quindi sequenziati e mappati. Il primo risultato di questi nuovi approcci è stato la conferma molecolare di quei territori cromosomici visualizzati dalla microscopia, associata a un’evidenza importantissima sul piano funzionale: la rivelazione che persino loci genomici distanziati di molti milioni di basi lungo la catena presentano un gran numero di interazioni, in genere più frequenti tra loci situati sullo stesso cromosoma che tra loci appartenenti a cromosomi diversi. E nel 2012 dalla 3C – che in breve tempo ha generato varianti ad altissime prestazioni – è arrivato un altro risultato chiave: la mappatura molecolare di dominii più piccoli, battezzati TAD, ovvero topologically associating domains, e altrettanto caratterizzati da una grande abbondanza di interazioni e connessioni tra pezzetti di genoma anche molto distanti in sequenza, soprattutto intra-dominio. La scala di lunghezza dei TAD – da circa centomila a qualche milione di basi – è la stessa dei dominii cromosomici visualizzati due anni prima al microscopio, e si è fatta strada l’idea che si tratti di uno stesso ed essenziale modulo di lavoro del genoma, strutturale e funzionale.
Da vicino nessuna cellula è "normale"
L’idea è affascinante. Perché oltre alla presenza di quelle reti multiple di cui si è detto, formate da interazioni a corta e lunga gittata tra loci genomici anche ampiamente distanziati in sequenza, gli studi più recenti hanno identificato un secondo fenomeno centrale che caratterizza l’organizzazione del DNA nelle cellule: i principi generali del ripiegamento dei cromosomi si applicano sì a tutte le cellule di una popolazione, ma tra una cellula e l’altra esiste poi un’enorme eterogeneità nella conformazione del genoma. Le analisi basate sulla 3C infatti presentano una visione unica, mediata su tutta la popolazione, delle frequenze di interazione tra loci, ma questo non significa affatto che in tutte le cellule analizzate sia presente quella stessa, costante, riproducibile (e intricatissima) organizzazione spaziale del genoma. Anzi, una varietà così ampia di interazioni osservata sulla popolazione non può che essere il frutto di numerosissime disposizioni molto diverse tra cellule individuali. E questo fenomeno sembra fare a pugni con la constatazione generale che tutte le cellule di una stessa popolazione alla fine regolano l’espressione genica in modo robusto e omogeneo. Vuol dire che devono tutte ritrovare in qualche modo una rete di interazioni riproducibile nell’arco di ciascun ciclo cellulare, ma come? La dinamicità sembra essere la chiave: mentre cromosomi e territori cromosomici sono grossi, ingombranti, pachidermici, i TAD sono moduli abbastanza piccoli, al loro interno possono oscillare e variare conformazione e interazioni, e un’ipotesi di lavoro avanzata di recente è che siano proprio loro a garantire con il loro dinamismo la riproducibilità delle interazioni più probabili e produttive, quelle che danno luogo infine a una robusta regolazione dell’espressione genica.
Genoma a 4 dimensioni
Il quadro del genoma 3D che emerge dagli studi degli ultimi 5 anni dunque è non solo complesso e variegato, ma anche marcatamente legato alle dinamiche nel tempo. Bisogna allora andare oltre e poter associare all’informazione nello spazio, pur accurata e ad alta risoluzione, l’informazione temporale, la descrizione di come il quadro si modifica nel corso del tempo, per arrivare a una vera e propria vista 4D. In questo senso un nuovo affascinante obiettivo sarà poter riconoscere, ad esempio, se una variazione nella disposizione spaziale è casuale, una semplice “oscillazione” di quel dato blocchetto di genoma, oppure sta in relazione di causa-effetto con altre variazioni, al punto da determinare lo svolgersi della vita cellulare e in toto addirittura lo stato di salute oppure di malattia dell’intero organismo. Non è un caso che già nel 2014 i National Institutes of Health americani abbiano individuato quest’area scientifica come matura per investimenti mirati in sviluppo tecnologico e in ricerca, e abbiano lanciato un’iniziativa dedicata, il 4D nucleome program, proprio allo scopo di capire i principi che stanno alla base dell’organizzazione del nucleo nello spazio e nel tempo e come le modifiche dell’organizzazione nucleare influenzino salute e malattia.
Luisa Rusconi