Views: 56
Numerose manifestazioni fenotipiche che sono particolarmente variabili nei mammiferi, tra cui l’apprendimento vocale, la durata della vita e le dimensioni del cervello, si sono evoluti attraverso cambiamenti nell’espressione genetica. Le loro differenze tra le specie, quindi, sono state determinate da differenze nella sequenza del DNA negli elementi cis-regolatori (CRE).
La possibilità di accesso alle proteine regolatrici del DNA da parte delle CRE, controlla, nella pratica, il modo in cui i geni vengono espressi nei tessuti: i tempi, i livelli e la posizione.
Risultano sconosciute però le modalità con cui le differenze nella sequenza del genoma in tali CRE abbiano portato a differenze nell’espressione genetica.
Attraverso il progetto Mammals è stato possibile per la prima volta in assoluto, confrontare i CRE tra centinaia di mammiferi.
Tuttavia, poiché molti CRE sono tessuto-specifici, caratterizzare sperimentalmente questi CRE comporterebbe l’esecuzione di analisi su molti tessuti di molte specie, il che non è fattibile.
È stato quindi sviluppato un modello di apprendimento automatico per prendere ciò che sappiamo sui CRE specifici dei tessuti di specie di mammiferi ben studiate per prevedere – utilizzando la conservazione – quali CRE di altre specie di mammiferi potrebbero mostrare modelli di espressione tissutale simili.
È possibile applicare questo modello per trovare CRE specifici del cervello che potrebbero essere responsabili delle differenze nelle dimensioni, nello sviluppo e nell’attività del cervello tra i mammiferi. Sono stati addestrati quindi i modelli utilizzando i dati ATAC-seq del cervello, un metodo che individua il DNA accessibile, o cromatina aperta, nel genoma. Sono stati generati questi dati da topi, ratti e macachi Rhesus, nonché raccolto dati ATAC-seq cerebrali disponibili al pubblico provenienti da esseri umani. Il modello che è stato sviluppato ha raggiunto un’elevata precisione predittiva per la classificazione dei CRE cerebrali (AUPRC = 0,88) nel set di validazione. I modelli utilizzati sono serviti a fare previsioni sull’attività CRE cerebrale in centinaia di mammiferi del 200 Mammals Project. È stato così possibile dimostrare come la somiglianza nelle previsioni tra le specie nel Progetto 200 Mammals è fortemente anti-correlata con la distanza evolutiva.
Sono state quindi utilizzate le previsioni per identificare CRE specifici del clade, il che significa che il CRE è accessibile nella maggior parte delle specie all’interno di un clade ma non in molte altre, e ha dimostrato che le previsioni erano coerenti con i nostri dati. L’ approccio alla previsione dell’attività CRE conservata può essere applicato a qualsiasi tipo di tessuto o cellula con dati di cromatina aperti disponibili da più specie. Inoltre, le revisioni possono essere collegate ai fenotipi dei mammiferi che si sono evoluti attraverso l’espressione genica.
Si prevede che i genomi del 200 Mammals Project e l’allineamento multispecie consentiranno ai ricercatori di estendere il nostro lavoro per identificare CRE che potrebbero essere coinvolti nei fenotipi dei mammiferi più variabili.
L’approccio alla previsione dell’attività CRE conservata può essere applicato a qualsiasi tipo di tessuto o cellula con dati di cromatina aperti disponibili da più specie. Inoltre, le nostre previsioni possono essere collegate ai fenotipi dei mammiferi che si sono evoluti attraverso l’espressione genica.