Anonim

Temaer

  • Alternativ spleising

Pre-mRNA-spleising er en grunnleggende prosess som kreves for uttrykket av de fleste metazoanske gener. Det utføres av spliceosomet, som katalyserer fjerning av ikke-kodende introniske sekvenser for å samle exoner i modne mRNA før eksport og oversettelse. Mangler i spleising fører til mange menneskelige genetiske sykdommer 1, og spleising mutasjoner i en rekke gener involvert i vekstkontroll har blitt involvert i flere typer kreft 2 . Gitt kompleksiteten av høyere eukaryotiske gener og det forholdsvis lave nivået av spleisstedbeskyttelse, er presisjonen til spleiseringsmaskinen i kjennetegn og sammenkobling av spleissteder bemerkelsesverdig. Introns som strekker seg i størrelse fra mindre enn 100 opp til 100 000 baser, fjernes effektivt. Samtidig observeres et stort antall alternative spleisehendelser mellom forskjellige celletyper, utviklingsstadier og andre biologiske prosesser. Av de ca. 25 000 gener kodet av det humane genom 3, antas mer enn 90% å produsere transkripsjoner som er alternativt spleiset 4 . Alternativ spleising av pre-mRNA kan således føre til produksjon av flere proteinisoformer fra et enkelt pre-mRNA, som signifikant beriker det proteomiske mangfoldet av høyere eukaryote organismer 5 . Fordi regulering av denne prosessen kan bestemme tidspunktet og plasseringen der en bestemt proteinisoform er produsert, endrer alter-ninger i spleiseringsmønstre mange cellulære aktiviteter. Denne omfattende alternative spleising innebærer en betydelig fleksibilitet av spliceosomet for å identifisere og behandle exoner innenfor et gitt pre-mRNA.

I løpet av de siste årene har forskningen fra ulike laboratorier vist at reguleringen av alternativ spleising avhenger av mange forskjellige cis- virkende RNA-elementer 6 . Mens de fleste av disse RNA-elementene syntes å ha et felles mekanistisk mål, ble den første rekruttering av spliceosomale komponenter, det rene antall RNA-sekvenser som var involvert i regulering av alternativ spleising, mer og mer skremmende. Som en følge av dette var entusiasmen for å utlede alternative spleisspådommer basert bare på pre-mRNA-sekvens, hensiktsmessig referert til som "splicing code", gitt vei til den voksende realiseringen at alternativ spleising er mye mer komplisert enn forventet. Beregningsanalyser av de identifiserte RNA-elementene viste seg å være de første effektive verktøyene for å klassifisere og gruppere disse RNA-elementene, samtidig som repertoaret av flere RNA-sekvenselementer sannsynligvis er viktig for spleisregulering 7 . Sekvensmotiver som definerer exon / introngrensen, tilstedeværelsen eller fraværet av spleiseforsterker eller lyddempersekvenser, RNA sekundære strukturer og lengden av exoner og deres flankerende introner er de mest fremtredende klasser av RNA-elementer som er involvert i å formidle effektiv exon splicing 6 . Mens det ble verdsatt at det relative bidrag av hver av disse RNA-sekvenselementene styrer hvordan effektive spleisningssteder blir gjenkjent og flankerende introner fjernes, er arbeidet for å beskrive hvordan deres relative bidrag vektet i forskjellige celletyper, begrenset til suksess på grunn av utilstrekkelige spleisprofiler fra unike vev. "Spleykoden" forblir uklar.

Med adventen av høye gjennomstrømningsmetoder som mikroarrays og dyp sekvensering, endret mRNA-landskapet dramatisk. Omfattende mRNA-profiler avledet fra unike cellelinjer eller vevstyper ble rapportert innen en kort tidsramme, slik at det ble muliggjort mer spesifikke alternative spleisanalyser. Disse nye verktøyene har vist at i det vesentlige alle multi-intronholdige gener gjennomgår alternativ spleising, generelt på en vevsspesifikk måte 4, 8 . Den 6. mai-utgaven av Nature rapporterte om den kombinerte innsatsen fra laboratoriene Blencowe og Frey designet for å ta en stakk ved å dechiffrere "splicing code" 9 . Utstyrt med omfattende mikroarray-resultater som evaluerer inkluderingsnivåene på mer enn 3 500 exoner fra 27 forskjellige musevevier, bestemte Barash og kolleger seg for å utlede en algoritme som er i stand til å forutsi alternative spleiseringsresultater basert utelukkende på RNA-sekvenselementer. Unikt for deres ambisiøse tilnærming var kravet om at mange av de kjente RNA-sekvensfunksjonene fra alle forskjellige klasser av spleiseparametere ble inkludert i deres "spleykode", og fulgte dermed fullt ut den svært komplekse karakteren av spleisregulering. En maskininnlæringsmetode som utnytter informasjon entropi ble brukt til å avlede hvilke funksjoner som påvirket vevsspesifikk alternativ spleising og optimal spleising ble oppnådd ved evaluering av ~ 200 funksjonselementer. Interessant nok representerer de fleste av disse elementene formodede bindingssteder for transaktive faktorer.

Utførelsen av denne første omfattende "splicing code" er imponerende. Koden forutsetter korrekt den vevsspesifikke retningen for endring i ekson inkludering i 82, 4% av tilfellene ved bruk av mikroarray data og 93, 3% av tilfellene ved hjelp av RT-PCR data. Koden er også i stand til å skille alternativt splittede exoner fra konstitutivt spleiseformede exoner, med en sann detekteringsfrekvens på rundt 60% ved en falsk positiv hastighet på 1%. Dette betyr at "splicing code" er i stand til å forutsi sannsynlig ekson inkludering eller ekskludering hendelser i mer enn halvparten av forhørte saker. Mens det er åpenbart rom for forbedring, bør det understrekes at denne suksessraten overgikk de fleste forventninger, gitt den gjeldende følelsen i feltet som forsøker å blande de mange spleisregulatoriske elementene i en panne, ville fortynne en prediktiv kraft. En viktig hjemlig melding av Barashs og kollegers arbeid er at en "splicing code" er oppnåelig, og at den kan gjøres åpenbar ved hjelp av passende transkripsomme datasett og beregningsverktøy. En av de åpenbare fordelene med en "spleykode" ligger i sin prediktive kraft som tillater evaluering av de funksjonelle konsekvensene av sykdomsmutasjoner eller sykdomsassosierte SNPs i silico . Selv om gjeldende deteksjonsgrad på 60% kan gi noen tvil om hvorvidt et eksperimentell lag skal dykke inn i uttømmende molekylære analyser, kan den første generasjon "splicing code" betraktes som en potensiell spleise-blåkopi som styrer eksperimentell verifisering.

Den alternative splitsingsanalysen gjør det ytterligere viktige punktet at inkludering eller ekskludering av exoner er avhengig av flere RNA-elementelementer 9 . I gjennomsnitt var 12 vevsspesifikke RNA-funksjoner nødvendig for å definere ekson inklusjon eller ekskludering i sentralnervesystemet vev og 19 RNA-funksjoner definerer embryospesifikk alternativ spleising. Mens enkelte vevsspesifikke exoner deler en delmengde av de samme RNA-elementene, vil det endelige settet av RNA-funksjoner som utgjør en eksons identitet, sannsynligvis være unikt for hver ekson. Fra nå av bør det være forventning om at alternativ spleising moduleres av flere RNA-funksjoner. Denne forventningen støttes fullt ut når man vurderer en av de biokjemisk mest analyserte alternative spleisehendelsene, inkluderingen av Survival of Motor Neuron ( SMN ) exon 7, et gen assosiert med Spinal Muscular Atrophy 10 . Flere spleiseforsterkere og silencere, enten introniske eller exoniske, har blitt identifisert gjennom mutasjonsanalyser i tillegg til RNA sekundære strukturelementer (Figur 1A), noe som tyder på at selv spleising av konstitutive exoner, som SMN exon 7 i sin normale kontekst, formidles av flere spleising RNA-elementer. For alternativt splittede exoner kan det forventes at flere RNA-funksjoner deltar for å sikre regulert exon-utvalg. Det bør også forventes at vevsspesifikk alternativ spleising er under kontroll av spleising-nettverk som består av unike RNA-elementelementer. Identiteten til disse spleiseringsnettene varierer mellom vev og dermed fremme vevsspesifikk alternativ spleising.

Flere RNA-elementer påvirker alternativ exon-anerkjennelse. (A) Sammendrag av RNA-elementene som har blitt påvist å påvirke utvalg av SMN exon 7, et gen assosiert med spinal muskelatrofi. Uttømmende biokjemiske analyser har identifisert spleiseforsterker, lyddemper og RNA sekundære strukturelementer som modulerer konstitutiv ekson inkludering. AC til U-overgang skjer i duplisert SMN- genet, noe som til slutt resulterer i fortrinnsrett exon 7-hopping. (B) De mest innflytelsesrike, vevsspesifikke alternative spleisefunksjonene identifisert av Barash og kollegaer (PTB, Nova, Fox, Qkl og CUGbp) fungerer hovedsakelig fra de flankerende intronene. De funksjonelle effektene av denne overraskende små delmengden av spleisregulatorer er komplementert med eksoniske egenskaper som exonlengde, generering av for tidlig termineringskodon (PTC) eller aktiviteten av ESE / SR-proteiner. Det kombinatoriske bidraget til disse funksjonene dikterer vevsspesifikk alternativ ekson inkludering. Størrelsen på ovaler (som representerer bindingssteder for spleisregulatorer) og bokser (som representerer arkitektoniske og RNA-kvalitetskontrollfunksjoner) indikerer forskjeller i størrelsen av deres gjennomsnittlige regulatoriske innflytelse.

Full størrelse bilde

Hvilke RNA-funksjoner som er andre enn de generelle spleisforbindelsene har den mest signifikante effekten på vevsspesifikk alternativ ekson inkludering? Som forventet er spleisforbindelsessekvenser av betydning, men de antas ikke å formidle regulering av alternativ exon-seleksjon. Snarere satt de i stein et grunnlinjenivå av spliceosomal anerkjennelse. Blant de forskjellige splicing regulatoriske faktorene kjent til dags dato, oppstod et overraskende lite ensemble som mest innflytelsesrike. CUG-bindende proteiner (CUGbp) som Mbnl eller CELF-lignende faktorer, Fox-proteinene, Nova1 og 2, Quaking-like (Qkl) og PTBs fører listen som virker hovedsakelig fra de flankerende intronene, mens SR-proteiner synes å være mindre viktig i å diktere alternativ spleising. Faktisk er de mest fremtredende eksoniske egenskapene som knytter seg til vevsspesifikke spleising, exonlengden, og om inkluderingen eller ekskluderingen av den alternative exon resulterer i genereringen av et for tidlig termineringskodon (PTC) (Figur 1B). Dette plasserer de mest signifikante regulatoriske signaturene i flankerende introner, en konklusjon støttet av observasjonen om at "splicing code" fungerer optimalt bare når det krever høye nivåer av evolusjonær bevaring.

Det er klart at grunnlaget for å dekode "spleykoden" er volumet av mRNA-isoforminformasjon. Uten de nylig utviklede høye gjennomstrømmingsmetoder, ville ikke vevsspecifikke spleis-sammenligninger ha vært mulig på nivåene som var nødvendige for å oppnå tilstrekkelig statistisk effekt. Mens man anerkjenner fremskrittet Barash og kollegaer som presenteres i deres omfattende beregningsanalyse av alternativ spleising, er "splicing code" langt fra å bli fullført. Med fremkomsten av økt transkriptominformasjon gjennom dyp sekvensering, lover den umiddelbare fremtiden en flom av detaljert alternativ mRNA-isoforminformasjon som er unik for cellemiljøer eller biologiske sammenhenger. Dette ekspanderende reservoaret av mRNA-transkripsjonsinformasjon vil opprettholde utviklingen av "spleykoden". Det vil forfine og forbedre ytelsen til de nåværende algoritmer som forutsier alternativ ekson inklusjon og å inkludere de mange andre former for alternativ spleising, for eksempel alternativ spleisstedvalg, intronretensjon eller gjensidig eksklusiv ekson inkludering. For nå skal det forstås at alternativ spleising kan være forutsigbar fra RNA-sekvensen alene, selv i møte med svært komplekse regulatoriske nettverk.

Anbefalt Redaksjonens