Anonim

Temaer

Abstrakt

Store histokompatibilitetskomplekse klasse II DQA- og DQB- gener har vist seg å være under positiv utvelgelse hos visse pattedyrarter, men ikke i andre, forbrenning av en debatt om hvordan deres polymorfisme har utviklet seg. I denne studien har vi analysert om polymorfisme i peptidbindende regionen (PBR) av DQA (190 sekvenser, 11 arter) og DQB (209 sekvenser, 7 arter) molekyler er positivt valgt ved bruk av begge omtrentlige (Nei-Gojobori, Li -Wu-Luo og Pamilo-Bianchi-Li) og metoder for maksimal sannsynlighet. Resultatene som ble oppnådd ved tilnærmet metoder var ganske inkonsekvent for DQA, sannsynligvis på grunn av den høye unøyaktigheten som d S (PBR) anslås til, mens tegn på positivt utvalg ble observert for de fleste DQB PBR-sekvensene. En parallell analyse med CodeML tillot oss å demonstrere, på en svært konsistent måte, forekomsten av positivt utvalg i PBR-kodende regionen av både DQA og DQB- gener. Videre har vi identifisert flere DQA (α47, α55, α56, α68, α69, α76 og α79) og DQB (β9, β26 og 5757) kodoner som ser ut til å være under positivt utvalg i forskjellige og ofte ikke-relaterte, pattedyrsarter. Ikke-synonym polymorfisme på disse områdene har blitt evolusjonært konservert, noe som betyr at det kan ha funksjonelle konsekvenser for peptidbindingen.

Introduksjon

DQ-molekyler av klasse II-store histokompatibilitet (MHC) spiller en fremtredende rolle i adaptiv immunitet ved å presentere små prosesserte peptider avledet fra enten selv- eller fremmede proteiner til T-celler. 1, 2 Effektiviteten av antigenpresentasjonen dikteres blant andre årsaker av affiniteten til disse små peptider til peptidbindende regionen (PBR) av DQ: et ekstracellulært domene av proteinet som ligner en dyp p-plissert kløv flankert av to a-helikser. Mange sammenhenger har blitt funnet hos mennesker mellom polymorfismen av DQ- gener og motstand eller mottaglighet for et bredt spekter av infeksiøse og autoimmune sykdommer som klinisk tuberkulose, 3 HIV-1 og hepatitt C virusinfeksjoner, 4, 5 type I diabetes 6 og autoimmun hepatitt. 7 Disse lovende resultatene har ført til karakterisering av genetisk variasjon ved DQ- gener i et bredt spekter av innenlandske og ville pattedyrarter med sikte på å dissekere deres potensielle involvering i fremkalling av en passende immunrespons mot patogener.

En av de mest karakteristiske egenskapene til MHC-gener er at deres polymorfisme opprettholdes ved positiv utvelgelse som en måte å øke repertoaret av antigen-presenterende molekyler på celleoverflaten. 1, 2 Den genetiske signaturen som positivt utvalg forlater på MHC-gener består av et økt forhold ( w = d N / d S ) mellom ikke-synonyme substitusjoner per ikke-synonymt sted ( d N ) og synonyme substitusjoner per synonymt sted ( d S ) inne i PBR ( w > 1), men ikke utenfor (ikke-PBR-region, w 1). 1, 2 Dette sentrale konseptet er blitt tilstrekkelig demonstrert for MHC klasse I og klasse II DRB gener, noe som gir betydelig bevis på den biologiske fordelen ved å opprettholde høye nivåer av ikke-synonym variasjon ved PBR. 1, 2 Imidlertid er bevis for DQ- gener fortsatt noe omstridt. Selv om Garrigan og Hedrick 8 ikke fant en statistisk signifikant forskjell i w- forholdet inne i og utenfor HLA-DQB PBR, Hughes og Yeager, 1, nådde den motsatte konklusjonen ved å finne at d N overgikk sterkt d S i PBR. Tilsvarende Pfau et al. 9 og De Bellocq et al. 10 fant ikke tegn på positivt utvalg i bomullsrotten ( Sigmodon hispidus ) og henholdsvis European Woodmouse ( Apodemus sylvaticus ) DQA- gener. I kontrast, Bryja et al. 11 identifiserte en klar signatur av positivt utvalg i nært beslektede gnagere. Disse avvikene kan ha enten biologiske eller metodologiske årsaker. I denne sammenheng har de fleste studier som analyserer positive seleksjons signaturer på DQ- gener, stått på Nei-Gojobori (NG) -metoden, 12 med Jukes-Cantor-korreksjon for flere treff, 12 for å måle w . Årsakene til dette valget er uklare, men det bør legges merke til at NG er en ganske urealistisk modell, da det antas at overganger og transversasjoner er like sannsynlige. 12 Hvis denne antagelsen ikke oppfylles av dataene, kan NG føre til en overestimering av d S og en undervurdering av v som favoriserer nøytralitet. 12 En annen potensiell fallgruve, når man analyserer forekomsten av positive seleksjons signaturer, er at svært ofte DQ PBR-rester har blitt utledet av homologi med den tredimensjonale strukturen av DR i stedet for å anvende DQ-spesifikk krystallstrukturinformasjon. 13, 14 Denne ulempen er viktig fordi plasseringen av PBR-rester i DR og DQ ikke er identisk. Hovedmålet med den nåværende studien var å kaste lys på disse kontroversielle problemene ved å teste, gjennom et bredt utvalg av fylogenetiske tilnærminger, om DQ- gener er under positivt utvalg eller ikke i et representativt utvalg av pattedyrsarter. Videre var vi interessert i fin kartlegging kodoner som er positivt valgt i DQA og DQB gener med det endelige målet å identifisere de som deles av flere ikke-relaterte arter. Denne informasjonen vil være viktig for å velge bestemte steder for å utføre assosiasjonsanalyse med sykdomsresistensegenskaper.

Materialer og metoder

Beregning av nukleotid-substitusjonshastighetene og kodonbruksforstyrrelsen i DQ- gener

Vi har analysert 190 DQA og 209 DQB exon 2-sekvenser som svarer til henholdsvis 11 og 7 pattedyrarter (tilleggstabell 1). Nukleotid-substitusjonshastigheter i DQ- gener ble målt med det formål å vurdere om det er en overgangs- / transversjonsforstyrrelse som kan påvirke estimeringen av w . Dette målet ble oppnådd ved å analysere DQA og DQB genetisk variasjon for hver art med MrBayes 3.1-programvaren. 15 En generell reversibel modell ble brukt med seks forskjellige substitusjonshastigheter og de flate priorene definert i programmet. 15 I alt en million iterasjoner ble utført før de kom til konvergens. Codon bruk bias ble estimert ved å beregne Codon Bias Index (CBI) og det effektive antall kodoner (Nc) med DnaSP 4, 00. 16 Disse to parametrene varierer fra 0, 0 (tilfeldig bruk av kodoner) til 1, 0 (høyt forspent kodonbruk) for CBI og fra 20 (ekstremt forspent kodonbruk) til 61 (alle kodonene er like brukt) for Nc. Fordi seleksjon som favoriserer foretrukne kodoner antas å redusere andelen av virkelig nøytrale mutasjoner på synonyme steder, forventes gener med høy codon-bias å vise en redusert divergensgrad på synonyme steder.

Beregning av dN / dS- forholdet mellom pattedyr- DQ- sekvenser

Aminosyreposisjoner ble nummerert i henhold til IMG / HLA-databasen (//www.ebi.ac.uk/imgt/hla/align.html). De stillingene som utgjør en del av PBR ble identifisert ifølge Fremont et al., 13 Scott et al. 14 og Reche og Reinherz. På denne måten var DQA PBR-aminosyreposisjonene 11C, 14N, 25Y, 27H, 34E, 35F, 46W, 55G, 56G, 57F, 61G, 62A, 65N, 68V, 69A, 72N, 75I, 76M og 79R referansesekvens: HLA- DQA1 * 010101). DQB PBR-aminosyreposisjoner var 9Y, 11F, 13G, 14L, 15C, 26G, 27V, 28T, 30H, 37Y, 47Y, 56P, 57V, 61W, 67V, 71A, 74S, 78V, 79C, 82N og 85V sekvens: HLA- DQB1 * 050101). DQA- og DQB- sekvenser ble analysert med MEGA 3.1. programvare (//www.megasoftware.net) som følger: d N og d S ble beregnet ved å bruke tre forskjellige modeller: NG-metoden med Jukes-Cantor-korreksjonen, 18 og Li-Wu-Luo (LWL), 19 og Pamilo-Bianchi-Li (PBL), 12, 20 metoder. Totalt ble 1000 bootstrap-replikasjoner utført. Antallet synonyme og ikke-synonyme substitusjoner ble beregnet med DnaSP 4, 00, 16 mens gjennomsnittlig antall forskjeller mellom sekvenser ble beregnet med MEGA 3.1 (antall forskjeller). Vi utførte en Z- test med 1000 replikasjoner, hvor H 0 : d S = d N (nøytralitet) og H 1 : d N > d S (positivt utvalg), med MEGA 3.1-programvaren. Denne testen ble benyttet for å bestemme om d N er signifikant forskjellig fra d S under de tre nevnte evolusjonære modellene.

Identifikasjon av kodoner under positivt utvalg

Sannsynlighetsforholdsmodellering ble benyttet for å vurdere eksistensen av positiv seleksjon som virker på DQ- gener, samt å identifisere kodoner under positiv seleksjon. Dette målet ble oppnådd ved å bruke CodeML-programmet, som inngår i PAML 3.15-pakken. 21 To nestede modeller ble sammenlignet: M1a vs M2a og M7 mot M8. M1a (nøytral modell) antar eksistensen av to klasser av nettsteder med 0 w 0 1 og med w 1 = 1 og M2a (utvalgsmodell) som legger til en tredje type nettsted med w 2 estimert fra dataene. Modell M7 antar en β-fordeling for 0 w 1, mens modell M8 legger til M7 en ekstra kategori, med proporsjon p 1 av områder med w 1, mens resten av nettstedene (ved frekvens p 0 = 1 p 1 ) har w fra p-fordelingen mellom 0 og 1. Sannsynlighetskvotetesten ble utført ved å sammenligne dobbel forskjellen i logglisensverdiene som svarer til hver av de to sammenligningene med en x 2 hvis frihetsgrader (df) er like forskjellen i antall parametere ( p ) ansatt i hver modell (df = p M2a / 8 - p M1 / 7 ). Kodon under positiv utvelgelse ble identifisert med Bayes empiriske Bayes-metoden. 22

Resultater og diskusjon

NG-metoden er den mest brukte tilnærmingen til å estimere w i DQ- gener. Denne prosedyren er basert på antagelsen om at hvert nukleotid er substituert med et hvilket som helst annet nukleotid med samme hastighet og bruker Jukes-Cantor en-parameter formel for å korrigere for flere substitusjoner. LWL-metoden tar derimot hensyn til transitional / transversional bias når man teller substitusjoner, men antar lik hastighet når man teller nettsteder, mens PBL er en forlengelse av LWL-metoden som inkluderer en korreksjon for denne senere forspenning. 23 Vår måling av de seks nukleotid-substitusjonsratene i DQ- gener som svarer til 11 ( DQA ) og 7 ( DQB ) pattedyrsarter viser tydelig eksistensen av signifikante forskjeller mellom disse hastighetene (tabell 1), med overgangs- / transversjonsforstyrrelsen spesielt høy ved DQA (middelverdi: 2, 43). Som overgangsendringer ved tredje kodonposisjoner er i stor grad synonymt, vil brudd på den tilfeldige nukleotid-substitusjonsforutsetningen som ligger til grunn for NG-metoden føre til en undervurdering av antall potensielle synonyme steder og følgelig til en oppblåst verdi av d S. En annen mulig feilkilde ved estimering av d S i DQ- gener kan være relatert til kodesongbruk, som ikke tas i betraktning ved noen av de tre metodene som er vurdert. Vi har beregnet denne parameteren ved å beregne CBI 24 og Nc, 25 for DQA og DQB gener (Tabell 1). Våre data viser tilstedeværelsen av kodonforbruket bias i begge gener, en funksjon som kan utøve en rensende utvalgseffekt ved tredje codonposisjoner som reduserer frekvensen av synonyme substitusjoner. 26 Som tidligere diskutert, kan brudd på antagelsene som vurderes i hver evolusjonsmodell (NG, LWL og PBL) føre til forutbestemte estimater av w . Vi har analysert konsekvensene av disse forstyrrelsene ved å beregne d N, d S og deres forhold ( w = d N / d S ) med hver av de tre metodene som diskuteres (Tabeller 2 og 3). Den første konklusjonen som kan trekkes ut fra denne analysen er at estimatene varierer vesentlig avhengig av valgmetoden (tabell 2 og 3). For eksempel ser PBR-regionen til HLA-DQA seg under positiv utvelgelse ( w = 1, 488, NG) eller nøytralitet ( w = 0, 92-0, 94, LWL og PBL) avhengig av hvordan dN og dS beregnes. Inkonsekvensene som ble funnet ved måling w med forskjellige metoder, ba oss undersøke hvilke av de fire beregnede parametrene ( d N og d S i og utenfor PBR), estimert med en større standardavvik (sd). Måling av variasjonskoeffisienten (CV = sd / middel) for hver av disse fire parametrene viste at estimerte verdier av d S i PBR har stor sd uavhengig av metoden som brukes i beregningen av dem (Tabeller 2 og 3). Selv om d S PBR anslår gjennomsnittlig blant metoder, har standardfeil som er 72, 78% ( DQA ) og 70, 76% ( DQB ) av den gjennomsnittlige CV for dN PBR, d S no PBR og d N no PBR fra 29.09 til 45.99 % (Tabell 2 og 3). Den lave påliteligheten av d S PBR estimatene kan endre svært vesentlig beregningen av w- forholdet, og dermed skjule signaturen av positiv seleksjon på PBR av DQ molekyler. Nivåene av synonymvariasjon, angitt som antall synonyme substitusjoner og gjennomsnittlig antall synonyme forskjeller mellom sekvenser, er svært lave i PBR-regionen (tilleggstabell 2). På denne måten ligger det gjennomsnittlige antallet synonyme substitusjoner i PBR fra 1, 14 ( DQB ) til 2, 18 ( DQA ), og gjennomsnittlig antall synonyme forskjeller mellom sekvenser overskrider ikke enheten. Vi kan konkludere med at unøyaktigheten i estimeringen av d S PBR sannsynligvis er resultatet av en kombinasjon av faktorer, inkludert en dårlig passform av dataene i de antagelser som vurderes i hver evolusjonsmodell (overgangs- / transversjon og kodonbruksforstyrrelser), det lille tallet av kodoner som koder for PBR og det lave antallet synonyme substitusjoner som er lokalisert i denne regionen (mangel på informativitet), to funksjoner som åpenbart begrenser den statistiske kraften som avledninger blir gjort.

Full størrelse bord

Full størrelse bord

Full størrelse bord

Med tanke på disse ulempene har vi brukt en Z- test for å vurdere om w er signifikant større enn 1 i og utenfor PBR av DQ-molekylene (Tabell 4 og 5). Bare tre arter (mus, storfe og spenstig bomullsrot) viste noe bevis for positivt utvalg for DQA PBR, mens dette tallet økte til fem (ut av syv analyserte arter) for DQB PBR. Verdien av Z beregnes som ( d N - d S ) / (var d S + var d N ) 0, 5, noe som betyr at denne statistikken reduseres når variasjonene (var) av d N og d S estimatene er store. Med andre ord kan fraværet av signifikant avvik fra nøytralitet i DQA PBR av flere arter forklares ved metodologisk (høy sd ved beregning d S ) eller biologiske grunner (en annen sammensetning av PBR eller et svakere utvalgstrykk), eller av begge deler. Merkelig fant vi noen bevis på positivt utvalg i DQA no-PBR-regionen av hest og kaniner, et resultat som er vanskelig å tolke med mindre en differensiell struktur av PBR, med hensyn til krystallstrukturer rapportert i mennesker og mus, påberopes .

Full størrelse bord

Full størrelse bord

De forrige analysene klarte ikke opp mange av tvetydighetene om forekomsten av positivt utvalg på DQ- gener. Selv om en sterk signatur ble funnet for DQB i en rekke pattedyrrelaterte arter, var bevisbyrden ganske svak for DQA . For å få et mer meningsfylt perspektiv i disse problemene, analyserte vi våre data med en kodonbasert metodikk. 27 Ved å bruke en sannsynlighetskvotestest, tillater disse prosedyrene å sammenligne nøytrale modeller (M1a og M7) mot modeller som vurderer forekomsten av positivt utvalg (M2a og M8). En fordel ved denne tilnærmingen er at det tillater oss å identifisere de spesifikke kodonene som er under positiv utvelgelse, det vil si de som inneholder variasjon av funksjonell betydning. Det er verdt å nevne at M7 vs M8-testen er spesielt robust til økningen av den falske positive frekvensen som er forbundet med forekomsten av rekombinasjon 28 som derimot er relativt vanlig i DQ-regionen. 29, 30 Resultater oppnådd ved hjelp av denne metoden er vist i tabell 6 og 7. Sannsynlighetstestforsøkene ga betydelig bevis på positivt utvalg for DQA og DQB hos de fleste arter, idet de var signifikante til og med 0, 01% ( a = 0, 01%, sannsynlighet for type I-feil). Begge sammenligningene (M1a vs M2a og M7 vs M8) ga konsistente resultater. Fraværet av en signatur av positiv seleksjon på woodmouse Apsy-DQA- genet kan skyldes biologiske grunner, som argumentert av De Bellocq et al. 10, men det er også mulig at den lille størrelsen på de sekvenserte fragmentene (135 bp) har alvorlig begrenset den statistiske kraften som kodonbasert analyse ble utført (vi hadde bare sekvensinformasjon for 7 ut av 19 PBR-kodoner). Med andre ord, ville analysen av de komplette exon 2 Apsy-DQA- sekvensene være nødvendig for å bekrefte om dette genet er under positiv seleksjon eller ikke. I tilfelle av gris- DQA- genet ble det observert en svak tendens til positiv seleksjon, og det er mulig at inklusjonen av ytterligere DQA- sekvenser kan gi oss statistisk signifikans.

Full størrelse bord

Full størrelse bord

En stor del av kodonene som viste seg å være under positiv utvelgelse, tilhørte PBR eller ble plassert svært nær PBR-kodonene (Tabell 6 og 7), en funksjon som gir mening og gir betydelig bevis på at analysen vår tar en biologisk virkelighet. Generelt identifiserte M1a / M2a og M7 / M8-tester de samme kodonene som positivt valgt (Tabell 6 og 7). De eneste unntakene til denne generelle trenden var BoLA-DQB og SLA-DQB, hvor M7 / M8-testen tillot oss å identifisere flere positivt utvalgte kodoner som forblir uoppdaget med M1a / M2a-testen. Spesielt var flere positivt utvalgte kodoner uavhengig identifisert i minst tre arter (kodoner a47, a55, a56, a68, a69, a76 og a79 i DQA og kodonene P9, P26 og P57 i DQB ). Vedlikehold, i forskjellige og ofte ikke-relaterte, pattedyrsarter, av en betydelig mengde ikke-synonym variasjon ved disse spesifikke kodonene ved positiv seleksjon antyder at disse polymorfiene kan ha funksjonelle implikasjoner på peptidbindingen. Et eksempel på denne påstanden er kodon β57, som koder for en Asp vs ikke-Asp-polymorfisme som skjer med høy konservering gjennom hele evolusjonen. 31 Denne residensen spiller en kritisk rolle i peptidbindingen i både HLA-DQ og -DR molekyler, og det kan være forbundet med følsomhet overfor autoimmune sykdommer. 31 Videre har menneskelig erstatning av Ala ved Asp ved β57 dramatiske konsekvenser på bindingen av et λ-repressorpeptid av DQ, og fremhever den biologiske relevansen av denne konserverte polymorfisme. 31 Interessant har vi også funnet avvik mellom arter med hensyn til antallet og identiteten til de positivt utvalgte kodonene. Dette kan skyldes forskjeller i den tredimensjonale strukturen til PBR. Til tross for den bemerkelsesverdige konkordansen mellom PBR-kodende kodoner av mus H2-IA k og H2-IA d alleler eksisterer noen få små forskjeller, og også små avvik i PBR av mus IA og human DQ er blitt observert. 13, 14, 17 Det er også mulig at for bestemte arter er settet av sekvenser som er anvendt i vår analyse, ikke representativt for den reelle variabiliteten av DQ- generene (andre alleler og linjer forblir identifisert og variabilitet undervurderes) eller at genetisk drift og grunnleggereffekter har redusert MHC-variabilitet, som tidligere vist for DRB i forskjellige viltarter. 32

Til slutt gir vi vesentlig bevis på at positivt utvalg opererer i PBR-kodende regionen av DQ- gener ved å analysere et representativt utvalg av pattedyrsarter. Tidligere motstridende resultater, som de som er oppnådd for Apsy-DQA, kan forklares ved metodologiske snarere enn biologiske grunner. Til slutt har vi identifisert en rekke DQA- og DQB- kodoner som er positivt utvalgt i forskjellige arter. Disse kodonene kan være målet for assosiastudier med sykdomsresistens / følsomhetskarakteristika i disse innenlandske og vilde arter der genotypingsmetoder som er i stand til å fange hele variasjonen av DQA- og DQB- gener, ennå ikke er implementert.

Tilleggsinformasjon

Word-dokumenter

  1. 1.

    Tilleggsinformasjon

  2. 2.

    Tilleggstabeller 1 og 2

Tilleggsinformasjon følger med på papiret om gener og immunitet nettsted (//www.nature.com/gene)

Anbefalt Redaksjonens