Abstrakte
Den evolutionære tilstand af en multi-gen familie kan ændre sig over tid, afhængigt af den funktionelle differentiering og lokal genomisk miljø af familiemedlemmer. I denne undersøgelse har vi påvise en sådan ændring i melanom-antigen (
MAGE
) genfamilien på pattedyrs X-kromosom.
MAGE
gen familie består af ti underfamilier, der kan kategoriseres i to typer. Type I-gener er af relativ ny oprindelse, og de koder for epitoper til human leukocyt antigen (HLA) i cancerceller. Type II-gener er relativt gamle og nogle af deres produkter er kendt for at være involveret i apoptose eller celleproliferation. Den evolutionære historie
MAGE
genfamilien kan inddeles i fire faser. I fase I, havde en enkelt kopi tilstand af en nedarvet gen og evolutionært bevaret tilstand varede indtil fremkomsten af eutherian pattedyr. I fase II, otte underfamilie- forfædre, med undtagelse for
MAGE-C
MAGE-D
underfamilier, blev dannet via retrotransposition selvstændigt. Dette ville falde sammen med en gennemførelse byge af
LINE
elementer på eutherian stråling. Men
MAGE-C
blev genereret ved gen-duplikering af
MAGE-A
. Fase III er karakteriseret ved omfattende gen dobbeltarbejde inden for hver underfamilie og især dannelsen af palindromer i
MAGE-A
underfamilie, som fandt sted i en forfader til Østaber. Fase IV er karakteriseret ved nedbrydning af et palindrom i de fleste Østaber, med undtagelse af mennesker. Selvom palindrom er afkortet ved hyppige deletioner i aber og østaber er det bevaret i mennesker. Her vil vi argumentere for, at dette menneske-specifikke tilbageholdelse skyldes negativ selektion virker på
MAGE-A
gener, der koder epitoper af kræftceller, som bevarer deres evne til at binde til højt divergerende HLA-molekyler. Disse resultater fortolkes med hensyntagen til de biologiske faktorer forme seneste menneskelige
MAGE-A
gener
Henvisning:. Katsura Y, Satta Y (2011) Evolutionær historie Cancer Immunity Antigen
MAGE
Gene Family. PLoS ONE 6 (6): e20365. doi: 10,1371 /journal.pone.0020365
Redaktør: Nikolas Nikolaidis, California State University Fullerton, USA
Modtaget: 14 februar 2011; Accepteret: April 18, 2011; Udgivet: 10 juni, 2011
Copyright: © 2011 Katsura, Satta. Dette er en åben adgang artiklen distribueres under betingelserne i Creative Commons Attribution License, som tillader ubegrænset brug, distribution og reproduktion i ethvert medie, forudsat den oprindelige forfatter og kilde krediteres
Finansiering:. Dette arbejde blev understøttet af en Grant-in Støtte til videnskabelig forskning på prioriterede områder (17.018.032). De finansieringskilder havde ingen rolle i studie design, indsamling og analyse af data, beslutning om at offentliggøre, eller forberedelse af manuskriptet
Konkurrerende interesser:.. Forfatterne har erklæret, at der ikke findes konkurrerende interesser
Introduktion
den evolutionære tilstand af et gen familie, nemlig processen med fødsel og død af gener og omfang af sekvens divergens, afhænger af den funktionelle divergens af duplikerede gener og på den lokale struktur af genomet, hvor familien er bosat [1], [2]. Her, lokal struktur af genomet refererer til tandem eller omvendte gentagelser (IRS). Udviklingen af et gen familie på IRS kan være særlig komplekse som følge af homogenisering ved hyppig gen konvertering og strukturel ustabilitet som følge af hyppige indsættelser og /eller sletninger.
Warburton et al. (2004) fandt en overvægt af store, IR med en høj grad af lighed mellem gentagelser på X- og Y-kromosomer (-30% af IR i det humane genom er der X- og Y-kromosomer) [3]. Mange IR’er på X- og Y indeholder gener, overvejende udtrykt i testis [3]. Warburton og hans kolleger foreslog, at disse IR spiller en vigtig rolle i den menneskelige genom evolution. Imidlertid har den præcise rolle IRS i evolutionen forblev uklart. Derfor, i dette studie, vi forsøger at undersøge koncentrere tilstanden af gen familie evolution i IRS, med særligt fokus på melanom antigen (
MAGE
) gen-familien, hvor medlemmerne er placeret på en stor ( ~ 100 kb) palindrom på den menneskelige X-kromosom.
MAGE
blev oprindeligt identificeret som “en melanom antigen” og senere
MAGE
og dens homologer blev opdaget at danne en multi-genfamilien i eutherian genomer [4] – [7].
MAGE
homologe sekvenser er blevet fundet i nogle hvirveldyr (zebrafisk og kylling) [8], [9] og hvirvelløse dyr (frugt flyve) [10]. I det humane genom, er denne familie består af 10 underfamilier og hver underfamilie består af en til 15 gener [7]. Ud over klassificeringen af underfamilie,
MAGE
gener kan også klassificeres i type I eller type II, baseret på deres ekspressionsmønstre og funktion. Type I gener er sammensat af tre underfamilier (
MAGE-A
, til –
C
) og type II-gener af syv underfamilier (
MAGE-D
til –
F
, –
H
, –
L2
,
NDN
,
NDNL2
). Type I gener udtrykkes i stærkt prolifererende celler, såsom tumorer, placenta og kimlinieceller [4]. Type II-gener, derimod, er allestedsnærværende udtrykt i somatiske celler, og nogle type II gener er kendt for at være involveret i apoptose eller celle proliferation [11].
Alle type I
MAGE
gener er placeret på X-kromosomet og indkode tumorantigener, der spiller en central rolle i immunitet kræft. Peptider i humane MAGE homologi domæne (MHD), der er 160-170 aminosyrer langt, er epitoper til human leukocyt antigen (HLA) klasse I-molekyler [4]. Når antigenet (peptid i MHD) på en tumorcelle binder til en receptor på en killer T-celle, T-celle-angreb tumorcellen [4], [12].
HLA
er usædvanlig polymorf i det humane genom og anderledes
HLA
alleler kan binde forskellige epitoper [13], [14].
MAGE
gener kan kode mange epitoper således at binde til eller reagere med, hver HLA-molekyle. Således er det af interesse at spore oprindelsen af sammenhængen mellem
HLA
MAGE
samt at bestemme, hvordan den genetiske mangfoldighed i epitop-kodende region har udviklet sig og er blevet vedligeholdt.
Mange
MAGE
gener menes at være pattedyr-specifikke [7]. Desuden fleste eutherian
MAGE
gener har en enkelt exon at kode for et protein, og derfor er de tilbøjelige til at have stammer fra retrotransposition af
MAGE-D
[7], fordi kun
MAGE-D
underfamilie- medlemmer har 14 exoner, hvor en ORF kodes mellem den anden til 12. exoner [15]. Men forholdet mellem type I og type II-gener er ikke blevet fuldt undersøgt og den tilstand af diversificering af disse gener er fortsat uklart.
I denne undersøgelse undersøger vi den evolutionære historie
MAGE
genfamilie. Først søgte vi efter de fordums afveg
MAGE
gener i hvirveldyr og hvirvelløse genomer. For det andet, vi undersøgte, hvordan og hvornår forfædrene til hver tre type I og syv type II underfamilier blev genereret med særlig henvisning til deres form for forstærkning. For det tredje har vi fokus på den
MAGE
–
A
underfamilie (en af type I underfamilier) og demonstrere, hvordan genomet arrangement har fundet sted i primater. Endelig viser vi, at nogle menneske
MAGE
–
A
gener har gennemgået negativ selektion mod homogenisering af gen-konvertering for at bevare deres genetiske variationer blandt aminosyresekvenser. Vi foreslår, at dette valg er relateret til opretholdelse af en række HLA-epitoper i kræftceller.
Materialer og metoder
Sekvenser brugt
Menneskelige (
Homo sapiens
) nukleotidsekvensdata og tilsvarende gen information blev opnået fra NCBI-databasen (build 36,3; https://www.ncbi.nlm.nih.gov/). Syntenic eller homologe genomiske sekvenser fra andre primater og pattedyr, herunder opossums (
Monodelphis domestica
) og platypuses (
Ornithorhynchus anatinus
), blev hentet fra NCBI og Ensembl databaser (http: //uswest .ensembl.org /index.html). For at finde bevaret synteny mellem den menneskelige X-kromosom og kromosomer i andre dyr, analyser BLAST hjælp menneske
MAGE
gener som forespørgsler blev udført. For at identificere homologe sekvenser, bruger vi 70% som en cut-off værdi for BLAST søgninger.
Identifikation af genomiske strukturer
Identifikation af IR og tandemgentagelser blev udført på en dot-matrix tilgang [ ,,,0],16]. GenomeMatcher [17] blev derefter anvendt til at opnå detaljerede oplysninger om nukleotidsekvens lighed mellem dublerede enheder. Et diagram, der trækkes af dette program viser omfanget af lighed mellem sekvenser under anvendelse farvekoder, med røde repræsenterer ligheden større end 95%, orange svarende til ca. 90% -95%, grøn svarer til ca. 85% -90%, og blå repræsenterer under 85 %.
Phylogenetisk og molekylær evolutionær analyser
at studere fylogenetiske relationer mellem
MAGE
familiemedlemmer, 158 kodende sekvenser (CDS’er) i mennesket, chimpansen (
Pan troglodytes
), makak (
Macaca mulatta
), mus (
mus musculus
), ko (
Bos taurus
), hund (
Canis lupus
), opossum, næbdyr, kylling (
Gallus gallus
) og zebrafisk (
Danio rerio
) genom blev hentet fra NCBI-databasen (tabel S1).
MAGE
homologer blev også søgt i Ensembl database af den vestlige Xenopus laevis (
Xenopus tropicalis
), lampretter (
Petromyzon marinus
), lancelets (
Branchiostoma floridae
), sækdyr (
Ciona intestinalis
) og søpindsvin (
Strongylocentrotus purpuratus
). For hver af disse arter, vi har søgt på
MAGE
homologer over hele genomer. I søgninger i homologer,
MAGE-D
underfamilie- medlemmer blev anvendt som en forespørgsel, fordi
MAGE-D
menes at være den nedarvede
MAGE
underfamilien [7] . Når vi bruger andre menneskelige
MAGE
sekvenser som en forespørgsel, fandt vi, at sekvenser detekteret allerede var medtaget i den opnåede ved hjælp af
MAGE-D
resultat.
I det humane genom , var der 37 kommenteret
MAGE
gener på X-kromosomet: 15
MAGE-A
s, 11
MAGE-B
s, tre
MAGE-C
s, fem
MAGE-D
s, to
MAGE-E
s og en
MAGE-H
. Desuden er to
MAGE-F
s beliggende på kromosom 3 og
necdin-lignende 2 Hotel (
NDNL2
eller
MAGE-G
) ,
MAGE-lignende 2 Hotel (
MAGE-L2
) og
necdin
(
NDN
) er på kromosom 15. ud over de annoterede gener, en homolog sekvens (
psMAGEA-lignende: psMAGEAL
, NC_000023: 2.765.558 ‥ 2.770.471) svarende til den menneskelige
MAGE
pseudogen,
psMAGEA Hotel (NC_000023: komplementære 151.952.946 ‥ 151.957.859), blev identificeret. Gene forkortelser, der bruges i denne undersøgelse følger de standarder, der anvendes til menneskelige gener.
Sekvenserne opnåede blev justeret ved hjælp af Clustal W software [18] med manuelle korrektioner. Sekvenserne af menneskelig
MAGE-H
, –
A5
og mus –
A9
var korte. Disse blev kasseret, fordi inklusion af disse sekvenser optaget en meningsfuld sekvensalignment kort. Antallet af nukleotidforskelle per site (
s
-Distance) blev derefter beregnet under anvendelse MEGA4 [19], og fylogeni blev konstrueret under anvendelse af nabo-sammenføjning (NJ) [20] metode til rådighed i denne software. Phylogenies blev også konstrueret med randomiseret A (x) ccelerated Maximum Likelihood (RAxML) [21] og Bayesianske (Bayes) metoder. Et program for RAxML fremgangsmåden er leveret af https://phylobench.vital-it.ch/raxml-bb/og at for Bayes metoden er MrBayes 3 [22]. De justeringer, der anvendes her, er tilgængelige efter anmodning. DnaSP v5 [23] blev anvendt til vinduet analyse af nukleotid divergens. RepeatMasker [24] blev anvendt til at screene sekvenser for indflettede gentagelser i NCBI-databasen. Et program, GENECONV [25] blev anvendt til at detektere genomdannelse.
transkriptionsfaktorbindingssites
transkriptionsfaktorbindingssites (TFBS) blev undersøgt under anvendelse af TRANSFAC R4.3 databasen [26], tilgængelige på TFBIND hjemmeside (http: //tfbind.ims.u-tokyo.acjp/) [27]. For at finde en kandidat TFB blev sekvenser opstrøms af målgener justeret, og højt konserverede sekvenser blev valgt. Sekvenserne blev kontrolleret for tilstedeværelsen af TFBS kommenteret i databasen.
Resultater
Oprindelse af hvirveldyr og pattedyr
MAGE
genfamilien
For at identificere
MAGE
homologer i lampretter, lancelets, sækdyr og søpindsvin, var en bragende søgning udføres for deres genom og EST-sekvenser, ved hjælp af
MAGE-D
gener som forespørgsler. Selv om der var ingen påviselige homologe gener i lampretter og søpindsvin, hypotetiske gener i begge sækdyr (XM_002119518) og lancelets (XM_002613563) viste 37% sekvens lighed med den menneskelige
MAGE-D1
. De BLAST søgeresultater viste, at fremkomsten af
MAGE
gen kunne have fundet sted før divergens Protochordata fra Chrodata.
I kæbet hvirveldyr, zebrafisk genom har en enkelt
MAGE
gen,
Necdin-lignende 2 Hotel (
DareNDNL2
) [8].
NDNL2
gener findes også i mennesker, mus og køer, men eutherian
NDNL2s
behandles gener og har en enkelt exon, mens
DareNDNL2
besidder ~11 exons. Et fylogenetisk træ baseret på aminosyresekvenser viser, at eutherian
NDNL2
s er paraphyletic til
DareNDNL2
(fig 1 og S1.):
DareNDNL2
er en “primær” ortolog af eutherian
MAGE
gener [28]. Denne fylogenetiske forhold (topologi af træet) understøttes også af RAxML og Bayes træer (data ikke vist).
CDS’er på 158
MAGE
gener blev brugt (se tabel S1). CDS sammenlignet er 204 bp lang. Efter justering blev alle huller udelukket for træ konstruktion. Underfamilie klynger er vist. Antallet på hver node er bootstrap værdi understøtter node. Fisk
NDNL2 Hotel (
Dare NDNL2
) og pattedyr
NDNL2
er vist med blåt. Artsnavnet forkortelser er som følger: Bota (
Bos taraus
), Capo (
Cavia porcellus
), Dare (
Danio rerio
), Gaga (
Gallus gallus
), Hosa (
Homo sapiens
), Mamu (
Macaca mulatta
), Modo (
Monodelphis domestica
), Mumu (
Mus musculus
), Orna (
Ornithorhynchus anatinus
), og Patr (
Pan troglodytes
). Figur S1 er en forstørret udgave af dette tal og har læselig tekst.
Hver af frø og kylling genomer besidder kun en
MAGE
gen. I begge tilfælde, om syntenic forhold med
DareNDNL2
, position af genet på et kromosom kunne ikke bekræftes på grund af den ufuldstændige tildeling af gener på kromosomer i disse arter. Men da faser ved hver exon og intron grænse i CDS af fisk, frøer og høns var godt bevaret (tabel 1), den fælles
MAGE
gener i frøen og kylling vil sandsynligvis være en-til -on orthologer af
DareNDNL2
.
Selv om kun en enkelt
MAGE
blev fundet i fisk, frøer og høns, mennesker og mus har flere underfamilier af
MAGE
gener [7]. Det er således interessant at undersøge
MAGE
homologer i Monotremer (næbdyr) og pungdyr (opossum). En fuld-genom BLAST søgning ved hjælp af menneskelig
MAGE-D1
som en forespørgsel opdaget en
MAGE
-lignende (
Magel
) sekvens i Platypus og to
Magel
s i opossum. Disse blev tentativt navngivet
OrnaMAGEL
og
ModoMAGEL1
/
L2
hhv. BLAST søger hjælp andre
MAGE
gener såsom
DareNDNL2
som en forespørgsel resulterede i påvisning af de samme gener.
opossums
ModoMAGEL1
ModoMAGEL2
er placeret på kromosomer X og 8.
ModoMAGEL2
er kodet af en enkelt exon, mens
ModoMAGEL1
er kodet med 11 exons. Således
ModoMAGEL2
vil sandsynligvis være et forarbejdet gen afledt af
ModoMAGEL1
. Faktisk
ModoMAGEL1
ModoMAGEL2
danne en monofyletisk gruppe i træet (fig. 1, fig. S1) og i træer konstrueret ved tre forskellige metoder (NJ, RAxML og Bayes).
de platypuses
OrnaMAGEL
gen er placeret på contig’en Ultra 403 og består af 10 exons. Selvom antallet af exons afviger fra det i
ModoMAGEL1
faserne og størrelser af delte exons velbevarede (tabel 1). Desuden Ultra 403 indeholder også ubiquitin ligasegenet
HUWE1
(HECT, UBA og WWE domæne, der indeholder 1), som er placeret ~600 kb opstrøms fra
OrnaMAGEL
. En
in situ
hybridisering undersøgelse bekræftede, at i Platypus,
HUWE1
er placeret på kromosom 6 [29]; Således er det sandsynligt, at denne contig er en del af kromosom 6. Platypus kromosom 6 er homolog med autosomale forfader til eutherian og pungdyr X-kromosomer [29]. Faktisk området omkring
OrnaMAGEL
på contig’en viste et syntenic forhold til den humane Xp11 region. I det menneskelige genom, den position, der svarer til
OrnaMAGEL
er besat af
MAGE-D2
–
D3
(. Figur 2). Menneskelig
MAGE-D2
–
D3
besidder 13 exons og faser og størrelser af delte exoner er bevaret med
OrnaMAGEL
, samt med
ModoMAGEL1
og andre
MAGE
gener i kylling, frø og zebrafisk genomer (tabel 1).
Røde søjler angiver
MAGE-D
eller
Magel Salg gener i det humane eller næbdyr hhv. Sorte bjælker og gen navne indikerer syntenic gener mellem mennesker og platypuses. Blå barer og gen-navne indikerer gener, som ikke viser synteny. Andre
MAGE-D
underfamilie- medlemmer,
MAGE-D1
MAGE-D4
er placeret på 51,6 M og 51,9 M på den menneskelige X-kromosom, hhv.
Fylogeni af pattedyrs
MAGE
genfamilien
Et træ af menneskelig
MAGE
gener viser, at de tre type i
MAGE
underfamilier (
MAGE-a
, –
B
og –
C
) danner en monofyletisk klynge, der adskiller sig fra de syv type II underfamilier (
MAGE- D
, –
E
, –
F
, –
H
, –
L2
,
NDN
NDNL2
) (fig. 3). Beviserne er støttet af fem fylogenetisk informative substitutioner (D16Y, K23T, I62V, A113E og R156Q i en tilpasning af MHD, fig. S3). Desuden
MAGE-D Salg gener danner en monofyletisk klynge. Selvom antallet af nukleotider, der anvendes i denne analyse er lille, er det klart, at type I underfamilier afveg mere nylig end type II underfamilier (fig. 3 og fig. S2).
Træet er baseret på antallet af aminosyre forskelle pr webstedet (
s
-distances). Gener men for
DareNDNL2
i træet er alle
MAGE
gener fundet i det humane genom.
DareNDNL2
fra zebrafisk bruges til at bestemme roden af træet. Antallet af lokaliteter sammenlignet er 92 aminosyrer uden huller. Bootstrap værdi er angivet ved knudepunktet. Sekvenser er anført i tabel S1.
MAGE-E
har duplikeret MHD og dobbeltarbejde er opstået tidligere end fremkomsten af typen Ι gener.
MAGEE1_1 Hotel (
MAGEE2_1
) og
MAGEE1_2 Hotel (
MAGEE2_2
) repræsenterer MHD i N og C-terminal side af
MAGE-E1 Hotel (
MAGE-E2
), hhv. Den eutherian
MAGE-D3
genet koder trophinin (TRO), som udtrykkes i placenta og påvirker embryo implantation.
Med undtagelse af
MAGE-D
gener, pattedyr
MAGE
gener har en enkelt exon for CDS. Således disse er tilbøjelige til at blive behandlet gener stammer fra udskrifter af
MAGE-D
eller andre
MAGE-D
behandlet gener [7], [30]. Men vi kan ikke udelukke muligheden for, at en forfader til hver underfamilie skyldes duplikering af et forarbejdet gen.
For at undersøge, hvordan stamfader til hvert gen familie opstod, nukleotidsekvenserne af en enkelt repræsentanter fra hver underfamilie var sammenlignet med hinanden ved hjælp dot-matrix analyse [16]. Hvis en hel kodende region, herunder flankerende region er blevet duplikeret, den dotter analyse viser ligheden ud over CDS. På den anden side har en forfader til hver underfamilie blevet genereret af retrotransposition, viser analysen, ligheden kun i CDS.
For det meste
MAGE
gener, dot-matrix analyse viste der blev observeret inden for og mellem type i og II betydelige ligheder kun i CDS regioner, hvilket tyder på en retrotranspostion. En sammenligning mellem
MAGE-A
og
MAGE-C
, på den anden side, var en undtagelse. Sammenligningen afslører ligheden ud over CDS, hvilket tyder på DNA-baseret gen dobbeltarbejde. Imidlertid kan det være muligt, at andre underfamilier også blev dannet ved genduplikering. Rækkefølgen lighed i flankerende regioner af dubletter blev muligvis tabt under evolution på grund af den svagere funktionelle begrænsning. Faktisk omfanget af synonyme sekvens forskelle blandt type II gens og dem mellem type I og type II-gener i området fra 0,81 til 1,0, således at der ikke væsentlig lighed i en region uden CDS blev observeret. Selvom cladistisk markører såsom
linjer
kunne have været oplysende til at skelne retrotransposition fra gen dobbeltarbejde, blev der ikke fundet sådanne informative elementer. , I mangel af støttende beviser, vi konkluderede derfor, at
MAGE-C
blev kopieret fra
MAGE-A
og at andre underfamilier blev genereret af retrotransposition. I alt otte indrykninger af retrotransposed
MAGE
har fundet sted i genomet af fædrene Eutheria og hver forarbejdet gen blev en forfader til en underfamilie. Efter retrotransposition, ser ud til at have fundet sted inden for hver underfamilie en uafhængig gen dobbeltarbejde.
Gene dobbeltarbejde og palindrom dannelse
Det er bemærkelsesværdigt, at klyngedannelse mønster af
MAGE-A
adskiller sig fra
MAGE-B
(fig. 1, fig. S1). Hver af de 11 menneskelige
MAGE-B
gener danner et monofyletisk klynge med ortologer i andre eutherians, mens 15
MAGE-A
gener danner arts- eller højere systematiske enhed-specifikke klynger (fig. 1 , fig. S1 og S2). Desuden tre
MAGE-C
gener synes at være primat-specifik. Inden de to type II
MAGE
underfamilier, fem
MAGE-D
to
MAGE
–
E
gener viser også en klyngedannelse mønster (en- til-en ortologe forhold), der svarer til
MAGE-B Hotel (fig. 1 og 3).
i alt 16
MAGE-A
gener er placeret på Xq28, i størrelsesordenen 148 Mb til 153 Mb, og er grupperet i tre blokke A, B og C (fig. 4A). Blokke A og B indeholder fem (
MAGE
–
A11
, –
A9
, –
A9B
, –
A8
psMAGEA7
) og ti (
MAGE
–
A4
, –
A5
, –
A10
, –
A6
, –
A2B
, –
A2
, –
A12
, –
A3
,
psMAGEA
og
psMAGEAL
) generne, hvorimod blok C indeholder et enkelt gen (
MAGE-A1
) (fig. 4B og C). Hver af de tre blokke besidder et palindrom (fig. 4C). Men kun i blok B fleste gener (seks ud af ti) er placeret på begge arme af palindrom (fig. 4C). Tre næsten identiske par af
MAGE
–
A2-service /
A2B
, –
A3-service /
A6
,
psMAGEA /psMAGEAL
er placeret i symmetriske positioner på armene (fig. 4B og 4C), mens
MAGE-A12
ligger i loop regionen. Vi har udpeget et par dublerede gener eller sekvenser x og y på symmetriske positioner af palindrom som x /y. Den fylogenetiske forhold mellem 16
MAGE-A
gener, herunder
psMAGEAL
(fig. 4B, se Materialer og metoder), og med
MAGE-D
anvendes som udgruppe afslørede, at fem gener i blok B er i en monofyletisk gruppe, mens et par af
psMAGEA
/
psMAGEAL
gener er fjernt beslægtet med andre
MAGE-a
gener.
(
A
) En diagonal linje fra øverste venstre til nederste højre viser identitet inden for regionen. Regionen er opdelt i tre underregioner, A, B, og C, som indeholder fem, 10 og en
MAGE-A
gener hhv. (
B
) Træet blev bygget ved hjælp af antallet af nukleotid forskelle (
s
-distances) blandt CDS’er (1916 bp) af de 16
MAGE-A
gener. Antallet på hver node repræsenterer bootstrap sandsynlighed understøtter denne node. Bootstrap værdier større end 50%, er vist. Operationelle taksonomiske enheder (otu) i magenta, grøn og blå repræsenterer gener i delregioner A, B og C, hhv. (
C
) Tre forudsagt palindromer vist i delregioner A, B og C. I delregion B, de fleste af gener er placeret på formodede palindrom arme.
Menneskelig blok B består af syv duplikerede enheder. Hver enhed er 10-20 kb lang og indeholder et
MAGE-A
og en chondrosarcoma associeret gen (
CSAGE
) [31] (fig. 5
A
). BLAST analyse af pattedyr genomer viser også fravær af
CSAGE
homologer i ikke-primater pattedyr. Den palindrom i blok B blev ikke observeret i ikke-primater genomer, såsom mus, hund og hest genomer.
(
A
) De diagonale linjer fra venstre øverst til højre bund indikerer identitet i det menneskelige (venstre panel) eller makak (højre panel) sekvens. Huller i den diagonale linje i makak indikerer sekventering hullerne. De farvede kasser i bunden af hvert panel angiver syv duplikerede enheder. De samme farvede kasser inden for en art viser, at de er mere tæt knyttet til hinanden end til andre, mens dem mellem art viser formodede ortologer. (
B
) Palindromes forudsagt i delområde B i humane (venstre) eller makak (højre) sekvens. Tal ved siden af linjer angiver hver duplikerede enhed. (
C
) En NJ træ baseret på
s
-distances mellem duplikerede enheder (2880 bp) er vist. Farven-koden for OTU er den samme som i (
A
) og (
B
).
Blandt primater, blok B kan identificeres i makakaber (fig. 5
A
). Denne blok indeholder også syv duplikerede enheder, men i form af den forventede palindrom afviger mellem mennesket og makak. I modsætning til den lange stilk og korte loop observeret i det menneskelige, i makak, er en kort stilk og en stor løkke struktur forudsagt (fig. 5
B
). Endvidere er orthology af enheder mellem makakaber og mennesker nysgerrige givet deres positioner. For nemheds skyld har vi udpeget de syv duplikerede enheder i blok B som
h1
til
h7
i mennesker og
m1
til
m
7 i makakaber ( fig. 5
A
) og derefter undersøgt deres fylogenetiske relationer (fig. 5
C
). Enheder af
h1
/
h7
personen skjult
psMAGEAL
og
psMAGEA
gener er ortologe til
m1
/
m7
. Enheder af
h3
/
h5
med
MAGE-A2 /A2B
gener er ortologe til
m5
med
MAGE-A2
: men i makakaber,
m5
ligger i løkken, og der er ingen partner (en meget lignende sekvens) af
m5
i blokken. Enheden for
h4
med
MAGE-A12
er ortologe til
m3
, men i makakaber denne enhed ikke indeholder en
MAGE
gen (Fig . 5
A
). Desuden forholdet mellem
h2
/
h6
,
m
2,
m4
og
m
6 er noget forvirrende, trods det faktum, at
MAEG-A3 /A6
er i
h2
/
h6
og tre mulige homologer (
MAGE-A3
, –
3L
, og –
A3L
) er i
m
2,
m4
og
m
6.
s
-Distance mellem
h2
h6
var 0,7% (± 0,2), mens
s
-distances blandt
m
2,
m4
og
m
6 er meget større (12,1%) end den tidligere. De parvise afstande på enheder mellem mennesker og makakaber varierede fra 8,3% (± 0,5) til 17,7% (± 0,7), som er for stort til en ortologe forhold. Den fylogeni heller ikke støtte en ortologe forhold mellem hver af de tre enheder i makakaber (
m
2,
m4
, eller
m
6) og
h2
/
h6
(fig. 5
C
).
for yderligere at undersøge de ortologe relationer i disse duplikerede enheder, cladistisk markører såsom
SINE
s og
LINE
s blev søgt hjælp RepeatMasker software [24] (fig. 6). Generelt arrangementet af
SINE
s,
LINE
s,
LTR
s, og korte gentagelser i blok B viser en delvis lighed mellem det menneskelige og makak genom. Positionen og typen af repetitive sekvenser findes på tværs af hele
m2
region er næsten identiske med dem, der findes i den distale halvdel af
h2
. observeres En lignende fordeling af repetitive sekvenser mellem en region af
m5
og
h5
, og ligheden er også observeret mellem en del af
m4
og af
h4
. Men artsspecifikke regioner synes at være til stede i hvert genom. Hos mennesker, regionen er ~ 40 kb lang og strækker sig fra midten af
h2
til
h4
, mens det i makakaber, den artsspecifikke region er -30 kb og strækker sig fra midten af
m2
til
m4
. I modsætning til resultaterne af fylogeni og genetisk afstand analyser (fig. 5
C
og 6), viste cladistisk markører,
h2
med menneskelig
MAGE-A6
m2
med makak
MAGE3L
er faktisk ortologe til hinanden.
Farvede trekanter viser indflettede elementer (
linjer
eller
Sines
) ,
LTR
, DNA transposoner (
DNA-TP
) eller simple gentagelser (
SR
) findes i den menneskelige eller makak genom, hhv. Beslag under hver linje angiver duplikerede enheder. Lyserøde pile angiver palindrom struktur. Den lyseblå pil viser sekventering huller i makakaber. Breve a til l og et “til i ‘på trekanterne angiver orthologe indsættelse elementer i de menneskelige og makak-genomer. Den lysegrønne bar indikerer en human-eller makak-specifik region og stiplede linjer angiver grænsen mellem artsspecifik og ortologe regioner.
Menneske-specifikke palindrom og gen konvertering
dot-matrix analyse viste, at palindrom i blok B fremgår kun hos mennesker. Selvom sekventering huller i øjeblikket findes i chimpanse og orangutang genom, viste de tilgængelige sekvenser, at palindrom i blok B er mindre tydelig i disse to aber end i mennesker (fig. 7). Vi parsimoniously udledte den nedarvede tilstand af palindrom ved anvendelse af sekvensinformation af genomet af bevarede primater.
Vinduet størrelse er 500 bp med nogen overlapning mellem hosliggende vinduer. Farvede rektangler i bunden af figuren angiver den duplikerede enhed, herunder
MAGE
gener (lys rosa pile). Ordinaten repræsenterer nukleotid divergens (
d
) og abscissen repræsenterer positionen (i bp) i forhold til midten af sløjfen (position nul, blå pil). Området omkring en rød stiplet linie indikerer den høje afveget region i
MAGE-A3
MAGE-A6
.
Gener på palindromer kan opleve hyppige genkonversion . Faktisk et vindue analyse af 500 bp med et ikke-overlappende interval afslører, at sekvenser af palindrom i arme er næsten identiske (fig. 8).
Leave a Reply
Du skal være logget ind for at skrive en kommentar.