PLoS ONE: Y-kromosom Beviser for fælles afstamning af Tre kinesiske populationer med en høj risiko for kræft i spiserøret

Abstrakte

Høje kræft i spiserøret (EF) findes i mennesker i Henan Taihang Mountain, Fujian Minnan, og Chaoshan regioner i Kina. Historiske optegnelser beskriver store bølger af befolkningerne migrerer fra nord-centrale Kina (Henan og Shanxi Hans) gennem kystnære Fujian-provinsen til Chaoshan sletten. Selv om disse regioner er geografisk fjernt, hypotese vi, at EF højrisiko populationer i disse tre områder kunne dele en fælles afstamning. Derfor brugte vi 16 østasiatiske-specifikke Y-kromosom biallelmarkører (enkelt nukleotid polymorfier, Y-SNP’er) og seks y-kromosom kort tandem repeat (Y-STR) loci at udlede oprindelsen af ​​EF Chaoshan befolkning høj risiko ( CSP) og den genetiske forhold mellem CSP og EF højrisiko Henan Taihang Mountain population (HTMP) og Fujian befolkning (FJP). De dominerende haplogruppe i disse tre populationer er O3 *, O3e *, og O3e1, med ingen signifikant forskel mellem befolkningerne i hyppigheden af ​​disse genotyper. Frequency distribution og principal komponent analyse viste, at CSP er nært beslægtet med den HTMP og FJP, selvom førstnævnte er geografisk tættere på andre populationer (Guangfu og Hakka klaner). Den FJP er mellem CSP og HTMP i hovedkomponent plot. CSP, FJP og HTMP er mere nært beslægtet med kinesiske Hans end mindretal, undtagen Manchu kinesisk, og er efterkommere af Sino-tibetanere, ikke Baiyues. Korrelationsanalyse, hierarkisk klyngedannelse analyse og fylogenetisk analyse (nabo-sammenføjning træ) al støtte luk genetiske slægtskab mellem CSP, FJP og HTMP. Netværket for haplogroup O3 (herunder O3 *, O3e * og O3e1) viste, at HTMP har højeste STR haplotype mangfoldighed, hvilket tyder på, at HTMP kan være en stamcelle population for CSP og FJP. Disse resultater understøtter den potentielt vigtige rolle delt herkomst i forståelsen mere om den genetiske modtagelighed i EF ætiologi i højrisiko populationer og har betydning for bestemmelse af molekylære grundlag for denne sygdom

Henvisning:. Huang H, Su M , Li X, Li H, Tian D, Gao Y, et al. (2010) Y-kromosom Beviser for fælles afstamning af Tre kinesiske populationer med en høj risiko for kræft i spiserøret. PLoS ONE 5 (6): e11118. doi: 10,1371 /journal.pone.0011118

Redaktør: Amanda Ewart Toland, Ohio State University Medical Center, USA

Modtaget: Marts 24, 2009; Accepteret: 19 maj 2010; Udgivet 15. juni, 2010

Copyright: © 2010 Huang et al. Dette er en åben adgang artiklen distribueres under betingelserne i Creative Commons Attribution License, som tillader ubegrænset brug, distribution og reproduktion i ethvert medie, forudsat den oprindelige forfatter og kilde krediteres

Finansiering:. Dette arbejde blev støttet af National Natural Science Foundation of China (nr 30210103904) og Key Natural Science Foundation i Guangdong-provinsen, Kina (nr A1080203). De finansieringskilder havde ingen rolle i studie design, indsamling og analyse af data, beslutning om at offentliggøre, eller forberedelse af manuskriptet

Konkurrerende interesser:.. Forfatterne har erklæret, at der ikke findes konkurrerende interesser

Introduktion

den ikke-rekombination del af Y-kromosomet (NRY) har unikke egenskaber, herunder faderlige arv, manglende rekombination ved meiose, og en relativt lav sandsynlighed for tilbagevendende mutationer og dermed tilføre det med befolkningsbaserede og område- specifikke polymorfier. Således NRY er især nyttig for studiet af menneskelige evolution og populationsgenetik. To typer af polymorfier findes på NRY: single nukleotid polymorfier (SNP) og korte tandem repeat (STR) loci, hver med forskellige mutationsrater og mekanismer. Derfor kombineret analyse ved hjælp af disse 2 typer af polymorfe markører øger effekten af ​​NRY til brug i sporing den menneskelige evolution samt migration gennem forskellige geografiske lokaliteter og tidsplaner, og derfor kunne også være effektiv i at skildre de fædrene strukturer befolkninger.

Ja, i 1999, Su et al. [1] konstateret 17 Y-kromosom haplogruppe baseret på 19 østasiatiske-specifikke biallelmarkører, der afslører de faderlige strukturer af befolkningerne i Østasien. Ved at undersøge 63 udsnit af befolkningen, fra Asien, Afrika, Amerika, Europa og Oceanien, forfatterne fandt, at sydøst befolkninger i Østasien er mere genetisk forskelligartet end er nordlige dem og foreslog, at østasiater stammede fra syd. På grundlag af Y-SNP og Y-STR varians, konkluderede de, at den første afregning af moderne mennesker i Østasien skete omkring 18,000-60,000 år siden [1].

Kræft i spiserøret (EF) er en af de mest almindelige dødelige kræftformer verdensplan [2] og har høje forekomster i nogle geografiske områder. I Kina, de fleste EF patienter lever i den såkaldte “EF-bælte,”, som strækker sig fra det centrale Kina vestpå gennem Centralasien til det nordlige Iran [3] – [4]. Den bedst kendte region for høj EF risiko er nord-centrale Henan Taihang Mountain område (HTM befolkning [HTMP]), der ligger blandt de Henan, Hebei, og Shanxi provinser (fig. 1). Mindre kendte regioner er den sydøstlige kyststrækning Chaoshan Plain i Guangdong-provinsen (CS befolkning [CSP]) og Minnan området i Fujian-provinsen (FJ befolkning [FJP]). Selvom de 2 sidstnævnte provinser relativt geografisk isoleret fra det indre af Kina, er de stadig anses for at opholde sig i EF bælte og der er bevis for en høj EF risiko på disse områder [5] – [6]. For eksempel, i en forholdsvis isoleret distrikt i CSP-Nanao Island-årlig gennemsnitlig rå forekomst af EF var 103.98 /100.000 mennesker fra 1995 til 2004; de aldersbetingede standardiserede incidensrater for EF var 72~150 /100.000 mænd og 26~64 /100.000 hunner, med en signifikant øget forekomst for mænd, men ikke kvinder mellem 1995 og 2004 [5]. For FJP, 18 amter rapporterede en dødeligheden for EF over 30 /100.000 mennesker [7], som er mindst det dobbelte af landsgennemsnittet [8]. CSP, FJP og HTMP er tilhøre Nordøst-asiatiske grupper.

Pile viser nord-til-syd vandringer Han indbyggere fra nord-centrale Kina ifølge historiske optegnelser. CSP, Chaoshan EF høj risiko befolkning; FJP, Fujian EF høj risiko befolkning; HTMP, Henan Taihang Mountain EF højrisiko-population.

De geografiske områder syd-litorale (Chaoshan og Fujian-områder) og nord-centrale Kina (Henan og Shanxi) er forskellige, men befolkningerne i disse regioner deler en høj risiko for EF [9]. Ifølge historiske optegnelser [10] – [11], Han indbyggere i nord-centrale Kina (Henan og Shanxi Hans) kontinuerligt migreret ind i Chaoshan område gennem Fujian-provinsen for at undslippe krig og hungersnød, og efterhånden blev de fremherskende indbyggere Chaoshan. Desuden har familiær sammenlægning af EF blevet observeret i nord-centrale Kina og Chaoshan området [12] – [14]. Disse resultater understøtter den potentielt vigtige rolle delt herkomst bidrager til den genetiske modtagelighed for EF i højrisiko populationer i Kina.

Derfor har vi en hypotese, at disse tre EF højrisikogrupper kan være genetisk relateret. For at teste vores hypotese om fælles afstamning, vi analyseret 16 østasiatiske-specifikke biallelmarkører [1], [15] (SNP’er) og syv Y-STR loci blev analyseret for at undersøge NRY struktur i EF højrisiko-CSP, FJP og HTMP. Faktisk haplogroup frekvenser og principal komponent, korrelation, hierarkisk klyngedannelse, fylogenetiske (nabo-sammenføjning træ) og netværk analyserer alle støtter den tætte genetiske slægtskab af CSP, FJP og HTMP. Fastslå den genetiske baggrund af EF-patienter kan bidrage til at afklare de molekylære genetiske mekanismer esophageal carcinogenese, forbedre evalueringen af ​​risikofaktorer hos personer fra højrisikogrupper, og fremme gennemførelsen af ​​effektive screening og forebyggende foranstaltninger.

Resultater

Fordeling af NRY haplogruppe i de tre EF højrisiko populationer i Kina

de haplogroup frekvenser af de tre EF højrisiko populationer blev baseret på Y-SNP skrive. Som vist i tabel 1, blev 10 Y- kromosom haplogruppe identifed. Y-kromosomet haplogruppe af de tre undersøgte populationer hovedsageligt klynge omkring O3 *, O3e *, og O3e1, som er de karakteristiske haplogruppe for Northern østasiater; de overordnede frekvenser var 65,16%, 66,21% og 60,42% for CSP, FJP og HTMP henholdsvis og afveg ikke signifikant blandt befolkningerne (2-sidede

X

2 = 4,213,

s

= 0,122). Disse resultater giver evidens for genetisk slægtskab mellem disse tre EF højrisiko populationer. O *, O1 *, O2a *, og O2a1, de fire fælles haplogruppe i de sydlige østasiater, var hyppigere i CSP og HTMP end i FJP (2-sidet

X

2 = 8,355,

s

= 0,015). C *, D1, og F * haplogruppe var mere almindelige i den nordlige end sydlige gruppe, og deres samlede frekvenser var signifikant lavere i CSP end i de to andre (2-sidet

X

2 = 11,327,

s

= 0,003). Disse resultater understøtter hypotesen af ​​gen flow mellem HTMP, FJP, og CSP.

PC analyse afslører tæt affinitet mellem de tre EF højrisiko populationer

PC plots af Y- SNP og Y-STR frekvenser er vist i fig. 2 og 3, henholdsvis og er baseret på genotypebestemmelse Resultaterne af de tre EF højrisiko populationer og yderligere data fra andre kinesiske befolkningsgrupper. Fig. 2 og 3 er de to-dimensionelle grafer for komponent 1 (PC1) og komponent 2 (PC2). Den kumulative bidrag PC1 og PC2 udgjorde 79,88% og 76,88%, henholdsvis af de samlede variationer fra Y-SNP og Y-STR hhv. Som vist i fig. 2, de tre EF højrisiko populationer hovedsageligt danne en klynge. To Northern Hans populationer (mærket 4 og 5) og Hakka (mærket 13) befolkning to sydlige Hans (mærket 22 og 23) klynge sammen, hhv. Resten af ​​de nordlige Hans og sydlige Hans danner en anden gruppe. EF højrisiko CSP er isoleret fra både Guangzhou Han (mærket 15) og Hakka populationer. De tre EF højrisiko populationer og Manchu danner en tydelig klynge (fig. 3). De er mere tæt forbundet med kinesiske Hans end til de andre seks minoriteter. Seks mindretal nationaliteter og en Southern Han (mærket 4) er spredt. Resten af ​​de nordlige og sydlige Hans danner en anden gruppe.

I principal-komponent plot, jo mindre afstanden mellem befolkninger, jo tættere deres forhold. Generelt 23 populationer er inddelt i 4 klynger: de tre EF højrisiko populationer, to nordlige Han populationer (mærket 5 og 6) og Hakka befolkning, to sydlige Han populationer (mærket 22 og 23) og resten af ​​den nordlige Han og Southern Han klynge hhv. 1, Chaoshan EF høj risiko befolkning; 2, Fujian EF høj risiko befolkning; 3, Henan Taihang Mountain EF højrisiko befolkning; 4, Hebei Han; 5, Liaoning Han; 6, Xinjiang Han; 7, Shangdong Han; 8, Gansu Han; 9, Shanxi Han; 10, Neimeng Han; 11, Henan Han; 12, Hakka Han; 13, Hunan Han; 14, Hubei Han; 15, Guangzhou Han; 16, Zhejiang Han; 17, Jiangxi Han; 18, Shanghai Han; 19, Anhui Han; 20, Jiangsu Han; 21, Yunnan Han; 22, Guangxi Han; 23, Sichuan Han. 4-11 refererer til det nordlige Han og 12-23 til det sydlige Han.

Dette kort tegner sig for 76,88% af den oprindelige genetiske variation. De tre EF højrisiko populationer og Manchu formular 2 klynger; de tre nordlige Han (mærket 10-12) og fem sydlige Han befolkninger (mærket 5-9) udgør en anden gruppe. De resterende populationer er spredt. 1, Chaoshan EF høj risiko befolkning; 2, Fujian EF høj risiko befolkning; 3, Henan Taihang Mountain EF højrisiko befolkning; 4, Fujian Han; 5, Anhui Han; 6, Yunnan Han; 7, Henan Han; 8, Zhejiang Han; 9, Guangzhou Han; 10, Dongbei Han; 11, Beijing Han; 12, Tianjing Han; 13, tibetansk; 14, Uygur; 15, Krigiz; 16, Manchu; 17, Shui; 18, Naxi; 19, Zhuang. 4-9 refererer til det sydlige Hans, 10-12 til det nordlige Hans, 13-17 til Northern mindretal nationaliteter, 18-19 til sydlige mindretal nationaliteter.

Correlation analyse afslører positive associationer mellem de tre EF høje -risk befolkninger og kinesiske Hans

for yderligere at belyse forholdet mellem befolkninger, vi udførte korrelationsanalyse baseret på Y-SNP haplogroup og Y-STR haplotypefrekvenser (tabel 2 og 3, henholdsvis). Signifikant positiv korrelation eksisterede blandt de tre EF højrisiko populationer. Korrelationskoefficienten mellem EF højrisiko-CSP og FJP var højere end mellem CSP og EF højrisiko HTMP. Desuden Tabel 2 viser et positivt korreleret mellem HTMP og det meste af den kinesiske Hans, en positiv korrelation mellem FJP og kun Liaoning Han, og en positiv sammenhæng mellem CSP og Hakka, Hebei, og Hunan Hans (tabel 2) . På grund af dårlig kommunikation og transport i fortiden, kan Chaoshan og Fujian områder er blevet et relativt lukket samfund, med mindre genflow med andre populationer, og fordi EF højrisiko HTMP ligger i det centrale Kina, kan denne population have haft større mulighed til at kommunikere med andre kinesiske Hans. Tabel 3 viser en positiv sammenhæng mellem de tre højrisiko populationer og de kinesiske Hans. Uventet, viser dataene en positiv sammenhæng mellem de tre undersøgte populationer og Manchu, som er en nordlig mindretal befolkning. Ingen signifikant korrelation blev fundet mellem andre populationer og de tre EF højrisiko populationer. Forskellen mellem data i tabel 2 og 3 kan være relateret til de sammenlignede befolkninger og de forskellige karakteristika af STR’er og SNP’er. SNP’er er kendetegnet ved lav mutation sats og lave sandsynligheder for ryg og parallel mutation, hvilket gør SNP analyse velegnet til sporing tidlige demografiske begivenheder i menneskets historie. Mutationen på STR’er er langt højere end for SNP’er, og derfor førstnævnte er egnede til at undersøge oplysninger om demografiske begivenheder forekommer på en nyere tidshorisont.

De tre EF højrisiko populationer klynge i den kinesisk-tibetanske sprogfamilie

for at afgrænse det genetiske forhold mellem de tre EF højrisiko populationer og populationer baseret på andre sprogfamilier, vi udført en yderligere principal komponent analyse ved hjælp af data, forudsat af staten Key Laboratory of Genetic Engineering og center for antropologiske studier (School of Life Sciences, Fudan University), som omfatter Y-SNP data for 64 kinesiske befolkningsgrupper, der tilhører de 5 sprogfamilier: Sino-tibetansk, Hmong-Mien, DAIC ( Baiyue), Austronesian, og Austroasiatic.

Y-kromosom haplogroup profiler identificeret i disse populationer blev behandlet som input vektorer til PC analyse. Den kumulative bidrag PC1 og PC2 udgjorde 54.85% af den samlede varians. En PC dot plot blev trukket med værdier for PC1 og PC2 som X- og Y-akser, henholdsvis. Som vist i fig. 4, er PC1 værdier forbundet med en strammere klyngedannelse af befolkninger, der tilhører den kinesisk-tibetanske sprogfamilie; høje PC2 værdier er forbundet med en mere spredt fordeling af kinesisk-tibetanske befolkningsgrupper. De tre EF højrisiko populationer er grupperet i yderste højre del af pc-plot, blandt de mest intense fordeling af Sino-tibetanere.

Chaoshan, Henan Taihang Mountain og Fujian EF højrisiko populationer er grupperet sammen og placeret blandt kinesisk-tibetanske befolkningsgrupper, der tyder på en tæt genetisk sammenhæng mellem dem.

Korrelation analyse blev udført for at søge oprindelsen af ​​hver pc (tabel 4). PC1 viste en signifikant negativ korrelation med PC2 (r = -0,44,

P

0,001). Analyse af PC1 viste, at antallet af negativt korrelerede haplogruppe trods deres svage korrelationer, var større end den af ​​de positive grupper. O3e * er den eneste haplogroup med en signifikant positiv sammenhæng med PC1 (r = 0,61,

P

0,05). For PC2, antallet af positivt og negativt korrelerede haplogruppe var ens. O2a * og O1 repræsenterer de sydlige oprindelige haplogruppe i øst asiatiske befolkning og O3e * er formentlig en nordlig haplogroup. Som vist i tabel 4, fordelingen af ​​O3e *, O2a *, og O1 er modsat med PC1 og PC2. O3e * var positivt korreleret med PC1, men O2a * og O1 negativt korreleret. O2a * og O1 var positivt korreleret med PC2, men O3e * var negativt korreleret. Dette fund antyder, at disse tre haplogruppe er de vigtigste komponenter i PC1 og PC2. Notatet analyse på kun haplogroup O3e * var i overensstemmelse med fordelingen af ​​kinesisk-tibetanske befolkningsgrupper vist i fig. 4. Desuden de tre EF højrisiko populationer er næsten på toppen værdien af ​​PC1 og klynge med nogle kinesisk-tibetanske befolkningsgrupper, hvilket tyder på, at EF højrisiko populationer er alle typiske kinesisk-tibetanske befolkningsgrupper.

hierarkisk klynge analyse afslører isolering af EF højrisiko-klynge fra andre populationer

for yderligere at belyse affinitet mellem de tre EF højrisiko populationer og andre kinesiske befolkningsgrupper, blev hierarkisk klyngeanalyse udført med gennemsnitlig binding (mellem grupper) baseret på Y-SNP-data. For at illustrere klynge af de tre højrisikogrupper og dets forhold til andre Hans, Baiyue og Hmong-Mien grupper vi medtaget 20 kinesiske Hans [16] – [18], data for Liaoning, Guangzhou og Guangxi Hans blev leveret af staten Key Laboratory of Genetic Engineering og center for antropologiske studier (School of Life Sciences, Fudan University), to Hmong-Mien (Hun [19] og Yao [1]) og to Baiyue populationer (Zhuang og Dong) [1] ( fig. 5). Informationen om data til sammenligning er vist i tabel 5. Hierarkisk klyngedannelse analyse belyser den genetiske afstand mellem populationer. I fig. 5, EF højrisiko CSP er genetisk tæt på EF højrisiko-FJP og HTMP. Den genetiske afstand mellem FJP og CSP er kortest. Desuden er de tre isoleret fra andre populationer, hvilket indebærer en bestemt migration begivenhed i oldtiden.

Viser affinitet mellem de tre EF højrisiko populationer. De fleste kinesiske Hans er grupperet i en stor klynge i den øvre del af dendrogram.

Genetisk afstand analyse og konstruktion af et fylogenetisk træ

For yderligere at undersøge genetiske relationer mellem de tre EF højrisiko populationer blev første afstande mellem par af befolkningerne beregnet på grundlag af syv Y-STR’er ved brug af Alrequin 3.1 software. Seks yderligere kinesiske populationer blev inkluderet i denne analyse: Zhejiang [20], Henan [21], Dongbei [22], Tianjing [23], og Hunan Hans [24], og tibetansk [25], som alle hører til den kinesisk -Tibetan sprogfamilie, som gør de tre EF højrisiko populationer. Fra Rst distance matrix blev en urodede nabo-sammenføjning træ konstrueret med brug af MEGA 2.1 software (fig. 6). EF højrisiko CSP blev tæt knyttet til EF højrisiko-FJP og HTMP. Alle tre er tættere på kinesiske Hans end til den tibetanske befolkning. De Hunan, Tianjing, Dongbei, og Henan Hans samles.

Denne urodede træ blev bygget ved anvendelse af genetiske afstande mellem befolkninger. Viser, at EF højrisiko Chaoshan er meget tæt på EF højrisiko FJP og at to er grupperet med EF høj risiko HTMP. Hunan, Tianjing, Dongbei, og Henan Hans er grupperet i den øverste del af træet.

Netværk analyse af Y-STR haplogruppe af de tre EF højrisikopopulationer

højeste haplogroup frekvens deles af CSP, FJP og HTMP var haplogroup O3. Netværket for haplogroup O3 blev yderligere konstrueret ved hjælp af Network 4,516 software (www.fluxus-engineering.com) baseret på alle haplogroup O3 (herunder O3 *, O3e * og O3e1 *) individer til analyse af forholdet mellem CSP, FJP og HTMP. Som vist i fig. 7, 29 personer fra HTMP har 26 Y-STR’er, den højeste Y- STR’er frekvens af alt, hvoraf seks deles af CSP og /eller FJP. 58 personer fra CSP har 47 Y- STR’er, 49 personer fra FJP har 37 Y- STR’er. Y- STR frekvens af CSP er lidt højere end den FJP, hvilket kan skyldes den korte afstand mellem disse to områder, og hyppigere gen flow mellem dem.

I netværket, HTMP har mere STR haplogroup polymorfier end CSP og FJP. Seks Y-STR’er af HTMP er andelen af ​​CSP og /eller FJP. Cirkler repræsenterer slægter, område er proportional med frekvensen, og farve indikerer befolkning oprindelsesland.

Diskussion

Vores hypoteser for denne undersøgelse, at EF højrisiko-befolkninger i Henan Taihang Mountain , Fujian Minnan, og Chaoshan regioner i Kina kunne dele en fælles herkomst, var baseret på historiske optegnelser af migration på tværs af Kina. I det sydlige Kina (Guangdong distrikt) de Baiyue befolkninger dannede den tidligste bosættelse i moderne historie. Før 2200 f.Kr., en gren af ​​Baiyue befolkning-the Minyue-var den største gruppe, der bor i de Chaoshan kystområderne. Den nordlige-til-syd strategiske ekspansion startet af kejser Qin Shi Huang igangsat store sydpå vandringer centrale Kina Hans fra 214 f.Kr. videre [26]. Under Han-dynastiet (206 BC~220 e.Kr.), tre bølger af store vandringer i det sydlige Kina resulterede i et fald i den indfødte befolkning i dette område. Som registreret i stamtavler og gamle inskriptioner under den nordlige Song-dynastiet (960~1127 e.Kr.), et stort antal sydlige Fujian mennesker, især fra Quanzhou og Putian, bosatte sig i Chaoshan området [27]. Gradvist, over en periode på 2000 år, blev dette den større population i Chaoshan region (kaldet Helao eller Fulao folk), der kommer stort set fra Henan og Shanxi via Fujian med velholdte sprog og skikke fra nord-centrale Kina. På grund af geografisk isolation og den historiske svært ved at rejse, den Helao /Fulao blev en relativt isolerede befolkning. I øjeblikket er de fleste Fujian og Chaoshan befolkninger mener, at de er efterkommere af nord-centrale Kina Hans, som er støttet af genealogiske optegnelser, stentavler og arkæologiske opdagelser [28]. Vores team har indsamlet og analyseret 40 genealogier af forskellige efternavne i Chaoshan områder. Næsten alle forfædrene til disse 40 genealogier kommer fra Nord-centrale Kina. De fleste af dem først bosatte sig i Fujian, derefter overført til Chaoshan området (data upublicerede). Dette resultat bekræftede også den historiske rekord og vores hypotese.

Forekomsten og dødeligheden for EF er meget højt i CSP, FJP, og HTMP områder. Vi foreslår, at Chaoshan Littoral Region er et EF højrisikoområde på grund af den genetiske baggrund af CSP og FJP deles med dem i nord-centrale Kina. Forfædrene til EF højrisiko-CSP kan have afledt af EF højrisiko HTMP via FJP. Denne undersøgelse giver genetisk bevis for denne hypotese

Generelt befolkninger deler lignende mønstre af haplogroup fordeling kan forventes at have en forholdsvis tæt genetisk sammenhæng. I denne undersøgelse, de tre EF højrisiko populationer ligner hinanden i distribution af haplogruppe O3 *, O3e * og O3e1 (tabel 1), hvilket antyder, at de er relativt nært beslægtede. PC og korrelation analyser blev også udført for yderligere at verificere den genetiske slægtskab mellem de tre EF højrisiko populationer og andre grupper. Som det fremgår af PC analyse faderlig struktur for EF højrisiko-CSP adskiller sig fra for Guangzhou og Hakka Hans, selv om de er i geografisk nærhed og alle betragter sig selv efterkommere af nord-centrale Kina Hans. I modsætning hertil EF højrisiko CSP tæt grupperet med EF høj risiko FJP og HTMP, selv om HTMP og CSP er geografisk disjunct. Desuden korrelationsanalyse baseret på Y-SNP haplogroup og Y-STR haplotypefrekvenser afslørede en positiv korrelation mellem de tre EF højrisiko populationer, hvilket yderligere understøtter deres tætte genetiske affinitet.

Som historisk indspillet to årtusinder siden blev det sydlige Kina oprindeligt beboet af de sydlige indfødte, herunder dem taler DAIC (Baiyue), østrig-asiatisk, og Hmong-Mien sprog [29] – [30]. Derfor har vi inkluderet DAIC, Hmong-Mien, Sino-tibetansk, Austronesian og Austroasiatic befolkninger i PC-analyse til sammenligning. Resultaterne i fig. 4 og korrelationen analyse (tabel 4) viser, at EF højrisiko CSP er relateret til Sino-tibetanere, ikke Baiyues, hvilket er i overensstemmelse med migration historie CSP. Resultaterne af hierarkisk klyngedannelse analyse understøtter yderligere den tætte genetiske affinitet mellem de tre EF højrisiko populationer. Desuden vores resultater viste også, at disse tre populationer er tættere på Yunnan Han og to Baiyue populationer (Zhuang og Dong) end til andre kinesiske Hans, hvilket tyder gen flow mellem dem. Den faderlige genetiske struktur af de tre EF højrisiko populationer adskiller sig fra de andre kinesiske Hans. Det fylogenetiske affinitet blandt de tre undersøgte populationer blev yderligere åbenbaret i en nabo-sammenføjning træ (fig. 6). Netværket for haplogroup O3 (herunder O3 *, O3e * og O3e1) viste, at HTMP har en højere STR haplotype mangfoldighed end CSP og FJP, mens deling nogle STR mutationer med CSP og FJP, hvilket tyder på det nære forhold mellem dem og videre tyder på, at HTMP kan være en stamcelle population for CSP og FJP. Tilsammen disse resultater understøtter den hypotese, at EF CSP deler højrisiko fælles genetiske træk med EF højrisiko FJP og HTMP, og at de kan dele en nylig fælles forfader. Uventet fandt vi en positiv sammenhæng mellem de tre EF befolkninger og Manchu, en nordlig mindretal befolkning. Årsagen til denne affinitet er ukendt, men foreslår gen flow mellem disse grupper.

Selvom vi brugte to typer af Y-kromosom polymorfe markører og demonstreret konsistente resultater fra flere analyser, befolkninger fra andre EF højrisikoområder var ikke medtaget i denne undersøgelse, så kan vi ikke konstatere, om alle EF højrisiko populationer deler en fælles genetisk baggrund. For yderligere at udforske dette aspekt, er det nødvendigt med en storstilet undersøgelse af EF højrisiko populationer.

Sammenfattende patrilineære genetiske struktur af EF højrisiko CSP, foreslår HTMP, og FJP en oprindelse i genetisk baggrund af EF højrisiko-CSP. De tre EF højrisiko populationer i denne undersøgelse synes at dele en lignende patrilineære genetisk baggrund, der kan forklare, i det mindste delvis, den høje forekomst af EF på disse områder i Kina. I hvilket omfang andre faktorer som miljø og skikke kan bidrage til den høje forekomst af EF stadig at blive udforsket.

Materialer og metoder

Prøvetagning og DNA-ekstraktion

Blodprøver fra 211 ubeslægtede raske mænd blev indsamlet fra de tre EF højrisikoområder i Kina løbet af 2002 til 2004; 89 prøver var fra Chaoshan området, 48 fra Henan Taihang bjergområde og 74 fra Fujian-området (Minnan område). Alle individer gav deres informerede samtykke, før de indgår i undersøgelsen. Undersøgelsen blev godkendt af de etiske anmeldelse udvalg i Medical College of Shantou University. Genomisk DNA blev ekstraheret fra helblod ved standard phenol /chloroform metoder [31]. DNA-prøver blev opbevaret ved -20 ° C efter ekstraktion.

Genotypning af Y-kromosom SNPs og STR’er

Tre strategier blev brugt til at skrive Y-SNP’er og Y-STR’er. SNP’er uden længdeændringer (basesubstitutioner) blev genotypebestemt ved en PCR-baseret restriktionsfragmentlængde-polymorfisme (PCR-RFLP) -metoden (primer information, restriktionsenzymer, mønster af polymorfi, og PCR-betingelser er i tabel 6) [17], [32 ]. SNP’er med variation længde (fx deletion eller insertion) blev typebestemt ved fluorescens PCR (primer informations- og PCR-betingelser er i tabel 7), og fluorescensmærkede forlængelsesprodukter blev elektroforeret på en 3100 Genetic Analyzer (ABI Company, USA). Y-STR’er blev også analyseret ved denne metode (tabel 7). Analyse af M1 polymorfi (Alu insertion, også kaldet YAP, se tabel 6) var ved agarosegelelektroforese direkte efter PCR [33]. Alle primere blev syntetiseret af Sangon Co. (Shanghai, Kina). Restriktionsendonukleaser blev anskaffet fra New England Biolabs, USA. Y-SNP haplogroup opgaver var baseret på de skrive resultater. Det fylogenetiske diagram af 17 haplogruppe defineret ved 16 Y-SNP’er er i fig. 8 [34].

Dette diagram defineret af 16 Y-kromosom biallelmarkører trukket ifølge NRY haplogroup træ East Asia (vist i henvisning 34). De seneste markører definerer haplogruppe er ved siden af ​​grenene. Vejviser

Dataanalyse

Y-SNP haplogroup enkeltes blev defineret i henhold til genotype resultater og fig. 7. Y-kromosom haplogruppe kan betragtes som en monofyletisk clade i fylogenetisk træ (dvs. et sæt haplogruppe med samtlige efterkommere af deres seneste fælles forfader, udledes af de delte mutationer). For eksempel, O3 *, O3e *, og O3e1 * alle deler en T → C mutation i locus M122. O3 * er det fædrene haplogroup af M122C alleler, mens O3e * og O3e1 * er de 2 afledte haplogruppe med yderligere mutationer, M134 og M117, hhv. Haplogroup frekvenser blev beregnet og sammenlignet blandt de tre EF højrisiko populationer. Chi-square test blev udført for at vurdere forskellene i haplogroup frekvens blandt befolkninger.

PC analyse og korrelationsanalyse blev udført for at sammenligne den genetiske affinitet mellem de tre EF højrisiko populationer og andre grupper. Undersøgelsen populationer blev defineret som det nordlige østasiatiske (NEAPs) og sydlige østasiatiske befolkninger (SEAPs) i henhold til deres geografiske placeringer. Yangtze-floden blev brugt som den geografiske grænse at adskille NEAPs og SEAPs; NEAPs blev yderligere opdelt i nordlige Hans (NHS) og nordlige mindretal nationaliteter (NMNs), og SEAPs blev defineret som de sydlige Hans (SHS) og sydlige mindretal nationaliteter (SMNs). Yderligere Y-SNP data tilladt for at opdele de store kinesiske Han-befolkninger i 2 grupper (for detaljerede sammenlignende data, se tabel 5): NHS herunder Hebei [17], Liaoning, oplysninger fra staten Key Laboratory of Genetic Engineering og Center for antropologiske studier (School of Life Sciences, Fudan University), Xinjiang, Gansu, Shanxi, Neimeng [16], Shandong og Henan [17] befolkninger; og SHS, herunder Hakka [18], Hunan, Hubei, Zhejiang, Jiangxi, Shanghai, Anhui, Jiangsu, Yunnan, Sichuan [17], Guangzhou og Guangxi befolkninger, oplysninger fra staten Key Laboratory of Genetic Engineering og Center for antropologiske studier (School of Life Sciences, Fudan University). Tilføjet til analysen var Y-STR-data for 16 bestande, som var de samlede befolkninger, som vi kunne få fra referencer.

Be the first to comment

Leave a Reply