PLoS ONE: Pathway-baseret analyse Brug genom-dækkende sammenslutning af data fra en koreansk ikke-småcellet lungekræft Study

Abstrakt

Pathway-baseret analyse, anvendes i forbindelse med genom-dækkende forening undersøgelse (GWAS) teknikker, er et kraftfuldt værktøj til at opdage subtile men systematiske mønstre i genomet, der kan hjælpe belyse komplekse sygdomme, ligesom kræft. Her har vi trådte tilbage fra genetiske polymorfier på et enkelt locus og undersøgt, hvordan flere foreningens signaler kan orkestreret at finde veje relateret til lungekræft modtagelighed. Vi brugte enkeltnukleotidpolymorfi (SNP) array-data fra 869 ikke-småcellet lungekræft (NSCLC) sager fra en tidligere GWAS på National Cancer Center og 1.533 kontroller fra den koreanske Association Resource projekt for vejen-analyse. Efter kortlægning enkelt nukleotid polymorfier til gener i betragtning af deres kodende region og regulatoriske elementer (± 20 kbp), multivariat logistisk regression af additiv og dominerende genetiske modeller blev monteret mod sygdomsstatus, med justeringer for alder, køn og rygning status. Pathway statistik blev evalueret ved brug Gene Set Enrichment Analysis (GSEA) og Adaptive Rank trunkeret Produkt (ARTP) metoder. Blandt 880 veje, 11 viste relativt betydelige statistik i forhold til vores positive kontroller (P

GSEA≤0.025, falsk opdagelse rate≤0.25). Kandidat veje valideret ved anvendelse af ARTP metode og ligheder mellem veje blev beregnet mod hinanden. De top-rangerede veje var

ABC Transporter Hotel (P

GSEA 0,001, P

ARTP = 0,001),

VEGF signalvej Hotel (P

GSEA 0,001, P

ARTP = 0,008),

G1 /S Check Point Hotel (P

GSEA = 0,004, P

ARTP = 0,013), og

NRAGE Signaler Død gennem JNK

(P

GSEA = 0,006, P

ARTP = 0,001). Vores resultater viser, at pathway analyse kan belyse post-GWAS forskning og hjælpe med at identificere potentielle mål for kræft modtagelighed

Henvisning:. Lee D, Lee GK, Yoon KA, Lee JS (2013) Pathway-baseret analyse Brug genom-dækkende Association data fra en koreansk Ikke-småcellet lungekræft Study. PLoS ONE 8 (6): e65396. doi: 10,1371 /journal.pone.0065396

Redaktør: William C. S. Cho, Queen Elizabeth Hospital, Hongkong

Modtaget: Februar 5, 2013; Accepteret: April 24, 2013; Udgivet: 6 Juni 2013

Copyright: © 2013 Lee et al. Dette er en åben adgang artiklen distribueres under betingelserne i Creative Commons Attribution License, som tillader ubegrænset brug, distribution og reproduktion i ethvert medie, forudsat den oprindelige forfatter og kilde krediteres

Finansiering:. Forskningen blev støttet af National Cancer center forskningsbevilling 1210360. de finansieringskilder havde ingen rolle i studie design, indsamling og analyse af data, beslutning om at offentliggøre, eller forberedelse af manuskriptet

konkurrerende interesser:. forfatterne har erklæret, at der ikke konkurrerer eksisterer interesser

Introduktion

Lungekræft er en af ​​de førende årsager til dødelighed kræft i Korea og på verdensplan [1] -. [3]. Blandt de mange lungekræft histologiske typer, mere end 70% af koreanske lungekræft er ikke-småcellet lungekræft (NSCLCs), den førende undertype er adenocarcinom [4].

Selv om årsagerne til sygdommen kan stamme fra miljømæssige faktorer, såsom kræftfremkaldende findes i cigaretrøg og indånding af giftige kemikalier, i bestræbelserne på at bestemme ætiologien af ​​sygdommen, har forskerne vurderet genetiske mangfoldighed af individer. Adskillige genom-dækkende forening undersøgelser (GWASs), som fokuserer på scanning for sygdom-associerede SNP’er over hele genomet, med succes har demonstreret mulig lungekræft modtagelighed loci i det seneste årti. De fleste af disse GWASs var baseret på europæiske og amerikanske befolkning og bemærkelsesværdige mistænkte identificeret var 5p15 (hTERT-CLPTM1L) [5], [6], 6p21 (BAT3-MSH5) [7], og 15q25 (CHRNA 3-5) [8 ] – [10]. I tidligere GWAS involverer 1.425 NSCLC patienter og 3.011 kontroller fra Korea, vi rapporterede, at en roman locus, 3q29, og et sted, der tidligere rapporteret i emner af europæisk afstamning, 5q15, var forbundet med risiko for lungekræft i koreansk befolkning [11].

på trods af den vellykkede identifikation af disse sygdomme modtagelighed loci bruger GWASs, det menes, at de forklarer kun en lille del af den anslåede arvelighed [12]. GWASs sammenligne en halv million til millioner af markører på en gang og varianter med beskedne foreninger vil sandsynligvis blive forsømt efter flere test korrektion [13]. Efter sin art, er det højst usandsynligt, at en enkelt variant er associeret med en kompleks sygdom som kræft. Det antages, at lav-penetrans varianter over genomet bedre vil forklare biologien pågældende [14]. For at kompensere for manglerne i GWAS, i stedet for at stole på en stringent genom-dækkende betydning cutoff, alternative metoder forbedre magt, såsom brugen af ​​kombinationer af SNP-markører [15] – [20], indarbejdelse af imputerede genotyper og sammenkædning information [21] – [23], og senest, pathway tilgange [24] er blevet udviklet

pathway tilgange er baseret på princippet om, at gener involveret i den samme funktionelle vej interagere med hver. anden og udgør et netværk, således at deres sygdom sammenslutninger er indbyrdes [25]. Aktuelle pathway-baserede analyser er blevet inspireret meste fra genekspression microarray dataanalyse. Baseret på forudgående biologisk viden, sæt berigelse gen analyse (GSEA) [26] måler, hvor meget foreningen signaler beriget i et defineret sæt af gener. Fordi GSEA kræver microarray data som input har adskillige grupper foreslået ændringer til den oprindelige algoritme til at indarbejde GWAS data [27] – [30].

I den foreliggende undersøgelse, vi brugte GSEA-baserede pathway analyse foreslået af Wang et al. [24] med vores tidligere koreanske lungekræft GWAS data fra 869 tilfælde og 1.533 kontroller, med håbet om at finde ekstra følsomhed loci og opnå indsigt i den underliggende patogenese (figur 1). Veje, der viser høj statistisk signifikans valideret ved anvendelse en anden sti-baserede metode kaldet adaptiv rang afkortet produkt (ARTP) [31]. I modsætning til GSEA, ARTP er en selvstændig test [32], som direkte forbinder gener i en vej til sygdomme og arbejder uafhængigt af gener uden for pathway. Vi rapporterer syv veje kategoriseret i fire cellulære processer, der viste konsekvente foreninger med koreansk NSCLC modtagelighed.

Materialer og metoder

Etik Statement

Undersøgelsen blev godkendt af Institutional Review Board og den etiske komité for National Cancer center Korea. Blodprøver blev indsamlet fra NSCLC patienter, der besøgte National Cancer Center Korea og tog en frivillig sundhed spørgeskemaundersøgelse mellem maj 2002, og december 2005. For hver blodprøve, skriftligt informeret samtykke, der er godkendt af medlemmer Institutional Review Board, blev opnået. Alle kliniske undersøgelser blev udført i overensstemmelse med principperne i Helsinki-deklarationen.

Undersøgelse Befolkning

I første omgang vi rekrutteret 2.441 koreanske NSCLC sager og knapper (871 tilfælde og 1.570 kontroller) til denne undersøgelse. De fleste NSCLC prøver (621 sager) blev delt fra en tidligere GWA undersøgelse på National Cancer Center Korea [11], og yderligere 250 patienter med NSCLC blev nyansatte til genotypning. Til sammenligning blev genotype data fra 1.570 kontrolpersoner uden kræft, som den koreanske Association Resource (KARE) projektet, et igangværende populationsbaseret kohortestudie, der er blevet udført af Koreas National Institute of Health (KNIH) og Center for Disease Control og Forebyggelse (KCDC) siden 2007 [33]. Vi anvendte en streng prøve kvalitetskontrol (QC) kriterier, overvejer rå signal intensitet, genotype sats (≥95%), kliniske oplysninger, og befolkningen lagdeling at filtrere ukvalificerede prøver. Konkret har vi fjernet 19 prøver med lav genotypebestemmelse kvalitet, 18 med utilstrækkelige demografiske informationer, og to med køn fejlidentifikation. Som et resultat, 869 tilfælde og 1.533 kontroller bestået QC, og forblev i den efterfølgende analyse. Blandt 869 histologisk bekræftet NSCLC sager, 623 sager var adenokarcinomer, mere end 70% af vores NSCLC patienter, 175 sager var skællede-celle carcinomer, og resten var andre NSCLC histologiske typer (tabel 1). Mere end 97% af personerne (n = 2334) blev genotypede hjælp Affymetrix Genome Wide Menneskelig SNP Array 5,0 (Affymetrix, Santa Clara, CA, USA), og resten (n = 68) blev genotype hjælp Affymetrix GeneChip Menneskelig Mapping 500 K Array Set. Ved genotype og samle datasæt, vi anvendt følgende SNP QC filtre: SNPs med en mindre allel frekvens (MAF) på mindre end 5% og genotype opkald satser på mindre end 95%; Hardy-Weinberg ligevægt (HWE) test P-values≤0.0001 blev udelukket fra yderligere analyse.

Pathway Definition

Vi konstrueret en liste over pathway definitioner baseret på tre store offentligt tilgængelige vej databaser: specifikt 217 gen sæt fra BioCarta [34], 186 fra Kyoto Encyclopedia of Gener og genomer (Kegg) [35], og 430 fra Reactome [36]. Vi inkluderede også flere curated pathwaygen-sæt fra SABiosciences [37], Sigma-Aldrich [38], signaltransduktion Viden Miljø magasin Science [39], og signalvej Database (SPAD) i Kyushu University [40] for at dække i alt 880 biologiske veje (bilag S1).

for at måle effektiviteten af ​​vores analyse og angive en baseline, vi også samlet seks brugerdefinerede veje fra tidligere rapporterede lungekræft modtagelighed gener. Først, vi lånte ni onkogener (IL1B, MTHFR, AKAP9, CAMKK1, SEZ6L, FAS, FASLG, TP53, og TP53BP1) fra en undersøgelse foretaget af International lungekræft Consortium (ILCCO) [41]. Ifølge ILCCO undersøgelsen, genetiske varianter med stærke beviser for en forbindelse med risiko lungekræft tilhørte gener fra forskellige kræftrelaterede veje, såsom inflammation (IL1B), folat metabolisme (MTHFR), regulerende funktion (AKAP9 og CAMKK1), celle vedhæftning (SEZL6), og apoptose (FAS, FASL, TP53, TP53BP1, og BAT3). Desuden har vi vedtaget 11 NSCLC driver mutation gener (EGFR, KRAS, erbB2, ALK, BRAF, PIK3CA, Akt1, MAP2K1, MET, ROS1, og de nationale tilsynsmyndigheder) fra en gennemgang af Pao og kolleger [42], [43]. I lyset af deres gennemgang af, hvordan disse gener påvirker kræft celledeling og overlevelse, vi medtaget disse klinisk vigtige gener som grundlag for vores positive kontroller. Endelig har vi tilføjet gener dækket i lungekræft modtagelighed loci rapporteret i flere tidligere GWA studier: C3ORF21 og TP63 fra 3q28-29 [11], [44], TERT og CLPTM1L fra 5p15 [5], [7], BAT og MSH5 fra 6p21 [7], CHRNA5, CHRNA4, og CHRNA3 fra 15q25 [8] – [10], og DNA-reparation gener (XRCC1, RRM1, ERCC1) [45]. Vi kategoriseret gener efter sted eller efter funktion og designet seks forskellige kombinationer af lungecancer-relateret gen sæt som positive kontroller (tabel 2).

SNP Association og kortlægning

multivariat logistisk regression af additiv og dominerende genetiske modeller blev monteret mod sygdomsstatus, med justeringer for alder, køn og rygning status, for nøjagtigt at fange SNP foreningens signaler. Fordi vi var interesserede primært i de genetiske effekter af at have en variant allel og MAF var generelt lav for vores undersøgelse pool, vi udelukket recessive genetiske model fra vores analyse.

Også 20 kbp opstrøms for 5′ ende og 20 kbp nedstrøms for 3′-enden blev anset for at være en del af et gen, således at det omfatter den kodende region og regulatoriske elementer. Den mest signifikant associeret SNP inden en genregion blev valgt til at repræsentere hele genet området. Kun gen sæt med et minimum af 20 gener og højst 200 gener blev behandlet i den efterfølgende analyse.

Pathway Analyse

Vi delte vejen analyse i to-trins screening og validering processer. Først brugte vi en SNP tilpasning af GSEA metode udviklet af Wang et al. [24] til at screene kandidat veje er forbundet med NSCLC risiko. Derefter bruger ARTP algoritme udviklet af Yu et al. [31], bekræftede vi de statistiske betydninger af kandidat veje.

Gene Set Enrichment Analysis (GSEA).

For hvert gen, SNP med den højeste teststørrelsen (koefficient t-statistik fra logistisk regression i vores tilfælde) blev tildelt repræsentere genet. For alle n-gener, blev sta sorteret fra størst til mindst (r

1, r

2, …, r

N), og en vægtet Kolmogorov-Smirnov-lignende (KS), der løber sum berigelse score (ES) af sti S med N

p-gener blev beregnet ud fra prioriteret liste over gener [24].

Da beregningen af ​​ES (S) var baseret på en maksimal statistik, veje med store tal af gener havde klare fordele i forhold til mindre veje. At sammenligne statistikker mellem veje af forskellig størrelse, blev en normaliseret berigelse score (NES) beregnes som følger:

Endelig fordi vi tester flere hypoteser på én gang, vurderede vi den forventede falsk positivt forhold ved at beregne den falske opdagelse sats (FDR).

til vores GSEA, 1.000 fænotype permutationer blev anvendt til at estimere hvert gen statistiske signifikans.

Adaptive Rank trunkeret Produkt (ARTP).

for alle L gener i en pathway, blev den bedste SNP P-værdien af ​​hvert gen sorteret fra laveste til højeste (P

1, P

2, …, P

L), og produktet fra K mindste P- værdier i en sti blev beregnet som følger:

Normalt trunkering punkt K skal bestemmes, før du bruger RTP statistik. Imidlertid ARTP metode foreslået af Yu et al. [31], som kombinerer beregnes ud fra den observerede datasæt, gør det muligt at estimere den justerede P-værdi uafhængigt af størrelsen af ​​vejen. Til vores ARTP analyse blev de samme 1.000 permutationer bruges til at vurdere betydningen af ​​hver kandidat vej.

Pathway Overlap Analyse

For at sammenligne ligheder mellem veje, de fraktioner af overlap mellem veje blev beregnet, ved hjælp af følgende ligning:

Antag a og B er veje, så:

Vi anvendte denne ligning til at håndtere en situation, hvor man pathway er en delmængde af den anden. Således 100% lighed indikerer, at den ene vej er en delmængde af den anden, medmindre de to veje er de samme.

Resultater

demografiske karakteristika

demografiske træk studiepopulation er vist i tabel 1. i univariate analyser, køn og alder viste statistisk signifikans (P 0,05), mens rygning status ikke gjorde (P = 0,16). Men alle tre demografiske træk (køn, alder, og rygning status) viste statistisk signifikante associationer (P 0,001) i multivariate analyser. Således har vi inkluderet alle tre som justering covariables under logistisk regression foreningen analyse. Adenocarcinom var den fremherskende histologiske type, der repræsenterer mere end 70% af vores NSCLC prøver, en sammensætning i overensstemmelse med den generelle koreanske NSCLC befolkning profil [4].

Genotypning og kortlægning

Efter anvendelse af SNP QC kriterier, herunder MAF og HWE blev 440,530 genotypede SNPs filtreret ned til 300,410 SNPs. Fra dem, fjernede vi SNP’er bopæl i gen ørkener, og de resterende 147,970 SNPs lykkedes kortlagt til vores definition af gener (14,089 gener). Fordi vi kortlagt SNPs beliggende inden 20 kb opstrøms og nedstrøms en kodende region som et gen, nogle SNP’er placeret mellem gener blev talt to gange.

Positiv kontrol Tests

Som vist i tabel 2, vores positiv kontrol testresultater viste en række nominelle P-værdier, 0,014-0,42, og en række FDRs, 0,055-0,408, for tilsætningsstoffet og dominerende modeller i GSEA metoden. For ARTP metode, P-værdier var stærkere og varierede fra 0,001 til 0,035 for tilsætningsstoffet og dominerende modeller. Således fra de positive kontrolanalyser, vi brugte de følgende filtreringskriterier for den første vej opdagelse skridt ved hjælp af GSEA metode: P-values≤0.025 og FDRs≤25% i additiv eller dominerende genetiske model blev udvalgt til efterfølgende analyse. For ARTP fremgangsmåde blev P-values≤0.01 anses bemærkelsesværdige.

Pathway Analyse

Blandt 880 veje, vi undersøgt under anvendelse af GSEA metoden, 11 bestået de positive kriterier kontrol filtrering (tabel 3) . De 11 ansøgerlande veje blev undersøgt yderligere ved hjælp af ARTP metoden og deres P-værdier were≤0.01 i tilsætningsstoffet eller dominerende model, igen bekræfter, at disse veje havde statistisk signifikante associationer med NSCLC, kontra vores positive kontroller. for

Aktivering af Pre-replikative Complex

, Vi fandt imidlertid, at den meget betydelige P-værdi af additivet model i GSEA metode adskilte sig fra en ubetydelig P-værdi i den additive model i ARTP metoden , så vi udelukket det fra den efterfølgende analyse. Undersøgelse kandidat veje i dybden efter resultaterne af ligheden tests, som vist i fig S1, fandt vi flere veje, der lignede hinanden. For eksempel

G1 /S Transition

vej var en delmængde af

Cell Cycle

vej, og når et rummeligt forhold blev fundet, vi elimineret supersæt, som i dette tilfælde, var

Cell Cycle

vej. Tilsvarende

NRAGE Signaler Død gennem JNK

sti var en delmængde af

Cell Død signalering via NRAGE, NRIF, og NADE

vej, som var undergrupper af den

P75 NTR Receptor medieret signaling

vej. Således har vi fjernet to supersets af

NRAGE Signaler Død gennem JNK

vej. De resterende syv kandidatlande veje blev kategoriseret i fire typer af cellulære processer: membran transport (

ABC Transporter

), intracellulær signalering (

VEGF signalvejen

,

Inositol Fosfat Metabolisme

,

Phosphatidylinositol Signaling System

), cellecyklus (

G1 /S Check Point

,

G1 /S Transition

), og programmeret celledød (

NRAGE Signaler død gennem JNK

). Især

G1 /S Check Point

pathway havde den mindste antal gener (25 gener), under opretholdelse statistisk signifikans i både GSEA og ARTP metoder (dominerende model). Brug GSEA statistikker som primære og ARTP statistikken som sekundære målinger,

ABC Transporter

gen sæt viste den bedste NSCLC risiko forening blandt de syv endelige kandidater med en GSEA nominel P-værdi 0,001, FDR = 0,122, og ARTP P-værdi = 0,001 (begge dominerende model). Den næstbedste var

VEGF signalvejen

med en GSEA nominel P-værdi. 0,001, FDR = 0,107, og ARTP P-værdi = 0,008 (begge dominerende model)

For bemærkelsesværdige veje i hver cellulær proces kategori blev SNP foreninger inden gen-apparater undersøges nærmere (tabel 4, S1, S2, og S3). Bortset fra

ABC Transporter

, der blot var en samling af transmembrane protein pumper, netværk diagrammer over bemærkelsesværdige veje blev trukket som vist i Tal S2, S3, og S4. De yderligere resultater for vejen analysen i hvert delmængde efter de histologiske typer af lungekræft er beskrevet i tillæg S2.

sammenligning med andre Lung Cancer Study

I et differentielt udtrykt gen studere med normal lungevæv, udført af Falvella et al. [46], blev et gen-ekspression signatur består af 85 gener foreslået at skelne lungeadenokarcinom patienter fra andre kræftpatienter. Vi vedtog 67 gener, der var til rådighed i NCBI humane genom build 36 og anvendte den samme vej analyse procedure. Ved hjælp af vores genotypebestemmelse data blev SNP foreninger held kortlagt til 54 gener. Med det gen sæt med disse 54 gener, den GSEA metoden viste nominelle P-værdier for 0,001 for både tilsætningsstof og dominerende modeller og FDR værdier på 2,6% og 11,7% for tilsætningsstoffet og dominerende modeller, hhv. Tilsvarende ARTP metode gav P-værdier på 9,99 × 10

-4 og 3,00 × 10

-3 for tilsætningsstoffet og dominerende modeller for dette gen sæt, hhv. Dette resultat igen bekræftet, at vores vej-analyse var legitimt og i overensstemmelse med andre lungekræft studie med mRNA-baserede gen-ekspression analyse. Resultaterne fra association analyse af SNPs i 54 gener blev vist i tabel S4.

Diskussion

Nylige fremskridt i high-throughput SNP genotypning teknologi har genereret enorme mængder af genotypebestemmelse data og har ført til værdifulde resultater vedrørende fælles genetiske varianter forbundet med forskellige sygdomme gennem GWASs. Imidlertid har de rapporter, primært fokuseret på en lille del af foreninger, der opfylder betingelserne for genom-dækkende signifikansniveau og de fleste foreninger, med moderate statistiske beføjelser, er svære at fortolke. Brug forudgående biologisk viden, har pathway-baserede forening tilgange nylig åbnet en ny måde at undersøge sammenhængen mellem GWAS resultater og komplekse molekylære netværk. Pathway-baseret analyse inkorporerer foreningens data for funktionelt relaterede gener og oversætter dem til sygdom modtagelighed information.

I denne undersøgelse anvendte vi en blanding af kontrasterende vej analyser ved hjælp af koreanske lungekræft GWAS data, der består af 869 NSCLC sager og 1.533 kontroller. Vi har tidligere rapporteret signifikante sammenhænge mellem polymorfier på kromosomer 3q28, 3q29, og 5p15 og koreanske lungekræft modtagelighed [11], [44]. Vi brugte først en GSEA-baserede metode med genom-dækkende SNP-array data til foreløbigt skærm til kandidatlande veje er forbundet med lungekræft modtagelighed. Blandt 11 kandidatlande veje, valgte vi 7, der blev også bekræftet af ARTP metoden. Fire cellulære signalveje,

VEGF signalvejen

,

G1 /S Check Point

,

NRAGE Signaler Død gennem JNK

, og

ABC Transporter, var

højt beriget med signaler, der er forbundet med risiko lungekræft. I modsætning GWASs, P-værdier for SNPs forbundet med gener var generelt moderat signifikant og kun få af dem ville kvalificere sig på den såkaldte genom-dækkende signifikansniveau. Dette indikerede, at pathway statistikker understregede virkningerne af subtile, men systematiske, mønstre inden for et gen sæt i stedet for et par peak foreninger i et gensæt.

Gene medlemmer af ATP-bindende kassette (ABC) transporter familie har væsentlige funktioner i transport af forskellige substrater, såsom ioner, sukkerarter, lipider og proteiner, under fysiologiske betingelser. I mange år har forskere opdaget, at

ABC Transporter

spille væsentlige roller i kræft kemoterapi og er ansvarlige for multiresistens (MDR), i form af en ATP-drevet stof pumpe [47]. Det menes, at overekspression af

ABC Transporter

reducerer intracellulære lægemiddelniveauer via et udbygget udstrømning af kemoterapeutiske midler, hvilket resulterer i medikament ufølsomhed, hvilket kan føre til cancerkemoterapi svigt [48]. På den anden side,

ABC Transporter

kan også fungere som effektive kræftfremkaldende eksportører, holde celler fri for skadelige kemikalier og kræftfremkaldende stoffer. Langvarig nedskrivninger eller ændringer i genekspression af disse transmembrane protein pumper kan øge potentiel kræftrisiko. Tobak-specifik nitrosamin 4- (methylnitrosamino) -1- (3-pyridyl) -1-butanon (NNK) er en af ​​de mest potente kræftfremkaldende stoffer i cigaretrøg, der har vist sig at forårsage lungekræft hos gnavere [49], [50 ]. Når disse toksiner er indåndet,

ABC Transporter

kodet af ABCB1 og ABCC1 effektivt fjerne disse kræftfremkaldende stoffer fra lungerne. Forskere har opdaget, at de fælles polymorfier af ABCB1 og ABCC1 kan påvirke stofskiftet og disposition af den veletablerede kræftfremkaldende, NNK, og potentielt øge risikoen for lungekræft [51]. Som vist i tabel 4, udviste ABCA4, ABCC1, og ABCC signifikante sammenhænge med lungekræft modtagelighed (P-værdier 0,0005). I vores efterfølgende undergruppe analyse viste nogensinde-rygere en større forening end aldrig-rygere, som vist i tabel S5. Således er det muligt at modulere individuel risiko lungekræft efter genetiske polymorfier i disse gener gennem forskellige cellulære funktioner.

VEGF signalvejen

også rangeret højt i vores vej analyse. Medlemmer af denne pathway kan påvirke en angiogenese-afhængige biologisk vej, hvilket er et afgørende element i onkogenese. Foreninger mellem genetiske polymorfier i VEGF /VEGFR og risikoen for at udvikle kræft er blevet rapporteret i forskellige kræfttyper, herunder lungekræft [52]. Blandt 63 gen medlemmer, phosphatidylinositol 3-kinase (PIK3R5), phospholipase C (PLCG2), og SHC adapter protein viste stærke associationer til lungekræft modtagelighed i vores GWAS (tabel S1, figur S2).

Selv om en vej -baseret tilgang er en attraktiv retssag i en post-GWAS æra, vi notere nogle begrænsninger i vores design. I vores undersøgelse, efter SNP QC, sammenslutninger af mere end 300.000 SNPs forblev og blev analyseret, men kun omkring halvdelen af ​​dem blev kortlagt med held, til 14,089 gener. Mange SNPs inden ikke-kodende regioner blev simpelthen forsømt. Desværre, med den nuværende GWAS genotypebestemmelse platform, antallet af markører, der dækker gener er begrænset. Desuden er selv de 880 veje, vi analyserede var klart en ufuldstændig sæt veje, fordi mange humane gener er endnu ikke blevet tildelt veje, fordi deres funktion (e) er ukendt. Endelig vores GWAS sæt indeholder genom-dækkende SNP data på mere end 2.400 koreanere stammede fra en enkelt population. Formålet med undersøgelsen var at finde veje, der er forbundet med lungekræft modtagelighed inden koreansk befolkning, og vi kunne ikke finde en sammenlignelig koreansk lungekræft GWAS datasæt for validering vores resultater. Som flere data bliver tilgængelige, bør vores resultater sammenlignes med andre østasiatiske befolkninger overvejer etniske forskelle.

Som konklusion, vi viste, at lungekræft modtagelighed kan være knyttet til biologiske veje ved hjælp GWAS data, og flere subtile foreningens signaler kan fortolkes på en systematisk måde. Vores resultater antyder, at den genetiske variation i gener involveret i fire signalveje kan bidrage til individuel lungecancer modtagelighed. Desuden vores resultater viser, at pathway tilgange er vigtige analysemetoder i en post-GWAS æra, der eventuelt kunne bruges til at løse funktionelle relevans af genetisk modtagelighed.

Støtte Information

Figur S1.

Ligheder mellem kandidatlandene veje. (Enhed:%).

Doi: 10,1371 /journal.pone.0065396.s001

(TIF)

Figur S2.

Pathway Diagram over “VEGF Signaling”

doi:. 10,1371 /journal.pone.0065396.s002

(TIF)

Figur S3.

Pathway Diagram over “G1 /S Check Point”

doi:. 10,1371 /journal.pone.0065396.s003

(TIF)

Figur S4.

Pathway Diagram over “NRAGE Signals Død gennem JNK”

doi:. 10,1371 /journal.pone.0065396.s004

(TIF)

tabel S1.

SNP Sammenslutninger af gener i “VEGF signalvejen”

doi:. 10,1371 /journal.pone.0065396.s005

(DOC)

tabel S2.

SNP Sammenslutninger af gener i “G1 /S Check Point”

doi:. 10,1371 /journal.pone.0065396.s006

(DOC)

tabel S3.

SNP Sammenslutninger af gener i “NRAGE Signaler Død gennem JNK”

doi:. 10,1371 /journal.pone.0065396.s007

(DOC)

Tabel S4.

SNP Sammenslutninger af 54 Gener i “Rygere med lungekræft” Gene Expression Undersøgelse af Falvella et al

doi:. 10,1371 /journal.pone.0065396.s008

(DOC)

tabel S5. Sammenligning

af “ABC Transporter” Pathway Gener Mellem Never-ryger og Ever-ryger

doi:. 10,1371 /journal.pone.0065396.s009

(DOC)

appendiks S1.

Liste over 880 Pathways

doi:. 10,1371 /journal.pone.0065396.s010

(XLSX)

appendiks S2.

Pathway Analyse af 2156 Adenocarcinom Kun Group og 1806 pladecellekræft Kun Group

doi:. 10,1371 /journal.pone.0065396.s011

(XLSX)

Tak

Vi vil gerne anerkende center for Disease Control i National Institute of Health Korea, der venligt forudsat at genom-dækkende SNP data for kontrol. Vi vil også gerne takke Dongwan Hong og Seungyoon Nam på National Cancer Center for nyttige diskussioner og kritikker.

Be the first to comment

Leave a Reply