PLoS ONE: Indblik i kræft i bugspytkirtlen Ætiologi fra Pathway Analyse af Genome Wide Association Study data

Abstrakt

Baggrund

Kræft i bugspytkirtlen er den fjerde hyppigste årsag til kræft dødsfald i USA og ætiologien af ​​denne meget dødelige sygdom er ikke veldefineret. For at identificere genetiske følsomhed faktorer for kræft i bugspytkirtlen, vi gennemførte pathway analyse af genom-dækkende forening undersøgelse (GWAS) data i 3.141 bugspytkirtlen kræftpatienter og 3.367 kontroller med europæisk afstamning.

Metoder

Brug af gen sæt højderyg regression i association studier (græs) metode, vi analyserede 197 veje identificeret fra Kyoto Encyclopedia of Gener og genomer database. Vi brugte den logistiske kerne maskine (LKM) test for at identificere de store bidrager gener til hver vej. Vi gennemførte funktionelle berigelse analyse af de væsentligste gener (

P

0,01). Ved hjælp af Database til Annotation, Visualisering, og integreret Discovery (DAVID)

Resultater

To veje var signifikant forbundet med risiko for kræft i bugspytkirtlen efter justering for flere sammenligninger (

P

0,00025) og i replikation test: neuroaktive ligand-receptor-interaktion, (

Ps

0,00002) , og det olfaktoriske transduktion pathway (

P

= 0,0001). LKM test identificeret fire gener, der var signifikant forbundet med risiko for kræft i bugspytkirtlen efter Bonferroni korrektion (

P

1 × 10

-5):

ABO, HNF1A, OR13C4,

SHH.

Funktionel berigelse analyse under anvendelse DAVID konsekvent fundet G-protein-koblet receptor-signalvejen (herunder både neuroaktive ligand-receptor interaktion og olfaktoriske transduktionsveje) at være den mest betydelige vej for bugspytkirtelkræft risiko i denne undersøgelsespopulationen .

Konklusion

Disse nye fund giver nye perspektiver på genetisk modtagelighed til og molekylære mekanismer i kræft i bugspytkirtlen

Henvisning:. Wei P, Tang H, Li D (2012) Indsigt i kræft i bugspytkirtlen Ætiologi fra Pathway Analyse af Genome Wide Association Study data. PLoS ONE 7 (10): e46887. doi: 10,1371 /journal.pone.0046887

Redaktør: Zhongming Zhao, Vanderbilt University Medical Center, USA

Modtaget: Juni 22, 2012; Accepteret: September 6, 2012; Udgivet: 4 oktober 2012

Copyright: © Wei et al. Dette er en åben adgang artiklen distribueres under betingelserne i Creative Commons Attribution License, som tillader ubegrænset brug, distribution og reproduktion i ethvert medie, forudsat den oprindelige forfatter og kilde krediteres

Finansiering:. Dette arbejde blev støttet af National Institutes of Health gennem en supplerende tilskud til RO1 CA98380-05 (til DL) og gennem MD Andersons Cancer center Support Grant (CA016672). P. W. blev delvist støttet af NIH R01HL106034-01. De finansieringskilder havde ingen rolle i studie design, indsamling og analyse af data, beslutning om at offentliggøre, eller forberedelse af manuskriptet

Konkurrerende interesser:.. Forfatterne har erklæret, at der ikke findes konkurrerende interesser

Introduktion

kræft i bugspytkirtlen er den fjerde hyppigste årsag til kræft-relaterede dødsfald i USA, der tegner sig for mere end 37,660 dødsfald om året [1]. Fordi der ikke findes en effektiv screeningstest for kræft i bugspytkirtlen, er det vigtigt at identificere genetiske faktorer, der bidrager til udviklingen af ​​denne cancer. Nylige genom-dækkende forening undersøgelser (GWAS) og post-GWAS analyser har identificeret kromosomområder, der indeholder

ABO

,

NR5A2,

og

CLPTM1L-t

gener [2] , [3], samt den

HNF1A

gen [4], som modtagelighed loci for kræft i bugspytkirtlen. Imidlertid har single-markør forening tests begrænset magt til at identificere gener, der virkelig er forbundet med sygdomsstatus, men kan ikke nå en stringent genom-dækkende betydning tærskel i GWAS. Således kan mange vigtige sygdomsgener stadig ukendt med denne tilgang. Endvidere cancerudvikling typisk involverer dysfunktion af flere funktionelt beslægtede gener handler samstemmende i et netværk eller veje [5]. Således pathway analyse af GWAS data, som i fællesskab finder flere varianter i interagerende gener og multiple gener i en biologisk vej, som en tilgang til enkeltstrenget markør association test [6], kan have potentiale til at afsløre polygenic grundlag af sygdomsmodtagelighed . Pathway-baserede GWAS analyser har tilvejebringes nye indsigt i ætiologien af ​​kræftformer, såsom tyktarmskræft [7], lungecancer [8], og melanom [9], og andre komplekse sygdomme, herunder skizofreni [10], bipolær lidelse [11 ], og rheumatoid arthritis [12]. En nylig undersøgelse analyserede GWAS data med fokus på 23 udvalgte veje eller grupper af gener og identificeret bugspytkirtlen udvikling pathway gener som modtagelighed faktorer for kræft i bugspytkirtlen [13]. Mens disse data understøtter kandidaten pathway analyse som en nyttig metode til genetisk forbindelsesundersøgelse, er det begrænset af antallet af veje /gener undersøgt, tyder på, at en mere omfattende agnostiker analyse af alle kendte veje kan have potentiale til at afdække hidtil ukendte gener, der var ikke tidligere behandlet i bugspytkirtelkræft.

Gene sæt højderyg regression i associationsstudier (græs) er en af ​​de nyudviklede pathway tilgange [7]. I GRASS, er hovedkomponenter analyse (PCA) anvendes til at indfange den genetiske variation indenfor et gen for at reducere dimensionalitet af enkeltnukleotidpolymorfi (SNP) data og legaliseret logistisk regression udføres for at vurdere sammenslutning af veje med sygdom. I denne undersøgelse har vi først brugt græs på GWAS data til vurdering af sammenslutningen af ​​veje med kræft i bugspytkirtlen. Så vi anvendt den logistiske kerne maskine (LKM) metode til at screene de store bidrager gener til hver vej [14]. Endelig har vi gennemført funktionelle berigelse analyse af de væsentligste gener ved hjælp af Database til Annotation, Visualisering, og integreret Discovery (DAVID) metoden [15], [16]. I denne undersøgelse, den første omfattende analyse af GWAS data i bugspytkirtelkræft ved hjælp af en agnostiker tilgang, har vi identificeret nye veje og gener, der er væsentligt forbundet med risiko for sygdom. Disse resultater kan åbne nye veje i forskningen på det molekylære mekanisme og ætiologi af kræft i bugspytkirtlen.

Metoder

Undersøgelse Befolkning og datakilde

Undersøgelsen befolkning omfattede en alt 7,019 personer: 1.871 tilfælde og 2026 fra PanScan1 herunder 12 indlejrede case-control studier og ét hospital-baseret case-control studie og 1.528 tilfælde og 1.594 kontroller fra PanScan2 herunder 6 case-kontrol undersøgelser af kræft i bugspytkirtlen [2], [3] . Tilfælde blev defineret som primær adenocarcinom i exokrin pankreas. Controls, der var fri for kræft i bugspytkirtlen ved ansættelsen, blev matchet på sager efter fødselsår, køn, og selvrapporteret race /etnicitet. GWAS var blevet udført på National Cancer Institute Core Genotypning Facility hjælp af HumanHap550, HumanHap550-Duo, og human 610-Quad arrays (alle fra Illumina, San Diego, CA) [2], [3]. De oprindelige GWAS data blev hentet fra databasen af ​​genotyper og fænotyper (dbGaP) [17]. På grundlag af International HapMap Project genotype data (fase 3 release # 3, NCBI bygge 36, dbSNP B126, 2010-05-28) i tre populationer (CEU, JPT /CHB, og Yri) [18] og mindre allel frekvens ( MAF) 5%, valgte vi 10.155 SNPs med

r

2 0,004 til brug i befolkningen struktur analyse [19]. I alt 6,508 personer (3.141 sager og 3.367 kontroller) med europæisk herkomst (dvs. 0,75-1 lighed med CEU) blev udvalgt fra start studiepopulation af 7,019 personer i den aktuelle sti analyse.

Kvalitetskontrol

De originale GWAS data bestået kvalitetskontrol procedurer før lagt ud på dbGaP. Vi beskæres de genotypedata ved yderligere at udelukke 13.822 SNPs med takst 98%, 45,653 SNPs med MAF 5%, og 38,857 SNP’er afviger fra Hardy-Weinberg ligevægt (

P

0,001), som samt SNPs i genet ørkenområder, hvilket resulterer i 82,881 SNPs i sidste ende fra en start antal 468,111 SNPs.

for at vurdere virkningen af ​​befolkningens struktur, vi gjort fraktil-fraktil (QQ) plot og beregnet inflation factor () hos personer med eneste europæiske afstamning. Den inflation faktor blev beregnet efter metode, de Bakker et al. [20], justeret for en stikprøve på 1.000 sager og 1.000 kontrol ved hjælp af formlen: Hvor, og er faktiske antal bruges til at beregne; 1000 er stikprøvestørrelsen skal korrigeres. QQ plot viser lidt inflation af test statistik i forhold til forventede fordeling (λ = 1,03), at udelukke muligheden for potentielle befolkning struktur mellem cases og kontroller.

Gener med -log10 (

P

) 1 er ikke medtaget i plots. For klarhedens skyld ikke alle gener er mærket. For detaljer, se tabel S1 og S3.

Veje og Gener

I alt 214 humane biologiske veje er opført i Kyoto Encyclopedia of Gener og genomer (Kegg) [ ,,,0],21]. Efter at have udelukket veje med 10 eller 500 gener, vi analyserede 197 veje ved hjælp af GRASS tilgang [22]. Vi identificerede 19,058 reference Sequence (RefSeq) gener i GWAS data fra det menneskelige genom 18 (hg18) database ved hjælp af University of California Santa Cruz (UCSC) Tabel Browser data hentning værktøj [23]. Vi testede 5.127 gener i de 197 veje til samarbejde med kræft i bugspytkirtlen. For hvert gen region, vi medtaget SNPs inden for 20 kb opstrøms eller nedstrøms for genet i denne undersøgelse.

Den fuldt optrukne linie og stiplet linie henholdsvis viser de direkte og indirekte vekselvirkninger mellem gener.

statistiske metoder

Vi brugte GRASS at teste sammenslutning af hver vej med kræft i bugspytkirtlen. Genotypedata blev kodet i en additiv model ved hjælp Plink udgave 1.07 [24] med 0 for homozygot almindelige allel, 1 for heterozygot, og 2 for homozygot mutant allel. Græsset tester nulhypotesen, at ingen af ​​SNP’er i et givet pathway var forbundet med sygdommen [6]. For at undgå unødig påvirkning af varierende gen- og pathway størrelser, græsset bruger normaliserede statistik gen-niveau og prøve (emne) permutationer. Detaljerne i GRASS er tidligere blevet beskrevet [7]. Kort fortalt er fremgangsmåden består af tre trin. Først PCA anvendes til at sammenfatte SNP’er i hvert gen som ukorrelerede (ortogonale) lineære kombinationer af de oprindelige SNP’er, kaldet eigenSNPs, der tegner sig for ≥95% af den genetiske variation. Antallet af resulterende eigenSNPs er sædvanligvis meget mindre end de oprindelige genotypede SNP’er og tjener som prædiktorer i normaliseret logistisk regressionsmodel. En straffet sandsynlighed funktion bruges til at estimere regressionskoefficienter af eigenSNPs. For det andet er en standardiseret gen-niveau statistik beregnes efter regressionskoefficienter af eigenSNPs. Den statistik, analog med z-statistik, er defineret aswhere

er kvadratroden af ​​summen af ​​kvadrerede regression koefficient for hver eigenSNP anslået under optimale tuning parameter; og, estimeret ud fra permutationer, er gennemsnittet og standardafvigelsen af ​​under nulhypotesen, at genet ikke er forbundet med sygdommen. Således hvert gen, uanset dens størrelse, bidrager også til gensæt forening statistik, som beskrevet nedenfor. Det tredje trin indebærer beregning gen sæt (pathway) forening statistik () og p-værdi. er kvadratroden af ​​summen af ​​kvadrerede standardiserede statistikker gen-niveau;

P Drømmeholdet værdi estimeres ved anvendelse, hvor der er beregnet ud fra de permuterede data og B er antallet af permutationer. På grund af det store antal gener og pathways analyserede vi anvendte Bonferroni-metode til at korrigere for multiple sammenligninger. Tærsklen signifikans var

P

0,00025 (0,05 /197). På grund af den intensive beregning følger af GRASS vedtog vi en to-trins permutation testprocedure, der svarer til den implementeret i Plink [24]: vi først gennemført 5.000 permutationer til hvert gen sat i denne undersøgelse, og for de gen-sæt med p- værdi mindre end 0,00025, vi øget antallet af permutationer til 50.000.

vi anvendte LKM test for at vurdere sammenslutning af hvert gen med kræft i bugspytkirtlen som tidligere beskrevet [14]. Kort fortalt omfatter denne fremgangsmåde to trin: at danne SNP sæt til hvert gen og teste associering SNP sæt med sygdomsstatus. Genet databasen definition genregion, og genotype kodning brugt her var de samme som i græs. Den LKM model integrerer en regelmæssig logistisk model med en semi-konkret kerne funktion (en lineær kerne blev anvendt her), der er specielt designet til genetiske data. Variansen-komponenter score test af Zhang og Lin [25] blev brugt til at teste gen-sygdom forening. I denne analyse, vi testede sammenslutninger af 5.127 gener (i 197 veje) med kræft i bugspytkirtlen efter justering for alder (10-årgange), køn, undersøgelse (kategoriske), og fem hovedkomponenter (kvantitative) fange befolkningens struktur opnået fra en PCA-analyse under anvendelse EIGENSTRAT [26]. P-værdier fra KLM analyse blev justeret for multipel sammenligning ved hjælp af Bonferroni-metode. Tærsklen signifikans var

P

. 9,75 × 10

-6 (0,05 /5127)

Endelig, som en supplerende tilgang til GRASS pathway analyse undersøgte vi den funktionelle berigelse af de væsentligste gener i genbaserede forening tests (

P

≤0.01 i LKM) ved hjælp af web-tilgængelige bioinformatik værktøj DAVID [15], [16]. Den DAVID består af en integreret biologiske knowledgebase og analytiske redskaber til systematisk at udvinde biologisk betydning og over-repræsenterede biologiske funktioner fra store gen eller protein lister baseret på den hypergeometriske (Fishers eksakte) test. Vi brugte Kegg, GO og InterPro [27] databaser til at definere gen sæt. Desuden DAVID grupper funktionelt lignende gen sæt i klynger for at reducere overflødige karakter af gen funktionel annotation systemer, f.eks, den hierarkisk organiseret GO.

Som en replikering indsats, vi analyserede data fra PanScan1 (1.796 sager og 1.880 kontroller) og PanScan2 (1.345 sager og 1.487 kontrol) separat. Vi har også delt tilfældigt hele datasættet i to grupper og udført separat analyse i hver gruppe. Vi udførte meta-analyse af

P

værdier fra individuel kohorte /gruppe ved hjælp af Stouffer s z-score metode, der har vist sig at være effektive i metaanalyse af GWAS [28]. Testen statistik for at kombinere p-værdier fra to individuelle kohorter for en given vej opgøres som, hvor er inverse af den standard normale kumulative funktion. Den overordnede metaanalyse

P

værdi beregnes som. Endelig har vi anvendt GRASS metode til at teste de to største signifikante veje (som beskrevet i Resultater) ved hjælp af Wellcome Trust Case Kontrol Consortium (WTCCC) GWAS oplysninger [29] for empirisk evaluere effekten af ​​sti størrelse og demonstrere specificiteten af ​​vores resultater .

Resultater

pathways associeret med kræft i bugspytkirtlen

Vi analyserede 197 veje med 5.127 gener ved hjælp af GRASS tilgang og fandt, at seks veje betydeligt var forbundet med kræft i bugspytkirtlen efter Bonferroni korrektion (

P

2,5 × 10

-4) (tabel 1). Tre veje var signifikant på

P

værdier 0,0001: neuroaktive ligand-receptor-interaktion, langsigtet depression, og aldersdiabetes af de unge (MODY) veje. Tre veje havde en mindre betydning

P Drømmeholdet værdi af ≥0.0001 men 0,00025: den olfaktoriske transduktion, Fc epsilon RI signalering, og de vaskulære glatte muskel sammentrækning veje. Ud over de ovennævnte seks veje, den glycerophospholipid metabolisme, pancreas sekretion og vaskulær endotelvækstfaktor (VEGF) signalveje var forbundet med kræft i bugspytkirtlen ved

P =

0,0004 (tabel S1, tilgængelig online).

pathway Replication Resultater

To af de seks betydende veje, dvs. olfaktoriske transduktion pathway og den neuroaktive ligand-receptor interaktion vej viste konsekvent små

P

værdier på tværs af PanScan1 og PanScan2 kohorter, men ikke begge

P

værdier var signifikant efter flere test korrektioner sandsynligvis på grund af meget mindre stikprøvestørrelse i hvert enkelt kohorte og den deraf lavere statistisk styrke (tabel 2). Metaanalysen

P

værdier for disse to veje (1 × 10

-5 og 1 × 10

-5, henholdsvis) var signifikant efter Bonferroni korrektion. Den MODY pathway forblev signifikant i PanScan1 (

P

= 0,00006), men ikke i PanScan2 (

P

= 0,91), og meta-analyse

P Drømmeholdet værdi var 0,0589. Alle tre resterende væsentlige veje i den kombinerede GRASS analyse havde

P

værdier 0,1 i PanScan1 og PanScan2 kohorte (tabel 2). Når vi tilfældigt opdele datasættet i to grupper, alle seks veje havde en

P

værdi 0,05 i en af ​​de to grupper, men ikke i begge; og ingen af ​​metaanalysen

P

værdier var signifikant efter justering for flere sammenligninger (tabel S2). For at undersøge, om betydningen af ​​det olfaktoriske transduktion pathway (353 gener og 1.122 eigenSNPs) og neuroaktive ligandreceptoren interaktion vejen (263 gener og 1.374 eigenSNPs) var simpelthen på grund af deres store størrelse, vi testede disse veje ved at anvende GRASS til WTCCC GWAS data og opnåede en

P

værdi på 0,5652 og 0,2332 for bipolar lidelse og 0,246 og 0,0062 for Crohns sygdom, henholdsvis (hver sygdom havde 2.000 sager og 3.000 kontroller). Disse resultater, sammen med de konsekvente lille

P

værdier på tværs af PanScan1 og PanScan2, viser, at den betydelige

P

værdien af ​​disse to veje i græsset analysen er usandsynlig på grund af vejen størrelse. Hertil kommer, at undersøge, om de pathway resultater primært var drevet af GWAS top hits rapporteret i PanScan1 og PanScan 2 fjernede vi genet

NR5A2

fra MODY pathway og re-udført GRASS analyse med 50.000 permutationer. P-værdi for den kombinerede datasæt, PanScan1 og PanScan2 delmængde var 0,4 × 10

-4, 0,6 × 10

-4, og 0,88 hhv. De respektive

P

værdier var 0,6 × 10

-4, 0,6 × 10

-4 og 0,91 fra analysen herunder

NR5A2

gen, hvilket tyder på, at vores vej analyse bragt i orden signaler uafhængige af dem ved en enkelt-SNP-analyse. Bemærk, at andre GWAS top hits såsom

ABO

og

TERT1

indgik ikke i nogen af ​​de 197 veje.

Major Medvirkende Gener til Pathways

Anvendelse af LKM metode, vi identificeret 365 gener med nominel betydning (

P

0,05) og 118 gener med

P

0,01 for de 197 veje (tabel S3, tilgængelig online). De vigtigste medvirkende gener til hver af de seks betydende veje identificeret ved GRASS er opført i tabel 1. De store gener, der bidrager til de 197 veje og de seks betydende veje er vist i figur 1 og 2, henholdsvis. Efter vi justeret for multiple sammenligninger, fire gener forblev signifikant (

P

9,75 × 10

-6):

ABO

,

HNF1A

,

OR13C4

, og

SHH

gener (tabel 3). Ud over disse fire gener,

ABL1

,

MYC, HNF4G

,

NR5A2

(en GWAS top hit) og

ADPGK

havde

P

værdier 0,0001

funktionel berigelse analyse af Væsentlige gener

Endelig har vi gennemført funktionelle berigelse analyse, ved hjælp af DAVID, på sættet af 118 gener med

P

0,01 fra LKM analyse. Fyrre-fire klynger blev identificeret på grundlag af Kegg, GO og InterPro kategorier. De klynger af gener med

P

0,01 fra DAVID er anført i tabel 4 (se tabel S4 for detaljeret liste af gener i hver klynge). Superfamilien af ​​rhodopsin-lignende G-proteinkoblede receptorer (GPCR’er), opfattelse af lugt og olfaktoriske transduktion var den mest betydningsfulde gruppe af gener på grundlag af InterPro (

P

= 1,61 × 10

– 13), GO (

P

= 1,30 × 10

-7) og Kegg (2,38 × 10

-3) databaser henholdsvis ekko vores resultater fra græs. Gener opretholde homøostase processen blev også overrepræsenteret i bugspytkirtelkræft (tabel 4). Den biologiske forhold kortet for top 81 gener (

P

0,05 i LKM). Af de seks betydende veje er vist i figur 3, som blev oprettet med Ingenuity Pathway og analyse software [30]

diskussion

i denne GWAS pathway analyse identificerede vi to nye veje, dvs. neuroaktive ligand-receptor interaktion og olfaktoriske transduktionsveje der er signifikant associeret med bugspytkirtlen kræftrisiko efter justering for flere sammenligninger og i replikation test. Disse resultater blev også støttet af funktionelle berigelse analyse. Vi identificerede også fire gener, der er signifikant associeret med bugspytkirtlen kræftrisiko, herunder tre tidligere impliceret gener

ABO

,

HNF1A

, og

SHH

[2] – [4] såvel som en ny gen

OR13C4

. Disse resultater giver nye provokerende indsigt i polygenisk grundlag af kræft i bugspytkirtlen modtagelighed og ætiologi

GPCR proteinsuperfamilie af transmembrane receptorer udgør ca. 4% af hele humane genom og . 50% af moderne terapeutiske mål [ ,,,0],31]. Gener af neuroaktive ligand-receptor-interaktion og olfaktoriske transduktionsveje er vigtige komponenter i GPCRs (Tabel S4). Den neuroaktive ligand-receptor interaktion pathway forblev signifikant efter justering for flere test i PanScan1 (

P

= 0,0006), men ikke i PanScan2 (

P

= 0,002). Men P-værdi fra meta-analysen var, meget signifikant (

P

1 × 10

-5). De bidrager gener til denne vej, f.eks

CCKBR, CHRM5, EDNRA, LPAR1

,

SSTR2 /3 fotos, og

SCTR

, har forskellige funktioner i regulering af endokrine og eksokrine funktioner i bugspytkirtlen, der er stærkt relevant for kræft i bugspytkirtlen [32], [33], [34], [35]

mennesker har . 700 olfaktoriske receptor (OR) gener (hvoraf ≥50% er funktionelle) [36]. Genetiske varianter af SR gener og dysfunktioner i SR signalering er tidligere blevet associeret med skizofreni [37], føtalt hæmoglobin i seglcelle-anæmi [38], og proliferation af prostatacancerceller [39]. Selvom sammenhængen mellem olfaktoriske transduktion og kræft i bugspytkirtlen stadig at blive belyst, en tidligere sekventering analyse af humane pancreas tumorer fandt mange somatiske mutationer i eller gener, herunder syv gener identificeret i den aktuelle analyse:

OR13C3

,

OR13C5

,

OR10P1

,

OR1J2

,

OR4A16

,

OR51F2

, og

OR5D13

[40] . Ekspression af mindst to eller gener er blevet rapporteret i humane bugspytkirtel væv [41]. De to øverste bidrager gener til den olfaktoriske transduktion pathway,

OR13C4

og

OR13C3

, rangeret som den tredje og femte mest betydningsfulde gener blandt de 5.127 gener analyseret i denne undersøgelse. I replikering studiet, den olfaktoriske transduktion pathway forblev som en af ​​de øverste veje med konsekvente små

P

værdier i PanScan1 og PanScan2 kohorte med en betydelig metaanalyse

P Drømmeholdet værdi efter justering for flere testning. På den anden side, har vi ikke finde nogen sammenslutning af denne vej med bipolar eller Crohns sygdom i dataanalyse på WTCCC GWAS. Alle disse data antyder, at sammensætningen af ​​olfaktoriske transduktion pathway og bugspytkirtelkræft er sandsynligvis ikke skyldes tilfældigheder. Yderligere replikation af denne forening i andre datasæt og funktionelle studier af de biologiske og molekylære forbindelser mellem olfaktoriske transduktion signalering og bugspytkirtelkræft er berettiget. GPCR’er er den første port, gennem hvilken udenfor signaler transmitteres til cellen. Høje aktivitet af GPCR’er kan bidrage til transduktion af eksterne skadelige signaler, såsom insulin, glucose, eller carcinogener, i en celle og inducere en kaskade af reaktioner relateret til carcinogenese.

Ud over disse to veje, fire ekstra veje også bestået Bonferroni korrektion for multiple sammenligninger, dvs. MODY, Fc epsilon RI, langsigtet depression og vaskulære glatmuskelkontraktion pathways. Men MODY vej var meget signifikant i PanScan1 men var ikke signifikant i PanScan2. Den formindskede eller svagere gen-risiko forening i PanScan2 er tidligere blevet observeret for andre gener [3], [4]. Denne forskel kan være relateret til det faktum, at PanScan1 blev samlet fra 12 kohortestudier og et tilfælde kontrol undersøgelse, mens PanScan2 blev trukket fra otte tilfælde kontrol studier. På grund af den hurtige dødsfald af kræft i bugspytkirtlen, kan tilfælde kontrol studie underkaste en overlevelse skævhed, hvis test gener forbundet med overlevelse. Selvom metaanalyse ikke viste en signifikant

P Drømmeholdet værdi, er denne vej blevet identificeret som den mest betydningsfulde vej i forbindelse med kræft i bugspytkirtlen i en separat analyse af de panscan data ved hjælp af to forskellige statistiske metoder [13]. De MODY gener er en vigtig del af den transkriptionelle netværk, der regulerer bugspytkirtel udvikling og differentiering tidligt i livet og opretholder pancreas homeostase i voksenalderen [42], [43], [44]. Tre MODY gener (

HNF1A

,

HNF4G

, og

NR5A2

) var blandt de 10 gener med

P

værdier 0,0001 i LKM analyse . Især anden to af de 10 gener,

SHH

og

MYC

, er også kendt for at spille en væsentlig rolle i bugspytkirtlen udvikling [45]. Gener involveret i organudvikling og differentiering kan bidrage til evnen af ​​tumorceller til at proliferere og overleve, samt ændre celle plasticitet, således at omprogrammere celler til en tilstand, der kan give anledning til en tumor. MODY gener kan også bidrage til pancreascancer ved at modificere risikoen for diabetes [46] og fedme [47], [48], eller ved at regulere epitelcellevækst og differentiering, lipidmetabolisme [49], protein fucosylering [50], og inflammation [51].

Fc epsilon RI er en høj affinitet receptor for IgE, og mastcelleaktivering medieret af Fc epsilon RI er en vigtig begivenhed i den allergiske inflammatoriske respons. Stigende tyder på, at betændelse omkring tumor, herunder infiltrering af mastceller, faciliteter tumorvækst og angiogenese i bugspytkirtelkræft [52], [53]. Men denne vej sammen med den langsigtede depression og vaskulære glatte muskulatur sammentrækning veje ikke har ensartede resultater i replikation undersøgelser. Således skal behandles med forsigtighed disse data.

I forhold til resultater fra tidligere rapporterede kandidat pathway /gen-analyse [13], vores resultater om veje, der indgik i begge undersøgelser var ganske konsekvent, dvs. en positiv finde på bugspytkirtlen udvikling (aka MODY) pathway /gener og de negative resultater om DNA-reparation, apoptose, insulin signalering, wnt, hak og pindsvin veje /gener.

Dette er langt den største undersøgelse i bugspytkirtlen kræft med den mest omfattende analyse af alle biologiske veje identificeret fra Kegg hjælp agnostiker tilgang. Brug PCA i GRASS stærkt reduceret dimensionalitet af GWAS data og øget sandsynligheden for udskille nyttige oplysninger. Brug af LKM metode overvandt påvirkninger af positive og negative effekter af SNP’er og gjort os i stand til at identificere nye gener ud over at gentage de genregioner opdaget af tidligere marginal-associationsstudier [54]. Ved at udføre græsset analyse i to uafhængige kohorter, har vi vist konsistente resultater på nogle af de væsentlige veje. Yderligere replikation af disse resultater i fremtiden yderligere bugspytkirtelkræft GWAS data er berettiget. Samlet set vejen analyse tilgang med intensiv kontrol for falsk positive fund har et stort potentiale til at afdække gen træk, der er forbundet med sygdommen uden a priori. Korrekt brug af dette værktøj kan åbne nye muligheder for forskning i de molekylære mekanismer i kræft i bugspytkirtlen og potentielle mål for forebyggelse og behandling af denne sygdom.

Støtte oplysninger

tabel S1.

Liste over 197 biologiske veje analyseret i denne undersøgelse

doi:. 10,1371 /journal.pone.0046887.s001

(XLS)

tabel S2. .

Resultater af GRASS analyse i undergrupper og i WTCCC GWAS datasæt

doi: 10,1371 /journal.pone.0046887.s002

(XLS)

tabel S3.

Liste over 5.127 gener analyseret i denne undersøgelse

doi:. 10,1371 /journal.pone.0046887.s003

(XLS)

Tabel S4.

Liste over gener i hver klynge identificeret i DAVID analyse

doi:. 10,1371 /journal.pone.0046887.s004

(XLS)

Tak

Vi takker alle bidragydere til PanScan GWAS. Vi takker Dr. Yuxin Fu for hans råd om befolkningen struktur analyse og Mr. Jin Yu for hans hjælp med den intensive beregning ved hjælp af klynge system på University of Texas, School of Public Health i Houston.

Be the first to comment

Leave a Reply