PLoS ONE: I Silico Funktionel Pathway Annotation af 86 Etablerede Prostata Cancer Risk varianter

Abstrakt

Heritabilitet er en af ​​de stærkeste risikofaktorer for prostatakræft, understreger betydningen af ​​den genetiske bidrag til risiko prostatakræft. Til dato har 86 etablerede prostatakræft risiko varianter blevet identificeret ved genom-dækkende forening undersøgelser (GWAS). At afgøre, om disse risikofaktorer varianter er placeret i nærheden af ​​gener, der interagerer sammen i biologiske netværk eller veje, der bidrager til prostatakræft initiering eller progression, genereret vi gen-sæt baseret på nærhed til 86 prostatakræft risiko varianter de. Vi tog to tilgange til at generere gen lister. Den første strategi omfattede alle umiddelbare flankerende gener, op- og nedstrøms for risikoen variant, uanset afstand fra indekset variant og den anden strategi omfattede gener nærmest indekset GWAS markør og varianter i høj LD (r

2 ≥0.8 i europæerne) med indekset variant inden for en 100 kb vindue op- og nedstrøms. Pathway kortlægning af de to gensæt støttede betydningen af ​​androgen receptor-medieret signalering i prostatacancer biologi. Derudover blev hedgehog og Wnt /β-catenin signalveje identificeret i pathway mapping for den flankerende gensæt. Vi brugte også HaploReg ressource til at undersøge 86 risiko loci og varianter høj LD (r

2 ≥0.8) for funktionelle elementer. Vi fandt, at der var en 12,8 gange (p = 2,9 x 10

-4) berigelse for forstærker motiver i en stamcelle linje og en 4,4 gange (p = 1,1 x 10

-3) berigelse af DNase overfølsomhed i en prostata-adenocarcinom-cellelinie, hvilket indikerer, at risikoen og korrelerede varianter er beriget for transskriptionelle regulatoriske motiver. Vores vej-baserede funktionelle annotation af prostatakræft risiko varianter de fremhæver den potentielle regulerende funktion, der GWAS risikomarkører og deres højt korrelerede varianter, udøve på gener. Vores undersøgelse viser også, at disse gener kan fungere kooperativt i vigtige signalveje i prostatakræft biologi

Henvisning:. Loo LWM, Fong ayw, Cheng I, Le Marchand L (2015)

I Silico

Funktionel Pathway Annotation af 86 Etablerede risikoen for prostatacancer Varianter. PLoS ONE 10 (2): e0117873. doi: 10,1371 /journal.pone.0117873

Academic Redaktør: Allen Gao, UC Davis Comprehensive Cancer Center, UNITED STATES

Modtaget: 26 september, 2014 Accepteret: December 23, 2014; Publiceret: 6 feb 2015

Copyright: © 2015 Loo et al. Dette er en åben adgang artiklen distribueres under betingelserne i Creative Commons Attribution License, som tillader ubegrænset brug, distribution og reproduktion i ethvert medie, forudsat den oprindelige forfatter og kilde krediteres

Data Tilgængelighed: Alle relevante data er inden for papir og dens støtte informationsfiler

finansiering:.. forfatterne har ingen støtte eller finansiering til at rapportere

konkurrerende interesser:. forfatterne har erklæret, at der ikke findes konkurrerende interesser

Introduktion

genom-dækkende forening undersøgelser (GWAS) har identificeret hundredvis af genetiske varianter associeret med kræft [1] [2]; endnu, er de fleste risikofaktorer alleler forbundet med en beskeden sygdomsrisiko (OR 1,5). Desuden vil yderligere følsomhed varianter identificeres, med voksende stikprøvestørrelser og anvendelse af high-throughput sekventering teknologier. De vigtige næste skridt indebærer fine kortlægning af foreningens signaler efterfulgt af funktionel karakterisering af de formodede kausale varianter. I denne tid med omfattende karakterisering af det humane genom med Den Internationale HapMap og 1000 genomer projekt, datasikring af genomiske modifikationer er involveret i genregulering af Encyclopedia of DNA Elements (KODE), og den høje opløsning molekylær karakterisering af almindelige kræftformer af The kræft Genome Atlas (TCGA), kan vi forsøge at integrere disse oplysninger til at karakterisere de biologiske mekanismer, der er påvirket af kræftrisiko varianter.

Prostatakræft vil påvirke en i syv mænd i deres levetid, og er den næststørste årsag af mandlige kræftrelaterede dødsfald i USA det er en heterogen sygdom med variabel kliniske forløb. Selv om de fleste prostata tumorer er indolent, nogle er aggressive, spreder sig til blæren, endetarmen, og knogle. Familiens historie er en etableret risikofaktor for prostatakræft, understøtter den observation, at der er en stærk genetisk komponent til denne sygdom [3-5]. Mænd med en familie historie af prostatakræft er over 3 gange større sandsynlighed for at udvikle prostatakræft, og deres risiko stiger med to eller flere berørte førstegradsslægtninge [6]. Twin undersøgelser viser, at bidraget af arvelige faktorer er så høj som 42% for at udvikle prostatacancer [4].

De fleste af de 86 risikoen for prostatacancer varianter, der er blevet identificeret til dato er placeret i ikke-kodende introniske eller intergeniske regioner [2]. Derfor udfyldelse de funktionelle elementer, der er forbundet med disse risikofaktorer varianter, korrelerede varianter i høj bindingsuligevægt sammen med tilstødende gener og funktionelle netværk, kan bidrage til at forbedre vores forståelse af de biologiske mekanismer, der er involveret i ætiologien for prostatakræft.

Metoder

prostatakræft risiko alleler

seksogfirs prostatakræft risiko varianter blev indvindes af National human Genome Research Institute (NHGRI) GWAS katalog (fra april 2013) [1,2 ] og den Internationale Collaborative Onkologiske Gene-miljø Study (iCOGs) konsortium [7], der mødte genomet hele signifikansniveau på p ≤ 5 x 10

-8 (S1 tabel).

Prostatakræft risiko allel associeret gen lister

Vi tog to tilgange til at generere gen lister at kortlægge biologiske veje potentielt underliggende genetiske signaler repræsenteret ved prostatakræft risiko alleler. Med den første fremgangsmåde, vi medtaget alle umiddelbare flankerende gener (nærmeste gen på hver side af risikoen allelen), op- og nedstrøms for risiko allelen, uanset afstand fra indekset variant. Med den anden metode, vi analyserede alle gener tættest på indekset markøren og alle andre varianter i høj LD (r

2 ≥0.8 i europæerne fra 1000 genomer Project) med indekset markør inden for en 100 kb vindue op- og nedstrøms for SNP, overvejer de fleste enhancerelementer placeret inden for 100 kb deres målgener.

HaploReg analyse

i alt 86 SNPs blev anvendt til funktionelle annotation analyse af etablerede risiko prostatakræft alleler. Den HaploReg v2 (https://compbio.mit.edu/HaploReg) ressource og database blev anvendt til at identificere biofeatures i sekvenser, der indeholder de prostatakræft risiko varianter og SNPs i i høj LD (r

2 ≥0.8 i europæerne fra 1000 Genomer Project) [9]. Funktionelle elementer placeret i de samme områder som indekset og korreleret SNPs blev identificeret i KODE [8]. Den HaploReg værktøj identificeret evolutionært konserverede regioner baseret på SiPhy (stedsspecifik fylogenetiske) analyse [10]. Varianter blev kommenteret med potentielle virkninger for regulatoriske motiver baseret på eksisterende databaser som TRANSFAC, Jaspar, og PBM [9].

Protein Motiv Forudsigelse

PolyPhen og PROVEAN analyse blev anvendt til kodning SNPs til forudsige de strukturelle og funktionelle effekter af aminosyresubstitutioner [11,12]

Funktionel Netværk og Pathway Prediction

Ingenuity Pathway Analysis. (IPA; https://www.ingenuity.com/) blev anvendt til at identificere potentielle funktionelle netværk og veje. IPA Core Analyse blev anvendt på gen lister til at identificere direkte og indirekte vekselvirkninger baseret på IPA Knowledge Base, en samling af curated biologiske interaktioner og funktionelle anmærkninger baseret på eksisterende litteratur.

TCGA analyse af prostatakræft tumorvæv

cancer Genome Atlas (TCGA) database over prostata cancer tumor væv genekspression profiler blev forespurgt ved hjælp af cBioPortal for cancer Genomics analyse ressource (https://www.cbioportal.org/public-portal/) [13, 14].

Resultater

Funktionelle Profiler af gener Flankerende Risk SNPs

i alt 97 kommenterede gener blev identificeret til at være de mest umiddelbare nabolande gener op- og nedstrøms for 86 prostata cancer risiko varianter (S2 tabel). IPA software blev anvendt til at karakterisere den funktionelle sammensætning af 97 gener. Af de 97 gener, 56 blev identificeret til at have en funktionel rolle i cancer, med berigelse for gener forbundet med prostatakræft, der omfattede: HNF1 homeobox B (

HNF1B)

, kallikrein-relaterede peptidase 2

(KLK2 )

, kallikrein-relaterede peptidase 3

(KLK3)

, lemur tyrosinkinase 2

(LMTK2)

, NK3 homeobox en

(NKX3-1)

, og solut luftfartsselskab familie 22 (organisk kation transporter), medlem 3 (

SLC22A3)

. IPA identificerede også potentielle gen-gen interaktioner og netværk, der foreslog, at listen genet var sammensat af gener, der kunne fungere kollektivt i specifikke biologiske mekanismer. Den øverste funktionelle netværk omfattede 20 fokus molekyler fra genet listen og har en rolle i

organismal udvikling

,

fosterudvikling

,

og Organ udvikling

(fig. 1). Andre funktionelle netværk identificeret baseret på 97 gen listen, var

celle-til-cellesignalering og Interaktion

,

bindevæv; Celledød og overlevelse

,

Cancer

,

organismal Skade og abnormaliteter

(tabel 1). Disse resultater understøtter den iagttagelse, at de gener, der flankerer de prostatakræft risiko alleler har potentiale til funktionel konnektivitet at danne biologiske netværk, der har en rolle i udvikling, cellulær signalering, celledød og overlevelse, og kræft.

I alt af 97 unikke gener indeholdt eller flankerer 86 prostatakræft risiko loci. Gene-gen interaktioner blev identificeret ved hjælp af Ingenuity Pathway Analysis software. Den mest markante funktionelle netværk demonstrerer forbindelse mellem gener blev identificeret som havende en potentiel funktion i

organismal udvikling

,

fosterudvikling

,

og orgel udvikling

. De repræsentative genprodukter er opført og formodede funktioner opført i legenden. Genprodukter skraverede i grå repræsenterer gener stammer fra genet listen.

Når disse 97 gener blev forespurgt til ændringer genekspression, kopi nummer, og mutation profiler i The Cancer Genome Atlas (TCGA ) prostata adenokarcinom datasæt (n = 236), fandt vi, at mere end halvdelen af ​​de gener (65 af 97 gener) blev ændret i mindst 5% af tumorerne i datasættet, herunder 8 gener, der blev ændret i 10% af tumorerne (S3 tabel).

IPA Upstream Regulator værktøj blev anvendt til yderligere at identificere kritiske signalveje, der kan funktionelt sammenbinder gener, som kan have en rolle i prostatacancer initiering og progression. Dette værktøj identificerer potentielle opstrøms regulatorer baseret på den statistiske signifikans af gener fra genet liste, der fungerer nedstrøms for den identificerede opstrøms regulator. Eksempler på opstrøms regulatorer omfatter transkriptionsfaktorer, cytokiner, microRNA, receptorer, kinaser, kemikalier og lægemidler. Af de 22 betydende opstrøms regulatorer (Fisher eksakt test p 1 x 10

-4), identificeret af IPA, de fem vigtigste opstrøms regulatorer var androgen, androgen receptor (

AR)

, lymfoid enhancer- bindende faktor 1 (

LEF1)

, pindsvin

(HH)

, og cadmium chlorid (S4 tabel). Disse opstrøms regulatorer peger på vigtigheden af ​​gener, der fungerer i androgenreceptoren, pindsvin, og Wnt /β-catenin signaleringsveje i prostatacancer biologi. Sytten gener fra 97 gen liste blev identificeret til at fungere nedstrøms af disse top 5 opstrøms regulatorer. Desuden disse resultater understøtter potentialet for krydstale mellem disse veje i prostatakræft, da flere af de efterfølgende gener fra det gen listen delte de samme opstrøms regulatorer (fig. 2).

IPA Upstream Regulator værktøjet blev anvendt at identificere potentielle opstrøms regulatorer baseret på den statistiske signifikans af gener i genet liste, der fungerer nedstrøms for denne regulator. De øverste 5 opstrøms regulatorer identificeret var androgen, androgen receptor (AR), lymfoid forstærker-bindende faktor 1 (LEF1), pindsvin (HH), og cadmium chlorid. Upstream regulatorer (rød); AR var både og opstrøms regulator og af genet listen (lilla skravering); gener fra genet listen (blå).

Når vi forespørges TCGA data med de 17 gener, der er forbundet med de fem opstrøms regulatorer at afgøre, om disse gener blev ændret med hensyn til genekspression, kopiere nummer, og mutation i prostataadenokarcinom (n = 236). Vi fandt, at størstedelen af ​​de gener fra denne delmængde (11 af 17) blev ændret i mindst 5% af de 236 tumorer. Den hyppigste ændret gen var tumor suppressor,

NKX3-1

, som blev slettet eller muteret i 30 af de 236 prostatakræft (12,7%) indeholdt i TCGA datasæt. Andre opstrøms netværk gener, der blev ændret i TCGA tumorer (i 5% af 236) var v-myc aviær myelocytomatosis viral onkogen homolog (

MYC)

, Kruppel-lignende faktor 5

(KLF5 )

, integrin, alpha 6

(ITGA6)

, microseminoprotein, beta

(MSMB)

, claudin 11

(CLDN11)

, fibroblast vækstfaktor receptor 2

(FGFR2)

, SRY (sex bestemme region Y) -boks 9

(Sox9)

, fibroblast vækstfaktor 10

(FGF10)

, GATA bindende protein 5

(GATA5)

, og kallikrein-relaterede peptidase 3

(KLK3) Hotel (S3 tabel). Ændringer i disse gener i prostatatumorer er overensstemmelse med det potentiale regulerende rolle af genetiske varianter at regulere gener involveret i vigtige signalveje i prostatakræft biologi.

Funktionelle profiler af gener tilstødende SNP’er i høj LD med risikoen for prostatacancer alleler

i alt 1.594 individuelle SNPs (herunder 86-indekset SNP’er) blev identificeret til at være i høj LD med indekset SNPs og 81 fokus molekyler (78 kommenterede enkelte gener og 3 microRNA) var inden for 100 kb af disse SNPs (S5 tabel). Netværk analyse, ved hjælp af IPA, for at identificere funktionelle forbindelse mellem generne, viste, at den øverste funktionelle netværk var

Cancer

,

Cellular Vækst og spredning

,

og organismal Skade og abnormaliteter

, med 16 af de 78 gener fra genet listen i dette netværk (fig. 3). Ekstra tilknyttede netværksfunktioner, såsom

arvelig sygdom; Organismal Skade og abnormaliteter; DNA Replication

,

Rekombination

,

og reparation; Cellemorfologi; og Cellulær Funktion og vedligeholdelse

, blev identificeret baseret på 78 gen listen og beskrevet i tabel 2.

I alt 78 unikke gener indeholdt eller var placeret inden for 100 Kb af SNPs i høj LD (r

2 0,80). Gene-gen interaktioner blev identificeret ved hjælp af Ingenuity Pathway Analysis software. Den mest markante funktionelle netværk demonstrerer forbindelse mellem gener blev identificeret som havende en potentiel funktion i

Kræft

,

Cellular Vækst og spredning

,

og organismal Skade og abnormaliteter

. Genprodukter skraverede i grå repræsenterer gener stammer fra genet listen.

Når disse 81 indsatsområder molekyler blev forespurgt til ændringer genekspression, kopiere nummer, og mutation profiler i TCGA prostata adenokarcinom datasæt ( n = 236), fandt vi, at mere end halvdelen af ​​de gener (52 af 81 gener) blev ændret i mindst 5% af tumorerne i datasættet, herunder 5 gener, der er blevet omformet i 10% af tumorerne (S5 tabel) .Vi analyserede også de 81 indsatsområder molekyler til signalering konnektivitet ved hjælp af IPA opstrøms regulator analyse tilgang og identificeret 9 signifikante opstrøms regulatorer (Fisher eksakt test p 1 x 10

-4) (S6 tabel). De 5 mest betydningsfulde opstrøms regulatorer, flufenaminsyre,

AR

, cadmium chlorid, prostata transmembrane protein, androgen induceret en (

PMEPA1)

, og URI1, prefoldin-lignende chaperone (

URI1 )

viste tilslutningsmuligheder ved at dele flere downstream mål på tværs genet listen (fig. 4). Den mest markante opstrøms regulator var det non-steroide anti-inflammatorisk lægemiddel, flufenaminsyre (FLF). Flufenaminsyre funktioner opstrøms af androgen receptor for at inhibere

AR

genekspression og gennem denne funktion er blevet anvendt som et terapeutisk middel til prostatacancer [15]. Androgenreceptoren var det næstvigtigste opstrøms regulator med flere nedstrøms gener på genet listen, nemlig fibroblastvækstfaktor 10 (

FGFR10)

, integrin, a 6

(ITGA6)

,

CLDN11

, nerve growth factor receptor

(NGFR)

,

NKX3-1

,

MSMB

, og

KLK3

. Den transskription regulator prefoldin-lignende chaperone (

URI1)

også regulerer udtryk for

AR

, samt en delt nedstrøms gen på det gen listen, såsom

NKX3-1

[16], en tumor suppressor almindeligt slettet i prostata tumorer. Disse resultater viser, at en delmængde af generne identificeret som flankerer prostatakræft indeks SNPs eller SNP’er i høj LD med dem, kan have en vigtig funktionel rolle i reguleringen af ​​gener involveret i androgen receptor-medieret signalvej for prostatakræft.

IPA upstream regulator værktøjet blev brugt til at identificere potentielle opstrøms regulatorer baseret på den statistiske signifikans af gener i genet liste, der fungerer neden for denne regulator. De øverste 5 opstrøms regulatorer identificeret var flufenaminsyre, androgen receptor (AR), cadmium chlorid, prostata transmembrant protein, androgen inducerede 1 (PMEPA1), og prefoldin-lignende chaperone (URI1). Upstream regulatorer (rød); opstrøms regulator og af genet listen (lilla skravering); gener fra genet listen (blå).

Vi forespørges TCGA for ændringer i genekspression, kopiantal, og mutation i prostata-adenocarcinom datasæt (n = 236) under anvendelse af genet liste delmængde forbundet med top fem opstrøms regulatorer og fandt, at de fleste af de gener (6 af 9 gener) blev ændret i mindst 5% af de 236 tumorer, med sletning begivenheder

NKX3-1

(frekvens: 12,7%) som den hyppigste ændring. Andre opstrøms netværk gener fra vores gen liste, der blev ændret ( 5% af 236) var

ITGA6

,

MSMB

,

CLDN11

,

NGFR

,

FGF10

,

KLK3

(S5 tabel).

Funktionel Annotation af prostatakræft Risk alleler og SNPs i High LD

Vi brugte derefter den HaploReg redskab til at identificere potentielle mekanistiske funktioner af ikke-kodende risiko alleler ved at bestemme, om SNP af interesse forventes at være inden for exons, promotorer og forstærkere af gener ved loci af interesse. Den HaploReg Værktøjet identificerer potentielt funktionelle SNPs baseret på regulatoriske anmærkninger af kodende sekvenser baseret på oplysninger fra KODE [17].

Vi først fokuseret på karakterisering af potentielle regulerende funktion for 86 indeks SNPs (S7 tabel). To af de 86 SNPs blev placeret i exoner, genererer missense-mutationer; on blev placeret i 3’UTR-regionen af ​​et gen; 29 blev placeret i intron-regioner af gener; syv blev placeret i en evolutionær konserverede region forventes at være under funktionel begrænsning baseret på SiPhy (stedsspecifik fylogenetiske) analyse [10]; fem indeholdt promotor histon mærker; 37 indeholdt forstærker histon mærker; 36 var i DNase overfølsomme regioner; og 20 fandtes at have transkriptionsfaktorer bundet (baseret på chip-seq) til flere celletyper. Disse resultater antyder, at mange af 86 risikoen for prostatacancer varianter de var placeret i regulatoriske sekvenser i transkriptionelt aktive steder. Desuden blev flere risikofaktorer varianter fundet at have flere regulatoriske funktioner ved dens locus. Et eksempel, rs11568818 ved 11q21, ligger 182 bp 5 ‘fra matrix metallopeptidasen 7 (

MMP7

) gen. Dette SNP er inden for en region med bevarelse sekvens, forstærker histon mærker og DNase overfølsomhed i flere celletyper, og baseret på chip-Seq analyser, viste sig at binde transkriptionsfaktorer, der understøtter sandsynligheden at denne SNP er beliggende i et område med transkriptionel regulerende funktion. Desuden er det blevet vist ved ekspression quantitative trait loci (eQTL), som transkriptionelle eksisterer regulerende funktion på denne risiko locus for

MMP7

gen i levervæv [18].

Når 1.594 SNP’er, herunder de 86 indeks SNPs og SNP’er i høj LD med dem, blev undersøgt under anvendelse af HaploReg værktøjet identificerede vi ti SNPs, der var placeret i exon af kommenterede gener, fire placeret i 5’UTR, 22 placeret i 3’UTR , 15 ligger i potentielle promotorområder ( 1,5 Kb af det transkriptionelle startsted), 562 placeret i intron-regioner, og 936 ligger i intergeniske regioner (S8 tabel)

Ser specifikt mod projektlederne ( 1,5 kb fra det transkriptionelle startsted) og 5 ‘og 3’ UTR-regioner foreslået at være involveret i transkriptionel regulering, vi fandt, at 15 SNPs blev placeret i putative promotorregioner for 9 forskellige kodende gener (

MDM4

,

PIK3C2B

,

MLPH

,

VAMP8

,

NOTCH4

,

MSMB

,

MMP7

,

NGFR

,

VPS53

) og en ikke-kodende gen, kræft modtagelighed kandidat 8 (

CASC8

). Tre SNP’er var placeret i 5′-UTR af gener (

ZBTB38

,

VPS53

, og

PPP1R14A)

, og 22 SNPs var placeret i 3′-UTR af 11 forskellige gener (

MDM4

,

GGCX

,

VAMP8

,

PDLIM5

,

ARMC2

,

SESN1

,

PSORS1C1

,

NKX3-1

,

ZNF652

,

KLK3

, og

LIME1

). SNP’er placeret i 5′- og 3′-UTR-sekvenser af gener kan spille en vigtig rolle i reguleringen af ​​de mekanismer, der kontrollerer genekspression, mRNA-stabilitet, og translationseffektivitet [20] .For udforske yderligere regulatoriske mekanismer for indekset risiko og forbundet SNP sæt, bruger vi HaploReg redskab til at identificere forudsagte forstærkere og initiativtagere på disse loci (S8 tabel). Den HaploReg værktøj angivet en samlet betydelig berigelse af forstærkere i stamcelle linje, H1, med en 12,8 gange (p = 2,9 x 10

-4) berigelse af forstærker mærker i forventning til denne SNP sæt (S9 tabel). DNase berigelse analyse indikerede en signifikant berigelse af transkriptionelt aktive steder i SNP sæt med en 4,4 ganges forøgelse i forhold til forventet (p = 1,1 x 10

-3) i en cellelinie, der stammer fra en prostata-adenocarcinom (LNCaP-celler), og en 5.8 fold forøgelse i forhold til forventet (p = 1,8 x 10

-3) for en prostata epitelial cellelinje (Prec). Den berigelse af forstærker mærker og DNase overfølsomhedsreaktioner mærker i stamceller og prostatacancerceller giver stærke beviser for den rolle af prostatakræft risiko SNPs og SNPs i høj LD med dem i reguleringen af ​​genekspression.

For de ti forbundne SNPs beliggende i exoner af karakteriserede gener, fem SNP’er er synonyme varianter, og fem er missense varianter. Én missense variant rs11765552 på 7q21, ligger i exon 11 (forårsager L780M) i

LMTK2

er stærkt korreleret (r

2 = 0,99 i europæerne) med indekset SNP, rs6465657. Vi anvendte PolyPhen analyse for at forudsige den funktionelle potentiale af denne aminosyresubstitution og fundet, at denne variant kan resultere i en muligvis skadelig virkning (score 0,761 1,00) på proteinfunktion af LMTK2. Denne variant er placeret meget tæt på myosin VI bindende domæne (aa s 567-773) af LMTK2 [19]. To af de 5 missense varianter er placeret i melanophilin (

MLPH)

gen på 2q37. En af SNPs er et indeks risiko variant (rs2292884) placeret i exon 10 (forårsager H347R) og den anden SNP (rs2271809) placeret i exon 11 (E407D) er i høj LD (r

2 = 0,82) med dette indeks risikere SNP. Vi anvendte PolyPhen og PROVEAN analyse at forudsige funktionelle potentiale i disse aminosyresubstitutioner, havde begge varianter lav forudsagte proteinfunktion forstyrrelser. Den missense-varianten ved 6p21, rs130067, er et indeks risiko SNP placeret i exon 7 (E275D) af det coiled-coil alfa-helix stang protein 1 (

CCHCR1)

gen. PolyPhen analyse forudsiger meget lav, eller godartet, potentiale for protein-funktion forstyrrelser (score 0,00 eller 1,00). En anden missense variant ved 20q13, rs8957, er stærkt korreleret (r

2 = 0,83) med indekset risiko SNP, rs6062509 og placeret i exon 6 (E233D) af det opløste stof luftfartsselskab familie 2,

SLC2A4

gen . PolyPhen analyse forudsagde en meget lav eller godartede (score 0,02 1,00) potentiale for protein-funktion forstyrrelser for denne variant.

Diskussion

Vi har udført en omfattende

i silico

funktionel vej karakterisering af de 86 etablerede prostata kræft risiko alleler identificeret til dato. For at øge vores forståelse af de biologiske mekanismer, at indekset risiko varianter og nær-ved gener kan være sendt dønninger, tog vi to tilgange til at identificere gen netværk, der kan fungere i prostatakræft initiering eller patogenese. Én fremgangsmåde var at generere et gen liste bestående af kommenterede gener umiddelbart flankerer indeks SNP, uanset afstanden til nærmeste gen. Den anden fremgangsmåde var at betragte forbindelsen struktur og omfatter de omkringliggende gener af SNPs i høj LD (r

2≥0.8) med indekset SNP, inden for 100 kb. Sammenligning af de to gen-lister, der var 58 gener deles mellem de to lister, 39 gener unikke til listen genereres ved at identificere flankerende gener og 23 gener unikke til listen baseret på sammenkædning struktur. Samlet størstedelen af ​​de gener som blev identificeret viste sig at have en biologisk rolle i tumorigenese, med mange af de gener, der har en rolle i prostatacancer specifikt.

Med den første fremgangsmåde, ved hjælp af gen liste baseret på gener flankerende indekset SNP’er, vi identificeret 97 unikke gener og 56 af disse var cancerrelaterede gener. Sytten gener blev associeret med prostatacancer, specifikt. Med den anden metode, evaluering tilstødende gener til SNPs i høj LD med risiko varianter, vi identificeret 78 unikke gener. Halvdelen af ​​disse 78 gener var cancerrelaterede gener, med 14 gener specifikt associeret med prostatacancer. Ikke alle generne for de to lister var overlappende, som afspejles i de forskellige biologiske funktioner i de to øverste net til hvert gen liste Tabel 1 og 2. Begge gen lister identificerede androgen receptor som en betydelig opstrøms regulator, i overensstemmelse med den kendte centrale rolle androgen receptor-signalvejen i prostatacancer [26,27]. Interessant, de fem væsentlige opstrøms regulatorer (androgen,

AR

,

LEF1

,

HH

, og cadmium chlorid) baseret på flankerende gen listen, støtte en yderligere rolle for hedgehog og Wnt /β-catenin signalveje pathway. Gowda et al. for nylig rapporteret, at den synergistiske hæmning af både pindsvin og androgen receptor signalveje undertrykte væksten af ​​kastrationsresistent prostatacancer, mens hæmning af enten på Dansk eller androgen receptor veje individuelt ikke kunne opnå tilsvarende niveauer af vækst undertrykkelse [28], hvilket tyder på, at begge veje spiller en kritisk synergistisk rolle i biologi prostatacancer. I modsætning hertil de fem væsentlige opstrøms regulatorer (flufenamsyre,

AR

, cadmium chlorid,

PMEPA1

, og

URI1)

genereret, baseret på 78 gen liste over gener i høj LD med prostata kræftrisiko varianter, primært funktion i androgen receptor-signalvejen og ikke identificere pindsvinet eller Wnt /β-catenin signalveje [15,16,29,30]. Samlet set tyder disse resultater på, at indekset SNP’er er placeret i nærheden gener, der kan interagere og har funktionelle relationer i signalering netværk. Derfor antager, at de risikofaktorer alleler faktisk har regulatoriske virkninger på deres nærliggende gener, når de overvejer funktionelle rolle af risikofaktorer alleler, opmærksomhed på muligheden for, at flere varianter kan fungere til at påvirke en højere orden netværk af gener, der regulerer specifikke veje. Yderligere biologiske assays skal udføres for at bekræfte rolle af de risikofaktorer alleler og synergistiske interaktioner mellem de gener, de potentielt regulerer.

Brug af HaploReg værktøj til analyse af SNPs og gener i høj LD med indekset risiko varianter, vi udvidet vores analyse til at omfatte mere end 1.500 ekstra SNPs. Denne udvidede analyse pegede på regulerende funktioner, som ikke blev identificeret med de 86 index SNPs alene, potentielt forstærke listen af ​​gener, der er forbundet med det indeks genetiske signaler. De fleste af disse 1.500 SNP’er var placeret i intergeniske regioner, blev næsten en tredjedel af de linkede SNP’er placeret i intron regioner, blev et mindretal af de linkede SNP’er placeret i regulatoriske domæner (initiativtagerne og 5 ‘og 3’ UTR’er), og 10 SNPs var placeret i exon.

Når vi har evalueret 86 indeks SNPs for biologiske funktioner, der kan påvirke genfunktion, rs11568818 ved 11q21 viste den stærkeste bevis for at have transkriptionel regulerende funktion. Denne variant kan direkte påvirke ekspressionen af ​​

MMP7

gen. Det er beliggende i et evolutionært konserveret sekvens 182 bp 5 ‘for

MMP7

genet og indeholder karakteristika transskriptionel regulatorisk aktivitet, såsom histon mærker (H3K27Ac) og DNase overfølsomhed. Desuden har chip assays identificeret transkriptionsfaktorer (

TBP

,

FOS

,

juni

) binding til denne region og en eQTL analyse har vist interaktion mellem dette SNP og

MMP7

gen i levervæv [18]. Allelspecifik transaktivering af MMP7 gen via FOXA2 transkriptionsfaktoren blev observeret i idiopatisk lungefibrose patienter [21].

MMP7

har vist sig at være overudtrykt i prostatacancer væv sammenlignet med normalt væv og blev for nylig påvist at være reguleret af den ETV1 transkriptionsfaktor [22]. Regulering af ETV1 er af særlig interesse, fordi det er et medlem af ETS transkriptionsfaktorer. Translokationer af ETS transkriptionsfaktorer, herunder

ETV1

, forekommer i halvdelen af ​​alle prostatakræft resulterer i aberrerende ETS transskriptionsfaktor ekspression, der menes at være en tidlig, potentielt initierende begivenhed, for prostatacancer [23-25] . Tilsammen tyder disse data stærkt en funktionel rolle for rs11568818 i den transkriptionelle regulering af

MMP7

gen for prostatakræft. Yderligere funktionelle studier for at undersøge den potentielle rolle allelspecifik transkriptionel regulering af

MMP7

ved rs11568818 og ETV1 for prostatakræft bør gennemføres.

Blandt de SNPs, der er i høj LD med prostata kræft indeks SNP’er, vores resultater fremhæver en af ​​missense SNPs rs11765552, i høj LD (r

2 = 0,99) med SNP rs6465657 indeks risiko, som bliver placeret i

LMTK2

gen.

LMTK2

genet koder for et membranbundet kinase, der er involveret i intracellulær handel og endosomal genbrug. Puri et al.

Be the first to comment

Leave a Reply