Abstrakt
Selvom genom-dækkende forening undersøgelser har identificeret mange risici loci forbundet med kolorektal cancer, det molekylære grundlag for disse foreninger er stadig uklart. Vi havde til formål at udlede biologiske indsigt og fremhæve kandidatgener af interesse inden GWAS risiko loci. Vi brugte en
i silico
pipeline baseret på funktionel annotation, kvantitativ trait loci kortlægning af cis-virkende gen, PubMed tekst-mining, protein-protein interaktionsstudier, genetiske overlapninger med kræft somatiske mutationer og knockout mus fænotyper, og funktionelle berigelse analyse til at prioritere de kandidatgener på kolorektal cancer risiko loci. På baggrund af disse analyser, observerede vi, at disse gener var mål for godkendte behandlinger for kolorektal cancer, og foreslog, at lægemidler, der er godkendt til andre indikationer kan repurposed til behandling af kolorektal cancer. Denne undersøgelse sætter fokus på anvendelse af offentligt tilgængelige data som en omkostningseffektiv løsning til at udlede biologiske indsigt, og giver en empirisk bevis for, at den molekylære basis for kolorektal cancer kan give vigtige leads for opdagelsen af nye lægemidler
Henvisning.: Zhang J, Jiang K, Lv L, Wang H, Shen Z, Gao Z, et al. (2015) Anvendelse af genom-Wide Association Studies for Cancer Research and Drug Repositionering. PLoS ONE 10 (3): e0116477. doi: 10,1371 /journal.pone.0116477
Academic Redaktør: Giuseppe Novelli, Tor Vergata-universitetet i Rom, Italien
Modtaget: 27. september 2014 Accepteret: 8. december 2014 Udgivet: 24 marts 2015
Copyright: © 2015 Zhang et al. Dette er en åben adgang artiklen distribueres under betingelserne i Creative Commons Attribution License, som tillader ubegrænset brug, distribution og reproduktion i ethvert medie, forudsat den oprindelige forfatter og kilde krediteres
Data Tilgængelighed: Alle relevante data er inden for papir og dens Støtte Information filer
Finansiering:. Dette arbejde blev støttet af National Key Technology Support Program (Grant nummer: 2104000032), National Natural Science Foundation of China (Varenummer: 81.372.290) og National Natural Science Foundation of China (Varenummer: 81.372.291).
konkurrerende interesser:. forfatterne har erklæret, at der ikke findes konkurrerende interesser
Introduktion
Siden indførelsen af high-density enkelt-nukleotid polymorfisme (SNP) genotypebestemmelse arrays, har forskere anvendt genom-dækkende forbindelsesundersøgelser (GWAS) for at identificere utallige loci forbundet med en lang række sygdomme. Langt størstedelen af SNP’er identificeret af GWAS ligger inden for de intergeniske eller intronregioner (ca. 88%) [1,2]. GWAS har også muliggjort opdagelsen af mange genetiske variationer af kolorektale cancere (CRC). Det næste skridt var at identificere de gener, der er blevet berørt af kausale varianter, hvilket ville gøre det muligt for os at oversætte de risikofaktorer SNPs til meningsfulde indsigt på patogenese.
De fleste rapporter har simpelthen impliceret den nærmeste genet til en GWAS hit som en mål af den funktionelle variant uden beviser [1]. Identifikationen af udtryk kvantitativ egenskab loci (eQTL) er blevet foreslået som en lovende metode til at finde de kandidatgener forbundet med en sygdom risiko [3] [4]. Det skal bemærkes, at identificere en eQTL giver kun en indirekte bevis for en sammenhæng mellem genotype og gentranskription [1].
Så vidt vi ved, er der simpelthen ingen god måde at identificere disse målgener, som er nøglen til at forstå den mekanisme, hvormed GWAS varianter handling. Så vi foreslog en bioinformatik rørledning til at prioritere de mest sandsynlige kandidat gener ved hjælp af flere biologiske datasæt. Syv kriterier blev vedtaget at prioritere kandidatgener. Den udbredte eQTL ovennævnte kriterium er kun én af syv kriterier i støbeskeen.
En måde at fremskynde oversættelsen af data fra GWAS i kliniske fordele, er at bruge resultaterne til at identificere nye indikationer for behandling med eksisterende molekyler. GWAS kan anvendes til at konstruere narkotikarelaterede netværk, medvirken narkotika repositionering. Selvom GWAS ikke direkte identificere de fleste af de eksisterende lægemiddeltargets, er der flere grunde til at forvente, at nye mål alligevel vil blive opdaget ved hjælp af disse oplysninger [5,6]. De første resultater på narkotika nyorientering undersøgelser med anvendelse af netværksanalyse er opmuntrende og foreslå retninger for fremtidig [7] udvikling. Ved at integrere reumatoid arthritis genetiske fund med kataloget over godkendte lægemidler til leddegigt og andre sygdomme, Okada Y et al forudsat en empiriske data til at indikerer, at genetiske metoder kan være nyttige til at understøtte genetik-drevet genomiske drug discovery indsats i komplekse menneskelige træk [8 ].
i den foreliggende undersøgelse, brugte vi den
i silico
rørledning til systematisk at integrere data om risiko loci for CRC biologi og lægemiddelforskning fra en række forskellige databaser.
materialer og metoder
En oversigt over undersøgelsens design er vist i fig. 1. Biologiske kandidatgener blev opnået fra GWAS identificerede CRC risiko loci. Dernæst blev genetiske data integreres med resultaterne af statistiske analyser, beregningsmæssige metoder, og offentligt tilgængelige store datasæt til at prioritere de opnåede gener, og foreslå nye mål for lægemiddelbehandlinger.
Et hundrede og syvogfyrre kandidat gener blev opnået fra 50 CRC risiko loci. En bioinformatik rørledning blev udviklet til prioriteringen af disse kandidatgener. Syv kriterier blev anvendt til at score generne: (1) CRC risiko missense variant; (2)
cis
-eQTL; (3) PubMed tekst mining; (4) PPI; (5) kræft somatisk mutation; (6) knockout mus fænotype; og (7) funktionel berigelse. Omfanget af overlapning med target gener for godkendte CRC narkotika blev også vurderet.
CRC risiko loci fra GWAS
Vi hentede CRC risiko SNPs fra National Human Genome Research Institute (NHGRI) GWAS katalog database den 31. januar 2014 [2]
Biologiske kandidatgener fra CRC risiko loci
det er et velkendt faktum, at risikoen SNPs angiver haplotyper, hvor de funktionelle varianter bor.; derfor, det næste skridt var at identificere deres mål gener. Med vedtagelsen af multi-anmærkninger mellem risiko SNPs og de omgivende gener,
snp2gene
tilladt konventionel anmærkning på grund af deres nærhed, samt koblingsuligevægt [9].
For hver af de GWAS SNPs involveret, vi brugte den
snp2gene
at identificere kandidatgener. For hvert gen i risikoen loci, vi evalueret hvis genet var den nærmeste genet til CRC risiko SNP inden risikoen locus.
Prioritering af kandidatgener
Ved at bruge flere biologiske datasæt, vi udtænkt en bioinformatik rørledning til at prioritere de mest sandsynlige kandidatgener.
for det første funktionelle anmærkninger for CRC risiko SNPs blev identificeret ved
ANNOVAR
[10]. Egenskab-associerede varianter blev beriget i kromatin varemærker, særligt i H3K4me3 [11]. H3K4me3 data for 34 celletyper kunne give den fine kortlægning af associerede SNPs at identificere kausale variation i de tidligere undersøgelser [12]. Så vi vurderet, om CRC risiko SNPs og SNPs i bindingsuligevægt (r
2 0,80) blev overlappende med H3K4me3 toppe af 34 celletyper. De H3K4me3 data blev indhentet fra National Institutes of Health køreplan Epigenomics Mapping Consortium ved en permutation procedure med 10
5 gentagelser [12]. Vi identificerede gener for CRC risiko SNPs eller SNPs fra koblingsuligevægt (r
2 0,80), der blev kommenteret som missense varianter
For det andet har vi vurderet den
cis
-expression kvantitativ. trait loci (
cis
-eQTL) effekter ved hjælp af data fra 5.311 europæiske emner fra undersøgelsen om mononukleære celler fra perifert blod (PBMC’er) [13]. Westra HJ et al. havde lavet en browser til rådighed for alle væsentlige
cis
-eQTLs, opdages på et falsk opdagelse sats på 0,50. (https://genenetwork.nl/bloodeqtlbrowser/) I deres undersøgelse blev eQTLs anset
cis
-eQTLs når afstanden mellem SNP kromosomale position og sonden midtpunktet var mindre end 250 kb. De eQTLs blev kortlagt ved hjælp af Spearman rang korrelation på imputerede genotype doser. Resulterende korrelationer blev derefter omdannet til P-værdier, og deres respektive z scoringer blev vægtet med kvadratroden af stikprøvestørrelsen.
At evaluere
cis
-eQTL gener af risikofaktorer SNPs, det var kun nødvendigt at give alle risici SNP. Når CRC risiko SNP ikke var tilgængelige i eQTL datasæt, vi alternativt brugt resultaterne af bedste proxy SNPs i koblingsuligevægt med den højeste r
2 værdi (r
2 0,80).
tredje ved hjælp genet relationer mellem impliceret loci (
GRAIL Salg), vi vurderede graden af slægtskab mellem gener i sygdoms regioner.
GRAIL
er et værktøj til at undersøge forholdet mellem gener i forskellige sygdom forbundet loci. Givet mange genomiske regioner eller SNPs forbundet med CRC,
GRAIL
søgninger efter ligheder i offentliggjort videnskabelig tekst blandt de tilknyttede gener [14]. En p-værdi på 0,05 blev betragtet som signifikant. For at undgå publikationer, der rapporteres på eller var påvirket af sygdommen regioner opdaget i de seneste scanninger, bruger vi kun de PubMed abstracts offentliggjort før december 2006, inden den seneste stormløb af GWA papirer identificere nye foreninger, undgå stærk slagside i retning generne nærmeste til de tilknyttede SNP’er. Denne tilgang effektivt undgår dette problem. [14].
Dernæst brugte vi Disease Association Protein-Protein Link evalueringsværktøj
(dapple)
til vurdering af tilstedeværelsen af signifikante fysiske tilslutningsmuligheder blandt proteiner kodet af kandidatgener af protein-protein-interaktion (PPI), er rapporteret i litteraturen.
dapple
tager en liste over frø SNPs, der omdanner dem til gener baseret på overlap. Hypotesen bag dapple er, at en genetisk variation påvirker et begrænset sæt af underliggende mekanismer, der er påviseligt ved PPI [15]. En p-værdi på 0,05 blev betragtet som signifikant
Nest, vi opnåede cancer somatiske mutation gener fra Katalog over somatiske mutationer i Cancer (
COSMIC
) database [16], og hentede knockout. mus fænotype etiketter og gen-information fra databasen Mouse Genome Informatics (MGI) [17] den 8. april 2014. Vi definerede alle CRC risikofaktorer gener indgår i CRC risikoen loci, og evalueret overlapningen med kræft fænotyper med registrerede somatiske mutationer, og fænotype etiketter knockout mus gener med menneskelig ortologe. Hypergeometriske fordeling test blev anvendt til overlappende statistiske analyser med signifikans ved en p-værdi på. 0,05
Endelig har vi udførte funktion berigelse analyse for at undersøge, om gener, der berøres af SNPs blev beriget for specifikke funktionelle kategorier eller veje. David Bioinformatik Resources, der omfattede Gene Ontology (GO), Kyoto Encyclopedia of Gener og genomer (Kegg) og Mendelian Inheritance in Man (OMIM) blev anvendt til analyser. [18] De opnåede resultater blev betragtet som signifikante ved et
s
værdi 0,05
Vi scorede hver af generne ved hjælp af følgende udvælgelseskriterier, og beregnet antallet af de tilfredse kriterier:. (1) gener med missense varianter; (2)
cis
-eQTL gener af risikofaktorer SNPs; (3) gener prioriteret af PubMed tekst mining; (4) gener prioriteret af PPI-netværk; (5) cancer somatisk mutation gener; (6) gener prioriteret af tilknyttede knockout mus fænotyper; og (7) gener prioriteret ved funktionel berigelse analyse.
Korrelationer af kandidat gen prioriteringskriterier blev evalueret af Pearson korrelationsanalyse. Hvert gen blev scoret baseret på antallet af kriterier, der var opfyldt (scores varierede fra 0-7 for hvert gen) i tilfælde af svage korrelationer. Gener med en score på ⩾2 blev defineret som ‘biologiske risikofaktorer gener’.
Drug validering og opdagelse
Hvis human genetik kan validere lægemiddeltargets, så det kan bruges til at identificere, om den godkendte midler, der anvendes til behandling af andre indikationer, kan anvendes til behandling af CRC. Vi præsenterer her en analyse af den potentielle anvendelse af GWAS data, narkotika repositionering.
Vi opnåede drug target gener og tilsvarende oplysninger om narkotika fra Drug Bank [19] og terapeutiske mål Database (TTD) [20] den 18. okt , 2013. Vi valgte drug target gener, der havde farmakologiske aktiviteter og var effektive i humane ortologe modeller, og dem, der kommenteret med nogen af de godkendte, klinisk undersøgelse eller eksperimentelle narkotika.
de narkotika målgener kommenteret til CRC narkotika blev manuelt udvundet af professionelle onkologer. For at mindske af de falsk positive, kun de stoffer i henhold til gældende klinisk brug var involveret i undersøgelsen, som kunne findes i de NCCN klinisk praksis retningslinjer tarmkræft. [21]
Vi udvundet gener fra direkte PPI med biologiske CRC risiko gener ved hjælp af protein interaktion netværksanalyse-2 (
PINA2)
, der integrerer seks kendte manuelt kurateret PPI databaser [22].
Vi evaluerede muligheden for at udforske proteinprodukter fra de identificerede biologiske risikofaktorer gener, eller eventuelle gener fra en direkte PPI netværk som mål for godkendte CRC narkotika eller lægemidler til andre indikationer. Lad x være sæt af de biologiske CRC risikofaktorer gener og gener i direkte PPI med dem (n
x gener), y være det sæt af gener med protein produkter, der er direkte mål for godkendte CRC lægemidler (n
y gener), og z være det sæt af gener med protein produkter, der er direkte mål for alle godkendte lægemidler (n
z gener). Vi definerede n
x∩y og n
x∩z da antallet af gener overlappende mellem x og y og mellem x og z henholdsvis. Hypergeometriske fordeling tests blev anvendt til overlappende statistiske analyser, og ap værdi 0,05 blev betragtet som statistisk signifikant
Resultater Salg
I den foreliggende undersøgelse blev 50 CRC-associerede SNP’er opnået fra NHGRI (. tabel 1), og 140 gener blev opnået på grundlag af nærhed og koblingsuligevægt hjælp af
snp2gene
(S1 tabel).
Funktionelle anmærkninger af CRC risiko SNPs
de fleste SNP’er (62%) blev placeret i intergeniske regioner (S2 Table). To SNP’er blev identificeret i bindingsuligevægt med missense SNPs (r
2 0,80; S3 tabel). Dernæst vurderede vi 50 CRC risiko loci for beriget epigenetiske kromatin mærker [12]. Af de 34 celletyper undersøgt, vi observerede en betydelig berigelse af CRC risikofaktorer alleler med H3K4me3 toppe i rektal slimhinde celler (
p
= 0,00014 og 0,00023 hhv) (S4 tabel).
Cis -expression kvantitativ egenskab loci (
cis
-eQTL)
Brug af
cis
-eQTL data fra PBMC undersøgelse [13], fandt vi, at 13 risikofaktorer SNPs viste
cis
-eQTL effekter (p 0,0016 og FDR 0,5). (S5 Table)
PubMed tekst-mining
Fireogtyve gener blev prioriteret på grundlag data opnået ved PubMed tekst mining bruge
GRAIL
med gen-baseret p 0.05 [14] (S6 Table)
Protein-protein interaktion (PPI)
To gener blev prioriteret ved PPI netværk ved hjælp af gen-baserede
dapple
med p 0.05 [15] (S7 tabel).
Kræft somatisk mutation
Blandt de 522 gener med registrerede somatiske mutationer opnået fra COSMIC database [16], en betydelig overlapning blev observeret i gener, der er forbundet i ikke-hæmatologiske kræftformer (5/6, p = 2.41E -05) (S8 tabel).
Knockout mus fænotype
Vi evaluerede overlap med gener impliceret i knockout mus fænotyper [17]. Blandt de 30 kategorier af fænotyper, vi observeret ni kategorier væsentligt beriget med CRC risikofaktorer gener (p 0,05)., Ledet af kraniofaciale fænotype (S9 Table)
Funktionel berigelse analyse
GO analyse indikeret, at nogle få gener blev beriget i tre kategorier (S10 tabel); to med Kegg veje observeret i kræft (p = 0,002), og en med småcellet lungekræft (p = 0,011) var funktionelt relateret (S11 tabel). Funktionel analyse af OMIM demonstrerede berigede gen sæt i kolorektale sygdomme (S12 tabel)
På baggrund af disse nye resultater, vi vedtog følgende syv kriterier for at prioritere hver enkelt af de 140 gener fra 50 CRC risiko loci:. (1 ) gener med CRC risiko missense variant (n = 2); (2)
cis
-eQTL gener (n = 13); (3) gener prioriteret af PubMed tekst mining (n = 24); (4) gener prioriteret af PPI (n = 2); (5) kræft somatisk mutation gener (n = 6); (6) gener prioriteret af associerede knockout mus fænotyper (n = 40); og (7) gener prioriteret af funktionelle berigelse analyse (n = 31)
Fordi disse kriterier viste svage korrelationer med hinanden (R
2 0,48; S13 tabel)., hvert gen blev scoret baseret af antallet af kriterier, der var opfyldt (scores varierede 0-7 for hvert gen)
Femogtredive gener (25,2%) havde en score . 2, som blev defineret som ‘biologiske risikofaktorer gener’ ( S1 fig.). Tre loci omfattede flere biologiske CRC risikofaktorer gener (f.eks ROS1 og GOPC ved rs2057314) (Tabel 2).
For at give empirisk bevis af rørledningen, vi analyserede gen scoringer. Gener med højere biologiske scoringer var mere tilbøjelige til at være nærmest risikoen SNP (62,8% for gen score ⩾ 2, 24% for gen score 2; p 0,001). I mellemtiden, rektal mucosa i celler viste signifikante overlappende proportioner med H3K4me3 toppe sammenlignet med andre celletyper.
Endelig har vi vurderet den potentielle rolle genetik i forhold til lægemiddelforskning til behandling af CRC. Hypergeometriske fordeling tests blev anvendt til overlappende statistiske analyser. Vi opnåede 11303 gener parvis fra kurateret PPI databaser. Vi opnåede 871 drug målgener svarende til godkendt, i kliniske forsøg eller eksperimentelle lægemidler til sygdomme hos mennesker (S14 tabel). Af hensyn til beregning pålidelighed blev kun CRC narkotika i den første linie terapi involveret i undersøgelsen. Otte målgener godkendte CRC lægemidler blev inkluderet (S15 tabel).
Enogtredive biologiske CRC risikofaktorer gener overlappede med 533 gener fra den udvidede PPI-netværket (S2 Fig. Og S3 Fig.). Vi fandt et overlap på 5/8 drug target gener af godkendte CRC lægemidler (5/8 vs 70/781, 12.09-fold berigelse, P = 0,00013). Alle 871 drug målgener (uanset indikation sygdom) overlappede med 70 gener fra PPI-netværket, hvilket antydede, at berigelsen var 1,55 gange højere end den, der forventes ved en tilfældighed alene (p = 0,00012), men mindre ved 7,78 gange sammenlignet med nuværende godkendte CRC lægemidler (p = 1,78 × 10
-5). Eksempler på godkendte CRC behandlinger identificeret ved denne analyse omfattede irinotecan, regorafenib, og cetuximab (fig. 2).
Sorte linjer angiver forbindelser.
Korrelation af godkendte lægemidler til andre sygdomme med biologiske CRC risiko genet blev også vurderet. Et eksempel på medikament repositionering (fig. 3) er anvendelsen af crizotinib, et godkendt lægemiddel til ikke-småcellet lungekræft til behandlingen af CRC [16]. Arsentrioxid vrinostat, dasatinib, estramustin, og tamibarotene er alle lovende lægemidler til behandling af CRC (fig. 4).
Diskussion
GWAS har identificeret utallige sygdoms- tilknyttede genetiske varianter. Imidlertid har betydelige hindringer hæmmet vores evne til at identificere gener, der berøres af kausale varianter og belyse den mekanisme, hvorved genotype påvirkninger fænotype.
De fleste rapporter har simpelthen impliceret den nærmeste genet til en GWAS ramme uden betydelige beviser [1] . Denne undersøgelse prioriteret de mest sandsynlige målgener. blev identificeret i alt 31 biologiske CRC risikofaktorer gener. Selvom biologiske CRC risikofaktorer gener er mere tilbøjelige til at være kausale gener, dette stadig skal bekræftes af basale molekylære studier ved hjælp af avancerede teknologier. Edwards et al forudsat en rørledning til opfølgende undersøgelser, der omfatter fint kortlægning af risikofaktorer SNPs, prioritering af formodede funktionelle SNP’er, og in vitro og in vivo eksperimentel verifikation af forudsagte molekylære mekanismer til at identificere de målrettede gener [1].
GWAS kritiseres for deres manglende klinisk oversættelse på grund af størrelsen af effekten. Men enkelte små effektstørrelser ikke nødvendigvis udelukker kliniske anvendelighed. Sanseau et al foreslået at anvende GWAS for lægemiddel repositionering, der betragtes som en lovende strategi i translationel medicin. I en undersøgelse undersøger 3-hydroxy-3-methyl-glutaryl-coenzym A, et velkendt kolesterolsænkende medicin, blev SNPs inden dette gen utvetydigt med lav massefylde lipopolysaccharid kolesterol i GWAS data. [6] Deres undersøgelse omfattede alle GWAS-associerede gener, der blev valgt fra GWAS katalog, uden præstation om CRC stoffer.
I den foreliggende undersøgelse har vi fokuseret på nyorientering lægemidler til CRC baseret på prioritering af kandidatgener i de GWAS-identificerede loci. For eksempel er crizotinib, arsentrioxid, vrinostat, dasatinib, estramustin, og tamibarotene også lovende repurposed lægemidler til CRC. Selv er nødvendige for at bekræfte resultaterne af denne undersøgelse yderligere undersøgelser, vi mene, at disse mål lægemidler valgt kunne være lovende lægemiddelkandidater til behandling af CRC.
GWAS data er nyttige i at yde indsigt i biologi sygdomme, men kan også oversætte disse fører til rentable muligheder i lægemiddeludvikling. Men GWAS data ikke give detaljerede patofysiologisk information; Derfor kan de nyligt identificerede anvendelser gamle lægemidler muligvis være bivirkninger [23]. Vellykket nyorientering af et lægemiddel indebærer en kombination af resultater fra offentliggjort litteratur, og klinisk forskning.
Selv om der var en række positive aspekter fra denne undersøgelse, der var nogle begrænsninger så godt. For det første blev data for PBMC undersøgelsen bruges til
cis
-eQTL analyse. Selvom eQTLs identificeret fra én vævstype kan være et nyttigt surrogat at studere genetik for genekspression i et andet væv [24], anvendelse af vævsspecifikke eQTLs er sandsynligvis mere nyttige i forståelsen af patogenesen af CRC [25]. For det andet af de 34 celletyper undersøgte, vi kun observeret en betydelig berigelse af risiko SNP med H3K4me3 toppe i rektal slimhinde celler. Ikke desto mindre, berigelsen var ikke signifikant for kolon mucosa celler.
I denne undersøgelse har vi integreret genetiske data og statistiske analyser, beregningsmæssige metoder, og offentligt tilgængelige store datasæt, prioritere kandidat gener, og foreslå nye mål for CRC medicinsk behandling. Vi mener, at målgener og lægemidler udvalgt af denne fremgangsmåde kunne lovende kundeemner i udviklingen af lægemiddelkandidater til behandling af CRC, selv om yderligere undersøgelser er berettiget til bekræftelse af disse resultater.
Støtte oplysninger
S1 fig. . Histogram fordeling af gen scoringer
Femogtredive gener med en score på 2 blev defineret som ‘biologiske risikofaktorer gener’
doi: 10,1371 /journal.pone.0116477.s001
(TIF)
S2 fig. Overlapning af 31 biologiske gener plus 553 gener i direkte PPI med dem og narkotika målgener.
Vi fandt overlap af 5 gener fra 8 narkotika målgener godkendte CRC lægemidler (12.09-fold berigelse, p = 1,78 × 10
-5). Alle 871 drug target gener (uanset indikation sygdom) overlappede med 70 gener fra PPI-netværket, hvilket indikerer en 1,55 gange højere berigelse end forventet tilfældigt alene (p = 1,20 × 10
-4); men mindre end 7,78 gange berigelse i forhold til CRC lægemidler (p = 1,30 × 10
-4)
doi:. 10,1371 /journal.pone.0116477.s002
(TIF)
S3 Fig. PPI netværk af biologiske CRC risikofaktorer gener og narkotika målgener
Pink:. Drug target gener; Orange: CRC risikofaktorer gener; Cyan:. Direkte PPI gener i PINA2 database
doi: 10,1371 /journal.pone.0116477.s003
(TIF)
S1 Table. Oversigt over 140 kandidatgener baseret på nærhed og koblingsuligevægt
doi:. 10,1371 /journal.pone.0116477.s004
(XLSX)
S2 Table. Risiko SNPs kommenteret af
annovar
doi:. 10,1371 /journal.pone.0116477.s005
(XLSX)
S3 tabel. Missense variant i koblingsuligevægt (r
2 0,8) med risiko enkelt nukleotid polymorfier kommenteret af
ANNOVAR
doi:. 10,1371 /journal.pone.0116477.s006
(XLSX)
S4 Table. Overlapning af kolorektal cancer risiko enkelt nukleotid polymorfier med H3K4me3 toppe i celler
doi:. 10,1371 /journal.pone.0116477.s007
(DOCX)
S5 Table.
cis
-expression kvantitativ egenskab loci af kolorektal cancer risiko enkelt nukleotid polymorfier
doi:. 10,1371 /journal.pone.0116477.s008
(XLSX)
S6 Table. Gener prioriteret af PubMed tekst mining
doi:. 10,1371 /journal.pone.0116477.s009
(XLSX)
S7 Table. . Gener prioriteret af protein-protein interaktion netværk
doi: 10,1371 /journal.pone.0116477.s010
(XLSX)
S8 Table. Overlapning af kolorektal cancer risiko gener med kræft somatiske mutation gener
doi:. 10,1371 /journal.pone.0116477.s011
(XLSX)
S9 tabel. Gener prioriteret af knockout mus fænotype hjælp hypergeometriske fordeling test
doi:. 10,1371 /journal.pone.0116477.s012
(DOCX)
S10 Table. Gener prioriterer gå berigelse analyse
doi:. 10,1371 /journal.pone.0116477.s013
(XLSX)
S11 Table. Gener prioriteret af Kegg berigelse analyse
doi:. 10,1371 /journal.pone.0116477.s014
(XLSX)
S12 tabel. Gener prioriteret af OMIM berigelse analyse
doi:. 10,1371 /journal.pone.0116477.s015
(XLSX)
S13 tabel. Korrelationer biologiske kandidat gen prioriteringskriterier
doi:. 10,1371 /journal.pone.0116477.s016
(XLSX)
S14 Table. En liste over narkotika målgener
doi:. 10,1371 /journal.pone.0116477.s017
(DOCX)
S15 tabel. Oversigt over godkendte lægemidler for tarmkræft og målgener
doi:. 10,1371 /journal.pone.0116477.s018
(DOCX)
anerkendelser
Tak for hjælp af data analyse fra Suzhou BioNovo Gene Co., LTD
Finansiering kilde:.
Dette arbejde blev støttet af National Key Technology Support Program (Grant nummer: 2104000032), National Natural Science Foundation of China (punkt nummer: 81372290) og National Natural Science Foundation of China (Varenummer: 81.372.291)
.
Leave a Reply
Du skal være logget ind for at skrive en kommentar.