PLoS ONE: En tilgang til identifikation af Mål Specifikt for knoglemetastaser Brug Cancer Gener Interactome og Gene ontologi Analysis

Abstrakt

Metastase er et af de mest gådefulde aspekter af kræft patogenese og er en væsentlig årsag til kræft associeret dødelighed. Sekundær knoglekræft (SBC) er en kompleks sygdom forårsaget af metastase af tumorceller fra deres primære site og er kendetegnet ved indviklede samspil af molekylære interaktioner. Identifikation af mål for multifaktorielle sygdomme som SBC, den hyppigste komplikation af brystkræft og prostatakræft, er en udfordring. Mod at nå vores mål om identifikation af mål specifikke for SBC, vi konstrueret en “Kræft Genes Network”, et repræsentativt protein interactome af cancer gener. Brug graf teoretiske metoder, opnåede vi en række centrale gener, der er relevante for generiske mekanismer af kræft og har en rolle i biologisk væsentlighed. Vi kompileret også en kurateret datasæt af 391 SBC gener fra publiceret litteratur, der tjener som grundlag for ontologiske korrelater til sekundære knogle kræft. Med udgangspunkt i disse resultater, vi implementere en strategi baseret på generiske cancer gener, SBC gener og gen-ontologi berigelse metode, for at opnå et sæt mål, der er specifikke for knoglemetastaser. Gennem denne undersøgelse præsenterer vi en metode til at probe en af ​​de store komplikationer i cancere, nemlig metastase. Resultaterne på gener, der spiller generiske roller i kræft fænotype, fremstillet ved netværksanalyse af ‘Cancer Gener Netværk’, har bredere konsekvenser i forståelse rolle molekylære regulatorer i mekanismer af kræft. Konkret vores undersøgelse giver et sæt af potentielle mål, der er af ontologisk og lovgivningsmæssige relevans for sekundære knogle kræft

Henvisning:. Vashisht S, Bagler G (2012) En tilgang til identifikation af Mål Specifikt for knoglemetastaser Brug cancer Genes Interactome og Gene Ontology Analysis. PLoS ONE 7 (11): e49401. doi: 10,1371 /journal.pone.0049401

Redaktør: Matthias Dehmer, UMIT, Østrig

Modtaget: Juli 5, 2012; Accepteret: 11 oktober 2012; Udgivet: November 14, 2012 |

Copyright: © 2012 Vashisht, Bagler. Dette er en åben adgang artiklen distribueres under betingelserne i Creative Commons Attribution License, som tillader ubegrænset brug, distribution og reproduktion i ethvert medie, forudsat den oprindelige forfatter og kilde krediteres

Finansiering:. Ingen strøm eksterne finansieringskilder til denne undersøgelse

konkurrerende interesser:. forfatterne har erklæret, at der ikke findes konkurrerende interesser

Introduktion

Kræft er en sygdom i flere systemer og komponenter, der interagerer. på både molekylære og cellulære niveauer, der fører til initiering, progression og spredning af sygdommen [1], [2]. De skiftende interaktioner af disse systemer i et dynamisk miljø understrege iboende kompleksitet af sygdommen. Indtil for nylig har kræft undersøgt med en reduktionistisk tilgang med fokus på en specifik mutation eller en sti. På det seneste har der været en enorm stigning i systemer-niveau undersøgelse for kræft og brugen af ​​integrative tilgange til at forstå mekanismerne for kræft [3], [4] og deres metastaser [5], [6].

Metastase er en af ​​de mest gådefulde kendetegnende for kræft kendetegnet ved komplekse molekylære interaktioner [1], [7]. Den er ansvarlig for så meget som 90% af cancerassocierede dødelighed, men stadig den mest dårligt forstået bestanddel af kræft patogenese [7], [8]. Tumormetastase er en flertrins proces, hvor maligne celler spredes fra den primære tumor til usammenhængende organer [7]. Metastatisk formidling indebærer en sekvens af trin, der involverer invasion, intravasation, ekstravasation, overlevelse, unddragelse af host forsvar og tilpasning til den udenlandske mikromiljø [7], [8].

Sekundær knoglekræft (SBC) er en kompleks sygdom involverer samspil mellem osteolytiske og osetoblastic mekanismer [9] (Figur 1). Knoglemetastaser er den hyppigste komplikation af brystkræft og prostatakræft med en meget høj tilbøjelighed metastaserende til knogle forårsager knoglesmerter, fraktur, hypercalcæmi og lammelse [10] – [13]. Bryst og prostata carcinomer er ofte kendt for at tage år at udvikle metastatiske kolonier (i et begrænset antal lokaliteter) tyder på, at i disse kræftformer, celler ansætte distinkte adaptive programmer til møjsommeligt flikke sammen komplekse skift i gen-ekspression programmer [14]. Mange molekyler og tilhørende veje rapporteres at være involveret i metastase af cancerceller fra brystkræft [13], [15] – [22], og dem af prostatakræft [10], [18], [23] – [30].

knoglemetastaser resultater fra ubalance i normal knogle remodellering proces, der involverer osteolytiske (der fører til knoglenedbrydning) og osteoblastiske (fører til afvigende knogledannelse) mekanismer. Brystkræft metastaser er normalt osteolytiske, hvorimod prostatakræft metastaser er normalt osteoblast. Osteolytisk metastase: osteolytisk metastase af tumorceller involverer en “ond cirkel” mellem tumorceller og skelettet. Den onde cirkel er formeres ved fire bidragydere: tumorceller, knogledannende osteoblaster, knogleresorberende osteoklaster og lagrede faktorer inden knogle matrix. Osteoklastdannelse og aktivitet er reguleret af osteoblast, tilføjer kompleksitet til den onde cirkel. Tumorceller frigive visse faktorer, herunder IL-1, IL-6, IL-8, IL-11, PTHrP og TNF, som stimulerer osteoklastisk knogleresorption. Disse faktorer øge ekspressionen af ​​RANKL løbet OPG ved osteoblaster, deponering balancen mod osteoclast-aktivering og dermed forårsager knogleresorption. Denne knogle lysis stimulerer frigivelsen af ​​BMP’er, TGFp, IGF’er og FGF’er til stimulering af væksten af ​​metastatiske cancerceller til knogler. Osteoblastiske metastase: Faktorer frigivet af osetoblastic celler, såsom ET-1, Wnt, ErbB3, VEGF spiller en vigtig rolle i osteoblastisk metastase ved at øge cancercelleproliferation og øge virkningen af ​​andre vækstfaktorer, herunder PDGF, FGF, IGF-1. Osteoblastdifferentiering øges også ved BMP’er gennem aktivering af visse transkriptionsfaktorer. Urokinaseplasminogenaktivator (uPA), en protease, fungerer også som mægler for osteoblastiske knoglemetastaser ved at spalte osteoklastlignende medieret knogleresorption faktorer er ansvarlige for regulering af osteoklastdifferentiering; derved blokerer knogleresorption.

Kræft er kendetegnet ved kendetegnende processer og delte mekanismer involveret i ekspression af sygdom fænotype. Det er en udfordring at identificere sådanne gener involveret i generiske mekanismer kræft. Identifikation af sådanne “generiske cancer gener” kan hjælpe os til at fokusere på ‘sygdomsspecifikke cancer gener “af potentiel terapeutisk værdi. På grund af kompleksiteten og subtile mekanismer involveret i metastaser, er det vanskeligt at identificere deres kontrolmekanismer. Derfor er det vigtigt at have metoder til identifikation af gener og reguleringsmekanismer, der er nøglen til en kompleks patogen tilstand såsom sekundære knogle kræft. Komplekse netværksmodeller af interactomes, sammen med graf-teoretisk analyse og overrepræsentation studier, præsentere os en nyttig strategi til sondering molekyler, der er centrale for SBC mekanismer og dermed potentielle terapeutiske mål.

Cellular funktioner afspejler tilstanden af ​​cellen som en funktion af en indviklet net af interaktioner blandt stort antal gener, metabolitter, proteiner og RNA-molekyler. En sygdom fænotype afspejler forskellige patobiologiske processer, der interagerer i et komplekst netværk, og er sjældent en konsekvens af abnormitet i en enkelt effektor genprodukt [3]. Forståelse sygdomme i forbindelse med organisering af principper for arkitekturen i biologiske netværk giver os mulighed for at løse nogle fundamentale egenskaber af gener, der er involveret i sygdommen. Undersøgelse af sygdomme protein interactomes tilbyde en bedre forståelse af sygdomsspecifikke gener og processer, og kan tilbyde bedre mål for lægemiddeludvikling. Molekylære interaktionsnetværk er karakteriseret ved tilstedeværelsen af ​​nogle få meget forbundne knudepunkter, ofte kaldet hubs, hvilket antyder en særlig rolle af disse promiskuøse interaktionskandidater. Hubs af protein interactomes er mere tilbøjelige til at være afgørende for overlevelsen [31] og også rapporteret at være vigtige for cellulær vækst [32]. Proteiner med høj betweenness [33], [34] er rapporteret at have meget højere tendens til at være essentielle gener [35], [36]. Kræft proteiner er rapporteret til at være mere centralt i proteinet interactome og er, på et gennemsnit, der er involveret i dobbelt så mange interaktioner som dem af ikke-cancer proteiner [37].

Gene ontologi [38] Projektet giver en ontologi definerede udtryk repræsenterer gen produktegenskaber. Ontologi omfatter tre domæner: cellulær komponent, dele af en celle eller dets ekstracellulære miljø; molekylær funktion, elementært aktiviteter af et gen produkt på det molekylære niveau og biologisk proces, sæt molekylære begivenheder med en defineret begyndelse og slutning, er relevante for driften af ​​integrerede levende enheder. GO berigelse metoder giver en måde at udtrække biologisk indsigt fra et sæt af gener ved hjælp af magt af gen-apparater [39]. Berigelse analyse indebærer identifikation af GO vilkår, er signifikant overrepræsenteret i et givet sæt af gener ved hjælp af statistiske modeller såsom hypergeometriske og chi kvadreret distributioner [40]. Et stort repertoire af værktøjer er blevet udviklet i de senere år for berigelse analyse [41], [42]. Metoder til netværksanalyse og berigelse undersøgelser har været effektivt til at identificere mål af sygdomme som kronisk træthedssyndrom [43], depression [44], glioblastom [45], kolorektal carcinogenese [46] og primær immundefekt sygdom [47].

I denne undersøgelse, vi havde til formål at identificere sekundære knogle kræft specifikke gener. Mod dette mål, vi brugte en sammensat strategi (figur 2), der involverer identifikation af kræft gener specificerer generiske kræft mekanismer, udarbejdelse af gener impliceret i metastaser til knogler og identifikation af gener annoteret med GO vilkår specifikke for sekundære knogle kræft, for at opnå sygdomsspecifikke mål . Mens netværksanalyse giver et system perspektiv af komplekse molekylære mekanismer og hjælper med at identificere de centrale elementer (funktionelle elementer), gen-berigelse metode muliggør identifikation af karakteristiske ontologiske træk af genet sæt. Vi først konstrueret et repræsentativt protein interactome af alle cancer gener og opnåede hubs, der er involveret i generiske mekanismer kræft. Yderligere, vi samlet en række eksperimentelt verificerede gener fra litteraturen, der er involveret i metastase af primære bryst- og prostatacancer i knoglerne, den dominerende årsag til sekundære knogle kræft. Ved hjælp af en kombination af protein interactome analyse og gen ontologi berigelse undersøgelser, opnåede vi et sæt gener (mål) er specifik for SBC mekanismer. Vores undersøgelse giver en tilgang til at identificere mål er specifikke for en kompleks sygdom fænotype (knoglemetastaser) ved at kombinere systemer-niveau interactome analyse og ontologiske studier.

Strategien, der blev implementeret i dette arbejde bestod af tre opgaver, der fører til tre tilsvarende gen-sæt, der blev brugt til at opnå SBC-specifikke mål for potentiel terapeutisk værdi. (A) En samling af kræft gener fra CancerGenes database blev brugt til at konstruere en repræsentativ cancer gener interactome (Cancer Genes Network; CGN) ved at kortlægge dem til en reference humant protein interactome (Human Protein reference Database, HPRD). blev opnået ved hjælp af metoder til netværksanalyse, proteiner, der er centrale for CGN og interaktion dynamik. Disse sæt af gener (SET-A, skraverede område) viste sig at være korrelerer godt med gener impliceret i generiske kræft mekanismer (figur 6), samt dem, kommenteret som essentielle ved hjælp af musen fænotype data (figur 8). Den CGN, bestående af 11602 samspil mellem 2665 proteiner, fungerer også som en henvisning sæt (univers) til gen-berigelse studier; (B) Et sæt af gener (Sekundær knoglekræft Genes; SBCGs), som indgår i metastase til knogle fra primær bryst- og prostatakræft, de mest udbredte årsager til knoglemetastaser, blev indsamlet fra litteraturen. Dette sæt (SET-B) tjener som grundlag for gener og ontologiske korrelater til sekundære knogle kræft, der kendetegner sygdommen fænotype; (C) Markant beriget GO vilkår, der kendetegner SBCGs blev opnået ved overrepræsentation analyse mod de “cancer gener ‘univers. SET-C, en undergruppe af CGN, blev opnået ved adskillelsen cancer gener, der blev mærket med disse SBC-specifikke ontologiske vilkår. En del af SET-C (skraveret område Set-c og Set-bc i figur 10A) fungerer som en “kilde sæt mål cancer gener ‘, der, både, transporterer ontologiske essens SBCGs og ikke er involveret i generiske mekanismer kræft. SBC-specifikke mål (figur 3 og figur 10B), som er annoteret med centrale GO vilkår (figur 9) reflekterende rolle i både, knogle processer og metastase mekanismer, blev yderligere opnået fra kilden sæt.

Resultater

CGN som repræsentant Interactome af Cancer mekanismer

Vi bestemt at konstruere en interactome der repræsenterer mekanismer involveret i processer, der bidrager til kræft. Til dette formål brugte vi gener opført i CancerGenes database [48], en samling af kræft gener, der kausalt impliceret i onkogenese. Vi opnåede 3164 cancer-gener fra CancerGenes database, som blev anvendt til at konstruere en interactome. Disse gener blev kortlagt på humant protein reference Database [49], en database over kurateret proteomisk oplysninger vedrørende humane proteiner, at konstruere Cancer Gener Network (CGN). CGN repræsenterer således et indviklet netværk af kræft proteiner. CGN omfatter 11602 samspil mellem 2665 proteiner. Figur 3 viser CGN, et repræsentativt protein interactome af molekylære agenter og deres regulerende interaktioner, der er involveret i sygdommen fænotype af kræft. Baseret på tidligere rapporter [3], vi hypotesen, at proteiner, der er nøglen til den strukturelle integritet og interaktion dynamik CGN ville svare til proteiner involveret i reguleringsmekanismer generiske for kræft.

Cancer Gener Network (CGN) er en protein interactome af cancer-gener der rummer molekylære mekanismer i kræft. Hvert knudepunkt repræsenterer et cancer-protein og en kant mellem to knudepunkter betegner et protein-protein-interaktion. Kæmpen klynge omfatter 89% af alle kræft gener. Navene af CGN, kræft gener centrale for de strukturelle stabilitet og information dynamik, er afbildet i nuancer af rød. Navene koder gener involveret i generiske mekanismer kræft og dem er klassificeret som afgørende hjælp fænotypiske data fra Mouse Genome Informatics. 88% af disse knudepunkter er essentielle ( »mørkerød ‘) og resten ikke-essentielle (” lys rød “). SBC-specifikke mål, med ontologisk rolle i knogle- og metastase processer, er fremhævet i “grønne”.

Topologisk Centrale Gener fra CGN Correlate til Generiske Cancer Mekanismer

Molekylær interaktion netværk har blevet rapporteret at have en skala-fri natur kendetegnet ved tilstedeværelsen af ​​få knudepunkter, som er kritiske for nettene [50]. Sådanne hubs af protein interactomes rapporteres at være mere afgørende for overlevelsen [31] og også vigtigt for cellulær vækst [32]. Proteiner med høj betweenness er rapporteret at have meget højere tendens til at være essentielle gener [35], [36]. Kræft proteiner er rapporteret til at være mere centralt i proteinet interactome og er, på et gennemsnit, der er involveret i dobbelt så mange vekselvirkninger som non-cancer proteiner [37]. Som rapporteret for andre biologiske molekylære net [50], [51], finder vi, at CGN har en skala-fri karakter indikerer tilstedeværelsen af ​​usædvanligt promiskuøst interagerende hub knuder og dem medierer en lang række interaktioner (figur 4) [52].

De fordelinger af (a) grad og (B) stress (såvel som dens normaliseret modstykke «betweenness«) viser en skala-fri natur. Stiplede linjer viser magt loven pasform med en eksponent for -2,85 og -2,13, hhv. Dette indikerer tilstedeværelsen af ​​promiskuøst interagerende proteiner med høje grader og centrale mediatorer, der spiller rolle i informations- dynamik på tværs af netværket, hhv.

Vi beregnede syv parametre, der afspejler topologiske funktioner (grad [53] og kvarter tilslutningsmuligheder [54]), netværk flow (betweenness [33], [34], stress [33], [34] og gennemsnitlige korteste vej længde [55]) og lokal klyngedannelse (clustering koefficient [53], [55], [56 ] og topologisk koefficient [57]). De “centrale” proteiner, der er topologisk og dynamisk central til CGN, blev identificeret ved netværksanalyse. Til dette formål “grad”, “stress” og den normaliserede modstykke af sidstnævnte, “betweenness ‘, blev anvendt til identifikation af centrale proteiner af CGN. Vi finder, at de valgte parametre viser meget store gensidige positive korrelationer (figur 5). De bedst placerede proteiner fra hver af disse parametre blev udarbejdet af forskellige tærskler (Top25-Top200), at identificere proteiner, der er udpeget som “hubs” (Set-A i figur 2 og tabel S1).

Heatmap af parvise korrelationer mellem syv parametre, der angiver numre topologiske, dynamiske og lokale clustering funktioner af netværket: betweenness, stress, grad, nabolag tilslutningsmuligheder (neigh_conn), klyngedannelse koefficient (clust_coeff), gennemsnit korteste vej længde (avg_short_paths) og topologiske koefficient ( topo_coeff). Den Heatmap fremhæver tre parametre med meget høje gensidige positive korrelationer (r = 0,8989, 0.9930 og 0.9210): grad, betweenness og stress. Den øverste trekant af Heatmap skildrer parvise korrelationer som lagkagediagrammer. Den nederste trekant skildrer positive og negative sammenhænge i nuancer af blå og røde, henholdsvis; jo mørkere farve jo stærkere korrelation. Positive og negative korrelationer også afbildet med højre- og venstrehåndede diagonale linjer

Vi finder, at de »hubs« (Figur 3; Top75 tærskel)., Således identificeret, omfatter gener involveret i regulering af processer vides at være generisk stede i de fleste cancere [1]. Proteiner er kendt for at være involveret i vækst signaler, hvilket fører til selvforsyning i kræftceller, såsom TGFBR1, EGFR, IGFR1R, Grb2, er i »hubs« af CGN [2]. Navene bl.a. RB1, BCL2, Akt1, CDK2, CASP8 som er involveret i mekanismer apoptose, hvortil celler vides at erhverve resistens i alle typer af cancere [1], [58]. Den TP53 tumorsuppressorprotein, vides at være involveret i de fleste almindeligt forekommende tab af proapoptotiske regulering og påvirker den apoptotiske effektor kaskade [59], [60], er også til stede i de CGN hubs. En af hub proteiner Smad4, er kendt for at være involveret i differentiering, apoptose og cellecyklus [61]. MYC, kendt for at opregulere cycliner og nedregulere CDKN1A (P21), er også en af ​​de knudepunkter i CGN.

Endvidere kontrolleres vi, hvor godt de identificerede hubs korrelerer med Kegg-PIC [62], en samling af gener fra generiske involverede veje i kræft (tabel S2). Figur 6 viser overlapningen af ​​hub gener (Top25 til Top200) med Kegg-PIC gener. Vi finder, at faktisk de Top25 hubs, som omfatter de mest promiskuøst interagerende proteiner og medierende et stort antal interaktioner i cancer gener interactome, har en 74% overlapning med Kegg-PIC. Præcisionen af ​​identifikation af generiske kræft proteiner falder som definitionen af ​​»hubs« er afslappet yderligere (57% for Top50 og 52% for Top75). Som en negativ kontrol, for evnen af ​​net-metrics-baserede ranking at identificere generiske proteiner, vi anvender gener rangeret værste efter de valgte parametre. Vi finder, at disse gener har en meget dårlig overlapning med Kegg-PIC-gener, selv sammenlignet med den, der forventes fra tilsvarende stikprøver (figur 6). Vi behandler Top25, Top50 og Top75 CGN knudepunkter som repræsentanter for generiske cancer gener og bruge dem endvidere til at identificere SBC-specifikke mål.

De knudepunkter CGN, identificeret ved hjælp af udvalgte netværk centrale parametre, korrelerer med det sæt af generiske cancer gener (Kegg-PIC). For hub definitioner varierer mellem Top25-Top200, de CGN navene (top klassificeret cancer gener) viser god overlapning med Kegg-PIC gener (udfyldte cirkler). Korrespondancen af ​​netværket centrale og generisk rolle i kræft, forventeligt, falder som strenge kriterium anvendes til at identificere hubs løsnes. For de tilsvarende stikprøver, overlapning med Kegg-PIC er som forventet (stjerner, fejllinjer indikerer standardafvigelser fra 1000 prøver). De kræft gener med værste centrale placeringer (åbne cirkler), viser næsten ingen overlapning med generiske kræft gener; værre end det forventes af stikprøver. Top75, Top50 og Top25 hubs, med 52%, 57% og 74% overlap med generiske cancer gener henholdsvis blev yderligere anvendt til identifikation af SBC-specifikke cancer gener.

GO Berigelse af CGN Hub gener

Vi udførte GO berigelse analyse af ‘hub’ identificerede gener CGN. Vi forventer, at “hubs” til at repræsentere generiske kræft processer, som er fælles for de fleste, og måske alle typer af humane kræftformer. Den molekylære maskineri regulerer proliferation, differentiering og død alle pattedyrceller er meget ens [1]. Den genetiske transformation af kroppens normale celler resulterer i fejl af lovgivningsmæssige kredsløb, der styrer normal celledeling og homeostase, og kollektivt dikterer ondartet vækst.

Kræftceller viser selvforsyning af vækst- signaler involverer ændring af transcellulære eller intracellulære mekanismer [ ,,,0],2]. Vækst- signalveje mistænkes at lide deregulering i alle humane tumorer [2]. Dette blev afspejlet i de følgende betydeligt overrepræsenterede GO form af CGN hubs: cellulær respons på væksthormon stimulus (GO: 0.071.378), regulering af epidermal vækstfaktor receptor signalvejen (GO: 0.042.058), transformerende vækstfaktor beta receptor signalvejen (GO: 0007179), signalerer kompleks samling (GO:. 0.007.172)

i modsætning til normale celler, som reagerer på antigrowth signaler, kræftceller er ufølsomme over for antigrowth signaler på grund af afbrydelse af veje relateret til cellecyklus ur. Vi finder, at vores liste over betydeligt beriget GO vilkår for CGN hubs havde mange vilkår forbundet med cellecyklus processer: mitotisk cellecyklus G1 /S overgang checkpoint (GO: 0.031.575), regulering af G1 /S overgang mitotisk cellecyklus (GO: 2.000.045 ), DNA skader reaktion, signaltransduktion ved p53 klasse mediator (GO: 0.030.330), regulering af stress-aktiverede MAPK kaskade (GO:. 0.007.173)

i human carcinogenese, alle typer af kræft er kendt for at erhverve modstand til apoptose [58]. De overrepræsenterede GO form af CGN hubs understrege denne observation: frigivelse af cytochrom c fra mitokondrier (GO: 0.001.836), aktivering af pro-apoptotiske genprodukter (GO: 0.008.633), celletypespecifik apoptotisk proces (GO: 0.097.285), cellulære komponent demontering involveret i apoptotisk proces (GO: 0.006.921), positiv regulering af anti-apoptose (GO: 0.045.768)

Desuden finder vi følgende betydeligt beriget ‘molekylære funktion «vilkår:. transformerende vækstfaktor beta receptor, sti -specifik cytoplasmatisk mediator aktivitet (GO: 0.030.618), receptor signalering proteintyrosinkinaseaktivitet (GO: 0.004.716), ephrin receptorbinding (GO: 0.046.875), MAP kinase aktivitet (GO: 0.004.707), beta-catenin binding (GO: 0.008.013) , cytokin receptorbinding (GO: 0.005.126), androgen receptor binding (GO: 0.050.681).

Alle GO-vilkår er nævnt ovenfor i store træk støtter generiske kræft processer. De p-værdier for disse “betydeligt beriget GO form af CGN Top75 hubs ‘er i området af 10e-4 og 10e-13. Figur 7 viser disse overrepræsenterede GO vilkår og statistikker på deres forekomst.

overrepræsentation studier af Top75 CGN hubs afspejler deres rolle i generiske kræft processer og funktioner. Blandt de væsentligt beriget GO termer, 17 repræsenterer selv-spredning kredsløb (lysegrå), 20 repræsenterer cytostase og differentiering kredsløb (mørkegrå) og 4 repræsenterer levedygtighed kredsløb (sort).

Topologisk Central Gener af CGN korrelerer med biologisk Væsentlighed

Vi yderligere kontrolleret den biologiske relevans af de centrale gener af CGN. Vi delte CGN i to sæt, essentielle og ikke-essentielle, ved hjælp af pattedyr Fænotype Ontologies [63] til at klassificere gener som væsentlige, når de forårsagede embryonale, perinatal, postnatal eller neonatal dødelighed i musemodeller [64] ved hjælp af fænotypiske data fra Mouse Genome Informatics ( MGI) [65]. Procentdelen af ​​essentielle gener blev beregnet i den “hubs” og deres tilsvarende ikke-knudepunkter for varierende hub definitioner. Figur 8 viser statistikken for procentdelen af ​​navet og ikke-hub gener kommenteret som væsentlige. Blandt de syv parametre beregnet, navene identificeret ved hjælp grad, betweenness og stress har en betydelig procentdel af essentielle gener (mellem 82% til 92%) (figur 8A). I øvrigt, ingen af ​​de resterende fire netværksparametre viser god korrelation med biologisk væsentlighed. Den ikke-hubs, som forventet fra stikprøver statistikken, har omkring 50% af essentielle gener, der er forbundet, uanset den metriske bruges til rangordning (figur 8B). For nav bestående af Top75 gener, de valgte parametre har en meget høj andel af essentielle gener (mellem 88% og 89%), sammenlignet med resten af ​​parametrene. Figur 3 viser den centrale karakter Top75 hub gener af CGN og fremhæver de essentielle og ikke-essentielle gener blandt dem. Dette understreger relevansen af ​​de netværk målinger valgt i koder biologisk relevans. Dette er i overensstemmelse med tidligere rapporter om hubs er mere afgørende [64] og netværk centrale i cancer gener [37].

A. For hub definitioner varierer mellem Top25 til Top200, identificeret navene hjælp grad (1, ‘rød’), betweenness (2, »grønne«), og stress (3, “blå”) har betydelig høj procentdel (82% -92% ) af essentielle gener, klassificeres ved anvendelse fænotypiske data for Mouse Genome Informatics. Blandt resten af ​​fire parametre kvarter tilslutningsmuligheder (4) og topologisk koefficient (5) viser hverken signifikant eller konsistent sammenhæng med essentielle gener. På grund af karakteren af ​​’clustering koefficient “og” gennemsnitlige korteste vej længde’ parametre, kunne dataene ikke være myndighed på samme intervaller. For clustering koefficient, procentdel af essentielle gener blandt knudepunkterne med op til Top200 placeringer er i området fra 27% og 62%. For gennemsnitlige korteste vej længde, andelen af ​​væsentlige gener for knudepunkter have ranking op til Top200 er 26%, værre end forventet fra stikprøver. B. I tilsvarende ikke-hubs, er procentdelen af ​​essentielle gener som forventet fra stikprøver, uanset centrale foranstaltning eller cut-off anvendt til hub definition.

SBCGs og deres karakteristiske GO Vilkår

Vel vidende, at metastaser i knoglerne skyldes primært spredes fra primære prostata og brystkræft [10] – [13], vi sigter mod at udarbejde gener forbundet med disse processer. Vi samlet en liste over 391 Sekundær Bone Cancer (SBC) modtagelige gener fra rapportering litteratur eksperimentelle undersøgelser (Set-B i figur 2 og tabel S3). For at identificere relevansen af ​​disse gener i forbindelse med metastaser i knoglerne, vi udførte en overrepræsentation analyse ved hjælp CGN som universet. forventes Gene ontologi berigelse studier af SBCGs at afspejle GO kategorier af biologiske processer og molekylære funktioner, der er relevante for metastaser i knoglerne, i overensstemmelse med de kendte aspekter af reguleringsmekanismer af knoglemetastaser (figur 1).

Vi identificerede 93 betydeligt beriget GO form af SBCGs for biologiske processer, molekylære funktioner og cellulære komponenter. Vi identificerer CGN gener kommenteret med en af ​​disse 93 GO vilkår til at konstruere “Beriget Gener ‘sæt (Set-C i figur 2). Vi finder, at ud af de 93 betydeligt beriget GO termer, er 31 forbundet med metastase eller knogle processer. Ud af disse 31 GO vilkår, 21 er mest relevant for metastase mekanismer og 10 for knogle-relaterede processer (figur 9).

Fra GO berigelse studier af SBCGs, kurateret fra litteraturen, 21 GO vilkår er relevante for metastaser ( ‘lysegrå «) og 10 GO vilkår er relevante for knogle (” mørkegrå “) processer blev identificeret

følgende GO vilkår, der var signifikant beriget, er relateret til knogleprocesserne:. osteoblast differentiering (GO: 0.001.649), regulering af knogle remodellering (GO: 0.046.850), endochondral ossifikation (GO: 0.001.958), udskiftning ossifikation (GO: 0.036.075), knoglemineralisering (GO: 0.030.282), ossifikation (GO: 0.001.503), brusk udvikling ( GO: 0051216), svar på D-vitamin (GO: 0.033.280), collagen metaboliske proces (GO: 0.032.963), kollagen fibril organisation (GO:. 0.030.199)

følgende biologiske processer GO vilkår, der var signifikant beriget , er relateret til mekanismerne for metastase: leukocyt migration (GO: 0.050.900), celle-celle-adhæsion (GO: 0.016.337), angiogenese (GO: 0.001.525), positiv regulering af celleadhæsion (GO: 0.045.785), negativ regulering af celleadhæsion ( GO: 0007162), positiv regulering af leukocyt migration (GO: 0.002.687), regulering af leukocyt kemotaksi (GO: 0.002.688), positiv regulering af leukocyt kemotaksi (GO: 0.002.690), positiv regulering af catenin import til nucleus (GO: 0.035.413).

Efter molekylære funktioner GO vilkår, der var signifikant beriget, er relateret til mekanismerne for metastase: laminin binding (GO: 0.043.236), fibronectinbindende (GO: 0.001.968), fibroblast vækstfaktor receptor binding (GO: 0.005.104), blodpladeafledt vækstfaktor binding (GO: 0.048.407), ekstracellulære matrix binding (GO: 0.050.840), kollagen bindende (GO: 0.005.518), integrin binding (GO: 0.005.178), glycosaminoglycan bindende (GO: 0.005.539), cytokin aktivitet (GO: 0005125), kulhydrat bindende (GO: 0.030.246)

Predicted SBC-specifikke mål

for at forudsige SBC-specifikke mål for potentiel terapeutisk værdi, vi logisk sidestillede de tre sæt gener opnået:. CGN nav gener (Top75), SBCGs og kræft gener annoteret med GO vilkår overrepræsenterede for SBCGs (Figur 2 og Figur 10). På grundlag af specificitet for sekundære knogle kræft, som afbildet i figur 10A, blev Venn-diagram svarende til disse gensæt opdelt i syv forskellige regioner: Set-a, Set-b, Set-c, Set-ab, Set-bc , Set-ac og Set-abc. Samlet set sættene tilhører centrale gener af CGN (Set-a, Set-ab, Set-ac og Set-abc) indeholder gener, der er involveret i generiske mekanismer kræft (figur 6) og er også vigtigt (figur 8). Derfor, mens opnåelse SBC-specifikke mål, vi ikke overveje disse gen-sæt. Ud af resten af ​​tre sæt, Set-b omfatter gener, som allerede indberettes at være forbundet med SBC mekanismer, derfor ikke kan afsløre hidtil ukendte gener.

Be the first to comment

Leave a Reply