PLoS ONE: Biologisk Konvergens af Cancer Underskrifter

Abstrakt

Genekspression profilering har identificeret kræft prognostiske og prædiktive signaturer med overlegen ydelse til konventionelle histopatologiske eller kliniske parametre. Derfor er signaturer bliver indarbejdet i klinisk praksis og vil snart påvirke hverdagen beslutninger i onkologi. Men den lille overlapning i genet identitet mellem signaturer for samme cancertype eller tilstand rejser spørgsmål om deres biologiske og kliniske implikationer. For at afklare disse spørgsmål, er der behov for en bedre forståelse for de molekylære egenskaber og mulige interaktioner underliggende tilsyneladende uens signaturer. Her har vi vurderet, om underskrifter fra 24 uafhængige undersøgelser er relateret ved genom, transkriptom eller proteomanalyse niveauer. Væsentlige foreninger blev konsekvent observeret på tværs af disse molekylære lag, der antyder, at der findes en fælles kræftcelle fænotype. Konvergens på celleproliferation og død understøtter den drejelige inddragelse af disse processer i prognosen, metastase og behandlingsrespons. Derudover blev funktionelle og molekylære associationer identificeret med immunresponset i forskellige typer og betingelser kræft som supplerer bidrag celleproliferation og død. Undersøgelse af yderligere, uafhængige, kræft datasæt bekræftede vores observationer. Denne undersøgelse foreslår en omfattende strategi for at fortolke kræft signaturer, der afslører fælles design principper og systemer niveau egenskaber

Henvisning:. Solé X, Bonifaci N, López-Bigas N, Berenguer A, Hernández P, Reina O, et al. (2009) Biologisk Konvergens af Cancer signaturer. PLoS ONE 4 (2): e4544. doi: 10,1371 /journal.pone.0004544

Redaktør: Gustavo Stolovitzky, IBM Thomas J. Watson Research Center, USA

Modtaget: 7. oktober, 2008; Accepteret: 16 Januar 2009; Udgivet: 20 Februar 2009

Copyright: © 2009 Sole et al. Dette er en åben adgang artiklen distribueres under betingelserne i Creative Commons Attribution License, som tillader ubegrænset brug, distribution og reproduktion i ethvert medie, forudsat den oprindelige forfatter og kilde krediteres

Finansiering:. Det la Caixa Foundation tilskud BM 05/254 (MAP) og det spanske sundhedsministerium tildeler FIS 05/1006 (VM) og 06/0545 (MAP), RCESP C03 /09 og RTICCC C03 /10 (VM og GC). CAM understøttes af en Beatriu de Pinos stipendium fra AGAUR agentur for den catalanske regering, er HA understøttet af en postdoc stipendium af det spanske sundhedsministerium og MAP er et Ramon y Cajal Forsker med det spanske ministerium for undervisning og videnskab. De finansieringskilder havde ingen rolle i studie design, indsamling og analyse af data, beslutning om at offentliggøre, eller forberedelse af manuskriptet

Konkurrerende interesser:.. Forfatterne har erklæret, at der ikke findes konkurrerende interesser

Introduktion

de seneste år har set en beskrivelse af et stort antal genekspression profiler eller signaturer med klinisk værdi til nøjagtig prognostisk eller prædiktiv karakterisering af kræftpatienter eller tumorer. Brystkræft er sandsynligvis paradigme sådanne undersøgelser, med mindst tre forskellige signaturer øjeblikket testet i kliniske forsøg og kommercielt tilgængelige til rutinemæssig klinisk praksis i onkologi [1], [2]. Imidlertid har den manglende overlapning i de udvalgte gener rejst fundamentale spørgsmål om deres biologiske og kliniske implikationer [3], [4]. Denne situation er ikke enestående for brystkræft prognose, og beskrivelsen af ​​nye udtryk profiler tyder på, at det er almindeligt at andre typer kræft eller betingelser-dvs.. metastaser og behandlinger [5]. Årsager til dette paradoks kan være metodologiske forskelle [6] og statistiske begrænsninger skabt af det store antal gener undersøgt med hensyn til det relativt lille antal prøver profileret [7] – [9]. Vigtigere er det, en nylig undersøgelse fra Perou og kolleger [10] etablerede fælles prognostiske værdi af nogle brystkræft signaturer, trods manglen på overlap i gen identiteter. Denne observation bekræftede den kliniske relevans af underskrifter og foreslog, at de effektivt kan fange en fælles tumor-fænotype (r) [11]. Denne formodede fælles fænotype for brystkræft og for andre neoplasier skal defineres, hvis vi til bedre at forstå betydningen af ​​underskrifter.

Nogle af de tidlige beskrivelser af underskrifter bemærkede tilstedeværelsen af ​​specifikke biologiske processer overrepræsenteret i tilsvarende gen lister. Blandt disse processer blev individuelle gener involveret i cellecyklus og apoptose fremhævet (fx [12], [13]). Nyere beviser peger på specifikke gener, der er globalt forbundet med brystkræft prognose og relateret til celleproliferation blandt andre processer eller veje [14] – [21]. Det er dog stadig uklart, hvordan denne dokumentation karakteriserer forskellige molekylære niveauer, og hvordan niveauerne integrere i et system-niveau model indeholder gen og /eller protein interaktioner for brystkræft og til human cancer generelt. Her brugte vi en integrativ tilgang at fastslå eksistensen af ​​en formodet fælles tumor-fænotype (r) i forbindelse med forskellige typer og betingelser kræft. Undersøgelsen identificerede fælles molekylære egenskaber og netværk interaktioner forbundet med celledeling og død, og afslørede foreninger med immunresponset. Vores resultater understreger betydningen af ​​at studere underskrifter fra et system-niveau perpective

Resultater

Genomisk egenskaber:. E2F’ere og østrogen receptor (ER)

For at identificere fælles egenskaber blandt cancer underskrifter vi samlet litteraturen gen lister fra 24 studier (tabel S1). Disse repræsenterer 19 prognostiske underskrifter, to underskrifter fokuseret primært på metastaser, og syv forudsigende behandling respons signaturer. Alle signaturer, der anvendes svarede til validerede sæt af gener på samme niveau. Vi undersøgte først de molekylære egenskaber eller netværkstopologi egenskaber af gener og /eller proteiner i disse underskrifter på genomet transkriptom og proteomanalyse niveauer. Dernæst blev de identificerede egenskaber og netværk foreninger bekræftet i uafhængige udtryk datasæt af forskellige typer og betingelser kræft (fig. 1).

Strategi for at definere de fælles egenskaber og interaktioner mellem underskrifter på genomet, transkriptom og proteomanalyse niveauer og validering i uafhængige datasæt.

Egenskaber på genomet niveau blev evalueret ved sondering den relative berigelse i forudsagt transskriptionsfaktorbindende websted motiver på fortalerne for signatur gener (se metoder). I disse analyser top-rangerede motiver på tværs af flere underskrifter var fra E2F familien. Betydelig overrepræsentation af E2F motiver blev identificeret i ~45% (13/28) af de testede underskrifter, herunder prognostiske (blære, bryst og centralnervesystemet (CNS) kræftformer, og tre multi-cancer underskrifter) og predictive signaturer (docetaxel i brysttumorer, EGFR tyrosinkinasehæmmere (TKI’er) i lunge tumorer og pemetrexed i fremskredne solide tumorer) (falsk opdagelse sats (FDR) -adjusted

P

værdier. 0,05) (figur 2

A

). I modsætning hertil kun én underskrift (immunresponset prognostisk signatur i østrogen receptor (ER) ekskluderet brystkræft [22]) viste underrepræsentationen af ​​E2F motiver. Denne observation vil blive diskuteret i de følgende afsnit.

En

, repræsentation af E2F motiver baseret på Jaspar og TRANSFAC matricer og distributionen Poisson, med

P

værdier justeres ved hjælp FDR tilgang til analyser-kolonner. Værdier er vist som beskrevet i det indsatte: rød /orange indikerer betydelig overrepræsentation og blå indikerer signifikant underrepræsentation. Den E2F1_Q6 motiv repræsenterer den formodede virkning af E2F1 og MYC.

B

, repræsentation af E2F1-AP2 og E2F4 bindingssteder fra kromatin immunofældning (chip) analyser ved hjælp af den samme statistiske metode som beskrevet ovenfor. De E2F4 data svarer til den fælles analyse af cellecyklus faser [23].

C

, repræsentation af gener med periodisk udtryk gennem cellecyklus.

D

, repræsentation af ER transkriptionel regulering fra chromatin immunopræcipitationsanalyser eller transkriptionelle ændringer i MCF7-celler.

E

, repræsentation af yderligere promoter motiver ved hjælp TRANSFAC matricer. Såret respons signatur uden cellecyklus-associerede gener er angivet med suffikset “(-CC)”, og “total sæt” signatur af ER-negativ brystcancer indeholder immunresponset plus andre biologiske processer, såsom cellecyklus. Dasatinib forudsigende signatur er opdelt i to sæt for effekten i prostata og brystkræft hhv. De kolorektale prognostiske signaturer er som defineret i tabel S1.

At evaluere motiv forudsigelser i promotorsekvenserne af signatur gener, vi undersøgte eksperimentelle data fra kromatin immunopræcipitationsanalyser af transkriptionsfaktorer [23], [24] . Denne analyse bekræftede den store rolle for E2F transkriptionelle programmer. Ca. 65% af underskrifter viste signifikant overrepræsentation af E2F1-AP2 og /eller E2F4 bindingssteder (fig. 2

B

). De stærkeste over-repræsentationer blev påvist i prognostisk-især brystkræft-og intelligent behandling respons signaturer til E2F1-AP2 sites. Ikke desto mindre blev særlige også foreslået for immunresponset, som viste underrepræsentation af E2F1-AP2, og prædiktive signaturer, der ikke udviste differential repræsentation af E2F4 under alle omstændigheder.

De E2F’ere er vigtige regulatorer af celle spredning og død [25], [26], og fælles deregulering af E2F-medierede transkriptionelle programmer er kendetegnende for kræft transcriptomes [27]. Forbindelsen til potentialet for celleproliferation blev yderligere vurderet ved at undersøge udskrifter med periodisk udtryk gennem cellecyklus [28], hvilket indikerer en direkte eller indirekte rolle i fase (r) af celledeling, og ved at analysere ER funktionelle genomiske data [29 ]. Betydelig overrepræsentation af periodisk udtrykte gener blev observeret i ~45% af underskrifter, hvoraf de fleste var prognostiske signaturer til forskellige typer kræft (fig. 2

C

). Detaljeret undersøgelse af cellecyklus faser viste specifik overrepræsentation af gener med et udtryk toppe på G2 og G2 /M, hvilket er i overensstemmelse med deres rolle i celledeling (data ikke vist). Desuden overensstemmelse med forbindelsen mellem celleproliferation og ER-signalvejen [30], betydelig overrepræsentation af ER-bindingssteder og /eller ER-medieret transkriptionel regulering blev identificeret i de fleste af signaturer (-90%), uanset deres type eller tilstand (fig. 2

D

). Denne høje overlap med ER regulering sandsynligvis afspejler en stærk sammenhæng med celledeling ud over kræft hormon-afhængigheder.

Samlet set alle undtagen to af de undersøgte her underskrifter viste signifikant overrepræsentation af en eller flere af de molekylære beviser, der er forbundet med regulering af celledeling og død. Undtagelserne var immunresponset signatur, som kan afspejle inddragelse af forskellige biologiske processer, og B-celle lymfom prognose signatur, hvilket kan forklares ved den statistiske styrke er nødvendig for at påvise forskelle i den mindste gen sæt undersøgt (

n

= 19). Ligheder for disse underskrifter på supplerende molekylære niveauer vil blive præsenteret i de følgende afsnit.

Ekstra programmer celleproliferation, død og metastase

I en undersøgelse for yderligere mekanismer for transkriptionel regulering af underskrifter, motiver af AHR blev EGR1, MYB og MYC fundet at være overrepræsenteret i endnu en periode. Disse over-gengivelser var ikke så udbredt som for E2F’ere eller ER, der tyder på, at de spiller kun en mindre rolle, men forskellige cancertyper og betingelser blev inkluderet: en EGR1 motiv viste sig at være overrepræsenteret i CNS og kolorektal kræft og β-catenin multi-cancer prognostiske underskrifter, brystkræft lunge metastase underskrift og de prædiktive underskrifter cisplatin og dasatinib (FDR-justeret

P

værdier 0,05) (. figur 2

E

) . Efter aftale med disse observationer, fandt vi lunge metastase signatur til at indeholde 22% (12/54) af de gener forudsagte andre steder at være EGR1 transkriptionelle mål [31] – [34] og såret respons blev tidligere vist skal koordineres med

MYC

forstærkning [35]. Desuden overrepræsentation af et AHR motiv er i overensstemmelse med dens association med ER for at regulere celledeling [36].

Dernæst betydningen af ​​motiv repræsentationer blev evalueret ved at analysere genekspression korrelationer i repræsentative kræft datasæt. Således har vi beregnede korrelationer ved hjælp af Pearson korrelationskoefficient (PCC) mellem de syv transkriptionsfaktorer præsenteret ovenfor og gener forbundet med brystkræft prognose [12] eller med respons på docetaxel behandling i brystkræft [37], og sammenlignede dem med gener ikke -differentially udtrykt i disse betingelser. Højere absolutte PCC’er mellem transkriptionsfaktorer og gener forbundet med prognose eller behandling respons blev identificeret i alle tilfælde for (test

P

værdier Mann-Whitney (MW) 0,001) gener og /eller microarray sonder (. Figur 3) . Prognosen datasæt indeholdt en enkelt repræsentant microarray probe for hver transskription faktor, derfor alle af dem viste signifikante forskelle (fig. 3

A

). Behandlingen svar datasæt indeholdt flere sonder for nogle faktorer, som blev evalueret individuelt for at identificere tekniske eller biologiske forskelle. I dette datasæt,

AHR

,

EGR1

HIF1A

var hver repræsenteret ved et enkelt sonde og alle af dem viste signifikant højere korrelationer med respons (fig. 3

B

).

E2F1

,

E2F4

,

MYC

og

MYB

havde mere end én sonde hver, med uoverensstemmende resultater i nogle tilfælde, men med gennemsnitlige PCC’er signifikant associeret med respons i tre af dem (fig. 3

B

), mens

E2F4

forblev ufordelt som to sonder var signifikant korreleret og to var ikke (data ikke vist).

En

, udtryk sammenhænge mellem syv transkriptionsfaktorer-gen navne vises øverst på hver graf-og gener udtrykkes forskelligt for brystkræft prognose målt ved metastase begivenheder op til 5 år (pink kurver) i forhold til ikke differentielt udtrykte gener i denne tilstand (brune kurver). Graferne viser absolutte PCC værdier.

B

, samme analyse for differentielt udtrykte gener efter docetaxel behandling af brystkræftpatienter i forhold til ikke-differentielt udtrykte gener i denne tilstand. Resultater for

E2F1

,

E2F4

,

MYB

MYC

er for gennemsnitsværdier for alle microarray sonder repræsenterer hver faktor, mens mellemværker viser resultater for de enkelte sonder med betydelige forskelle.

for yderligere at evaluere disse observationer, vi beregnede korrelationer mellem de syv transkriptionsfaktorer og 5.000 tilfældigt udvalgte sæt svarende til størrelsen af ​​de differentielt udtrykte gen sæt ovenfor. Højere PCC’er blev observeret for de fleste transkriptionsfaktorer i begge kræft betingelser, med undtagelse af

E2F4

i prognose og behandlingsrespons (

opnåede P

værdier ved hjælp af den empiriske fordeling af tilfældige PCC’er (empirisk

P

værdier) var på 0,16 og 0,11, henholdsvis). Samlet set identifikation af signifikante korrelationer med mindst seks af de syv testede faktorer understøtter motiv forudsigelser og foreslår, at der findes fælles transkriptionelle programmer, der konvergerer på celledeling og død, samt metastaser som afsløret ved EGR1 [33].

Analyse af motiver og udtryk korrelationer afslørede også en sammenhæng mellem tilsyneladende uens immunrespons sæt og forskellige prognose signaturer. Selvom det underrepræsenterede E2F1 motiver, immunresponset delte overrepræsentation af en MYB motiv med den 21-genet, sår svar brystkræft, og blærekræft prognostiske signaturer (fig. 2

E

). Overrepræsentation af denne faktor i immunresponset er i overensstemmelse med dens rolle i hæmatopoiese [38], og dens over-repræsentation i andre signaturer er i overensstemmelse med den nye inddragelse af immunresponset i prognosen forskellige typer kræft [39]. De høje korrelationer observeres i fig. 3

A

mellem

MYB

og gener globalt forbundet med brystkræft prognose (dvs. ikke begrænset af ER status) støtter denne hypotese. Sammenslutninger af denne signatur på andre molekylære niveauer vil blive præsenteret i de følgende afsnit.

transkriptom korrelationer mellem underskrifter

I betragtning af den identifikation af fælles transkriptionelle programmer, bør de globale udtryk korrelationer mellem signaturer være højere end forventet tilfældigt. Ved hjælp af en brystkræft datasæt [40] og den gennemsnitlige PCC på tværs af alle microarray probepar mellem to underskrifter, var betydelig co-ekspression identificeret i ca. halvdelen af ​​analyserne i forhold til 10.000 tilsvarende, tilfældigt udvalgte gen sæt (empirisk

P

værdier 0,05) (figur 4

A

).. Disse resultater understøtter tilstedeværelsen af ​​funktionelle og molekylære associationer mellem mange tilsyneladende uens signaturer, til trods for at datasættet anvendes havde tydelige tekniske og biologiske specificiteter. Desuden viste immunresponset signatur betydelig co-ekspression med 15 af de underskrifter undersøgt (data ikke vist), som også understøtter konvergens på denne proces.

En

, zonekort af gennemsnitlige PCC’er mellem kræft signaturer i en brystkræft genekspression datasæt [40]. Signifikant co-ekspression (empirisk

P

værdier 0,05) er angivet med prikker. Bemærk, at matrixen ikke er symmetrisk, fordi resultaterne var afhængige af størrelsen af ​​hvert gen sæt; derfor, de større gensæt (fx oprullede respons eller invasivitet) viste signifikant co-ekspression med mange andre signaturer, måske skyldes til dels det faktum, at de havde større statistisk styrke med til at detektere dem. Hver prik svarer til sammenligningen mellem en signatur til venstre (simuleret sæt) og en underskrift nederst. Celledød og mitose sæt er fremhævet i pink.

B

, venstre panel, liste over underskrifter, der viste signifikant sammenhæng med Cell Død eller mitose komplet GO sæt. Right panel, liste over underskrifter, der viste signifikant sammenhæng med Cell Død eller mitose sæt, men kun ved hjælp af deres hovedkomponenter.

C

, observeret (diskontinuert rød linje) versus forventet (sort kurve for 10.000 tilfældigt udvalgte sæt) gennemsnitlige PCC’er mellem Mitose sæt og 70-gen sæt, celledød sæt, eller gener med periodisk udtryk gennem cellecyklus.

for yderligere at teste linket til celledeling og død på transkriptomisk niveau, og med undtagelse af

a priori

oplysninger om ekspressionsniveauerne eller profiler at kunne skævhed i analysen, vi undersøgt korrelationer med gen-sæt udvalgte ved hjælp af kun kriterierne for Gene Ontology (GO) vilkår celledød og mitose. Disse sæt blev udelukkende defineres ved at vælge Entrez gener annoteret med disse vilkår, og derefter bruges i sammenligninger på samme måde som enhver anden signatur. Brug 10.000 tilsvarende tilfældige sæt, absolutte korrelationer mellem disse GO sæt og underskrifterne viste sig at være betydeligt højere i ≥ 12 sammenligninger (fig. 4

B

,

venstre

). The Cell Død sæt var signifikant korreleret med fem underskrifter og Mitose sættet var signifikant korreleret med 11 underskrifter fra forskellige typer eller betingelser kræft. Vigtigt er det, forskelle i GO satte i forhold til tilfældig var af samme størrelsesorden som sammenligninger mellem signaturer (fig. 4

C

).

Denne analyse antydede, at måle ekspressionsniveauerne af gener, der vides at deltage i specifikke biologiske processer vil sandsynligvis være af prognostisk eller prædiktiv værdi i forskellige situationer. Imidlertid blev analysen begrænset af den mulige tilstedeværelse af ikke-informative udtryk eller sub-sæt af gener med forskellig adfærd inden for GO sæt. Således reducerer dimensionalitet af celledød og Mitose indstiller ved hjælp af en principal komponent analyse, der erobrede -80% af variansen hævede antallet af signifikante sammenhænge til 12 og 14 sæt, (fig. 4

B

,

højre

); disse tal svarede til i alt -60% af underskrifter undersøgte, uanset deres art eller tilstand.

Interactome netværk foreninger

Funktionelle relationer mellem proteiner kan identificeres som direkte interaktioner, komplekse medlemskaber eller relativt tætte forbindelser i netværket af protein-protein interaktioner eller interactome netværk. I betragtning af beviser på de genomiske og transkriptom niveauer præsenteret ovenfor, vi hypotese, at proteiner kodet af tilsyneladende uens signaturer vil blive mere tæt placeret i interactome netværk end forventet ved en tilfældighed. Til denne analyse anvendte vi et datasæt bestående hovedsagelig af eksperimentelt identificerede protein-protein-interaktioner, undtagen homodimerer og orthology-baserede forudsigelser, og beregnet den korteste vej mellem to knudepunkter eller proteiner i den gigantiske netkomponent (dvs. den komponent, der indeholder det største antal tilsluttede proteiner) [41].

Alle signatur sammenligninger viste korteste vej distributioner skæv mod mindre værdier end forventet fra den gigantiske komponent (fig. 5). Statistisk vurdering under anvendelse af de ikke-parametrisk MW test identificeret signifikante forskelle i forhold til den gigantiske komponent fordeling i 90% af sammenligninger. De mindste korteste veje blev identificeret for 21-genet prognostisk, og dasatinib og EGFR TKI forudsigende underskrifter, selv om resultaterne kan være genstand for partiskhed, fordi disse sæt indeholder flere proteiner, der er bredt undersøgt i litteraturen, og derfor har høj netværk centralitet.

En

, zonekort af gennemsnitlige korteste veje mellem proteiner kodet af underskrifter. Denne analyse blev udført ved hjælp af kun den kæmpe netværk komponent. Et eksempel på korteste vej forskelle med hensyn til den gigantiske komponent vises i højre panel til sammenligning mellem den fuldstændige celledød og mitosen GO sæt.

B

, varme kort over sammenligninger af 1.000 tilfældigt udvalgte 50-protein sæt i den gigantiske komponent. Højre panel, tæthed plot af gennemsnitlig korteste vej i tilfældigt udvalgte sæt: 5% lavere værdier er fremhævet, som svarer til en gennemsnitlig korteste vej 4,09. Sammenligninger mellem underskrifter under denne empiriske cut-off er vist med prikker i

A

.

C

, venstre panel, netværk repræsentation af gennemsnitlige korteste veje mellem celledød og Mitose og kræft signaturer som vist i det indsatte. Kanter længder er proportionale med de gennemsnitlige korteste vej værdier. Right panel, netværk repræsentation af gennemsnitlige korteste veje mellem celledød og Mitose og kræft signaturer eller tilfældigt udvalgte protein sæt med tilsvarende grad centralitet.

For yderligere at evaluere disse forskelle, valgte vi tilfældigt 1.000 sæt af 50 proteiner med tilsvarende gennemsnitlig grad centrale til underskrifterne og opnåede deres korteste vej distributioner. De fleste af de kræft underskrifter blev mere tæt placeret end forventet tilfældigt og også tæt på den celledød og mitose komplette sæt (empirisk

P

værdier. 0,05 markeret med prikker i figur 5

A og B

). Ifølge disse observationer, gennemgang af GO anmærkninger i de direkte og én-hop kvarterer i underskrifter identificerede betydelig overrepræsentation af cellecyklus eller celledød betegnelser eller børn i alle tilfælde (FDR-justeret

P

værdier 0,05) (GO sigt detaljer ikke vist), som styrker den hypotese, at underskriften genprodukter er molekylært og funktionelt forbundet med disse processer.

Dernæst underskrifter blev afbildet som knudepunkter i et netværk, hvor længden af ​​den kanter er proportional med den gennemsnitlige korteste vej til celledød og mitose sæt (figur 5

C

,

venstre

). I dette netværk, var de fleste underskrifter fundet tæt på disse centrale processer i forhold til 100 tilfældige sæt med tilsvarende grad centralitet (figur 5

C

,

højre

). Distant underskrifter repræsenterede beskedne foreninger på de forskellige molekylære niveauer behandlet ovenfor, såsom prognostiske underskrifter for B-celle lymfom, kolorektal cancer og hypoxi respons. Disse observationer foreslog korrelation på tværs af forskellige molekylære niveauer. Således blev der observeret negative korrelationer for alle signaturer mellem PCC co-ekspression værdier og interactome korteste vej afstande (gennemsnit

r

= -0,31 og

σ

= 0,16; Mantel test

P

værdi = 0,059), hvilket er i overensstemmelse med funktionelle relationer [42] – [45]. Derfor højere co-ekspression mellem underskrifter delvist korreleret med mindre korteste veje mellem dem i interactome netværket. Disse observationer understreger betydningen af ​​den integrerende undersøgelse, som afslørede tidligere uidentificerede relationer i gen lister.

immunrespons signatur blev også placeret tæt på celledød og mitose sæt (MW test

P

værdier 0,001) (Figur S1

A

). Derfor undersøgelse af andelen af ​​GO anmærkninger i én-hop kvarter af denne signatur er identificeret over-repræsentationer af udtryk relateret til celledeling og død, mens de direkte interaktionskandidater kun gav overrepræsentation af vilkår i forbindelse med immunsystemet (figur S1

B

). Selv genprodukterne med prognostisk værdi for ER-negative brystkræft ikke er direkte forbundet til de fælles processer identificeret ovenfor, de er signifikant associeret i en anden periode, samt transkriptionelt co-udtrykt og co-reguleret med mange underskrifter.

Evaluering af ejendomme og interaktioner i uafhængige datasæt

De ovenfor beskrevne observationer blev evalueret i to uafhængigt genereret underskrifter kræft betingelser. En nylig undersøgelse beskrev en lunge metastase underskrift af brystcancer under anvendelse af en anden metodologi [46]. Vi fandt -70% (15/21) af generne i denne signatur til at indeholde E2F TRANSFAC motiver og -60% (13/21) for at være mål for E2F1-AP2 og /eller ER. Derudover blev signifikante korrelationer med otte prognostiske underskrifter identificeret, syv af dem af brystkræft (empiriske

P

værdier 0,001) (resultater af analyserne af denne signatur er beskrevet i tabel S2). Korrelationen med Mitose var højere end forventet (empiriske

P

0,001), mens korrelationen med Cell Døden var ikke-signifikant (empirisk

P

= 0,18). Endelig genprodukter i denne signatur viste mindre gennemsnitlig korteste veje end forventet med 21 af de 28 underskrifter, herunder celledød Mitose og lunge metastase signatur tidligere præsenteret [31] (empiriske

P

værdier 0,05).

for yderligere at bekræfte vores observationer, valgte vi en anden neoplastisk tilstand fra den nyere litteratur: metastatisk kolorektal cancer behandlet med EGFR inhibitor cetuximab (Erbitux®) [47]. Tidligere undersøgelser tyder på, at EGFR-mutationer er associeret med reaktionen på TKI’er men ikke at cetuximab [48], [49]. Vi evaluerede vores observationer ved at undersøge fordelingen af ​​gen anmærkninger i rang af hazard ratio (timer), der måler respons på cetuximab behandling af progressionsfri overlevelse. I denne analyse blev celledeling og immunresponset identificeret som de processer, der har størst effekt på respons (fig. 6). Vigtigt er det, det sæt af gener, hvis høj ekspression stærkest associere til respons var for et sår-lignende fænotype, der tidligere blev vist at tilvejebringe prognosen værdi for bryst-, lunge- og gastrisk cancer [50]. De næste tilknyttede high-udtryk sæt var for doxorubicin behandling i gastrisk cancer, brystcancer prognose (70-gen) og prognose af forskellige typer kræft ikke undersøgt i denne undersøgelse (hepatocellulært carcinom og myelomatose prognose). Desuden blev høj ekspression af E2F1, hypoxi og MYC mål også forbundet med den respons med samme styrke (fig. 6

A

). Kollektivt, disse observationer støtter den biologiske konvergens af underskrifter.

En

, venstre panel, GSEA resultaterne for den stærkeste forbindelse fænotype med high-udtryk gener forudsige behandlingsrespons (log

2 HR 0). Central panel, ekspressionsanalyse plot af den ekstreme genekspression (

ereg

), hvilket også blev bemærket i den originale publikation [47]. Right panel, ekstra fænotypiske og GO sigt sæt med high-udtryk gener associeret til behandling respons på FDR

Q

værdier 1%.

B

, venstre panel, GSEA resultaterne for den stærkeste forbindelse fænotype med lavt udtryk gener forudsige behandlingsrespons (log

2 HR 0). Central panel, ekspressionsanalyse plot af den ekstreme genekspression (

IL15

). Right panel, ekstra fænotypiske og GO sigt sæt med lav-udtryk gener associeret til behandling respons på FDR

Q

værdier 1%.

C

, Histogram plot af gennemsnitlige udtryk værdier af gener kommenteret med immunrespons eller Mitose tværs prøver i cetuximab datasæt. Gennemsnitlig GO indstillede udtryk værdier viser en negativ korrelation med bestilte metastatiske prøver.

Analysen af ​​cetuximab datasæt også afsløret en supplerende opførsel af celledeling og immunresponset i overensstemmelse med repræsentation af E2F1 motiver vist ovenfor . Patienter med høj ekspression af celleproliferation-relaterede gener og lav ekspression af immunrespons-gener reagerede på behandlingen (fig. 6

B

), mens der ikke var nogen patienter med høje ekspressionsniveauer værdier af begge processer. Derfor blev der observeret en stærk anti-sammenhæng mellem gener annoteret med GO sigt immunrespons og gener kommenteret med Mitose (

r

= -0,79) (fig. 6

C

). Denne observation fører til spekulere, at disse processer spiller balancering roller i prognose og behandlingsrespons. Gode ​​responders til cetuximab kan vise stærk afhængighed af en “celledeling-on” molekylær program, mens ikke-respondenter kan forstyrres af immunsystemet-baseret behandling.

Diskussion

På trods af den lave grad overlapning i form af gen-identitet, tilsyneladende uens kræft underskrifter konvergere på specifikke biologiske processer. Konvergens er defineret ved signifikante molekylære og funktionelle sammenhænge mellem gener og /eller proteiner: i /forudsagte promotor- motiver; ii /eksperimentelt identificerede DNA bindingssteder; iii /cellecyklus-periodisk profiler; iv /ER-medieret transkriptionel regulering;

Be the first to comment

Leave a Reply