PLoS ONE: Et Data lighed funderet for Meta-analyse af Transkriptionelle profiler i Cancer

Abstrakt

Baggrund

Robust transkriptionelle signaturer i kræft kan identificeres ved data ligheden-drevet meta-analyse af genekspression profiler. En uvildig dataintegration og forhør strategi har ikke tidligere været tilgængelig.

Metoder og Resultater

Vi implementeret og udført et stort meta-analyse af brystkræft genekspression profiler fra 223 datasæt indeholdende 10.581 human cancer prøver ved hjælp af en ny data lighed tilgang (iterativ ophøje). Kræft genekspression signaturer udvundet fra individuelle datasæt blev grupperet af data lighed og konsolideres i en meta-signatur med en tilbagevendende og overensstemmende genekspression mønster. En retrospektiv overlevelse analyse blev udført for at vurdere den prædiktive effekt af en hidtil ukendt meta-signatur udledes transskriptionsprofilering studier af human brystcancer. Validering kohorter, der består af 6.011 brystkræftpatienter fra 21 forskellige brystkræft datasæt og 1.110 patienter med andre maligniteter (lunge og prostatakræft) blev anvendt til at teste robustheden af ​​vores resultater. Under den iterative ophøje analyse blev 633 underskrifter grupperet efter deres data lighed og dannede 121 signatur klynger. Fra 121 signatur klynger, vi identificeret en unik meta-signatur (BRmet50) baseret på en klynge af 11 underskrifter deler en fænotype relateret til særdeles aggressiv brystkræft. Hos patienter med brystkræft, var der en signifikant sammenhæng mellem BRmet50 og resultatet sygdom, og den prognostiske magt BRmet50 var uafhængig af almindelige kliniske og patologiske kovariater. Desuden den prognostiske værdi af BRmet50 var ikke specifikke for brystkræft, da det også forudsagt overlevelse i prostata og lungekræft.

Konklusioner

Vi har etableret og implementeret en ny data lighed drevet meta -analyse strategi. Ved hjælp af denne metode, vi identificeret en transkriptionel meta-signatur (BRmet50) i brystkræft, og den prognostiske ydeevne BRmet50 var robust og anvendelig på tværs af en bred vifte af kræft-patient populationer

Henvisning:. Qiu Q, Lu P, Xiang Y, Shyr Y, Chen X, Lehmann BD, et al. (2013) Et Data lighed funderet for Meta-analyse af Transkriptionelle Profiler i Cancer. PLoS ONE 8 (1): e54979. doi: 10,1371 /journal.pone.0054979

Redaktør: Aedín C. Culhane, Harvard School of Public Health, USA

Modtaget: Maj 29, 2012; Accepteret: December 22, 2012; Udgivet: 29 Jan 2013

Copyright: © 2013 Qiu et al. Dette er en åben adgang artiklen distribueres under betingelserne i Creative Commons Attribution License, som tillader ubegrænset brug, distribution og reproduktion i ethvert medie, forudsat den oprindelige forfatter og kilde krediteres

Finansiering:. Dette arbejde blev delvist understøttet af en Howard Temin Award fra National Cancer Institute ved National Institutes of Health (CA114033 til YY), American Cancer Society-Institutional Research Grant (# IRG-58-009-51 til YY), og Vanderbilt Clinical og Translationel Science Awards (CTSA) UL1 RR024975 fra National center for Research Resources (NCRR), en del af National Institutes of Health (NIH), (CRC1838 til YY). De finansieringskilder havde ingen rolle i studie design, indsamling og analyse af data, beslutning om at offentliggøre, eller forberedelse af manuskriptet

Konkurrerende interesser:.. Forfatterne har erklæret, at der ikke findes konkurrerende interesser

Introduktion

Brystkræft er den mest almindelige form for kræft hos kvinder og den anden førende årsag til kræft dødsfald blandt kvinder i USA. En molekylær biomarkør, der kan forudsige sandsynligheden for kræft progression til invasiv eller metastatisk sygdom kan guide hvor aggressivt patienter er i første omgang behandlet [1]. Der er et klart behov for en bedre forståelse af, hvordan molekylære profiler vedrører kræft fænotyper og kliniske resultater og for nye kræft biomarkører med definerbar og reproducerbar ydelse i forskellige patientpopulationer.

Indførelsen af ​​genom-skala genekspression profilering har ført til identifikation af specifikke transkriptionelle biomarkører kendt som genekspression signaturer. Opdagelsen af ​​genekspression signaturer fra enhver well-drevne undersøgelse er relativt ligetil. Nogle signaturer har nytte som transkriptionelle biomarkører for klassificering af patienter med markant forskellige overlevelse udfald i brystkræft [2], [3]. For eksempel har transskriptionsprofilering af primær brystcancer tidligere er blevet anvendt til at identificere en 70-gen signatur (markedsført som MammaPrint men betegnet her som BRsig70) [3], en særskilt 76-genet signatur (BRsig76) [2], og andre ( Oncotype DX [4], [5], TAMR13 [6], Genius [7], GGI [8], PAM50 [9] og PIK3CAGS278 [10]). Typisk for andre transkriptionelle biomarkører, blev begge BRsig70 og BRsig76 stammer fra en uddannelse sæt fra en enkelt undersøgelse og derefter valideret med en test, der ud fra de samme retrospektive patientkohorter. Ved udsættelse for ekstern validering, kunne de fleste underskrifter kun valideres ved hjælp af en datasæt (NKI295) [11] eller et par mindre datasæt med tilbagevirkende kraft påløbne prøver. Denne validering metode har uundgåelige begrænsninger af statistisk styrke eller prøve selektionsbias. Som et resultat, en fælles svaghed ved denne metode er dens mangel på konsekvens og reproducerbarhed [12] – [16].

Med hundredvis af brystkræft genekspression datasæt deponeret i offentlige databaser, vi nu har mulighed for at udnytte disse data til deres fulde potentiale og opdage tilbagevendende og pålidelige genekspression signaturer til brystkræft prognose forudsigelse. Imidlertid er identifikationen af ​​en prognostisk ekspressionssignatur gennem meta-analyse af offentligt tilgængelige cancer genekspressionsprofiler repræsenterer en underudnyttet mulighed. Der er flere rapporter om meta-analyse rammer, der bruger flere brystkræft datasæt til at bygge og validere prognostiske klassificører [7], [17], [18]. Disse tilgange fokuserer på valg af prædiktorer fra kombinerede uddannelse sæt, enten ved hjælp af gennemsnitlige Cox-scores [18] eller under hensyntagen til prøven molekylære undertyper [7], [17]. , Et ubesvaret spørgsmål er, hvordan at identificere homogene genekspressionsstudier hjælp af en raffineret og fordomsfri valgmetode [19]. For at ekstrapolere validerede prognostiske underskrifter til en bredere patientgruppe, er behov for nye biostatistiske metoder ved hjælp af data lighed-baseret analyse [20].

For at undgå de svagheder enkelt undersøgelse afledt underskrifter og skabe en ny strategi en bedre udnyttelse af de tilgængelige genekspression data fra uafhængige undersøgelser, har vi udviklet en meta-analyse strategi kaldet ophøje (ekspressionsanalyse Tool) [21], [22]. Det væsentligste kendetegn ved ophøje er en database, der indeholder tusindvis af genekspression signaturer udvundet fra offentliggjorte undersøgelser, der muliggør signatur sammenligninger. I denne undersøgelse, brugte vi ophøje i en iterativ måde (iterativ ophøje) at gennemføre en data lighed-drevet metaanalyse og belyse transkriptionelle signaturer med forbedret prognostisk værdi i brystkræft. Vi viste, at heterogene underskrifter fra 223 offentlige datasæt indeholdende 10.581 brystkræft prøver kunne systematisk organiseret af deres fælles data (dvs. iboende ligheder og sygdom fænotyper) og samles til en ny signatur datatype kaldet en meta-signatur. Vi identificerede en specifik meta-signatur består af 50 gener (BRmet50), der er robust prædiktiv for kræft prognose i 6.011 brystkræftpatienter fra 21 forskellige brystkræft datasæt samt i andre maligniteter, herunder lunge- og prostatakræft. Disse resultater viser værdien af ​​BRmet50 i brystkræft prognose uafhængig af behandling variabler og viser, at iterativ ophøje er en roman metaanalyse metode stand til at udføre informative og robust opdagelse af meta-signaturer i kræft.

Resultater

Extraction of human Cancer Underskrifter

for at organisere de komplekse transkriptionelle data, har vi etableret en hierarkisk datastruktur. Det øverste niveau består af transskriptionelle undersøgelser, og hver transkriptionel undersøgelse blev delt i tre niveauer: datasæt, grupper og prøver. En undersøgelse kan indbefatte en eller flere datasæt afhængigt af dets eksperimentelle design [21]. Fra 56 brystkræft undersøgelser (tabel S1), har vi samlet 223 brystkræft datasæt repræsenterer 10,581 brystkræft prøver. Primær brystcancer prøver inden for hver datasæt blev grupperet efter deres kliniske egenskaber. Hver datasæt omfattede mindst to grupper af tumor prøver med forskellige kliniske fænotyper (figur 1 øverste panel). For eksempel fænotyper relateret til cancer tilbagefald eller dårlig prognose omfatter tumorstørrelse, kirtelinvolvering, klasse, lymphovascular invasion, p53 status, BRCA1 mutation, BRCA2 mutation, østrogenreceptor (ER), og human epidermal vækstfaktor receptor 2 (HER2) status [23], [24]. To eller flere grupper pr datasæt var nødvendige for at generere statistiske sammenligninger. I alt 633 betydelig gen lister ( “simple signaturer”) fra alle mulige parvise gruppe sammenligninger blev genereret i overensstemmelse hermed ved hjælp af en t-test [21]. Alle 633 “simple signaturer” blev derefter opbevaret i en human cancer signatur database (HuCaSigDB), der er tilgængelig online (https://seq.mc.vanderbilt.edu/exalt/) [22]. De vigtigste proceduremæssige skridt til udvinding af underskrifter leveres i Methods S1.

Arbejdsgangen af ​​iterative ophøje metode omfatter tre store processer. (1) Udvinding af 633 brystkræft signaturer. Alle parrede prøve grupper inden for hver brystkræft datasæt (n = 223) blev sammenlignet på grundlag af alle mulige kliniske og patologiske kovarianter såsom tumorstørrelse, lymfeknudeinvolvering, klasse, markør status, lymphovascular invasion, tilbagefald, metastase, p53 status, BRCA1 og BRCA2 mutationer. T-test blev derefter udført for alle parvise sammenligninger, og i alt 633 brystcancer signaturer blev dannet og overført til en database (HuCaSigDB). (2) Underskrift klynger og klassificering. Iterativ søgning blev udført ved hjælp af hver af 633 underskrifter som en forespørgsel (forankrede eller frø) signatur mod HuCaSigDB gentagne gange for at identificere homologe signaturer med betydelig data lighed defineret af ophøje. 121 ud af 633 query signaturer fundet mindst én tilsvarende signatur i HuCaSigDB og dannede 121 klynger, mens de resterende 512 (singletons) undladt at generere klynger. To typiske resultater er afbildet ved skematisk beskrivelse mærket med forankrede underskrifter: singleton Sig21 og klyngen Sig24 herunder 11 signatur medlemmer som Sig544, Sig128, Sig140 osv Viden baseret analyse af signatur fænotyper og størrelser blev udført blandt 121 signatur klynger. Otte klynger havde indlysende metastase fænotyper. Af de otte klynger, blev den største klynge forankret ved forespørgslen signatur (sig24) udvalgt til yderligere analyse. (3) Identifikation af meta-signatur BRmet50. Alle 6,526 signatur gener fra de 11 underskrifter fra klyngen Sig24 var samlet sammen til en syntetisk signatur (BRmet). Generne inden BRmet blev rangeret baseret på tilbagevendende hyppighed og overensstemmelsen af ​​differentieret udtryk repræsenteret ved en meta-zonekort. De 50 bedste gener (BRmet50) repræsenteret i rækker blev bestemt ved en 100% tilbagevendende frekvens og genekspression profil konkordans blandt de 11 underskrifter, der er repræsenteret i kolonner. Farverne i meta-zonekort repræsenterer retningen af ​​differential genekspression inden for en given transkriptionel profil (rød for op, grøn for ned, og sort for en manglende match). Color intensitet afspejler tillid niveauer af forskellen udtryk.

En genekspression signatur ( “simpel signatur”) som defineret ved ophøje er et sæt af væsentlige gener med deres tilsvarende statistiske scores og genekspression retning koder ( op eller ned). Nogle “simple signaturer” er biologisk relateret til brystkræft prognose, men de blev afledt fra individuelle transskription profilering undersøgelser og alt for ofte underdimensioneret, afkortet, eller af lav kvalitet. Der er iboende begrænsninger for enkelte profilering studie med lille stikprøve størrelse i forhold til det store antal potentielle prædiktorer, begrænsninger af teknologiske platforme, prøve variation, og bioinformatik eller statistisk metode bias. En underliggende antagelse vi gjort i formuleringen denne tilgang er, at enhver person transskriptionsprofilering undersøgelse ikke afkode en hel udtryk signatur. Snarere disse “simple signaturer” repræsenterer kun fragmenter af en komplet og fælles transkriptionelle profil (meta-signatur).

Identifikation af en roman Breast Cancer Meta-signatur

Vi hypotese, at en meta- signatur med forbedret forudsigelseskraft kunne blive opdaget af data lighed-drevet metaanalyse af transkriptionelle profiler fra flere relaterede studier. Ophøje analyse dannede grundlag for gruppering eller clustering “simple signaturer” deler betydelig data lighed. Den iterative ophøje proces indsamlet homologe underskrifter fra “simple signaturer” og konsoliderede dem i meta-signaturer (Figur 1 midterste og nederste panel). Kort fortalt blev hver brystkræft signatur i forhold til alle brystkræft signaturer i HuCaSigDB og underskrift par med betydelig lighed blev grupperet sammen. Den iboende forhold mellem parvise signaturer blev først bestemt ved hjælp af gen symbol match og overensstemmelsen i retning af genekspression forandring. Derefter blev en normaliseret total identitet score beregnes på basis af Q-værdier fra de to underskrifter. Den betydelige lighed niveau blev bestemt ved simulering analyse [21] som forklaret i Methods S1.

Vi har udført, hvor alt-versus-alle signatur lighed søgninger blev foretaget iterativ ophøje analyser. Mere specifikt har hver af de 633 “simple signaturer” fra HuCaSigDB tjente som et frø (også kaldet forespørgsel eller forankret underskrift) til at forespørge alle “simple signaturer” i HuCaSigDB gentagne gange og bringe andre homologe signaturer sammen ved deres fælles elementer (dvs. iboende ligheder). Denne iterative proces “sammenbygget” eller “klynger” signaturer baseret på deres ligheder (figur 1 midterste panel). Underskrift par, der var tilstrækkeligt ens (p 0,05) blev knyttet sammen til klynger. Efter iterative sammenligninger, hvert frø signatur enten forblev som en singleton (dvs. et frø signatur, selv-matchede, men gav ikke noget andre signaturer) eller dannet en klynge med andre signaturer.

Denne iterative ophøje proces starter med 633 frø underskrifter resulterede i 121 signatur klynger og 512 enkeltfødte (figur 1 midterste panel). Vi fokuserede på otte specifikke klynger, fordi de otte frø signaturer og alle andre klynger signaturer i hver af de otte var klart relateret til kræft metastaser. De resterende 113 klynger havde nogen konsekvente og tydelige kræft metastase fænotyper. For de otte metastase-relaterede klynger, indeholdt hver forskellige overlappende signatur medlemmer tilknyttet fænotyper, der er kendte risikofaktorer for cancer metastase, såsom high-grade tumorer, ER-negativ status, basal-lignende celletype og cancer tilbagefald. Af disse valgte vi det største signatur klynge indeholdende 11 metastase-relaterede signaturer (figur 1 og tabel 1) [2], [3], [6], [8], [11], [25] – [29]. Fordi hver signatur i klyngen stammer fra en sammenligning mellem meget aggressive og mindre aggressive brystkræft, denne sammenligning gav en “dårlig prognose” gen signatur (tabel 1).

Hver af de 11 underskrifter omfatter flere hundrede gener. For at identificere en tilbagevendende og overensstemmende genekspression mønster i den metastatiske signatur klynge, alle gener, der omfattede de 11 underskrifter (n = 6,526) blev samlet i en syntetisk signatur udpeget som BRmet. Generne inden BRmet blev rangeret baseret på tilbagevendende frekvens og retning af differentieret udtryk (meta-retning) blandt alle 11 underskrifter. En 100% tilbagevendende frekvens blev anvendt til at vælge de 50 gener for meta-signatur (BRmet50) (Figur 1 nedre panel). Således BRmet50 profiler er overensstemmende blandt alle 11 klynger simple signaturer (tabel 1). BRmet50 gener repræsenterer betydeligt differentielt udtrykt gener, ikke kun inden for deres egne datasæt, men også på tværs af 11 andre relaterede datasæt (figur 1).

Annotation for BRmet50 gener i tabel S3. Kun fem gener i BRmet50 overlappet med BRsig70, og to blev fundet fælles med BRsig76. Antallet af overlappende gener mellem BRmet50 og de seks andre kræft signaturer (Oncotype DX, TAMR13, Genius, GGI, PAM50, og PIK3CAGS278) er relativt lav (1% -27%), hvilket tyder på, at BRmet50 er et særskilt signatur. Fordi BRmet50 blev udledt fra en pakke af signaturer, der sammenligner meget aggressive og mindre aggressive brystcancere, vi forudså, at BRmet50 ville være forbundet med dårlig prognose ved brystcancer, såsom cancer tilbagefald, metastase, og død. Den generelle prognose træk ved BRmet50 kan være anderledes end dem, BRsig70 /76 (BRmet70 og BRmet76), fordi de er designet specielt til at forudsige fjernmetastaser i den tidlige fase brystkræftpatienter med lymfeknude-negativ status [2], [3]. , Indså vi således, at hverken BRsig70 eller BRsig76 var fuldt sammenlignelig med BRmet50. , De tjente snarere som prognostiske kontrol underskrifter i denne undersøgelse.

Meta-validering af BRmet50 i Breast Cancer

Siden BRmet50 blev udledt fra en signatur klynge sammenligne flere og mindre aggressive kræftformer, vi tilbagevirkende kraft undersøgt evne BRmet50 at forudsige prognosen i 21 datasæt, herunder 11 uafhængige validering datasæt, der ikke anvendes i signaturen klyngedannelse proces (tabel 2).

for at undersøge stabiliteten af ​​den iterative ophøje metode og for at undgå over-montering af de ni uddannelse datasæt, brugte vi en “leave-one-out” krydsvalidering strategi for at udlede ni BRmet50 kontrol signaturer til de tilsvarende ni uddannelse datasæt. I hver leave-one-out forsøg, de inkluderede underskrifter forblev klynger. Desuden alle BRmet50 kontrol underskrifter fra “leave-one-out” proceduren delte det centrale sæt af de 50 gener. Vi derefter testet disse kontrol meta-signaturer i tilsvarende uddannelse datasæt (tabel S2) og fandt, at deres prognostiske forestillinger var så godt som BRmet50 (tabel 2). Data antyder, at iterativ ophøje-baserede klyngedannelse proces er en stabil og pålidelig metode, der ikke påvirkes af nogen bestemt signatur medlem i BRmet klynge.

11 uafhængige validering datasæt blev anvendt til at evaluere BRmet50 prognose ydeevne. Log-rank tests blev udført for at vurdere forskellene i overlevelse analyse. De p-værdier fra log-rank test, der sammenligner BRmet50, BRsig70, BRsig76, og de seks andre offentliggjorte kræft signaturer (Oncotype DX, TAMR13, Genius, GGI, PAM50 og PIK3CAGS278) er opsummeret (tabel 2 og tabel 3). Hver signatur blev evalueret for sin evne til at klassificere individer med brystkræft i “gode” og “dårlige” prognostiske grupper. Expression værdier for hver signatur blev hentet fra hver tilsvarende datasæt, blev derefter opsyn hierarkisk klyngedannelse udføres ved hjælp af Spearman rank korrelation, og gruppeopgaver blev bestemt i hvert datasæt baseret på den første tvedeling af klyngedannelse dendrogrammer [30]. BRmet50 skelnes mellem de gode og dårlige prognostiske grupper med succes i alle datasæt (tabel 2), mens BRsig70 og BRsig76 ikke kunne diskriminere prognose grupper i fire og seks datasæt hhv. Den manglende BRsig70 og BRsig76 at stratificere prognostiske grupper i disse datasæt varet efter vi omklassificeret prøver ved hjælp af originale algoritmer (f.eks, enten Pearson korrelation metode [3] eller tilbagefald score metode baseret på vægtet Cox regression koefficientværdier [2] ). Således er disse resultater var uafhængige af statistiske metoder. Lignende resultater blev også opnået blandt de seks andre veletablerede kræft underskrifter, fordi ingen af ​​dem kunne diskriminere prognose grupper i alle 11 test datasæt (tabel 3). Som en anden ydelse foranstaltning, vi beregnet c-indekset for kræft signaturer i 11 validering datasæt (tabel 3), som er en generalisering af arealet under receiver operating characteristic (ROC) kurve [31]. Den prognostiske værdi (c-indeks) for BRmet50 og andre kræft underskrifter blev sammenlignet. For en given test datasæt, BRmet50 c-indeks svarer til dem fra de andre kræft underskrifter, hvilket tyder på, at BRmet50 og andre kræft signaturer giver sammenlignelige prognostisk information.

Resultat Målinger i BR1042

Kaplan-Meier analyse blev anvendt til at illustrere forskellige tilbagefald overlevelse i BR1042 blandt de tre typer af signaturer, herunder BRmet50, en BRmet50 kontrol signatur, og to tidligere identificerede signaturer (BRsig70 og BRsig76) (Figur 2). Resultaterne demonstrerer en signifikant forskel i tilbagefald overlevelse mellem de gode og dårlig prognose grupper som forudsagt for datasættet BR1042 af BRmet50 samt BRmet50 kontrol signatur (BRmet [-1042]) fra leave-one-out-processen (

s

0,05). Blandt patienter, for hvem BRmet50 forudsagde en god prognose, den 10-årige på tilbagefald overlevelse var 79% mod kun 47% blandt dem med en dårlig prognose (figur 2, øverste venstre panel). Risikoen for tilbagefald forudsagt af BRmet50 var signifikant højere blandt patienter i dårlig prognose gruppe end blandt dem i god prognose gruppen. Men for det samme datasæt, hverken BRsig70 eller BRsig76 adskiller en signifikant forskel i metastase overlevelse mellem de gode og dårlige prognostiske undergrupper.

Data fra 108 tumorer fra datasættet BR1042 blev stratificeret i to grupper af BRsig70 og BRsig76 (nederste paneler), kontrol signatur (BRmet [-1042]) fra leave-one-out-metoden, eller BRmet50 (øverste paneler) genekspression profiler. I hvert overlevelse plot blev to typer af tilbagefald overlevelse sammenlignet: en dårlig prognose gruppe (sort stiplet linie) og en god prognose gruppe (rød optrukket linje). Tilbagefald-fri tid i dage vises på x-aksen, og y-aksen viser sandsynligheden for tilbagefald overlevelse. Den p

– iBooked.dk værdier indikerer den statistiske signifikans af overlevelse tidsforskelle mellem de to grupper

Udførelsen af ​​BRmet50 (c-indeks:. 0,6573, p

værdi

:

0,002) var bedre end BRsig70 og BRsig76 (c-indeks: 0,5839 eller 0,5172 henholdsvis p-værdi 0,14), når den undersøger BR1042 datasæt. Vores resultater viser, at den prædiktive magt BRmet50 er robust og anvendelig i en bred vifte af uafhængige datasæt.

For at vurdere, om BRmet50 association med prognose resultatet var specifik, genereret vi 1.000 underskrifter fra samme størrelse (50 gener) ved hjælp af tilfældigt udvalgte gener fra det humane genom. Alle tilfældige signaturer blev testet i det samme panel af 21 test datasæt. Efter 1.000 tilfældige permutationer af genet underskrifter, blev p-værdien distribution (-log p-værdi) fra hver test datasæt genereres, og p-værdier fra BRmet50 og de seks andre offentliggjorte kræft signaturer blev også afbildet på X-akse distributionsselskaberne plots (figur S2 og S3)

Selv om nogle tilfældige signaturer er væsentligt (

s

0,05). i forbindelse med brystkræft resultater i forskellige datasæt, foreningerne er stærkere for de syv brystkræft signaturer i mere end halvdelen af ​​de test datasæt. Disse kontrolresultater giver gyldige statistisk støtte til deres prognose relevans. Derudover har vi bemærket, at de fleste p-værdier fra BRmet50 var på den yderste højre side af tilfældige p

– Drømmeholdet værdi distributioner (Tal S2 og S3). Vi derefter sammenlignet patienten resultat associering BRmet50 til dem af 1.000 tilfældige signaturer af ens størrelse (fig S2 og S3), og vi bekræftede, at BRmet50 viste en stærkere sammenhæng end det store flertal af ( 95%) tilfældige signaturer. Således sandsynligheden for at opnå de samme p-værdier som BRmet50 tilfældigt i de samme test datasæt i tabel 2 er betydeligt lav (

s

0,05).

Predictive Power of BRmet50 er uafhængigt af fælles klinisk og patologisk kovariater

Fordi datasæt BR1141 [6] omfatter 269 patienter med brystkræft og en fuld panel af almindelige kliniske og patologiske kovariater, vi testede, om sammenslutningen af ​​BRmet50 med dårlig prognose resultatet var uafhængig af etablerede kliniske og patologiske kriterier ved hjælp af robuste BR1141 datasæt undersøgt af Cox proportional-farer modeller (tabel 4 og tabel S4). Sammenhængen mellem BRmet50 og risikoen for dårligt klinisk resultat var signifikant uanset tumorstørrelse, lymfe-knude status eller tamoxifen behandling (

s

0,05). Desuden kunne BRmet50 adskille tumorer med mellemliggende differentiering eller ER-positive i gode og dårlige prognostiske underkategorier (hazard ratio for en dårlig prognose: 2,5;

s

≤0.001), men ikke for dem, der var ER-negative. Hverken BRsig70 eller BRsig76 var i stand til at stratificere tumorer med enten god eller dårlig differentiering i enhver delmængde af BR1141 undtagen tamoxifen behandling delmængde (tabel 4). Fordi BR1141 var blandt de uddannelse datasæt, vi også testet en “leave-one-out ‘BRmet50 kontrol signatur, og fundet identiske signifikante sammenhænge (Tabel S4). Sammenhængen mellem BRmet50 og tilbagefald resultat i BR1141 delmængde af patienter uden tamoxifen behandling er yderligere beskrevet i Methods S1.

Fem af de 21 datasæt, der anvendes til evaluering BRmet50 ydeevne (BR1042, BR1095, BR1128, BR1141, GSE7390) repræsenterede 1.183 tumorer og havde data på et fælles sæt af clinicopathologic karakteristika, herunder tumor størrelse, kvalitet, lymfeknude status, og Nottingham Prognostisk Index (NPI) [32], [33]. Univariate og multivariate analyser af disse fem validering sæt blev udført for yderligere at evaluere resultaterne af BRmet50 sammenlignet med andre prognostiske faktorer, nemlig, BRsig70, BRsig76, alder, tumorstørrelse, grad, lymfeknude status, og NPI. De ikke-justerede (tabel S5) og justeret (tabel 5 og tabel S6) hazard ratio for disse faktorer og underskrifter blev bestemt.

univariate Cox proportional-farer analyse viste, at BRsig70, BRsig76, eller enhver person fælles prognostiske faktor (tumorstørrelse, grad, lymfeknude status eller NPI) kunne ikke held forudsige kræft prognoser i alle fem datasæt. Men BRmet50 var entydigt i stand til væsentligt at differentiere tumorprøver i to prognostiske grupper i alle fem validering sæt. Den prognostiske værdi af BRmet50 var større end hver af de etablerede risikofaktorer (tabel S5). For eksempel optimale ukorrigerede hazard ratio (HR) (høj risiko vs lav risiko) i BR1128 var 2,8 (95% CI: 1,5-4,9; p 0,001) (BRmet50 kontrol), 1,9 (95% CI: 1,1-3,3; p = 0,01) (BRmet70), 2,0 (95% CI: 1,1-3,5; p = 0,02) (BRmet76), og 2,2 (95% CI: 1,6-2,9; p 0,01) (NPI), hhv. Dataene antydede, at BRmet50 var mere effektive til at forudsige tilbagefald overlevelse i BR1042, BR1141, og GSE7390 og sygdomsfri overlevelse i BR1095 og BR1128 end etablerede prognostiske faktorer.

blev brugt Multivariate Cox proportional-farer analyse at afgøre, om BRmet50, BRsig70 eller BRsig76 tilsat uafhængig prognostisk information til andre standard klinisk-patologiske træk. I denne multivariat Cox proportional-farer analyse (tabel 5), signifikante sammenhænge (

s

0,05) blev observeret i alle fem test datasæt mellem BRmet50 og patient tilbagefald-fri eller sygdomsfri tid efter justering for standard kliniske kovariater. Således BRmet50 bidrog nye og vigtige prognostiske oplysninger, der gives af etablerede kliniske prædiktorer. For det meste, BRsig70 og BRsig76 viste ingen signifikante associationer i disse analyser.

Predictive Power of BRmet50 i andre kræfttyper

Fordi BRmet50 held forudsagde brystkræft prognose og fordi nogle molekylære onkogene begivenheder er konserveret blandt flere typer kræft [34], vi hypotese, at BRmet50 kan repræsentere en bevaret transkriptionel profil for dårlig prognose i flere typer kræft.

for at undersøge den prognostiske specificitet BRmet50, vi undersøgt, om BRmet50 kunne forudsige prognosen i andre epiteliale cancere, såsom colon-, lunge-, eller prostatacancer. Tre datasæt, en for hver cancertype: tyktarmskræft (n = 73) [35], lungecancer (n = 441) [36], og prostatacancerpatienter (n = 596) (tabel 6) [37] blev underkastet univariate og multivariate analyser. På grundlag af genekspression signaturer (BRsig70, BRsig76 eller BRmet50), blev 1.110 patientprøver adskilt i to grupper (tabel 6). Alle tre underskrifter undladt at forudsige kræft tilbagefald i tyktarmskræft [35] (s 0,05). Men BRmet50 men hverken BRsig70 eller BRsig76 held forudsagde sygdomsspecifikke overlevelse i prostatakræft og tilbagefald overlevelse i lungekræft (

s

0,01), hvilket tyder på, at transkriptionelle profiler for dårlig prognose kan være mere bevaret i bryst-, lunge-, og prostatakræft. I lungekræft datasæt, de gode prognose grupper forudsagt af BRmet50 havde den højeste tilbagefald overlevelse ( 40% og

s

0,01) blandt de 3 underskrifter. Vi bestemt også, om sammenhængen mellem de tre underskrifter og de kliniske resultater hos patienter med prostata-, lunge- og tyktarmskræft var uafhængig af etablerede kliniske og patologiske kriterier (tabel 6). Resultaterne tyder på, at BRmet50 kunne tjene som en prognostisk biomarkør for både brystkræft og ikke-brystkræft og kan repræsentere en bevaret transkriptionel profil mellem flere typer kræft.

Diskussion

Data genereret af højt gennemløb transkriptionelle studier af kræft har hurtigt oparbejdet, og der er stigende interesse for at omsætte denne information i kliniske værdi. Selvom single-forsøgsanalyse kan være oplysende, er det ofte påvirket af iboende begrænsninger. Disse begrænsninger kan overvindes ved at kombinere relaterede uafhængige undersøgelser i en meta-analyse. Vores undersøgelse viste, at heterogene underskrifter fra de enkelte studier kræft systematisk kan organiseres i en meta-signatur (BRmet50) baseret på deres iboende data ligheder med en ny metaanalyse strategi (iterativ ophøje). Denne meta-analyse tilgang kan øge statistisk styrke, minimere falsk opdagelse, reducere batch effekter, og forbedre generaliserbarhed af resultaterne.

Be the first to comment

Leave a Reply