PLoS ONE: Discovery og Validering af en prostatakræft Genomisk Classifier der forudsiger Early Metastase efter radikal prostatektomi

Abstrakt

Formål

Clinicopathologic funktioner og biokemiske gentagelse er følsomme, men ikke specifikke, indikatorer for metastatisk sygdom og dødelig prostatakræft. Vi hypotesen, at en genomisk udtryk signatur påvist i den primære tumor repræsenterer sande biologiske potentiale aggressiv sygdom og giver forbedret forudsigelse af tidlig prostatakræft metastaser.

Metoder

En indlejret case-kontrol design blev anvendt at vælge 639 patienter fra Mayo Clinic tumor registreringsdatabasen, der undergik radikal prostatektomi mellem 1987 og 2001. En genomisk sorterer (GC) blev udviklet ved at modellere forskellen RNA udtryk ved hjælp 1,4 millioner har high-density udtryk arrays af mænd beriget for stigende PSA efter prostatektomi, Inklusive 213, der oplevede tidligt klinisk metastaser efter biokemisk recidiv. Et træningssæt blev brugt til at udvikle en tilfældig skov klassificeringen af ​​22 markører til at forudsige for sager – mænd med tidlig klinisk metastase efter stigende PSA. Udførelse af GC blev sammenlignet med prognostiske faktorer såsom Gleason score og tidligere genekspression signaturer i et tilbageholdt validering sæt.

Resultater

Expression profiler blev genereret fra 545 unikke patientprøver, med median føl- op på 16,9 år. GC opnåede et område under modtageren opererer karakteristiske kurve på 0,75 (0,67-0,83) i validering, udkonkurrerer kliniske variable og gen-signaturer. GC var den eneste signifikante prognostiske faktor i multivariable analyser. Inden Gleason score grupper sager med høj GC scoringer oplevet tidligere død af prostatakræft og reduceret samlet overlevelse. De markører i klassificeringen viste sig at være forbundet med en række centrale biologiske processer i prostatakræft metastatisk sygdomsprogression.

Konklusion

En genomisk klassifikatør blev udviklet og valideret i et stort patient kohorte beriget med prostatakræft metastase patienter og en stigende PSA, der gik på at opleve metastatisk sygdom. Denne tidlige metastase forudsigelse model baseret på genomisk ekspression i den primære tumor kan være nyttige til identifikation af aggressiv prostatakræft

Henvisning:. Erho N, Crisan A, Vergara IA, Mitra AP, Ghadessi M, Buerki C, et al. (2013) Discovery og Validering af en prostatakræft Genomisk Classifier der forudsiger Early Metastase efter radikal prostatektomi. PLoS ONE 8 (6): e66855. doi: 10,1371 /journal.pone.0066855

Redaktør: Chad Creighton, Baylor College of Medicine, USA

Modtaget: Februar 4, 2013; Accepteret: 10 maj 2013; Udgivet: 24 juni 2013

Copyright: © 2013 erho et al. Dette er en åben adgang artiklen distribueres under betingelserne i Creative Commons Attribution License, som tillader ubegrænset brug, distribution og reproduktion i ethvert medie, forudsat den oprindelige forfatter og kilde krediteres

Finansiering:. Denne undersøgelse blev delvist understøttet af National Research Council of Canada, industriel forskning Assistance Program (https://www.nrc-cnrc.gc.ca/eng/irap/index.html), og Mayo Clinic prostatakræft SPORE P50 CA91956 ( PI:. Donald Tindall ph.D.) de finansieringskilder havde ingen rolle i studie design, indsamling og analyse af data, beslutning om at offentliggøre, eller forberedelse af manuskriptet

Konkurrerende interesser: forfatterne har læst tidsskriftets politik og har følgende konflikter: NE, AC, IV, MG, CB, ZH, BZ, TS, TT, og ED er medarbejdere i GenomeDx Biosciences Inc. ED og TT eget lager i GenomeDx Biosciences Inc. ED har modtaget forskningsstøtte fra GenomeDx Biosciences Inc. og National Research Council – Industrial Research Assistance Program. PB har modtaget forskningsmidler fra GenomeDx Biosciences Inc. GK har modtaget forskningsmidler fra Beckman Coulter. KB, EB, RC, SF, RK, RJ, og TK har erklæret, at der ikke findes konkurrerende interesser. Dette ændrer ikke forfatterne overholdelse af alle de PLoS ONE politikker om datadeling og materialer.

Introduktion

Over 240.000 mænd er diagnosticeret med prostatakræft i USA hvert år, og et flertal af dem harbor lokal eller regional sygdom, hvor den langsigtede prognose er fremragende [1]. Omkring halvdelen af ​​disse mænd undergår radikal prostatektomi (RP) og næsten 40% vil præsentere med en eller flere clinicopathologic funktioner såsom høj Gleason score (GS), ekstra-kapsulær forlængelse (ECE), positive kirurgiske margener (SM +), sædblæren invasion (SVI) eller lymfekirtelinvolvering (N +), der er forbundet med forøget risiko for klinisk metastase [2] – [4]. Selv om kun et mindretal af disse mænd er virkelig i fare for at dø af deres kræftsygdom [5], mange af disse “klinisk høj risiko” patienter vil modtage yderligere postoperative indgreb (fx adjuverende stråling) og ofte lider behandling sygelighed. Omvendt er mange mænd præsentere uden negative kliniske træk og alligevel dø af prostatakræft. Aktuelle værktøjer har begrænset kapacitet til at identificere, på tidspunktet for RP, mænd, der er mest udsatte for metastaser og prostatakræft død – sådanne patienter er i øjeblikket behandles aggressivt efter observation af stigende PSA (Prostata Specifikt Antigen) eller biokemisk recidiv (BCR) . Nylige kliniske forsøg tyder på, at disse patienter sandsynligvis ville have mere gunstige resultater, hvis de behandles tidligere post-RP [6] – [10]. Således begrænset ydeevne af kliniske faktorer for at forudsige mænd størst risiko for metastaser fører til forhastede patientbehandling.

I det sidste årti, mange undersøgelser har forsøgt at løse det udækket behandlingsbehov til at forudsige aggressiv prostatakræft ved hjælp individ biomarkører eller genekspression signaturer [11] – [30]. Imidlertid har disse tidligere indsats ikke set udbredt implementering i klinisk praksis, fordi ingen overbevisende har vist forbedret forudsigelse løbet etablerede kliniske faktorer, såsom GS. Dette er primært på grund af begrænsninger i prøvestørrelse og magt, den langvarige kliniske opfølgning forpligtet til at overholde metastatisk eller dødelige prostatacancer begivenheder og brugen af ​​BCR som et surrogat endpoint; en følsom, men ikke-specifik, prædiktor for sygdomsprogression [31]. Således fleste biomarkør undersøgelser dårligt prøve klinisk bevist aggressive prostatakræft tilfælde. Desuden blev de fleste genekspression signaturer udviklet med analyser, der krævede friske eller frosne væv, som ikke sædvanligvis kan i klinisk praksis, og var begrænset til profilering protein-kodende gener – undersøger kun et mindretal af den aktive genom (dvs. transkriptom) . I en tidligere rapport opnåede vi arkiverede formalin-fikseret paraffin indstøbt (FFPE) primær prostatakræft prøver fra Mayo Clinic tumor registreringsdatabasen, der omfattede et stort antal patienter, der udviklede metastatisk sygdom. Ved langvarig opfølgning vi konstateret en biomarkør signatur, der kunne identificere mænd i risiko for progression til klinisk metastase og dødbringende prostatacancer [20]. Men i validering vi ikke vise en væsentlig forbedring på præstationen i forhold til kliniske variable og vi hypotese, at dette kan skyldes den begrænsede fokus på et sæt på omkring 1.000 protein-kodende gener.

Her vi udvider på dette arbejde ved at re-profilering patienterne i den oprindelige undersøgelse udnytte en høj densitet transkriptom-wide mikroarray, der vurderer ekspressionen af ​​over 1,4 millioner RNA funktioner, herunder de ~22,000 kendt protein-kodende gener samt mange tusinde ikke-kodende RNA. Sådanne ikke-kodende RNA’er nu anerkendt for deres evne til at regulere aktiviteten af ​​onkogener og tumorsuppressorgener, der er involveret i udviklingen af ​​recidiv og metastatisk progression [32], [33]. Vi præsenterer udvikling og validering af en genomisk sorterer (GC) for risiko forudsigelse af tidlig klinisk metastaser, der er beriget i ikke-kodende RNA. Vi viser, at GC yder uafhængig og statistisk signifikant prognostisk information ud over clinicopathologic variabler og vise, at GC tidligere hæver sig rapporteret gen signaturer.

Materialer og metoder

patientgrupper, og kliniske resultater

Patienter fra denne undersøgelse blev udvalgt ved hjælp af et nested case-control design fra Mayo Clinic radikal prostatektomi Tumor Registry, som tidligere [20] beskrevet. Kort fortalt, blev patienter, der fik radikal prostatektomi (RP) for primær prostataadenocarcinom som første linie behandling på Mayo Clinic Comprehensive Cancer Center mellem 1987 og 2001 med tilbagevirkende kraft klassificeret i følgende effektmål grupper:

Ingen tegn af sygdom (NED) progression gruppe

:. udviste ingen biokemiske eller andre kliniske tegn på sygdomsprogression efter RP, med mindst 7 års opfølgning

Prostata-specifikt antigen (PSA) -recurrence gruppe

: Erfaren biokemisk recidiv (BCR), defineret som to på hinanden følgende stigninger i PSA målinger over 0,02 ng /mL (med efterfølgende foranstaltning 0,05 ng /mL over den første måling) uden påviselig klinisk metastaser (se nedenfor) inden for 5 år fra BCR

Klinisk metastase gruppe (metastaser)

:. Erfaren BCR og udviklet regionale eller fjernmetastaser, bekræftet ved knogle eller CT-scanning, inden for 5 år fra BCR. Denne gruppe blev omtalt som Systemisk Progression (

SYS

) i vores tidligere undersøgelse [20].

I alt 213 patienter mødte definitionen af ​​metastaser gruppe og blev betegnet som sager [20]. For hvert tilfælde blev en patient hver fra PSA og NED grupper udvalgt på grundlag af de matchende kriterier tidligere beskrevne [20] og blev betegnet som kontroller.

Etik erklæring.

Denne undersøgelse blev godkendt af Institutional Review Board of Mayo Clinic og på grund af den arkivers karakter af prøverne, patient samtykke blev fastsat af bestyrelsen.

RNA Extraction og Microarray hybridisering

fra den oprindelige undersøgelse (n = 639 ), RNA var tilgængelig for microarray fra 545 unikke patienter. Som tidligere beskrevet, efter histopatologisk fornyet gennemgang af en ekspert urogenital patolog, blev tumoren macrodissected fra omgivende stroma fra 3-4 10 um vævssnit fra den primære Gleason grad af indekset læsion (den højeste patologisk GS) for total RNA-ekstraktion [20 ]. Totalt RNA blev underkastet amplifikation under anvendelse af WT-Ovation FFPE v2 kit sammen med Exon Module (NuGen, San Carlos, CA) ifølge producentens anbefalinger med mindre modifikationer. Forstærkede produkter var fragmenteret og mærket med anvendelse af Encore Biotin Module (NuGen, San Carlos, CA) og hybridiseret til human Exon 1.0 ST GeneChips (Affymetrix, Santa Clara, CA) efter producentens anbefalinger. Menneskelig Exon GeneChips profil kodende og ikke-kodende regioner af transkriptomet bruger cirka 1,4 millioner sonde valg regioner (PSR), i det følgende benævnt funktioner.

Microarray Processing

Microarray kvalitetskontrol.

af de 545 patienter med tilgængelige væv og RNA, mislykkedes i alt 59 prøver indledende QC (som vurderet af Affymetrix Power Tools AUC metrisk [34]) og blev re-run. Desuden blev en PC3 cellelinje (ATCC, Manassas, VA) kontrol køres med hver batch og anvendes til at identificere upålidelige funktioner (se nedenfor). Menneskekroppen Exon array-data svarende til denne undersøgelse er tilgængelige fra National Center for Biotechnology Informations Gene Expression Omnibus database (GSE46691).

Microarray Normalisering, Fjernelse af Upålidelige Funktioner og Batch Effect Korrektion

Feature sammendrag og normalisering af ekspressions-værdier blev udført ved frossen robust multi-array analyse (fRMA; [35]), som er tilgængelig via BioConductor. En brugerdefineret sæt af frosne vektorer blev genereret ved tilfældigt at udvælge 15 arrays fra hver af de 19 portioner over hele undersøgelsen. Features forhørt med færre end fire prober eller nogen cross-hybridiserende prober (som defineret af Affymetrix) blev fjernet (https://www.affymetrix.com). Variansen af ​​funktionen udtryk værdierne på PC3 cellelinier blev brugt til at måle tekniske versus biologiske variabilitet. Funktioner med den højeste 10% varians i PC3-cellelinjer blev fjernet fra udtrykket matrix. Endelig for at vurdere og fjern batch virkning blev data opdeles i de hovedkomponenter og blev brugt en variansanalyse model. Som foreslået af en tidligere undersøgelse [36], blev de første 10 hovedkomponenter undersøgt for deres korrelation med batch effekt. Fra disse 10 hovedkomponenter (fange 31% af den samlede varians), blev de to komponenter, der var mest korreleret med batch effekt fjernet.

Definition af uddannelse og validering sæt, Feature Valg og Genomisk Classifier Development

Uddannelse og validering sæt.

Efter at have vurderet de molekylære forskelle mellem de tre patientgrupper, blev observeret meget begrænset forskellen udtryk mellem NED og PSA-recidiv grupper. Differentiel udtryk for individuelle træk blev opnået gennem parvise sammenligninger af resultaterne grupperne (Crisan et al., Manuskript under udarbejdelse). Ved en tærskel på 1,5 fold-ændring (efter korrektion for falsk-discovery), kun to (ud af ~1.4 millioner) funktioner blev anset for at være udtrykt forskelligt mellem NED og PSA-grupper, i forhold til 1186 og 887 i metastase resultater i forhold til NED og BCR-eneste grupper, henholdsvis [37]. Derfor og for at udvikle en signatur, der forudsiger tidlige kliniske metastase, disse to grupper blev kombineret i en enkelt kontrolgruppe. Tildelingen af ​​patienter i uddannelse (n = 359) og validering (n = 186) blev som defineret i vores tidligere undersøgelse [20].

Feature udvælgelse.

I betragtning af det oprindeligt stort antal funktioner (~1.4 mio) blev hver funktion filtreret med en t-test (p 0,01) til kompleksitet reduktion på træningssættet (fig S1). Features blev yderligere undersøgt i efterfølgende selektionstrin. At identificere robuste funktioner, blev legaliseret logistisk regression anvendt [38], [39] med et elastisk net bøde på α = 0,5. Denne procedure blev bootstrapped 1.000 gange, og antallet af gange en funktion blev valgt af normaliseret regression blev optalt. Funktioner, der blev valgt mindst 25% af tiden blev brugt til klassificeringen udvikling.

Genomisk klassificeringen udvikling.

Et tilfældigt skov machine learning algoritme blev anvendt til at samle de valgte elementer i en sorterer [ ,,,0],40]. En endelig selektionstrin blev anvendt til at optimere funktionen indstillet på algoritme klassificering. Brug af rfcv funktion i randomForest pakke [41], mener den 10-fold krydsvalidering squared fejl (MSE) modeller med faldende antal funktioner blev plottet. I hver iteration, blev funktioner udelukket, hvis de havde den laveste 10% Gini Index. Funktioner, der viste lidt bidrag til gennemførelse af modellen blev ikke inkluderet i den endelige klassificeringen, holder de træk over knæet af MSE kurven (Figur S2). Med denne sidste feature sæt, den mtry og nodesize tilfældige skov parametre blev tunet med en nøjagtighed-optimere gitter søgning. Søgningen af ​​parameteren rummet blev forfulgt med tune.randomForest funktion i E1071 pakke [42]. Konkret træningssættet (bestående af 359 prøver) blev yderligere opdelt i 1/3 træning og 2/3 test og bruges med 1000 iterationer af bootstrapping at forbedre ydeevnen skøn og kontrol over-fitting. Den endelige genomisk klassifikator (GC) udlæser en kontinuerlig variabel score på mellem 0 og 1, hvor en højere score indikerer en højere sandsynlighed for klinisk metastaser.

Klinisk klassificeringen og integreret genomisk klinisk klassificeringen.

at benchmarke den prognostiske evne GC, vi udviklet en “klinisk-only” sorterer (CC), uddannet på de samme patienter, der anvendes til at opdage GC. CC kombinerer patologiske GS, præoperativ PSA (pPSA), SM +, SVI, ECE og N + bruger logistisk regression. Når lave patienter, CC producerer en score mellem 0 og 1, analogt med GC. Derudover for at måle det fælles prognostiske evne af de molekylære signatur og clinicopathologic variabler, blev en integreret genomisk-klinisk sorterer (GCC) konstrueret ved at kombinere CC og GC-modeller ved hjælp af logistisk regression.

Sammenligning Against Ekstern Biomarkør underskrifter

udførelsen af ​​GC blev sammenlignet med tidligere publicerede gen signaturer [11] – [13], [15], [16], [18] – [24], [28] – [30 ] og individuelle genomiske markører associeret med prostatacancer progression herunder CHGA [43], DAB2IP [44], GOLPH2 [45], PAP [46], ETV1 og ERG [47], KI-67 [48], PSA [49], PSCA [50], PSMA [51], AMACR [52], GSTP1 [53], PCA3 [54], B7-H3 [55], TOP2A [14] og CAV1 [56]. Hver genomisk markør og gen i underskrifterne blev kortlagt til dens tilknyttede Affymetrix

core

udskrift klynge (https://www.affymetrix.com/analysis/index.affx) hvis de foreligger, ellers

udvidet

udskrift klynge blev brugt. Baseret på fRMA sammenfattet udtryk værdier for de enkelte gener, blev underskrifterne modelleret i træningssættet anvendelse af et vilkårligt skov og tunet med

tune.randomForest

funktion fra E1071 R-pakken. Tuning involveret udfører en 20 med 20 gitter søgning for at finde den optimale “mtry” og “nodesize” modelparametre evalueret via validering 5-fold ind for at maksimere præcision.

Ydelse Vurdering af Klassificører og kliniske variable

statistiske analyser blev udført i R v2.14.1, og alle tests var to-sidet ved hjælp af en 5% signifikansniveau. Den prognostiske evne alle klassificører (GC, CC, GCC, og de eksterne biomarkør underskrifter) blev sammenlignet ved anvendelse arealet under ROC-kurver (AUC), boxplots diskrimination og univariable (UVA) logistisk regression. Betydningen af ​​klassificører forhold til klinisk information og uafhængig prognostisk evne blev sammenlignet ved hjælp af multivariable (MVA) logistisk regression.

Kliniske variable blev beregnet, kategoriseret eller transformeres som følger. GS blev dikotomiseret i grupper med tærskelværdien på ≥8; selvom konventionen er at adskille GS i tre grupper (≤6, 7, ≥8) den relative mangel på patienter med GS≤6 foranledigede dichotomization af GS. Den pPSA, målt umiddelbart før RP, var log

2-forvandlet. Følgende variabler blev binær: ECE, SVI, SM +, og N +. Hormon og strålebehandling blev inkluderet som særskilte binære kovarianter hvis den gives i en adjuvans ( 90 dage efter RP) indstilling eller bjærgning (efter PSA stigning). Behandlinger efter klinisk metastaser blev ikke inkluderet.

Baseret på en flertalsstyre kriterium, blev patienter med GC, CC og GCC scoringer større end 0,5 klassificeret som høj risiko mens dem med en score mindre end eller lig end 0,5 blev klassificeret som lav risiko. Kaplan Meier-overlevelseskurver blev genereret for prostatakræft dødelighed (PCSM) og samlet overlevelse endpoints. Endelig blev der rapporteret alle opfølgende gange ved hjælp af metoden beskrevet af Korn [57].

Resultater

Kliniske Karakteristik af Study Befolkning

Fra studiet befolkning på 639 patienter [20], 545 (85%) svarende til 192 tilfælde og 353 kontroller havde tilgængelige RNA og lykkedes hybridiseret til microarrays til analyse (se metoder). Den mediane alder af mænd i denne undersøgelse er 66 (IQR: 61-70) år, med en median på 16,9 år follow-up. De kliniske karakteristika for disse patienter er beskrevet i tabel 1. Samlet set 60% af tilfældene (116/192) havde GS ≥8 med kun seks GS ≤6, mens kontroller var overvejende GS 7 (57%) og GS ≤6 (16 %). En lignende andel af begge tilfælde og kontroller, (49% og 45%, henholdsvis) var patologisk stadium T3 /4. Controls havde 47% T2 sygdom (i modsætning til 27% for sager), og 23% af tilfældene var N +, i modsætning til kun 8% for kontrol. En lidt højere SM + blev observeret i de tilfælde (54%) i forhold til kontrol (46%). Som forventet i betragtning af undersøgelsens design, den gennemsnitlige tid til BCR var meget ens mellem tilfælde (2,3 år) og PSA kontroller (1,7 år). Mens der var 21 kliniske metastase begivenheder blandt kontroller, disse skete med en median på 9,39 (IQR: 7.5-10.95) år, mens sager oplevet meget hurtigere begivenheder med en median på 5,47 (IQR: 3.7-8.14) år efter RP. Samlet set gennemsnitlige tid til PCSM (n = 132) var 10,5 år. For at karakterisere den sande biologiske potentiale af tumorer fra patienter, som fremskridt tidligt at klinisk metastaser efter stigende PSA, vi udførte transkriptom hele forskellen ekspressionsanalyse at teste hypotesen om, at et udtryk signatur i primære tumorer bedre kunne forudsige klinisk metastase end kliniske variable alene .

udvikling af modeller til at forudsige tidligt klinisk Metastase

Cases og kontroller blev sammenlignet og anvendes til udvikling af en genomisk (GC), klinisk-only (CC) og integreret ( GCC) klassificeringen modeller til forudsigelse tilfælde (dvs. tidlig klinisk metastaser efter stigende PSA) som det primære endpoint (se metoder). De 545 prøver blev tildelt uddannelse (n = 359, 39% tilfælde) og validering (n = 186, 37% tilfælde) sæt (figur 1). GC blev udviklet fra analyse på 1,1 millioner RNA funktioner på microarray i uddannelsen sæt efter fjernelse af cross-hybridiserende og upålidelige funktioner (se metoder). Et indledende træk udvælgelse skridt baseret på t-tests for reduktion kompleksitet gav 18,902 differentielt udtrykte funktioner mellem cases og kontroller (Figur S1). Yderligere udvalg af disse differentielt udtrykte funktioner ved legaliseret logistisk regression reduceret listen til i alt 43. Som et sidste skridt blev disse 43 differentielt udtrykte funktioner yderligere filtreret til kun dem, der demonstrerede for at forbedre en tilfældig skov-baserede metrisk (se metoder ). Dette resulterede i et endeligt sæt 22 markører, der svarer til RNA’er fra kodende og ikke-protein-kodende regioner af genomet (tabel 2). Multidimensional skalering analyse viser gruppering af sager og kontroller baseret på ekspressionen af ​​de 22 markører (Figur 2). En tilfældig skov maskine-learning algoritme blev anvendt til at generere GC scorer efter samling af 22 markører med parametre skov at optimere for højeste nøjagtighed i træningssættet. Logistisk regression blev anvendt til at samle de seks clinicopathologic risikofaktorer i en CC og også integreret med GC til at bygge en GCC.

Undersøgelse opdeling i sager og kontroller. Uddannelse og validering sæt er vist.

Controls er angivet i blåt og sager i rødt. I både træning og validering sætter kontrol tendens til at klynge på venstre side af plottet, og sagerne til højre af plottet. På denne måde er de fleste af de biologiske forskelle udtrykt i den første dimension af skaleringen. nærhed Tilfældig skov [https://www.stat.berkeley.edu/~breiman/] blev anvendt til at måle 22 markør afstanden mellem prøverne.

Classifier Performance i træning og validering Set

i træningssættet, ROC areal under kurven (AUC) værdier for GC, CC og GCC var 0,90, 0,76 og 0,91 henholdsvis højere end nogen individuel klinisk variabel (figur 3). I valideringen sæt, GC og GCC havde den højeste AUC på 0,75, og 0,74, henholdsvis til at forudsige sager. Den kliniske kun CC havde en AUC på 0,69, hvilket kun var marginalt bedre end patologiske GS alene (0,65). Formen af ​​ROC kurver for GC og GCC viser, at disse modeller har den højeste specificitet og følsomhed sammenlignet med kliniske modeller over en tærskel på -50% specificitet (figur S3). Diskrimination box plots viser endvidere større median forskelle i GC og GCC score mellem cases og kontrol end for CC (figur 4).

For hver indikator, AUC opnået i uddannelses- og validering sæt, samt 95 % konfidensinterval for denne metrik vises. CC: klinisk kun klassificeringen. GC: genomisk klassifikator. GCC:. Kombineret genomisk-klinisk klassificeringen

Udlodning af scoringer er plottet for A) CC B) GC og C) GCC om kontrol- og sager. Median scores og 95% konfidensintervaller er repræsenteret ved en vandret sort streg og hak hhv. Ikke-overlappende hak indikerer, at forskelle i fordelingen af ​​score mellem cases og kontroller er statistisk signifikant. Outliers er repræsenteret som punkter ud over boxplot whiskers.

GC Reklassifikation af GS Grupper

Fordelingen af ​​sager og kontroller i valideringen indstillet af både GC og GS [58] risikogrupper er illustreret i figur 5 og opsummeret i tabel 3. blandt GS ≤ 6 tumorer (n = 18) ingen havde høje GC scores, mens der blandt GS 7 tumorer (n = 97), næsten en tredjedel (29%) havde høj GC scores og halvdelen af ​​disse var sager, der udviklede tidligt metastaser efter stigende PSA. Mens de fleste patienter med høje GS (≥8) havde høje GC scores, blandt de 29 (40%) med lav GC scoringer var der kun 7 tilfælde med 3 dødsfald fra prostatacancer. Samlet, 116 ud af 186 (62%) validering sæt patienter havde lave GC scoringer, hvoraf kun 21 var tilfælde med 7 dødsfald fra prostatakræft. Blandt de 70 (38%) patienter med for højt GC scoringer var der 42 tilfælde og 25 af disse mænd døde af prostatakræft.

GC scores plottes med en jitter, således at lettere differentiere patienter blandt hver patologiske GS (x-aksen) grupper. Case (rød) og kontroller patienter (blå) er vist for hver kategori. Den stiplede sorte linie angiver GC cutoff på 0,5. Tendenser viser patienter med højt GC scoringer tendens til at have høje GS så godt.

GC er en uafhængig Prognostisk Variabel

For at teste for effekten størrelsen af ​​individuelle variabler samt afhængigheder mellem disse variabler vi udførte univariable og multivariable analyser ved hjælp af logistisk regression på validering sæt (tabel 4). I univariable analyse fandt vi GC, CC, GCC, GS, SVI og ECE at være statistisk signifikante prædiktorer for sager (p 0,05). Odds ratio for GC var 1,42 for hver forøgelse af GC score 10%. Når dikotomiseret i lave og høje GC risikogrupper, som beskrevet ovenfor, odds ratio var 6,79 (95% CI: 3,46-13,29), mere end det dobbelte af odds ratio på GS (OR: 3,02 (95% CI: 1,61-5,68) ) til forudsigelse tilfælde. I multivariable analyse, efter justering for post-RP behandling, GC forblev den eneste signifikante prognostiske variable (p 0,001) med en OR på 1,36 for hver stigning i GC score 10%. Den uafhængige betydning af GC tyder på, at en mere direkte mål for tumor biologi (dvs. 22-markør ekspressionssignatur) tilfører betydelig prognostisk information til forudsigelse af tidlig metastase efter stigende PSA, som ikke opfanges af de kliniske variable tilgængelige fra patologisk analyse.

sager med High GC Scores Die Tidligere fra prostatakræft og andre årsager

Vi næste sammenlignede overlevelse resultater af sager og kontroller i Kaplan-Meier analyse af lave og høje GC score grupper. Sager med lavere GC scoringer havde en median 6,9 år prostata-cancer specifik overlevelse sammenlignet med median 2,9 år for sager med høje GC scores (p = 0,003) (Figur 6). For total overlevelse, var der en signifikant (p = 0,03) forskel i resultatet, med median samlet overlevelse efter metastaser på 2,5 og 4,98 år i sager med høje og lave GC scoringer, henholdsvis. Blandt alle kontroller, 21 patienter udviklede klinisk metastase uden af ​​undersøgelsens case-kontrol definitioner (dvs. 5 år efter stigende PSA). Vi vurderet, om GC var i stand til at adskille patienter, der havde sent forekommende metastase begivenheder blandt PSA kontroller (figur S4). GC var i stand til signifikant (p 0,05) adskille de PSA patienter, der ville gå på at opleve senere klinisk metastase, fra dem, der ikke gjorde. Denne forskel i resultaterne styrker forestillingen endvidere, at GC foranstaltninger en komponent af det biologiske potentiale for metastase, og at disse patienter med de højeste GC scoringer kan være mest udsatte for tidlig metastatisk progression post-RP.

Sager var adskilt i høj ( 0,5) eller lav risiko ifølge GC score. Log-rank p-værdier er vist i øverste højre hjørne. Tid til PCSM og OS måles fra BCR i år.

sammenligninger til eksterne biomarkør signaturer

For at sammenligne effektiviteten af ​​GC til tidligere rapporterede gen underskrifter, vi samlet generne forbundet til eksterne signaturer og kombineret dem i en Random Forest sorterer (se metoder). Desuden evalueres vi ekspressionen af ​​enkelte gener tidligere er rapporteret at være forbundet til prostatakræft resultater. Udførelsen af ​​de klassificører og de enkelte gener blev efterfølgende vurderet i både uddannelse og validering sæt (figur 7 og S5). Som forventet, vi observerer høje AUC i uddannelse for næsten alle de eksterne underskrifter, svarende til, hvad der blev observeret med GC. Når de anvendes til validering, AUC for hver model faldet. Blandt de 17 eksterne underskrifter, der blev modelleret, 12 var statistisk signifikante prædiktorer for metastaser (dvs. gjorde deres konfidensintervaller 95% ikke falde under en tærskel tilfældig chance AUC på 0,5) (Figur 7). AUC GC var 0,08 procentpoint højere end den mest effektive eksterne signatur, 16-genet signatur rapporteret af Bibikova et al [12], som havde en AUC på 0,68 (95% CI: 0,60-0,76,). I modsætning til de udtryk signatur modellerne, testet udførelsen af ​​de 16 enkelte gener forventedes at være ens i de uddannelses- og validering sæt. Disse genomiske markører viser en samlet aftale i ydeevne, med forskelle i betydning sandsynligvis forklares ved mindre stikprøve af valideringen sættet i forhold til træningssættet (Figur S5). Af de 16 genomiske markører, kun B7-H3 (CD276), GSTP1 og PCA3 var statistisk signifikant i både træning og validering sæt (Figur S5). Igen, ingen af ​​de enkelte genomiske markører udkonkurrerer GC eller de mest effektive kliniske prædiktor, GS (AUC ≤0.64).

For hver signatur, institutionen er forbundet til det, udgivelsesår, ledende forfatter, AUC opnået i uddannelse og validering sæt, samt 95% konfidensinterval for denne metrik vises.

diskussion

denne undersøgelse blev designet til at teste hypotesen om, at biologisk vurdering af både kodende og ikke-kodende udtryk profiler i primære tumorer kan forudsige udviklingen af ​​tidlig klinisk metastaser efter BCR. Vi opdagede en 22-markør genomisk sorterer (GC), at uden offer følsomhed, var mere specifik i validering end etablerede prognostiske faktorer såsom GS. Baseret på resultaterne præsenteret her, GC måler en bestanddel af det biologiske potentiale for tidlig klinisk metastase bedre end kliniske variabler eller tidligere rapporterede biomarkør signaturer.

Be the first to comment

Leave a Reply