Abstrakt
Baggrund
Mange mænd udvikler en stigende PSA efter initial behandling for prostatakræft. Mens nogle af disse mænd vil udvikle en lokal eller metastatisk recidiv som berettiger yderligere behandling, andre vil ikke have nogen tegn på sygdomsprogression. Vi antager, at et udtryk biomarkør panel kan forudsige hvor mænd med en stigende PSA ville drage fordel af yderligere behandling.
Metodologi /vigtigste resultater
En case-kontrol design blev brugt til at teste sammenslutning af gen ekspression med resultatet. Systemisk (SYS) progression tilfælde var mænd efter prostatektomi som udviklede systemisk progression inden for 5 år efter PSA recidiv. PSA progression kontroller blev matchet mænd efter prostatektomi med PSA recidiv, men ingen beviser for klinisk progression inden for 5 år. Anvende ekspressionsvektorer arrays optimeret til paraffinindlejret væv RNA blev 1021 cancerrelaterede gener evalueret-herunder 570 gener impliceret i prostatakræft progression. Gener fra 8 tidligere rapporterede markør paneler blev medtaget. En systemisk progression model indeholdende 17 gener blev udviklet. Denne model genereret en AUC på 0,88 (95% CI: 0,84-0,92). Lignende AUC’er blev dannet ved anvendelse 3 tidligere rapporterede paneler. I sekundære analyser, modellen forudsagde endepunkter prostatakræft død (med SYS tilfælde) og systemisk progression over 5 år (i PSA kontroller) med hazard ratio 2.5 og 4.7, henholdsvis (log-rank p-værdier på 0,0007 og 0,0005). Gener mappet til 8q24 signifikant beriget i modellen.
Konklusioner /Betydning
specifik genekspression mønstre er signifikant associeret med systemisk progression efter PSA recidiv. Målingen af genekspression mønster kan være nyttige til at bestemme, hvor mænd kan drage fordel af yderligere behandling efter PSA recidiv
Henvisning:. Nakagawa T, Kollmeyer TM, Morlan BW, Anderson SK, Bergstralh EJ, Davis BJ, et al . (2008) En Tissue Biomarkør Panel Forudsigelse Systemisk Progression efter PSA Gentagelse Post-Definitive prostatakræft Therapy. PLoS ONE 3 (5): E2318. doi: 10,1371 /journal.pone.0002318
Redaktør: Anja-Katrin Bielinsky, University of Minnesota, USA
Modtaget: December 27, 2007; Accepteret: 12 marts 2008; Udgivet: 28. maj 2008
Copyright: © 2008 Nakagawa et al. Dette er en åben adgang artiklen distribueres under betingelserne i Creative Commons Attribution License, som tillader ubegrænset brug, distribution og reproduktion i ethvert medie, forudsat den oprindelige forfatter og kilde krediteres
Finansiering:. Denne forskning blev støttet af P50 CA91956 Mayo prostatakræft SPORE tilskud fra NIH, og Richard M. Schulze Family Foundation. Det blev også støttet af Minnesota Department of Employment og økonomisk udvikling fra statens lovgivende reserve til Minnesota partnerskab for Bioteknologi og Medicinsk Genomics. Tohru Nakagawa blev delvist understøttet af en Grant-in-Støtte til tredje Term Omfattende 10-årig strategi for Cancer Kontrol fra Sundhedsministeriet, Labor og Velfærd Japan
Konkurrerende interesser:. Forfatterne har erklæret at der ikke findes konkurrerende interesser.
Introduktion
De fleste mænd med prostatakræft er nu diagnosticeret med kræft, der har en lav risiko for årsag dødelighed [1]. Disse mænd er normalt behandles med radikal retropubisk prostatektomi (RRP), strålebehandling ved ekstern bestråling, eller interstitiel brachyterapi og derefter efterfulgt af regelmæssige serum PSA evalueringer. I løbet af de næste 5 til 10 år, vil 15-30% af disse mænd udvikle en stigende PSA [2] – [6], der definerer en hastigt voksende befolkning af stor betydning klinisk og folkesundheden. Af denne PSA tilbagefald gruppe nogle mænd vil have lokalt recidiv eller har klinisk påviselig metastase, men mange vil ikke have nogen anden dokumentation for tilbagevendende andet end den stigende PSA prostatakræft. PSA “fordobling tid” er blevet identificeret som et potentielt surrogat for årsag dødelighed, og bruges af nogle klinikere til at bestemme, hvilke mænd med PSA tilbagefald fortjener adjuverende hormonal ablation, lokal strålebehandling, eller simpel observation [4] – [6 ]. Biomarkører, der forudsiger, hvilke af disse mænd ville nyde godt af enhver yderligere behandling er nødvendig
Storstilede genekspression studier af prostata kræft i forskellig kvalitet og scene er blevet udført af flere grupper [7] -. [16]. Disse udtryk undersøgelser har udnyttet arrays indeholder probe sæt på op til 35.000 gener. Mens disse undersøgelser er vigtige for biomarkør opdagelse, flere vanskeligheder udelukker deres oversættelse til en Klinisk indstilling. For det første er det sandsynligt, at mindre paneler vil blive anvendt klinisk. For det andet, fordi de tidligere undersøgelser kræves frosne materiale, hvis antallet af individer analyseret var begrænset. For det tredje, da uønskede kliniske hændelser i prostata cancer patienter kræver langvarig opfølgning, skal testmetoder gælde for arkivering paraffin-indlejret materiale. Endelig ingen af de tidligere undersøgelser var fokuseret på udviklingen af en biomarkør panel til at forudsige prostatakræft systemisk progression i fastsættelsen af PSA recidiv.
Brug af Mayo Clinic Radical Retropubic prostatektomi (RRP) Registry, vi designet en nested case-kontrol undersøgelse for at teste hypotesen om, at et begrænset sæt af RNA udtryk biomarkører kan forudsige, hvilke mænd med en stigende PSA efter RRP kunne drage fordel af yderligere klinisk intervention. Den Illumina DASL ™ udtryk microarray platformen blev valgt som biomarkør målemetoden, fordi den måler udtryk for gen-mål ved hjælp af paraffin væv [17] – [19]. Anvende ekspressionsvektorer data fra litteraturen og er afledt af vores eget forskningsprogram vi udviklet et begrænset sæt ekspressionsvektorer markører, der sandsynligvis ville blive ændret i association med prostatacancer progression. Panelet omfattede også udtryk biomarkører fra flere andre tidligere offentliggjorte paneler, der er forbundet med surrogater (høj Gleason score, høj patologisk stadie, eller metastatisk sygdom) for prostatakræft aggressivitet [12] – [16].
Vi rapporterer at array-baserede målinger viste fremragende korrelation med kvantitative RT-PCR målinger af paraffin-afledte RNA. Vi rapporterer også fremragende intra-array, inter-array og inden-genet reproducerbarhed. Vi beskriver derefter afprøvning og validering af en genekspression væv biomarkør panel til forudsigelse af prostatakræft systemisk progression efter en stigende PSA efter radikal prostatektomi. Vi sammenligne effektiviteten af vores panel med andre tidligere publicerede paneler. Endelig vil vi vise, at overekspression af gener kortlagt til kromosom bånd 8q24 er forbundet med prostatakræft systemisk progression.
Metoder
Gene Valg og Array Design for DASL ™ Assay
To Illumina DASL udtryk mikroarrays blev anvendt til forsøgene.
standarden kommercielt tilgængelige Illumina DASL udtryk microarray (Cancer Panel ™ v1), der indeholder 502 onkogener, tumorsuppressorgener og gener i deres tilknyttede veje. Otteoghalvfjerds af målene på det kommercielle arrayet er blevet associeret med prostatacancer progression.
En brugerdefineret Illumina DASL ™ ekspression microarray indeholdende 526 genmål for RNA’er, herunder gener, hvis ekspression er ændret i association med prostatacancer progression . Prober til brugerdefinerede DASL® panel designet og syntetiseret ved Illumina, Inc. (San Diego, CA).
Fire forskellige sæt af prostatakræft aggressivitet gener blev inkluderet i undersøgelsen (hvis generne ikke var til stede på cancer Panel v1 array, blev de medtaget i udformningen af den brugerdefinerede array):
Markører for prostatakræft aggressivitet identificeret ved en Mayo /University of Minnesota partnerskab [20]: udtrykket profiler af 100 laser-capture Mikrodissekterede prostatakræft læsioner og matchede normale og BPH kontrol læsioner blev analyseret ved hjælp af Affymetrix HG-U133 Plus 2,0 mikroarrays. Vurderet lister over betydeligt over- og under-udtrykte gener, der sammenligner 10 Gleason 5 og 7 metastaselæsioner til 31 Gleason 3 kræft læsioner blev genereret. De øverste 500 gener på denne liste blev sammenlignet med lister genereret fra tidligere udtryk microarray undersøgelser og andre markør undersøgelser af prostatakræft (se 2-4 næste). Efter denne analyse var der plads til 204 nye targets med potentiel forening med aggressiv prostatakræft på den brugerdefinerede array.
Markers forbundet med prostatakræft aggressivitet fra offentligt tilgængelige udtryk microarray datasæt (f.eks EZH2, AMACR, hepsin, PRLz, PRL3): Når vi designet array tilstrækkeligt store datasæt fra 9 forudgående microarray studier af prostatakræft med varierende kvaliteter og metastatisk potentiale [7] – [15] var tilgængelige fra Oncomine websted [21], [22], www.oncomine .org. Fra ordnede lister over disse data, vi har valgt 32 gener for optagelse på array
Tidligere offentliggjorte markører associeret med prostatacancer aggressivitet (fx PSMA, PSCA, Cav-1):. Expression microarray data er også blevet offentliggjort. Denne litteratur bedømtes for yderligere væv biomarkører. For eksempel, på tidspunktet for array design var vi i stand til at identificere 13 af høj kvalitet udtryk microarray studier af prostatakræft aggressivitet (Se tabel S1 og S2 for fuld referenceliste). Desuden blandt de 13 rapporter, 5 papers præsenteret 8 ekspression biomarkør paneler til at forudsige prostatakræft aggressivitet [12] – [16]. Når passende prober egnet til DASL kemi kunne være designet til disse paneler blev de optaget på den brugerdefinerede array. Vi identificerede også 12 artikler gennemgå gener forbundet med prostatakræft. Disse kriterier resulterede i udvælgelsen af 150 gener.
Markers stammer fra Mayo SPORE forskning (herunder gener og EST’erne mappet til 8q24). Ninety-tre ekstra biomarkører blev identificeret (se tabel S1 og S2).
Den brugerdefinerede vifte omfattede også probe sæt til 45 gener, der ikke forventedes at variere mellem case og kontrol grupper baseret på Mayo /University af Minnesota Partnerskab data. Tredive-otte af disse gener var også til stede på den kommercielle array (se tabel S1 og S2).
Efter at opremse de potentielt prostatakræft relevante gener på kommercielt tilgængelige kræft panel 570 potentielt prostatakræft relevante gener og 451 andre cancer-relaterede gener blev evalueret på tværs af begge arrays.
design af Indlejrede Case-Control Study
til dette studie vi stikprøven individer fra Mayo Clinic RRP Registry. Den indskrive består af en population af mænd, der har modtaget prostatektomi som deres første behandling for prostatakræft på Mayo Clinic (For en aktuel beskrivelse og brug af registreringsdatabasen, se reference [23]). Som systemisk progression er relativt sjældent, designet vi en case-kontrol undersøgelse indlejret i en kohorte af mænd med en stigende PSA. Mellem 1987-2001, inklusive, 9.989 tidligere ubehandlede mænd havde RRP på Mayo. På opfølgning, 2131 udviklet en stigende PSA ( 30 dage efter RRP) i fravær af samtidig klinisk recidiv. PSA stigning blev defineret som en opfølgning PSA = 0,20 ng /ml, med den næste PSA mindst 0,05 ng /ml højere eller indledning af behandling for PSA recidiv (for patienter, hvis opfølgning PSA var høj nok til at berettige behandling). Denne gruppe af 2.131 mænd omfatter den underliggende kohorte, hvorfra SYS tilfælde og PSA kontroller blev udvalgt.
Inden 5 år efter PSA stigning, 213 mænd udviklede systemisk progression (SYS sager), defineret som en positiv knoglescanning eller CT Scan. Af disse 100 mænd bukkede under for en prostatakræft-specifik død, 37 døde af andre årsager og 76 forbliver i fare.
PSA gentagelse kontroller (213) blev udvalgt fra de mænd uden systemisk progression inden for 5 år efter PSA stigning og blev matchet (1: 1) på fødselsår, kalenderår PSA stigning og indledende diagnostiske patologisk Gleason score ( = 6, 7 +). Tyve af disse mænd udviklede systemisk progression mere end 5 år efter første PSA stiger og 9 bukkede under for en prostatakræft-specifik død.
Et sæt af 213 Ingen tegn på sygdom (NED) Progression kontroller blev også valgt fra Mayo Clinic RRP Justitskontor 9.989 mænd og anvendes til nogle sammenligninger. Disse kontroller havde RRP fra 1987-1998 uden tegn på PSA stigning inden 7 års RRP. Den mediane (25
th, 75
percentil) opfølgning fra RRP var 11,3 (9,3, 13,8) år. De NED kontroller blev matchet til de systemiske progression sager om fødsel-år kalenderår RRP og indledende diagnostiske Gleason Score. Edb optimal matchning blev udført for at minimere den samlede “afstanden” mellem cases og kontroller i form af summen af den absolutte forskel i matchende faktorer [24].
Den aktuelle undersøgelse blev godkendt af Institutional Review Board of Mayo Clinic.
Block Identification, RNA Isolation, og Expression Analysis
listen over 639 sager og kontroller blev randomiseret. Der blev gjort forsøg på at identificere alle tilgængelige blokke (herunder tilsyneladende normale og unormale lymfeknuder) fra det randomiserede liste over 639 støtteberettigede sager og kontroller. Vedligeholdelse af randomisering, blev hver tilgængelig blok vurderet for væv indhold ved patologi gennemgang og blokken med den dominerende Gleason mønster kræft blev udvalgt til RNA isolering.
Fire frisk afskårne 10 um sektioner af FFPE væv blev afparaffiniseret og Gleason dominerende kræft fokus blev macrodissected. RNA blev ekstraheret under anvendelse af High Pure RNA Paraffin Kit fra Roche (Indianapolis, IN). RNA blev kvantificeret ved hjælp af ND-1000 spektrofotometer fra NanoDrop Technologies (Wilmington, DE). RNA’erne, herunder intra-plade og inter-plade replikater, blev fordelt på plader med 96 brønde i tilfældig rækkefølge til DASL analyse.
RNA-prøver blev forarbejdet, hybridiseret til Sentrix Universal 96-Arrays, scannet med BeadArray læser, og data behandles indledningsvis i BeadStudio ifølge producentens anvisninger. Microarray data er tilgængelige fra GEO-databasen (https://www.ncbi.nlm.nih.gov/geo/tiltrædelse nummer GSE10645).
For at vurdere nøjagtigheden af genekspressionsniveauer defineret af DASL teknologi vi udførte kvantitativ SYBR Green RT-PCR reaktioner for 9 udvalgte “mål” gener (CDH1, MUC1, VEGF, IGFBP3, ERG, TPD52, YWHAZ, FAM13C1, og Side4) og 4 almindeligt anvendte endogene kontrol gener (GAPDH, B2M, PPIA og RPL13a) i 384-brønds plader, med anvendelse af Prism 7900HT instrumenter (Applied Biosystems, Foster City, CA). 210 RNA-prøver med rigelige RNA fra gruppen af total 639 patienter blev analyseret. På grund af RNA mangel, blev kun 77 prøver analyseret for Side4. mRNA blev revers-transkriberet med SuperScript III First Strand Synthesis SuperMix (Invitrogen, Carlsbad, CA) under anvendelse af vilkårlige hexamerer. For hver af de ni gener undersøgt, blev cyklen tærskel (Ct) bestemt i tre eksemplarer og udtrykket blev normaliseret i forhold til det sæt af fire referencepunkter gener.
Patologi Anmeldelse
Gleason score i Registry Mayo Clinic RRP blev defineret som den oprindelige Gleason score. Da der har været ændringer i patologisk fortolkning af Gleason score over tid, en enkelt patolog (JCC) bedømte Gleason score på hver af de udvalgte til ekspressionsanalyse blokke. Denne kliniske variable blev defineret som den reviderede Gleason score.
Statistisk Metode
Indsamling af genekspression data blev forsøgt for de 623 patienter, som beskrevet i Resultater. Af disse var der 596 (n
SYS = 200, n
PSA = 201, n
NED = 195) patienter, for hvem oplysningerne er indsamlet, resten har undladt en eller begge udtryk paneler, som beskrevet i resultater. For at sikre udvælgelse af lignende uddannelse og validering sæt blev 100 case-kontrol-kontrol kohorter består af 133 tilfældigt udvalgte SYS patienter (to tredjedele af 200 til træning) sammen med deres matchede PSA og NED kontroller udvalgt som en foreslået træningssæt. De resterende sager og kontroller blev behandlet som en foreslået validering sæt. De kliniske variable blev testet for uafhængighed mellem den foreslåede uddannelse og validering sæt separat inden for de SYS sager og PSA kontroller. Diskrete kliniske faktorer (patologisk stadium, hormonbehandling adjuverende til RRP, strålebehandling adjuverende til RRP, hormonbehandling adjuverende til PSA recidiv, og strålebehandling adjuverende til PSA recidiv) blev testet ved hjælp af Chi-square analyse. Kontinuerlig kliniske variabler (Gleason score (revideret), alder ved PSA recidiv, først stigende PSA-værdi, andet stigende PSA-værdi, og PSA hældning) blev testet ved hjælp af Wilcoxon rank sum. Seks af sættene hundrede tilfældigt stikprøven undlod at vise afhængighed for nogen af de kliniske variabler på 0,2 niveau, og den første af disse blev valgt som træningssættet: 391 patienter (n
SYS = 133, n
PSA = 133, n
NED = 125). Dette er forbeholdt 205 patienter for validering sæt (n
SYS = 67, n
PSA = 68, n
NED = 70).
De rå data fra BeadStudio blev normaliseret ved hjælp cyklisk løss (fastlo) [25].
De træningsdata blev analyseret ved hjælp af tilfældige skove [26] ved hjælp af R Version 2.3.1 (https://www.r-project.org) og randomForest udgave 4,5-16 ( https://stat-www.berkeley.edu/users/breiman/RandomForests). Data blev analyseret ved panel (Cancer, Brugerdefineret og fusionerede, hvor Merged var kræft og brugerdefinerede data behandles som et enkelt array). Ved at teste
ntree
parameter i randomForest funktionen bestemt vi, at 4000 tilfældige skove var tilstrækkelige til at generere en stabil liste af markører. De øverste markører som sorteret for signifikans ved randomForest programmet blev kombineret med forskellige kombinationer af kliniske variable ved hjælp af logistisk regression R program (GLM () med familien = binær (en logistisk model), hvor GLM refererer til generaliseret lineær model). Den resulterende scoringsfunktion blev derefter analyseret under anvendelse Receiver Operating Characteristic (ROC) metoder og cut-off blev valgt som antaget en lige straf for falske positive og falske negative. En gennemgang af modellerne tillades en delmængde af markører, der skal identificeres, og en undergruppe af støtte kliniske data identificerede. Antallet af funktioner i modellen blev bestemt ved orlov 1/3 ud Monte Carlo Cross Validation (MCCV) ved hjælp af 100 iterationer. Antallet af funktioner blev valgt til at maksimere AUC og minimere tilfældig variation i modellen. Den endelige model blev derefter anvendt på 391 patient træningssættet og den reserverede 205 patient validering sæt. Til sammenligning blev andre tidligere rapporterede genekspression modeller også testet mod uddannelse og validering sæt [12] – [16].
Vi sammenlignede de tidligere rapporterede modeller til deres klassifikation af patienter i det kendte PSA gentagelse kontrol og SYS progression case grupper. Vi brugte Cramers V-statistik [27] for at sammenligne modeller.
Resultater
Study Design /Paraffin Block Recovery /RNA Isolation og Expression Panel Succes
Kort fortalt en indlejret case-kontrol undersøgelse blev udført ved hjælp af den store, veldefineret kohorte af mænd med stigende PSA efter RRP (Figur S1). SYS tilfælde var 213 mænd, der udviklede systemisk progression mellem 90 dage og 5,0 år efter PSA stigning. PSA kontroller var en tilfældig stikprøve af 213 mænd, der var 5 år efter RRP med PSA recidiv, men uden tegn på yderligere klinisk progression. NED kontroller var en tilfældig stikprøve af 213 mænd, der var 7 år efter RRP uden PSA stigning (sammenligning af PSA kontrol med NED kontroller-vil blive præsenteret i en efterfølgende papir). SYS tilfælde og PSA kontroller blev matchet (1: 1) til fødselsår, kalenderår PSA stigning, og indledende patologisk Gleason score ( = 6 vs. = 7). Listen over støtteberettigede sager og kontroller blev randomizeed for blinde konstatering af blokke, isolering af RNA og udførelsen af de udtryk array-eksperimenter.
Tabel 1 opsummerer fordelingen af kliniske parametre mellem SYS sager og PSA og NED kontrolgrupper. Der var ingen signifikant forskel mellem grupperne for de matchende variabler (der var ingen signifikant forskel i indledende diagnostiske Gleason score, når = 6 og 7 grupper-den matchende kriterier-blev sammenlignet). Sammenligning af den oprindelige diagnose Gleason score til de reviderede Gleason score afslørede, at Gleason score er steget over tid. Hertil kommer, at andelen af Gleason 8-10 tumorer steget sammenligne NED kontroller til PSA kontrol, og PSA kontrol for at SYS sager. Den reviderede Gleason score blev brugt i alle biomarkør modellering.
Alle paraffinindlejrede blokke fra støtteberettigede mænd blev identificeret, og hver blok blev adspurgte for vævet stede (primære og sekundære Gleason kræft regioner, normal og metastatiske lymfeknuder etc.). Vi macrodissected den dominerende Gleason mønster region og forsøgte at isolere RNA. Illumina Cancer Panel ™ og brugerdefinerede prostata kræft panel DASL array-analyser blev derefter udført på alle RNA prøver. Afsnittet Metoder og Borde S1 S2 beskriver sammensætningen af Cancer Panel og udformningen af den brugerdefinerede panelet.
Tabel 2 opsummerer den endelige blok tilgængelighed, RNA isolering succesrate og succesrater for udtrykket vifte analyser. Af de 639 egnede patienter, blokke var tilgængelige på 623 (97,5%). RNA blev isoleret og DASL analyser med succes udført på en høj andel af patienter /prøver: brugbar RNA blev fremstillet af alle 623 blokke, og Cancer Panel og brugerdefinerede panel DASL arrays var både vellykket (efter at gentage nogle prøver-se nedenfor) på 596-RNA prøver (95,7% af RNA, 93,3% af design patienter). Kun 9 (1,4%) RNA prøver mislykkedes begge paneler. Den primære årsag til disse fejl var dårlig RNA kvalitet-som målt ved QRT-PCR af RPL13a genekspression [19]. Af de 1246 indledende prøver køre på begge paneler, 87 (7,0%) enheder, mislykkedes. Disse enheder, for hvilke der var resterende RNA blev gentaget med en succesrate på 77,2% (61 af 79 prøver).
Expression Analysis Reproducerbarhed
Repliker analyseresultater (Figur S2), RT-PCR-sammenligninger (Figur S3) og inter- og intra-panel genekspression sammenligninger er beskrevet i Resultater S1.
specifik genekspression Resultater sammenligning de systemiske Progression Kohorter med PSA Gentagelse og ingen tegn på Progression Kohorter
Univariate Analyser af gen.
Fordi DASL assay syntes at generere præcise og reproducerbare resultater, blev array data undersøgt for gener, hvis ekspression blev signifikant ændret, da SYS sager blev sammenlignet med PSA kontrol . Til denne første analyse blev DASL genekspression værdi bestemt til at være gennemsnittet af up-to-tre prober til hvert gen på hvert array. Ved univariat analyse (to-tail t-test) af sonden-gennemsnit og fastlo normaliserede data [25], 68 gener var meget signifikant over- eller under-udtrykt i SYS sager versus PSA kontrol (p 9.73 × 10
-7, Bonferroni korrektion for p 0,001) (tabel 3). Et hundrede seksogtyve gener var signifikant over- eller under-udtrykt i SYS tilfælde versus PSA kontroller (p 4,86 × 10
-5, Bonferroni korrektion for p 0,05). Tabel S3 giver det komplette gen liste bestilt af p-værdi. Figur 1 illustrerer ni gener med væsentligt anderledes udtryk i SYS tilfælde og PSA kontroller.
P-værdier (t-test) for SYS sag /PSA kontrol sammenligning vises. Kontrol med ingen tegn på tilbagefald (NED) er også inkluderet.
Systemisk Progression Prediction Model Udvikling og afprøvning på et træningssæt.
En statistisk model til at forudsige systemisk progression (med og uden kliniske variable) ved hjælp af et træningssæt er udviklet ved hjælp tilfældige skove [21] og logistisk regression som beskrevet i Methods. Træningsdata blev analyseret ved panelet (kræft, tilpassede og fusionerede) ved gen (den gennemsnitlige ekspression for alle genspecifikke prober), og af individuelle prober. Tabel 4 lister de 15 gener og 2 individuelle sonder udvalgt til den endelige model.
Tabel 5 og figur 2A opsummere de områder under kurven (AUC) for tre kliniske modeller, den sidste 17-genet /sonde model og de kombinerede kliniske probe modeller. Variablerne i de kliniske modeller (tabel 6) var baseret på tilgængelige kliniske oplysninger. Klinisk model A omfattede revideret Gleason score og patologisk stadium (information tilgængelig umiddelbart efter RRP). Tilføjelsen af diagnostiske PSA og alder ved operation ikke signifikant føje til AUC og blev efterladt ud af denne model (data ikke vist). Klinisk model B tilføjede alder ved operation, præoperativ PSA værdi, og enhver adjuvans eller hormonbehandling inden for 90 dage efter RRP (information tilgængelig efter RRP men før PSA recidiv). Klinisk model C tilføjede alder ved PSA recidiv, den anden PSA-niveau på tidspunktet for PSA recidiv, og PSA hældning (oplysninger på tidspunktet for PSA recidiv).
A. Uddannelsen sæt AUC for tre kliniske modeller, den endelige 17-genet /sonde model og den kombinerede kliniske /17 gen /sonde model. B. valideringssættet AUC for tre kliniske modeller, den endelige 17-genet /sonde model og den kombinerede kliniske /17 gen /sonde model. C. træningssættet AUC for 4 tidligere rapporterede genekspression modeller af prostatacancer aggressivitet sammenlignet med den kliniske model C alene og med 17-genet /probe model. D. valideringssættet AUC for 4 tidligere rapporterede genekspression modeller af prostatacancer aggressivitet sammenlignet med den kliniske model C alene og med 17-genet /probe model. For en forklaring af de kliniske modeller se tabel 6. (E og F) En sammenligning af de uddannelses- og validering sæt AUC for hver af modellen. E. AUC for den enkelte gen /probe modeller alene. F. AUC for hver af de gen /probe modeller med inddragelse af kliniske model C.
Brug den indstillede uddannelse, klinisk model A, B og C alene havde AUC for 0,74 (95% CI 0,68-0,80), 0,76 (95% CI 0,70 til 0,82) og 0,78 (95% CI 0,73-0,84), hhv. Den 17-genet /sonde model alene havde en AUC på 0,85 (95% CI 0,81-0,90). Når det kombineres med den 17-genet /probe model, kliniske model A, B og C havde AUC for 0,86 (95% CI 0,81 til 0,90), 0,87 (95% CI 0,83-0,91) og 0,88 (95% CI 0,84-0,92) , henholdsvis. Vi testede også en 19-gen-model, der tilsat TOP2A og survivin (BIRC5) til the17 gen /probe model. Tilføjelsen af disse to gener ikke forbedre forudsigelse af systemisk progression i træningssættet (data ikke vist)
De arrays blev udvalgt til at omfatte probe sæt til flere tidligere offentliggjorte prostata aggressivitet modeller [12] -. [ ,,,0],16]. Tabel 5 opsummerer AUC for vifte udtryk resultater for disse biomarkør modeller. Figur 2C illustrerer AUC for fire af disse modeller med den relevante sammenligning med klinisk model C og med 17 gen /sonde model. Hver af disse modeller genereret AUC, der var mindre end den model, som vi udviklet. Men flere af de modeller genereret AUC (f.eks Lapointe et al. 2004 tilbagefald, Yu et al. 2004, og Singh et al. 2002-modeller), der var inden for eller tæt på 95% konfidensgrænser for vores AUC uddannelse sæt estimater.
Afprøvning af modeller på validering Set.
Vi anvendte derefter 17 gen /sonde model og de andre tidligere publicerede modeller til den reserverede 205 patient validering sæt (figur 2B og 2D). Figur 2E sammenligner sættet og validering uddannelse sæt AUC for hver af gen /probe-modeller. Med undtagelse af den Glinsky et al. 2004 Signature 1, alle de gen /probe modeller havde betydeligt lavere AUC i valideringssættet forhold til træningssættet. Figur 2F sammenligner uddannelse og valideringssættet AUC for hver af gen /probe modeller, herunder klinisk model C. Mens 17-genet /probe model og tre af de tidligere offentliggjorte modeller (den LaPointe et al., 2004 tilbagefald, Yu et al., 2004 og Glinsky et al. 2005-modeller) udkonkurrerede den kliniske model alene, AUC var signifikant lavere i valideringen sættet i forhold til træningssættet.
Vi sammenlignede også modellerne for klassificering af patienter i det kendte PSA fornyet kontrol og SYS progression case grupper. Tabel S4 opsummerer Cramers V-statistik [27] af de forskellige modeller, og indeholder en perfekt indikator ( “sandhed”) model for direkte evaluering af modellerne. Kort fortalt Cramers V-statistik varierede fra 0,38 til 0,70. Den laveste Cramers V-statistik var mellem den sande tilstand (perfekt forudsigelse) og Glinsky et al. 2005 model med kliniske data. Den højeste Cramers V værdi var mellem vores 17 gen /sonde model og Singh et al. 2002 model, både med kliniske data. De fleste af modellerne klassificeret de samme patienter i de kendte grupper (fx en patient klassificeres i PSA kontrolgruppen som en PSA gentagelse og en patient i SYS tilfælde gruppen som systemisk progression). De tendens også fejlagtigt klassificere de samme patienter (fx en patient klassificeres i PSA kontrolgruppen som en systemisk progression og omvendt). Den 17-genet /sonde model korrekt klassificeret 5-15 flere patienter i deres kendte kategori (PSA kontroller eller SYS tilfælde) i forhold til de andre modeller (data ikke vist).
Sekundære analyser
sonderende Overlevelse undersøgelser.
Som bemærket ovenfor er 17-genet /probe model og de tidligere rapporterede modeller hver klassificeret nogle af SYS tilfælde i godt resultat kategori (f.eks at være PSA gentagelser, ikke systemiske progressorer) og nogle af PSA kontrol i dårligt resultat kategori (f.eks at gå videre til systemisk progression). Vi var nysgerrige efter at vide, om disse tilsyneladende falske klassifikationer havde nogen biologisk eller klinisk relevans.
Sytten mænd i PSA kontrolgruppen (som havde både matrix og klinisk model C data) gik på at have systemisk progression over 5 år på tidspunktet for sidste opfølgning. Af disse 17 patienter, blev 9 forventes at have et dårligt resultat ved 17-genet /sonde model. Af de 179 patienter, som ikke har nogen systemisk progression, 38 blev klassificeret i dårligt resultat kategori ved modellen (p-værdi = 0,0066, Fisher eksakte test). Figur 3A viser den systemiske progressionsfri overlevelse for de gode og dårligt resultat grupper i PSA kontroller. PSA kontrol med en tumor klassificeret som havende en dårligt resultat var signifikant øget risiko for at udvikle systemisk progression over 5 år (log rank p-værdi = 0,00050) (HR = 4,7, 95% CI: 1,8-12,1).
A) Systemisk progressionsfri overlevelse for patienterne klassificeret i dårligt resultat kategori og for dem i godt resultat kategori i PSA kontrolgruppen-17-genet /sonde model. B) Prostatakræft-specifik samlet overlevelse for patienterne klassificeret i dårligt resultat kategori og for dem i godt resultat kategori i SYS casegruppe-17-genet /sonde model.
Leave a Reply
Du skal være logget ind for at skrive en kommentar.