PLoS ONE: Generation af “virtuelle” kontrolgrupper for Single Arm prostatakræft adjuvans Trials

Abstrakte

Det er svært at konstruere en kontrolgruppe for forsøg med adjuverende behandling (Rx) af prostatakræft efter radikal prostatektomi (RP) på grund af etiske spørgsmål og patient accept. Vi udnyttede 8 kurvetilpasning modeller til at estimere den tid til 60%, 65%, … 95% chance for progressionsfri overlevelse (PFS) baseret på data fra Kattan post-RP nomogram. De 8 modeller blev systematisk anvendt på et træningssæt af 153 post-RP tilfælde uden adjuverende Rx at udvikle 8 delmængder af sager (henvisning case sæt) hvis observerede PFS gange blev mest præcist forudsagt af hver model. For at forberede en virtuel kontrolgruppe for en enkelt-arm-adjuvans Rx forsøg, vi først vælge den optimale model for forsøg tilfælde baseret på den mindste vægtede euklidiske afstand mellem retssagen sagen indstillet, og henvisningen tilfælde sat i form af kliniske funktioner, og derefter sammenligne de virtuelle PFS gange beregnes af den optimale model med den observerede PFSs af tilfældene forsøg ved logrank testen. Metoden blev valideret ved anvendelse af en uafhængig datasæt af 155 post-RP patienter uden adjuvans Rx. Vi anvendte derefter metoden til patienter på en fase II forsøg med adjuverende kemo-hormonal Rx indlæg RP, hvilket indikerede, at adjuverende Rx er yderst effektiv til at forlænge PFS efter RP i patienter med høj risiko for prostatakræft tilbagefald. Metoden kan præcist generere kontrolgrupper for single-arm, post-RP-adjuvans Rx-forsøg for prostatakræft, letter udviklingen af nye terapeutiske strategier

Henvisning:. Jia Z, Lilly MB, Koziol JA, Chen X, Xia XQ, Wang Y, et al. (2014) Generation af “virtuelle” kontrolgrupper for Single Arm Prostata Cancer adjuvans Trials. PLoS ONE 9 (1): e85010. doi: 10,1371 /journal.pone.0085010

Redaktør: Stephanie Filleur, Texas Tech University Health Sciences Center, USA

Modtaget: April 21, 2013; Accepteret: November 24, 2013; Udgivet: 21 Jan 2014

Copyright: © 2014 Jia et al. Dette er en åben adgang artiklen distribueres under betingelserne i Creative Commons Attribution License, som tillader ubegrænset brug, distribution og reproduktion i ethvert medie, forudsat den oprindelige forfatter og kilde krediteres

Finansiering:. Denne undersøgelse blev støttet af USA National Institutes of Health giver NCI UO1CA11480 og NCI UO1CA152738 til D. Mercola og University of California Irvine Faculty Karriereudvikling Award og Chao Family Comprehensive Cancer center Seed Grant til Z. Jia. M. McClelland blev delvist understøttet af Award nummer P30CA062203 fra National Cancer Institute og W81XWH-08-1-0720 fra CDMRP. De finansieringskilder havde ingen rolle i studie design, indsamling og analyse af data, beslutning om at offentliggøre, eller forberedelse af manuskriptet

Konkurrerende interesser:. Yipeng Wang er ansat i AltheaDx Inc., og Zhenyu Jia er en konsulent for AltheaDx Inc. Dette ændrer ikke forfatternes tilslutning til alle PLoS ONE politikker om datadeling og materialer.

Introduktion

Prostatektomi giver fremragende sygdomskontrol for hovedparten af patienter med klinisk lokaliseret prostata kræft. Men for patienter i en høj risiko for tilbagefald, kan yderligere (adjuvans) behandling være nødvendig, for at forhindre recidiv. Tilmelding kontrolgrupper i tidlig fase sonderende undersøgelser af nye adjuverende regimer er problematisk på grund af etiske spørgsmål og patient accept. Sammenligningen af nye behandlinger med historiske kontroller kan give skæve resultater, fordi forskelle i patientudvælgelse nemt kan forvirre resultaterne. Den bedste kontrol ville være patienterne selv hvis de ikke blev behandlet med adjuverende behandling. Derfor kan et alternativ til samtidige eller historiske kontrolgrupper være at konstruere en “virtuel” kontrolgruppe til et sæt af patienter ved at anslå progressionsfri overlevelse (PFS) baseret på deres post-radikal prostatektomi (post-RP) kliniske karakteristika. De estimerede PFS for den virtuelle kontrolgruppen vil blive sammenlignet med den observerede PFS for den behandlede gruppe under anvendelse af logrank test [1], [2] for at evaluere effekten af behandlingen. Denne kontrol vil sandsynligvis blive mere nøje til forsøgspersonerne end ville et sæt historiske kontroller, som kun tilnærmet karakteristika undersøgelsespopulationen. Således afgørende skridt til at generere en forudsagt kontrolgruppe er at estimere PFS gange baseret på patienternes post-RP kliniske karakteristika.

Predictive nomogrammer i onkologi er grafiske repræsentationer af matematiske formler eller algoritmer, der inkorporerer observationer for relevante kliniske karakteristika for at forudsige en bestemt slutpunkt. Sådanne nomogrammer er typisk baseret på traditionelle statistiske metoder såsom multivariable logistisk regression eller Cox proportionel risiko analyse [3] – [5]. Den “Kattan” nomogram oprindeligt blev præsenteret i 1999 [6], og blev opdateret i 2005 [7] og 2009 [8]. Disse nomogrammer udnytter patientspecifikke parametre til at beregne en række sandsynligheder for at være progressionsfri på forskellige tidspunkter efter prostatektomi. Alle versioner er tilsvarende præcise i forudsige risikoen for post-RP PFS, med konkordans-indeks mellem 0,7680 og 0,7859 [9]. Selvom nomogrammer er blevet anvendt til at estimere PFS sandsynligheder på vilkårlige tidspunkter [10], den tilgængelige online-version af Kattan post-RP nomogram [6] kun giver PFS

sandsynligheder

for hver patient på en række tidspunkter, fx ved år 2, 5 og 7, efter kirurgi. Disse diskrete Kattan sandsynlighedsværdier kan ikke bruges til logrank analyse; de skal konverteres først til en enkelt tidsmåling for hver patient.

Her præsenterer vi en ny metode, der involverer 8 modeller til konvertering af Kattan sandsynlighed værdier til estimerede tidsmålinger, med hver model repræsenteret ved en henvisning sag sæt der har en anden grad af tilbagefald risiko. Trial kohorter med højere recidiv risiko kræver højere stringens modeller. Den optimale model er valgt til forsøget kohorten ved omhyggeligt matcher 8 referencetilfælde indstiller til retssagen kohorte baseret på patienternes post-RP kliniske karakteristika.

Materialer og metoder

Patient datasæt

træning og validering datasæt.

radikal prostatektomi tilfælde for uddannelse og validering blev identificeret fra forfatternes praksis og forskning databanker. Disse emner havde modtaget nogen form for adjuvans eller salvage terapi. Alle datasæt brugte en PSA grænse på 0,2 ng /mL, eller den nye udseende af radiografiske læsioner i overensstemmelse med metastaser, for definition af tilbagefald. Hyppigheden af radiografisk og PSA overvågning var på foranledning af de behandlende læger. Vi har fået godkendelse fra UC Irvine IRB. Skriftligt samtykke blev givet af de patienter, herunder deres oplysninger opbevares normalt på hospitalet database, der skal bruges til forskning. Højrisiko-sager udstillet en eller flere af følgende egenskaber: 1) præoperativ PSA 15 ng /ml, 2) Gleason score ≥8, 3) extraprostatic udvidelse, 4) invasion af sædblærer, 5) lymfeknudemetastaser , 6) positive kirurgiske margener, 7) vedvarende påviselig PSA ≥0.2 ng /mL mere end 45 dage efter operationen. De fleste tilfælde havde to eller flere af disse funktioner. For hver kilde til uddannelse og validering datasæt, alle sager, der opfyldte de nødvendige definitioner, og der havde alle relevante data, blev udnyttet. Krævede data inkluderet type operation, dato for operation, præoperativ PSA-niveau, alder ved kirurgi, prostatektomi Gleason score, sædblæren status, lymfeknude status, status margin, extraprostatic forlængelse status, en eller flere PSA værdier ≥45 dage efter kirurgisk dato, tilbagefald status, dato for tilbagefald status vurdering, og mindst 1 års opfølgning tid.

Vi skabte et træningssæt af 153 prostatakræft tilfælde bestående af patienter med en bred vifte af tilbagefald risici efter radikal prostatektomi. Flertallet bestod af 112 RP sager ved Long Beach VA Hospital (Long Beach, Californien) fra december 1990 juni 1998. For at øge andelen af mellem- og højrisiko-sager vi tilføjet 41 tilfælde fra UCI SPECIFIKATIONER register over 1.220 sager . De specs (Strategic Partners for Vurdering af Cancer Underskrifter) konsortium Projektet blev en NIH /NCI-finansieret undersøgelse, der søgte at identificere prædiktive biomarkører for tidlig tilbagefald efter prostatektomi [11] – [15].

En validering datasæt af 155 sager blev konstrueret med 62 sager fra University of California, Irvine (UCI), 32 sager fra Loma Linda University (LLU), og 62 yderligere tilfælde fra UCI SPECIFIKATIONER registreringsdatabasen udelukkende anvendes til validering (SPECS (2)). Ingen af disse senere specs sager (SPECS (2)) var blevet anvendt i træningen datasæt. Fordi vi forventede brug af vores metode med single-arm adjuverende terapi studier, vi brugte kun mellem- og højrisiko-sager i valideringen indstillet til at efterligne den sandsynlige befolkning, der ville blive inddraget i sådanne undersøgelser. Karakteristik af de uddannelses- og validering sæt kan findes i tabel 1.

Adjuverende behandling datasæt.

Mellem 2001 og 2006, 20 personer med prostatakræft højrisiko blev behandlet med åben RP efterfulgt af adjuverende multimodalitet terapi (HR, MBL) [16]. Alle individer var i høj risiko for fornyet prostatakræft, baseret på et eller flere af følgende kliniske funktioner: pT3 eller pT4 sygdom (80%), Gleason score 8-10 (60%), extraprostatic udvidelse (65%), positiv kirurgiske margener (55%), tumor i sædblærer (35%) eller lymfeknuder (75%) eller høj præoperativ PSA-niveau ( 15 ng /ml; 40%). Patienterne fik docetaxel og estramustin terapi i henhold til regime af Petrylak, et al [17], for en median på seks cyklusser, der begynder om kort tid (median 2 måneder) efter operationen. De modtog også samtidig androgen deprivation terapi (ADT) for en median på 4,3 år. Individer blev overvåget for tilbagefald ved seriel måling af PSA niveauer, såvel som ved standard kliniske parametre. Tid til tilbagefald blev defineret som tiden fra operation til den første PSA-niveau på 0,2 ng /ml eller derover efter kemoterapibehandling komponent. Disse patienter er blevet fulgt i gennemsnitligt 7,5 år, med et maksimum på 11,0 år.

Nomogram

En web-applikation (https://www.mskcc.org/cancer-care /voksen /prostata /forudsigelse-værktøjer) baseret på den Kattan nomogram 1999 [6] blev brugt til at beregne PFS sandsynligheder på år 2, 5 og 7 efter prostatektomi baseret på kliniske variabler, herunder alder, status margin, tumor stadie, Gleason primær score , Gleason sekundær score, pre-op PSA niveau, sædblæren status, lymfeknude status, og år for prostatektomi.

statistiske metoder

for hver patient, vi monteret de diskrete Kattan PFS sandsynlighed værdier ved år 0 (antages at være 100%), 2, 5 og 7 efter RP med en Løss kurve [18], [19] eller spline [20] (se detaljer i tillæg og supplerende Figur S1 i File S1). Den tilpassede kurve blev anvendt til at estimere tid til variable endpoints,

dvs.

, tid til 10%, 15%, …, eller 95% chance for at overleve, her betegnet

model

s (model 0,10, model.15, …, model.95). I denne undersøgelse har vi kun brugt 8 modeller, alle over median risiko,

dvs.

model.60, model.65, model.70, model.75, model.80, model.85, model.90, og model.95 fordi vi er interesseret primært i undersøgelser med patienter med høj risiko for tilbagefald.

det afgørende skridt for vores metode er udvælgelsen af den passende model for et bestemt sæt af forsøg sager (behandlede patienter). Vi oprindeligt forventet, at model.50 (tid til 50% chance for overlevelse) ville være optimal. Men denne model var utilstrækkelig til at forudsige PFS, især for case kohorter højere risiko. Vi udforskede derfor yderligere modeller med højere stringens. Vi identificerede delmængder af uddannelsen sager (betegnet referencetilfælde sætter) for hver af de 8 modeller, hvor de observerede PFS tider er nærmest forudsagt af enkelte model. Sagerne forsøg blev derefter sammenlignet med de 8 referenceniveauer sæt baseret på ligheden mellem kliniske karakteristika for at bestemme den bedste model til at generere virtuelle kontrol i de tilfælde forsøg.

Konstruktion af reference- sæt.

fremgangsmåde til konstruktion af 8 referenceniveauer sæt til de 8 modeller er afbildet i figur 1 (øvre del). De 153 uddannelse sager (adjuverende behandling-fri tilfælde) blev sorteret fra kort PFS tid til lange PFS tid baseret på den observerede PFS resultater for disse patienter. For hver model (model.60, model.65, … model.95), vi begyndte med en start delmængde af 30 tilfælde, og derefter tilsættes ekstra tilfælde i rækkefølge fra den rangeret pulje af uddannelse sager, indtil alle 153 sager var blevet udnyttet. Som hver ekstra tilfælde blev tilføjet, vi gentagne gange beregnet en PFS sammenligningsgruppen hjælp hver af de 8 modeller, og sammenlignet disse beregnede PFS gange til den faktiske PFS gange. Aftalen mellem de observerede og beregnede PFS gange for en delmængde af uddannelse sager blev kvantitativt vurderet af Chi-square statistik af logrank testen. Hvis de beregnede PFS gange genereret af modellen er aftalt med den faktiske PFS gange, bør de to Kaplan-Meier kurver oven. Chi-square statistik fra logrank test ville så være mindre end 3,84 som kan oversættes til ap value≥0.05 i Chi-square fordeling med frihedsgrader 1. Imidlertid ifthe to Kaplan-Meier kurver ville adskille, ville Chi-square statistik være større end 3,84. For enhver model, ville en delmængde af sager, der producerede den minimale Chi-square statistik har de optimale kliniske karakteristika for brug med denne model. Derfor, for hver enkelt model, de Chi-square statistikker fra logrank analysen blev plottet mod antallet af tilføjede sager (figur 2). Sættet af sager, der producerede den minimale Chi-square statistik, der angiver maksimal aftale af beregnede PFS tider og observerede PFS gange, blev valgt som “optimale” for den pågældende model.

Udvælgelse af den bedste model.

for at bestemme den bedste model for tilfælde behandling forsøg, en række kliniske variabler blev matchet anvendelse af det vejede euklidiske afstand af de kliniske parametre, mellem forsøg sager og hvert sæt af reference- sager (Eqn . 1). Kliniske variabler anses i beregningen afstand inkluderet alder, margin status, patologisk tumor stadie, Gleason primære score, Gleason sekundær score, pre-op PSA-niveau, sædblæren status, lymfeknude status. Vi placerede mere vægt på kontinuerlige variabler end på binære variabler i beregningen afstand,

dvs

, 17%, 5%, 17%, 17%, 17%, 17%, 5%, 5%, henholdsvis for disse 8 kliniske variable. Den vægtede euklidiske afstand baseret på de kliniske 8 variabler er defineret som: (1) hvor er den vægtede euklidiske afstand til model

, er vægten for

jeg

th klinisk variabel, er medianen værdien af

jeg

th klinisk variabel for behandling forsøg sager, og er medianværdien af

jeg

th kliniske variable af

th henvisning tilfælde sæt (

= 1, …, 8). Modellen hvis henvisning tilfælde havde den mindste vægtede euklidiske afstand til de tilfælde forsøg blev derefter udvalgt til generering af kontrolgruppen ved at estimere den tid for tilbagefald (eller “virtuelle” PFS tid) for hvert af de tilfælde forsøg. De observerede PFS tider for de sager forsøg blev derefter sammenlignet med de anslåede PFS tider for de samme patienter (virtuelle kontrol) ved hjælp af logrank test, for at nå en klinisk konklusion. Processen er afbildet i figur 1 (nederste del).

Alle analyser blev gennemført i det statistiske program R (https://www.R-project.org/) og skrevet i F sprog. En web-applikation til at gennemføre den foreslåede metode er offentligt tilgængelige på https://mercola.hs.uci.edu/singlearm/. Den samlede observerede og forudsagte PFSs for de behandlede patienter blev sammenfattet af Kaplan-Meier-metoden [21]. Den logrank test [1], [2], blev anvendt til at sammenligne Kaplan-Meier kurver.

Resultater

Validering hjælp uafhængige testcases

For at demonstrere effektiviteten af metoden brugte vi en helt uafhængig validering sæt af 155 sager (materialer og metoder). Den optimale model (model.75) blev identificeret til testen sæt. Sammenligningen

via

logrank testen viste, at de forudsagte PFS gange aftalt med de observerede PFS tider meget godt (= 0,094 og

værdi 0,05, figur 3).

for yderligere at undersøge effektiviteten af den metode vi skabt 6 mindre validering sæt fra 155 validering patienterne. Den første og anden undergrupper består af patienter, som havde kirurgi i årene 2000-2004 og årene 2005-2011 hhv. Den tredje og fjerde undergrupper består af patienter med Gleason score 6-7 (3 + 4) og 7 (4 + 3) -10 hhv. Det femte og sjette undergrupper repræsenterer patienter med initial PSA ≤ 9 og patienter med initial PSA 9, hhv. Sammenligningerne mellem de observerede PFS tider og de beregnede PFS værdier

via

logrank test for disse validering sæt er opsummeret i figur 4A-4F. De beregnede PFS gange aftalt med de observerede PFS tider meget godt (s 3,84 og p-værdier 0,05)., Som dokumenterer, at den prædiktive metode var robust over et spektrum af kliniske karakteristika, typer af operationer og drift datoer

Panel A: kirurgi 2000-2004; Panel B: kirurgi 2005-2011; Panel C: Gleason score 6-7 (3 + 4); Panel D: Gleason score 7 (4 + 3) -10; Panel E: præoperativ PSA ≤9; Panel F:. Præoperativ PSA 9

Anvendelse på adjuverende fase II studier

Vi har foretaget en fase II undersøgelse af adjuverende kemoterapi og ADT for motiver med høj risiko for tilbagefald efter radikal prostatektomi [16]. For at bestemme om kuren er aktiv ved forlængelse PFS, har vi brugt som en sammenligningsgruppe de forventede PFS tid udledes af den samlede patient Kattan data ved ovennævnte fremgangsmåder. Tilpasningen af otte kliniske parametre for vores patienter med de 8 reference- case sæt viste at model.60 ville være den bedste model til at beregne “virtuelle” PFS værdier. Ved den valgte model, vi konverteret nomogram-forudsagt sandsynligheder til den estimerede PFS tid for hver af 20 patienter (PFS, som om de ikke havde modtaget adjuverende behandling), og sammenlignet den observerede PFSs med den forudsagte PFSs ved Kaplan-Meier-metoden. Den observerede PFS signifikant forskellig fra de estimerede PFS med = 19,3 og p-værdi 0,0001 ved logrank test (figur 5A). Denne sammenligning havde magt på 97% til at påvise en forskel i overlevelse på grund af de 10-årige overlevelsesrater i to grupper er 80% og 20% (tilnærmet fra Kaplan-Meier kurver i figur 5), hhv. Beregningen af magt i forskellige scenarier baseret på den forenklede Rubenstein formel [22], [23] er givet i Supplemental tabel S1 i File S1, hvilket indikerer, at vores analyse tilstrækkeligt blev drevet til at registrere uoverensstemmelse mellem den beregnede PFSs og den observerede PFSs.

Panel A: Sammenligning af forudsagt og observerede PFS for en adjuverende behandling serie (n = 20), der modtager postoperative kemo-hormonbehandling. Panel B: Kaplan-Meier analyse af PFS for patienter adjuverende terapi (n = 20) og matchede historiske kontroller (n = 20) fra træningssættet

Som en ekstra bekræftelse på, at denne adjuverende behandling regime. er aktiv, sammenlignede vi observerede PFS med historiske kontroller – et sæt af 20 klinisk-matchede sager, der blev manuelt valgt blandt de 153 lærings-cases (se tabel 1). Ingen af disse komparatorer fik adjuverende behandling. Men PFS for vores behandlede kontrolgruppe var signifikant bedre end den, der ses for de historiske, klinisk-matchede individer fra den matchede gruppe (figur 5B). I samlede disse data viser, at den virtuelle kontrolgruppe metode identificerer adjuverende behandling regimer, der er i stand til at forbedre en betydelig endepunkt, PFS.

Diskussion

Det er afgørende at konstruere en kontrolgruppe for evaluering af virkningen af et adjuvans post-prostatectomy terapi ved tilmelding kontrolgrupper bliver upraktisk. Sammenligninger med

historiske

kontroller kan give unormale resultater på grund af prøveudtagning bias. Derfor ville den bedste kontrol være patienterne selv hvis de ikke blev behandlet med adjuverende behandling. Nomogrammer er blevet brugt til at konstruere en styrearm baseret på patienternes historiske data til at håndtere single-arm (behandling arm kun) forsøg. F.eks Gulley et al. brugte Halabi nomogram [24] til at estimere den gennemsnitlige overlevelse for hver patient, og derefter blev den vurderede overlevelse til den observerede overlevelse (efterbehandling overlevelse) ved hjælp af logrank test [1], [2]. Halabi nomogram blev afledt fra patienter med metastatisk kastrationsresistent prostatacancer, og derfor er uegnet til post-RP adjuvans terapi undersøgelser. Post prostatektomerede nomogrammer har også været anvendt til at generere sammenligning grupper for adjuvans terapi forsøg. Kibel et al. udført en fase II undersøgelse af adjuverende docetaxel hos højrisikopatienter [25]. For at sammenligne med den observerede PFS, de brugte en modificeret version af Kattan nomogram [6] til at forudsige progression i hver patient, og derefter gennemsnit sandsynlighederne på hver progression gang på tværs af patienter [25]. Lignende strategi blev anvendt ved vurdering effekten og sikkerheden af Pertuzumab i en fase II prostatakræft forsøg [10]. Denne metode anvendes, når nomogram estimering af PFS er tilgængelig på vilkårlige tidspunkter. Ikke desto mindre er den online-version af Kattan post-RP nomogram [6] kun giver PFS

sandsynligheder

for hver patient på 3 tidspunkter, dvs. år 2, 5 og 7. Således er behov for nye tilgange til at udvide anvendelsen af online-version af Kattan post-RP nomogram til single-arm forsøgsdata. er blevet foreslået modelbaserede metoder til enkelt-arm fase II forsøg data [26]; dog har denne tilgang kun blevet anvendt til den situation, hvor enkelt tidspunkt anses for eksempel forudsigelse af 2-års overlevelse sandsynlighed.

Vores indledende forventning var, at model.50 (tid til 50% chance for gentagelse) ville være den optimale model for de fleste tilfælde forsøg. Uventet, model.50 præstation var suboptimal,

dvs..

De beregnede PFS tider var betydeligt længere end de observerede PFS gange, hvilket indikerer, at model.50 (eller median PFS) kan overvurdere PFS for patienter i højrisikogruppen. Vi studerede dermed virkningerne af kliniske funktioner om udførelsen af 8 yderligere modeller (model.60, model.65, model.70, model.75, model.80, model.85, model.90, model.95). I denne undersøgelse har vi udviklet en ny metode baseret på Kattan s nomogram [6], og som tillod præcis beregning af de forudsagte PFS tider for forsøg med forskellige patientgrupper kompositioner.

Når vi konstrueret reference- sæt til de 8 modeller, vi havde bemærket, at den optimale model til konstruktion af et kontrolgruppe varierede baseret på kliniske karakteristika for de tilfælde anvendte. Model.60, model.65, model.70 og model.75 dannet en klasse af modeller (klasse 1), der er monteret moderat risiko patienter. I modsætning model.80, model.85, model.90 og model.95 dannede en anden klasse af modeller (klasse 2), der arbejdede bedre for højrisikopatienter. Dette fænomen sandsynligvis skyldes vægtningen af variable, der anvendes i nomogram beregning algoritme. Til udvikling af reference- sager for de modeller af disse to klasser, vi udnyttet forskellige udgangspunkter delmængder. For modellerne i klasse 1, vi startede med de første 30 (lang PFS) tilfælde i uddannelsen sæt, og derefter tilføjede sager i rækkefølge i en lang-til-kort PFS progression, indtil alle 153 sager var blevet udnyttet. For modeller i klasse 2, vi startede med de sidste 30 (korte PFS) tilfælde i uddannelsen sæt, og derefter tilføjede sager i rækkefølge i en kort-til-lange PFS risiko progression, indtil alle 153 sager var blevet udnyttet. Ordningerne for udvælgelse af start- delmængde skyldes den begrænsede størrelse af træningssættet. Hvis vi valgt 30 lang PFS sager som udgangsmateriale delmængde for modellerne i klasse 2, vil kurven for Chi-square statistik stige uden at nå et lavpunkt (minimum Chi-square statistik). Tilsvarende, hvis vi valgt de sidste 30 sager (korte PFS tilfælde) som starter delmængde for modellerne i klasse 1, ville der ikke være et lavpunkt for kurven for Chi-square statistik. Figur 2 viser populationen af Chi-square statistikker i forhold til antallet af tilfælde anvendes, for hver af de 8 modeller. Bemærk, at da vi sekventielt undersøgt model.60, model.65, model.70, og model.75 (figur 2A-2D) havde vi at tilføje flere og flere korte-PFS sager til den oprindelige sæt af 30 lange PFS sager . Progressionen fortsatte i de næste fire modeller, selvom vi her startede med 30 kort PFS tilfælde (Figur 2E-2H). For model.80 måtte vi tilføje et stort antal af lange-PFS tilfælde at minimere Chi-square statistik. Men for model.95 vi tilføjet meget få tilfælde, med disse primært være korte PFS patienter. Bemærk, at der kan være flere puljer af tilfælde med egenskaber, der kan analyseres godt af en bestemt model. Disse kan gengives grafisk ved bred ned peger toppe (i stedet for pigge) af Chi-square statistik, eller af flere diskrete nadir. I alle vores eksempler men der var en diskret “bedste” patientpopulation (henvisning sæt) for en bestemt model.

I løbet af udviklingen reference- sæt sager med 8 modeller, vi udnyttede den klassiske logrank test [1], [2] for at sammenligne den iagttagne PFS og “virtuelle” PFS anslået af forskellige modeller. Den logrank Testen er meget anvendt i kliniske forsøg for at etablere effekten af en ny behandling i forhold til en kontrol behandling, når målingen er det tid til begivenheden, såsom tid til biologisk tilbagefald hos patienter med prostatacancer. Hvis censurerede observationer ikke er til stede i data derefter Wilcoxon rank sum test [27], anvendes i stedet. Chi-square statistik med frihedsgrad 1 og dens tilhørende

værdi kan let beregnes for Logrank testen. Chi-square statistik større end 3,84 (

værdi 0,05) viser, at der er en betydelig forskel mellem den observerede PFS og den beregnede PFS; tværtimod, Chi-square statistik mindre end 3,84 (P-værdi 0,05) går ind for nulhypotesen, der tyder på en aftale mellem den observerede PFS og den beregnede PFS. Den Logrank testen kan ikke bare erstattes med konkordans indeks [28] eller receiver opererer karakteristiske (ROC) kurve-baserede metoder [29] fordi disse metoder ikke er hensigtsmæssigt at sammenligne to grupper af tid-måling overlevelsesdata involverer censurerer. Disse alternative statistikker er mere velegnet til situationer, hvor en risikofri prædiktiv model er etableret og forudsigelse nøjagtighed skal vurderes.

De sammenligninger mellem forudsagte og observerede PFSs i uddannelse og validering sæt brugte patientdatabaser afledt fra flere kirurger ved hjælp af både åbne og laparoskopiske operationer, i løbet af en periode på 21 år, på flere institutioner, med variable opfølgende mønstre. På trods af disse variabler, har vores metode fungeret godt til præcist at beregne PFS i en stor validering case-serier samt delmængder af sager valgt baseret på året for kirurgi, Gleason score og indledende PSA. Men fordomme kunne være problematisk med mindre serier, som sandsynligvis vil være normen for pilot adjuverende terapi forsøg. Iboende forskelle i typen af operation eller dygtighed eller kirurgen kan føre til skæve resultater. Den historiske udgave af Kattan nomogram [6] udnyttet data primært stammer fra åbne prostatektomi sager, mens laparoskopisk tilfælde er mere almindelige nu. Desuden er det kendt, at Kattan nomogram kan undervurdere tilbagefald risiko i nogle populationer [9], potentielt udfordrende model opgave i undersøgelsen. Derudover fælles brug af en PSA tærskel ≥0.2 ng /mL for definition af post-prostatectomy tilbagefald kan synes at give en dårligere PFS end kan forudsiges af en algoritme baseret på Kattan nomogram, som brugte en PSA tærskel på 0,4 ng /ml eller mere for at definere tilbagefald. Disse teoretiske bekymringer kan overvindes ved hjælp af reference- sæt, der er udviklet fra træning sæt betydeligt større størrelse og kompleksitet end anvendt i denne rapport. Vi er i øjeblikket engageret i disse undersøgelser.

Forskellige datasæt har varierende tidspunktet for kirurgi. For eksempel Ahlering robot tilfælde (UCI) var fra 2002 til 2009, Long Beach VA sager 1990-1998, Loma Linda University (LLU) adjuverende kemo /hormoner sager 2001-2006, LLU robot tilfælde (Ruckle) var fra 2007 til 2010, specs tilfælde var 2000-2010. Faktisk, årgang prostectomy er en vigtig variabel, som det tage højde for ændringer i diagnostiske og terapeutiske teknikker over tid. Givet nok prøver, kan man undergruppe prøver baseret på året for kirurgi (kategorisk variabel) og tog reference- sæt inden for hver undergruppe. På denne måde vil virkningen af tidspunktet for prostectomy kan der tages passende. Men på grund af den begrænsede størrelse af uddannelse prøver i den aktuelle undersøgelse, vi har ikke nok strøm til at bestemme, hvorledes operationstidspunktet. Ikke desto mindre gjorde vi teste effektiviteten af den nuværende model på patientprøver, der havde kirurgi under forskellige tidsrammer, dvs. en 2000-2004 og 2005-2011. Modellen arbejdede meget godt på begge testsæt (figur 4). Avanceret model vil blive udviklet på baggrund af øget prøve base.

Fordi Kattan numre kan beregnes for hver patient, er der ingen vanskelighed ved at opnå en matchet sammenligningsgruppen specifik for undersøgelsespopulationen. Anvendelsen af den nye metode til vores adjuverende fase II studie viste, at adjuverende behandling indgriben væsentligt forbedret PFS hos disse patienter, sammenlignet med PFS forventet med ingen behandling. Et sådant resultat ville ikke være helt overraskende, fordi 75% af vores patienter havde PN1 sygdom. Adjuverende ADT alene har vist sig at en væsentlig forbedring progressionsfri, sygdomsspecifikke, og samlet overlevelse i post prostatektomerede forsøgspersoner med positive lymfeknuder [30]. Desuden fremgår det, at adjuvans ADT alene er forbundet med en fremragende samlet PFS i et udsat post prostatektomerede forsøgspersoner [31]. Vores patienter alle fik adjuverende kemoterapi ud over ADT, som kan have givet en fordel i vore PN0 patienter og bidrog til den samlede, højt signifikant forskel i observerede PFS og forudsagde PFS for vores patienter.

I forskellige emne grupper, kan både adjuverende post-prostatektomi strålebehandling eller androgen deprivation være effektiv markant at øge progressionsfri, sygdomsspecifikke eller samlet overlevelse. Hverken behandling er optimal. Stråling øger bivirkninger såsom strikturer og inkontinens, samt rektale skader. Androgen deprivation kan være permanent, og fører til en række uønskede bivirkninger, såsom det metaboliske syndrom, impotens og erektil dysfunktion, og accelereret tab af knoglemasse.

Kronisk sygdom

PLoS ONE: Generation af “virtuelle” kontrolgrupper for Single Arm prostatakræft adjuvans Trials

Be the first to comment

Leave a Reply Annuller svar