Abstrakt
Baggrund
De fleste kvinder med en klinisk præsentation i overensstemmelse med kræft i æggestokkene har godartede betingelser. Derfor metoder til at skelne kvinder med ovariecancer fra dem med godartede betingelser vil være fordelagtig. Vi beskriver udviklingen og foreløbig evaluering af et serumbaseret multivariat analyse for ovariecancer. Denne hypotese-drevet undersøgelse undersøgt, om der kunne påvises en informativ mønster i fase I-sygdom, der varer ved gennem senere stadier.
Metodologi /vigtigste resultater
Sera, indsamlet under ensartede protokoller fra flere institutioner, der repræsenterer 176 tilfælde og 187 kontroller fra kvinder der præsenterer til operation blev undersøgt ved hjælp af high-throughput, multiplex immunoassays. Alle faser og fælles undertyper af epitelial kræft i æggestokkene, og de mest almindelige godartede æggestokkene betingelser var repræsenteret. Et panel af 104 antigener, 44 autoimmune og 56 infektionssygdomme markører blev analyseret og informative kombinationer identificeret. Ved hjælp af et træningssæt af 91 trins I datasæt, der repræsenterer 61 individuelle prøver, og et tilsvarende antal kontroller, en 11-analyt profil, der består af CA-125, CA 19-9, EGF-R, C-reaktivt protein, myoglobin , apolipoprotein A1, apolipoprotein CIII, MIP-1α, IL-6, IL-18 og tenascin C blev identificeret og synes informativt for alle faser og fælles undertyper af ovariecancer. Ved hjælp af en test sæt med 245 prøver, omtrent dobbelt så stor som den model byggesættet, foretager klassificeringen havde 91,3% følsomhed og 88,5% specificitet. Mens disse foreløbige resultater er lovende, yderligere finjustering og omfattende validering af klassificeringen i et klinisk forsøg er nødvendig for at afgøre, om testen har klinisk værdi.
Konklusioner /Betydning
Vi beskriver en blod- baseret assay ved anvendelse af 11 analytter, der kan skelne kvinder med æggestokkræft fra dem med godartede betingelser. Foreløbig evaluering af klassificeringen antyder det har potentiale til at tilbyde ca. 90% følsomhed og 90% specificitet. Mens lovende, har brug for ydeevne, der skal vurderes i et blindet klinisk validering studie
Henvisning:. Amonkar SD, Bertenshaw GP, Chen T-H, Bergstrom KJ, Zhao J, Seshaiah P, et al. (2009) Udvikling og Indledende Evaluering af en Multivariate Index Assay for kræft i æggestokkene. PLoS ONE 4 (2): E4599. doi: 10,1371 /journal.pone.0004599
Redaktør: Ewout W. Steyerberg, University Medical Center i Rotterdam, Holland
Modtaget: November 21, 2008; Accepteret: 14 januar 2009; Udgivet: 25 februar 2009
Copyright: © 2009 Amonkar et al. Dette er en åben adgang artiklen distribueres under betingelserne i Creative Commons Attribution License, som tillader ubegrænset brug, distribution og reproduktion i ethvert medie, forudsat den oprindelige forfatter og kilde krediteres
Finansiering:. Alle forfattere er ansat af Correlogic Systems, Inc.
Konkurrerende interesser: Alle forfattere er fuldtidsansatte i Correlogic Systems, Inc. og har aktieoptionsprogrammer rettigheder. Correlogic Systems, Inc. har indleveret patentansøgninger om aspekter af dette arbejde.
Introduktion
Kræft i æggestokkene er den mest dødelige gynækologiske kræft i USA [1]. I 2008 vil en anslået 21,650 nye tilfælde af kræft i æggestokkene opdages. Tidlig diagnose er forbundet med en 92% 5-års overlevelsesraten, men kun 19% af ovariecancere opdages tidligt [1], [2]. De fleste tilfælde opdages er fremskredent stadium sygdom, hvor 5-års overlevelse for kvinder med regional malignitet og fjern sygdom er 71% og 30%. Som følge heraf mere end 15.000 kvinder dør af ovariecancer i USA hvert år [1].
De tidlige symptomer på kræft i æggestokkene, som omfatter bækken og mavesmerter, vandladningstrang og frekvens, abdominal oppustethed, og svært ved at spise er ikke-specifikke, og typisk for mange ikke-kræft og benigne tilstande [3]. Derfor kan diagnosen ikke opstår typisk indtil udviklingen af enten en betydelig mængde af abdominal fluid, eller en pelvic masse, påvist ved fysisk undersøgelse eller med radiologiske evaluering [4]. En nylig rapport har foreslået, at en unik kombination af symptomer, hvis fuldt dokumenteret for hver patient, kan være mere informativ end tidligere anerkendt, selvom resultaterne er endnu ikke valideres [5]. Mange rapporter tyder på, at de mest anvendte billeddiagnostiske teknikker – transvaginal sonografi (TVS), positron-emissions-tomografi (PET), magnetisk resonans imaging (MRI), radioimmunscintigrafi og computertomografi (CT) mangler tilstrækkelig specificitet til at skelne mellem benigne og maligne ovariesyndrom [6]. Nogle nylige undersøgelser har antydet, at ultralyd alene eller i kombination med andre prognostiske variable kan være betydeligt mere informativ i hænderne på et specialiseret æggestokkene ultralyd ekspert [7], [8], men mange patienter ikke har adgang til de færdigheder, sådanne specialister. Desuden klar diagnose normalt kræver som minimum, kirurgisk indgreb i form af laparotomi eller laparoskopi. Derfor ville en præcis, informativ, men ikke-invasiv, test være af klinisk værdi.
Der er ingen FDA-godkendte biomarkører til diagnosticering af kræft i æggestokkene, eller for visitation af kvinder, der mistænkes for at have kræft i æggestokkene . Trods den udbredte anvendelse, cancerantigen 125 (CA-125) er eneste FDA-godkendte til overvågning tilbagefald og terapeutisk respons [9] – [11]. I undersøgelser af kvinder med kendt eller mistænkt kræft i æggestokkene, de rapporterede følsomhed CA-125 i afsløre fase I og II kræftformer spænder bredt 29-75% og 67-100%, hhv. Imidlertid er CA-125 forhøjet i en lang række af normale, benigne og maligne tilstande [12] – [14] og 86% af kvinder med unormale CA-125 test løse i 3-6 måneder [15]. Der er taget mange tilgange til at forbedre den prædiktive værdi af CA-125 gennem serielle målinger [16], [17] eller i kombination med yderligere markører [18] – [21]. Men en simpel og klinisk praktisk kræft i æggestokkene-screening værktøj forbliver undvigende
En nylig undersøgelse [22] beskrev et panel af seks markører -. CA-125, prolactin, leptin, makrofag faktor (MIF), osteopontin og insulin-lignende vækstfaktor II (IGF-II), at når de kombineres havde meget høj følsomhed (95,3%) og specificitet (99,4%). Testen er tænkt som en skærm på høj-risiko kvinder, men de endelige ydeevne blev ikke vurderet på høj-risiko kvinder og omfattede prøver også bruges til at bygge modeller, som kan have resulteret i overvurdering af klassificeringen ydeevne. Desuden blev kriterier for deltagerne inklusions- og eksklusionskriterier ikke klart defineret, og kræft og kontrolprøver blev indsamlet under forskellige kliniske indstillinger, som kan føre til skævhed i prøven sæt. Prolaktin og IGF-II blev hver rapporteret at være individuelt mere informativ end CA-125, i denne undersøgelse, men dette er i modstrid med rapporter om andre uafhængige prøvesæt [23], [24]. I en anden undersøgelse Moore og kolleger udnyttede logistisk regression for at finde markørkombinationer stand til at differentiere mellem benigne og maligne tilstande hos kvinder med bækken masser [25]. Ved at kombinere HE-4 og CA-125, 76,4% sensitivitet og 95% specificitet blev opnået. Mens lovende, kun 67 af de 233 prøver var fra individer med æggestokkræft og kun 15 af dem fra kvinder med trin I og II kræftformer. Desuden rapporterede resultater var baseret på tværs af valideringsresultater som manglede en uafhængig holdout sæt prøver.
Kræft i æggestokkene er en samling af forskellige enheder med mere end 30 undertyper af maligniteter, hver med en karakteristisk histologi, patologi og klinisk opførsel [26]. Mangfoldigheden og lave forekomst af kræft i æggestokkene hæmmer søgningen efter biomarkører. I en separat, post-hoc analyse af en delmængde af prøver, der anvendes i den foreliggende undersøgelse, var vi ikke i stand til at identificere en enkelt markør, selv samlet til præcist at forudsige tilstedeværelsen af ovariecancer [24]. I nærværende undersøgelse, beskriver vi udviklingen og foreløbig evaluering af en multi-analyt profil, der kan klassificere kvinder mistænkes for at have kræft i æggestokkene, i dem med og uden kræft i æggestokkene.
Metoder
Sample kohorte
Alle men 20 prøver var fra vævet-banking repository af National Cancer Institute-finansierede Gynækologisk onkologi Group (GOG, Columbus, OH, tabel 1. tabel S2). Skriftligt samtykke blev opnået ved GOG for alle deltagere og GOG Institutional Review Board (IRB) godkendt brugen af prøverne i vores undersøgelse. Disse prøver blev indsamlet fra flere sites, under protokoller godkendt af GOG IRB. Egnede patienter var kvinder planlagt til operation med mistanke om at have en gynækologisk cancer eller planlagt til profylaktisk kirurgi på grund af øget æggestokkene kræftrisiko (1. eller 2. grads slægtning med sygdommen). Alle prøver, herunder dem kategoriseret som raske, post-kirurgi, blev indsamlet forud for enhver diagnostisk eller terapeutisk intervention. Serum portioner fremsendt til Correlogic Systems, Inc.® (Rockville, MD) havde været de-identificeret og kodet med et unikt GOG identifikator. Hver prøve blev ledsaget af en komplet clinicopathology rapport, patientens alder og race, og en de-identificerede kode angiver indsamlingsstedet. Patologi blev revideret og bekræftet af GOG patologer at sikre konsistens. Prøverne blev udvalgt fra GOG samlingen at balancere patient aldersfordeling, dato for serum samling, og repræsentation af sager og kontroller på tværs indsamlingssteder. Den resterende sera bestod af 20 prøver fra individer med godartede tilstand fra et Correlogic prospektiv samling, som anvender en lignende serum samling protokol. Skriftligt samtykke blev opnået fra alle deltagere. Correlogic er “potentielle” prøver bliver indsamlet under IRB godkendelse til at støtte udviklingen af en klinisk test for kræft i æggestokkene. Studiepopulationen er kvinder med symptomer på kræft i æggestokkene og planlagt til kirurgi. Som sådan er sygdomsstatus bekræftet ved patologi efter kirurgi. De 20 prøver blev udtaget fra den potentielle samling på en måde, at undgå at indføre en systematisk fejl i den resterende indsamlingen og som sådan var ikke bevidst udtaget til nogen bestemt population. Undersøgelsen blev godkendt af den vestlige IRB (Olympia, WA) og af IRB af hver deltagende site.
Serum Processing, opbevaring, håndtering og forsendelse
Blodprøver (5- 20 ml) blev opsamlet i rød top glas Vacutainer rør (Becton-Dickinson, NJ), størknet i 30-180 minutter ved 4 ° C og derefter centrifugeret ved 3.500 g i 10 minutter ved 4 ° C. Serum blev dekanteret over i kryorør og opbevaret straks ved -80 ° C. Prøver fra lager blev sendt til Correlogic på tøris og opbevares straks ved -80 ° C. Frosne prøver blev opvarmet forsigtigt med hånden, indtil næsten optøet, afsluttet på is, vortexblandet, alikvoteret i 150 ul volumener og frosset igen ved -80 ° C. Endelig blev prøver afsendt på tøris til regelbaseret Medicine, Inc. (RBM, Austin, TX). En ledsagende dokument en kodet identifikationsnummer prøve nummer og en bestemt rækkefølge for analyse. RBM analytiske websted blev helt blændet alle prøve detaljer, herunder sygdomsstatus.
Multiplex Immunoassays
De multipleksede immunoassays er beskrevet andetsteds [24]. Kort fortalt blev to runder af multipleksede immunoassays udført ved ringmekanismer i deres Luminex-baseret CLIA-certificeret laboratorium. Analytter blev kvantificeret ved henvisning til 8-punkts kalibreringskurver og maskinens ydeevne blev verificeret ved hjælp af tre kvalitetskontrol (QC) prøver for hver analyt. QC prøver blev fordelt relativt jævnt over det dynamiske område for analysen ved lave, medium og høje niveauer og generelt havde koefficienter af varians under 15%. Kalibreringsstandarder og QC prøver var i en kompleks plasma-matrix, der svarer til prøven baggrund og blev analyseret in duplo. I runde én, blev i alt 204 analytter, der repræsenterer 104 antigener, 44 autoimmune og 56 infektionssygdomme molekyler målt i 147 epitelial kræft i æggestokkene prøver (40 trin I, 23 fase II, 67 fase III, 12 stadie IV, fem unstaged) og 149 kontrolprøver (104 godartede tilstande, 29 normale, raske, 14 andre kræftformer og to lave maligne potentielle) ved hjælp af proprietære multipleksede immunoassays (tabel S1). En anden runde af analyse blev udført 86 dage efter den første analytiske runde, på 104 antigener, ved anvendelse af en anden serum aliquot der var blevet underkastet en identisk frysning /optøning historie som de anvendte prøver runde én. På grund af prøvevolumen restriktioner blev 27 prøver ikke analyseres igen i runde to. Således i runde to, 132 ovariecancer prøver (30 trin I, 21 fase II, 65 fase III, 11 fase IV og fem unstaged) og 135 kontroller (94 benigne tilstande, 28 normale, raske, 13 andre kræftformer) blev analyseres igen. Desuden yderligere 69 prøver, der ikke indgår i runde én, blev analyseret (21 fase I, otte fase II, 36 godartet, tre normal sund og én tyktarmskræft). For begge runder af analyse blev rækkefølgen af analyse etableret for at undgå enhver sekventiel skævhed som følge af sygdom tilstedeværelse eller fravær, undertype eller stadiet af sygdommen, patientens alder eller alder serumprøven. Generelt prøver vekslede mellem cases og kontroller.
Data Håndtering
Da sera blev analyseret ved en tidligere optimeret fortynding, helst prøve at overskride den maksimale koncentration af kalibreringskurven blev vilkårligt tildelt koncentrationen af højeste standard, mens dem analyseret under minimum koncentration af kalibreringskurven blev tildelt værdien 0,0. En enkelt assay (IL-1α), der viste ingen variation i ekspression på tværs af alle prøver blev anset invariant /uninformative og fjernes fra den ekstraherede datasæt. De resterende data blev derefter skaleret med biweight skala; en robust og effektiv skalering mekanisme, der tegner sig for den varians inden for hver af de enkelte analyser [27]. En enkelt skala for hver analyse blev bestemt i en population-vægtet måde. Enhver analyse, hvilket giver en skaleringsfaktor på nul blev fjernet fra datasættet. De resulterende data blev derefter eksporteres i individuelle filer, hvor hver fil repræsenterede resultaterne af alle kvalificerede analyser til en enkelt prøve
Modeling -. “Out-of-Bag” Fejl Estimering og Bootstrap Validation
for at minimere prøvesæt bias og at hjælpe i vurderingen af mellemliggende modeller, vi beskæftigede en tredjedel “out-of-pose” (OOB) fejl estimering og en ekstern 100 gange bootstrap validering med 10% holdout bootstraps. Disse bootstrap skøn tilladt os at vurdere den potentielle værdi af mange modeller ved hjælp af træningsdata. På den måde kunne vi bevare uafhængighed hold-out test sæt prøver. Først efter en bestemt klassifikatør var blevet låst fast i en sporbar dokumenthåndteringssystem (DMS) var hold-out test datasæt anvendt til at teste effektiviteten af den valgte model
Modeling -. Proof-of-Princip Classifier
i første omgang, modellering blev udført med data genereret runde en (figur 1) ved hjælp af en modifikation af Breiman Random Forest kode [28]. Metoden blev forbedret ved at give batch automatisering, installerer eksterne lag af bootstrapping, der giver større kontrol over køre parametre, og tilpasse output. De resulterende træer blev gemt, og en proprietær rutine blev brugt til at score prøver og output prøve oplysninger sandsynlighed scoringer og klassifikation resultat. Fyrre fase I ovariecancer og 40 kontrolprøver blev brugt til model bygning. Kontrollerne blev valgt for at sikre, at modelleringen sæt repræsenterede de samme andele af normale, godartede og andre kræft betingelser som hele kontrolsæt imidlertid inden for hver af disse kategorier, blev prøver tilfældigt udvalgt. Modeling blev optimeret ved at variere både træet tæller (50, 100, 500 og 1000) i en skov, og antallet af biomarkører (5, 10, 15, 20, 25, 30, 35, 40, 45, 50) undersøges på hver forgrening punkt, hvilket resulterer i 40 modeller. Fra disse modeller blev de 20 mest informative analytter identificeret under anvendelse af variable betydning værdi. I det andet trin blev en række modeller bygget der var begrænset til det vigtigste analyt (1-analyt model), de to vigtigste analytter (2-analyt model) og så videre til en 20-analyt model, i alt 20 modeller. Den OOB og eksterne bootstrap fejl, og deres standardafvigelser blev tabuleret for hver af disse modeller. Ud fra disse resultater blev det bestemt, at mindst syv analytter skulle opnå den mest nøjagtig klassificering. En sidste, enkelt, model blev derefter bygget på disse syv analytter og deponeret i DMS som en “låst” model
Modeling -. Final Classifier
Den endelige modellering indarbejdet alle trin jeg kræft data fra og runder en to, herunder dubletter – i alt 91 fase i datasæt, der repræsenterer 61 unikke prøver og et identisk antal kontroller, matchede som før, og afbalanceret i den samme runde én til runde to forhold (figur 1). Kun disse datasæt (dvs. træningssættet) blev anvendt i model bygning og udvælgelse. Mønstret blev udført ved hjælp af en unik, patentanmeldt algoritme, Viden Discovery Engine-VS (KDE-VS ™). KDE-VS benytter en gruppe af stemmeberettigede strukturer ligner beslutningstræer med en unik metode til opbygning og definere afskæringsværdier inden for hver stemme struktur, hjælp ikke kun den målte værdi af en analyt, men også laboratoriet-baserede fejl skøn forbundet med denne måling, afledt af de historiske QC målinger for hver analyt. Brugeren kan variere den brøkværdi af fejlen estimatet inkorporeret i en sorterer under modellering. Resultatet er en robust klassifikator, der kan modstå betydelig forstyrrelse af eksperimentelt bestemte pointværdier af analytkoncentrationer. Under modelbygning, er hver terminal node på afstemningsstrukturen tildelt en given tilstand – enten æggestokkræft eller kræft i ikke-æggestokkene. At score et ukendt, vores software udtrækker værdierne for analytterne af interesse at bestemme, hvilke node prøven falder i.
To forskellige modellering kørsler, med fraktioneret værdi af fejl tolerancer på 1,0 og 3,0, blev udført ved hjælp af data for de 104 antigen assays. De 20 mest robuste analytter blev bestemt for hvert forsøg, og disse blev derefter samlet i en udtømmende sæt af 7-markør-modeller. Imidlertid blev alle modeller skal indeholde en invariant kerne af de tre mest robuste og informative analytter, nemlig CA-125, C-reaktivt protein og EGF-R, hvilket reducerede søgerummet til 2380 kombinationer. For begge niveauer af fejltolerance identificerede vi de ti mest følsomme og ti mest specifikke modeller – giver i alt 40 modeller. Hyppigheden af brugen af både individuelle analytter og forskellige analyt kombinationer på tværs af alle 40-modeller, førte til identifikationen af 11 analytter, der tilsammen optrådte robust og informativ. Endelig blev en enkelt model bygget på disse 11 analytter og låst i DMS. Først efter låsning af modellen var de resterende data, der ikke anvendes i uddannelse, scorede for at teste modellen (figur 1).
Dataanalyse
Konfidensintervaller blev beregnet ved anvendelse af Newcombe metoden [29] .
Resultater
Indledende Evaluering af Proof-of-Princip Classifier
det første sæt data, der genereres på 147 æggestokkræft og 149 ikke-æggestokkene prøver kræft kontrol var bruges til at udforske mulighederne for at bruge en high throughput multiplex immunoassay platform som en opdagelse værktøj. Vi antager, at en klassifikation mønster for trin I ovariecancer vil fortsætte gennem alle senere stadier sygdomme, så kun trin I kræft prøver blev anvendt til model udvikling. Denne tilgang også afbalanceret gennemsnitsalderen af case og kontrol patienter, fjerne aldersrelateret skævhed under modellering (tabel 1). Gennem flere runder af berigelse for de mest informative biomarkører, drevet af en vurdering af bootstrap fejl for modellen udvikling prøvesæt, en 7-analyt model udviklet, bestående af CA-125, EGF-R, C-reaktivt protein, apolipoproteiner CIII og A1, IL-18 og tenascin C. Denne fase i bestemt profil var låst ind i DMS. Først efter modellen var låst ind i DMS var data for analyse af prøver (dem, der ikke bruges i modellering) adgang til og scoret af modellen til at give de resultater, der er beskrevet nedenfor (figur 1).
Da alle trin I data genereret i den første runde af analyser var blevet anvendt i modellering, var der ingen uafhængige data til test fase i følsomhed. Men den 100-fold bootstrap estimat af trin I sensitivitet var 87% (tabel 2). Den bootstrap skøn for specificitet, er baseret på den kontrol, der anvendes i modellen udvikling var 82,3%. Klassificeringen blev derefter evalueret ved hjælp af runde en analyse af prøver, et sæt af uafhængige stikprøver ikke anvendes i ethvert aspekt af model udvikling. Klassifikatoren havde 95,3% følsomhed og 70,6% specificitet. Performance til godartede prøver var lavere (67,1%) end andre kontroller. Der var ingen enkelt undertype af kræft, der scorede signifikant forskellig fra de andre, og når opdelt efter scenen, følsomheden varierede lidt (94,0 til 100%), støtter hypotesen om, at en fase I mønster kunne fortsætte gennem alle stadier af sygdommen. Efter den anden runde af analyser, blev alle runde to data scoret på denne låste model. Prøverne er fælles for runde én viste en reproducerbar præstation med 97,1% sensitivitet (95% CI, 91,0-99,2%) og 74,5% specificitet (95% CI, 64,7-82,4%). De yderligere 69 prøver, der ikke tidligere er analyseret, forudsat en anden test sæt og gav 85,7% sensitivitet for trin I, 100% følsomhed for fase II og 67,5% specificitet.
Indledende Evaluering af Final Classifier
proof-of-principle klassificeringen bekræftede vores hypotese om, at kun bruger fase i data for både model udvikling og vurdering kunne vi identificere en informativ mønster, der kan eksistere og fortsætter gennem senere stadier af kræft. Derfor søgte vi at udvikle fase I modellen yderligere ved hjælp af alle trin I prøver til rådighed. Den samme modellering strategi blev gentaget med to vigtige ændringer. Først blev en anden, proprietær algoritme implementeres, og for det andet, blev alle trin I prøver analyseret på tværs begge runder et og to benyttes til at øge størrelsen af modellen udvikling datasæt (figur 1). Modelleringen strategi gik gennem flere iterative trin for at berige for de mest informative biomarkører, baseret på en vurdering kun for fase I uddannelse data, før der kulminerede i en nær-udtømmende søgning af biomarkør kombinationer, genererede 2380 modeller. Fyrre modeller blev udvalgt på grundlag af deres bootstrap følsomhed og specificitet på I prøveholderen sæt. Ved at sammenligne biomarkør kombinationer i disse top 40 modeller (tabel 3), og i betragtning af den balance, de viste i bootstrap nøjagtighed, følsomhed, specificitet, og standardafvigelser blev et endeligt sæt 11 informative biomarkører identificeret. Visse analyt kombinationer var almindelige i mange modeller, og der var klart “erstatningsmønstre”, hvor en anden analyt eller en kombination af analytter kunne giver tilsvarende modeller. De 11 biomarkører – CA-125, C-reaktivt protein, EGF-R, CA 19-9, apolipoproteiner A1 og CIII, myoglobin, MIP-1a, IL-6, IL-18 og tenascin C – blev samlet i en endelig model ved hjælp af KDE-VS-algoritmen og låst ind i DMS som den endelige model (figur 1).
som en indledende test af klassificeringen præstation, blev alle data, der ikke er anvendt i model udvikling scoret, hvilket giver 91,3 % følsomhed og 88,5% specificitet (tabel 4, figur 1). Især fase II sensitivitet var 83,9% og performance på de godartede prøver forbedret til 90,4%. Yderligere trin I prøver ikke var tilgængelige på det tidspunkt, til test af denne ydelse. Men bootstrap skøn over følsomhed for træningssættet var 83,4% for stadium I-sygdom og 84,2% (± 12,5%) specificitet (tabel 4). Som en separat øvelse blev alle duplikerede data fra runde to ikke brugt i model udvikling scoret. Som forventet fra de tidligere resultater, den præstation var ens med 96,1% sensitivitet (95% CI, 89,7-98,7%) og 88,1% specificitet (95% CI, 80,8-93,0%) med godartede prøver scoring 87,0% (95% CI, 76,2-93,5%). At give en referenceramme, vi sammenlignede model ydeevne som en klinisk beslutning baseret på CA-125 ekspressionsniveauerne. Da cut-off værdi på 35 IU /ml allerede er etableret, blev det komplette datasæt anvendes til at vurdere den prædiktive værdi af CA-125. Med denne afskæringsværdi, CA-125 gav 94,9% følsomhed og 58,6% specificitet (tabel 5). For trin I prøver alene, følsomheden faldet til 88,5%.
Vi implementeret to metoder til at estimere betydningen af de forskellige analytter til den samlede klassificeringen. Først vurderede vi model ydelse, når alle undtagen én analyt blev holdt konstant i datafilerne, med værdien af den valgte analyt randomiseret. Dette blev gentaget successivt for hver analyt. Den relative værdi af hver analyt blev derefter rangeret ved at bestemme hvilke analyt forårsaget klassificering ydeevne til at falde mest, når randomiseret. Vi observerede, at biomarkør betydning tendens til gruppe sammen. Specifikt, CA-125 var den vigtigste biomarkør, fulgt en gruppe bestående af C-reaktivt protein, CA 19-9 og EGF-R, efterfulgt af MIP-1α, efterfulgt af myoglobin, apolipoprotein CIII, apolipoprotein A1, IL-18 og IL-6 og endelig tenascin C. Som en anden metode til at estimere analyt betydning, vi analyserede forgrenede punkter de stemmeberettigede strukturer. På tværs af alle forgrenede punkter de stemmeberettigede strukturer blev CA-125 involverede hyppigst (15,8%) efterfulgt af CA 19-9 (12,1%), myoglobin (11,1%), C-reaktivt protein (10,8%) og EGF-R (9,9%). CA-125 blev udnyttet i 80% af de øverste niveau forgreningspunkter, der repræsenterer den første store prøve partitionering, efterfulgt af C-reaktivt protein (11,2%), EGF-R (5,0%) og CA19-9 (1,8%). På det andet lag, blev CA19-9 anvendes hyppigst (20,3%) efterfulgt af EGF-R (18,8%), CA-125 (11,4%), myoglobin (9,8%), tenascin C (8,0%), IL-18 (7,2%) og apolipoprotein A1 (6,9%). Den akutte fase markører MIP-1 og IL-6 blev set kun 6,2% og 1,3% på dette niveau.
Diskussion
I denne undersøgelse identificerede vi en klassifikation mønster for kræft i æggestokkene i serum proteomanalyse af patienter med stadium i sygdom, som stadig tydeligt gennem senere sygdom. Sera fra patienter med patolog-bekræftet betingelser – enten med eller uden epitelial ovariecancer – blev profileret ved anvendelse af en perle-baserede multi-analyt profilering tilgang. Analytterne med en bred vifte af biologiske strukturer og funktioner, herunder cancerantigener, hormoner, koagulationsfaktorer, tissue modellering faktorer, lipoprotein bestanddele, proteaser og proteasehæmmere, markører for kardiovaskulær risiko, vækstfaktorer, cytokin /kemokiner, opløselige former af celle- signalering receptorer og inflammatoriske og akutfasereaktanter samt markører for autoimmunitet og infektion (tabel S1). To uafhængige analyser af prøver blev udført 86 dage fra hinanden. Der var flere reagens lot og batch ændringer i denne periode, hvilket giver en virkelig verden udfordring til robustheden af de underliggende assays og modellen.
Fire hovedkomponenter var afgørende for succes med denne undersøgelse. Først var det vigtigt at finde frem til en meget konsekvent, veldokumenterede og klinisk repræsentativ stikprøve sæt af bekræftede tilfælde og kontroller. For kræft i æggestokkene, kan bekræftelse kun komme fra patologisk undersøgelse af kirurgisk fjernet væv. Vi valgte serumprøver fra godt karakteriserede kollektioner fra kvinder, der allerede er planlagt til operation. Den stort flertal af kontrollen i denne population havde patologi-bekræftet godartede tilstande, som er baseret på univariat analyse, bør udgøre en større udfordring for klassificering end sera fra ikke-symptomatiske kvinder (Figur 2, [24]). For det andet, vi udnyttet et panel af fuldt kvalificeret, high throughput, immunoassays, der måler en bred mangfoldighed af molekyler, herunder autoimmune og infektionssygdomme markører, og en bred vifte af velkarakteriserede serumproteiner, inklusive dem, der tidligere impliceret i ovariecancer. Tredje, brugte vi en hidtil ukendt multivariabel modelmetode at identificere en robust mønster af molekyler informative for ovariecancer. Den proprietære algoritme (KDE-VS) forbedret klassificering ydeevne i forhold til Random Skov og andre klassificering algoritmer ved at bygge robuste beslutningsprocesser grænser i sine stemmeberettigede strukturer, som inkorporerer den virkelige verden eksperimentel variabilitet i de data, der modelleres. Endelig var der en klar adskillelse mellem prøver, der anvendes til at udvikle og identificere en enkelt informativ model, og prøverne bruges til at vurdere, at modeller ydeevne
For hver analyt, de box-knurhår plots viser:. Den laveste observation, lavere kvartil, median værdi, øvre kvartil, og højeste observation. Alle analyser, herunder dubletter vises. CA-125 – en kræft i æggestokkene, 11 godartet og fem normale prøver under laveste kalibrering værdi; CA 19-9 – 14 æggestokkræft, 18 godartede, ni normale og fire andre kræft prøver under laveste kalibreringsværdi; C-reaktivt protein – 93 æggestokkræft, 21 godartet, to normale og to andre kræft prøver ovenstående højeste kalibrering værdi; IL-6 til 82 æggestokkræft, 161 godartet, 28 normal og 14 andre kræft prøver nedenfor laveste kalibreringsniveau; MIP-1α – 50 æggestokkræft, 53 godartet, 10 normal og fire andre kræft prøver under laveste kalibreringsniveau; tenascin C – to æggestokkræft og en godartet prøve over højeste kalibrering niveau. OvCa, kræft i æggestokkene; Ca, cancer; Apo, apolipoprotein; CA-125, cancer antigen 125; CA 19-9, cancer antigen 19-9; EGF-R, epidermal vækstfaktor receptor (opløselig form); IL, interleukin; . MIP-1a, makrofag inflammatorisk protein 1 alpha
Vores undersøgelse fokuserer på analysen af tidligt stadium sygdom med 50% af den indstillede kræft prøve repræsenterer trin I og II sygdom (tabel 1). I overensstemmelse med litteraturen, den gennemsnitlige patient alder ved diagnose korreleret med den fase af sygdommen på diagnosetidspunktet (tabel 1; [22]). Subtype fordeling var repræsentativ for den amerikanske befolkning, med en større andel af serøs (42%) og endometrioide (26%) carcinom (tabel 1). Kontrolprøverne var overvejende fra individer med fælles godartede æggestokkene betingelser (75%), såvel som andre gynækologiske og ikke-gynækologiske cancere (8%), og et lille antal ikke-sygdomsramte prøver (17%), på grund af nødvendigheden for en klinisk test for symptomatiske kvinder (tabel 1).
Vores rationale for at fokusere på tidligt stadie sygdommen var dobbelt. For det første er tidligt stadium ovariecancer anses helbredes, men i mange tilfælde symptomer er subtile og svære at opdage.
Leave a Reply
Du skal være logget ind for at skrive en kommentar.