Abstrakt
Omkring 30% trin I ikke-småcellet lungekræft (NSCLC) patienter, der gennemgår resektion vil gentage sig. Robuste prognostiske markører er forpligtet til bedre at styre indstillinger terapi. Formålet med denne undersøgelse er at udvikle og validere et nyt gen-udtryk signatur, der kan forudsige tumor gentagelse af trin I NSCLC patienter. Cox proportionel risiko regressions analyse blev udført for at identificere gentagelse gener og en delvis Cox regressionsmodel blev brugt til at generere et gen underskrift tilbagefald i uddannelsen datasættet -142 fase I lunge adenokarcinomer uden supplerende behandling fra direktørens Challenge Consortium. Fire uafhængige validering datasæt, herunder GSE5843, GSE8894, og to andre datasæt, som Mayo Clinic og Washington University, blev anvendt til at vurdere forudsigelse nøjagtighed ved at beregne korrelationen mellem risikoscore estimeret fra genekspression og ægte recidiv-overlevelsestid og AUC for tidsafhængig ROC-analyse. Pathway-baserede overlevelse analyser blev også udført. 104 probesets korreleret med recidiv i uddannelsen datasættet. De er beriget med celleadhæsion, apoptose og regulering af celleproliferation. En 51-genekspression signatur blev identificeret til at skelne patienter, der kan udvikle tumor recidiv (DXY = -0,83, P 1e-16), og denne signatur blev valideret i fire uafhængige datasæt med AUC 85%. Flere veje herunder leukocyt transendothelial migration og celleadhæsion var stærkt korreleret med recidiv overlevelse. Genet signatur er yderst prædiktive for tilbagefald i fase I NSCLC patienter, som har vigtige prognostiske og terapeutiske implikationer for den fremtidige forvaltning af disse patienter
Henvisning:. Lu Y, Wang L, Liu P, Yang P, du M (2012) Gene-Expression Signature Forudsiger Postoperativ Gentagelse i fase i ikke-småcellet lungekræft Patienter. PLoS ONE 7 (1): e30880. doi: 10,1371 /journal.pone.0030880
Redaktør: William C. S. Cho, Queen Elizabeth Hospital, Hongkong
Modtaget: December 3, 2011; Accepteret: December 28, 2011; Udgivet: 23 januar, 2012 |
Copyright: © 2012 Lu et al. Dette er en åben adgang artiklen distribueres under betingelserne i Creative Commons Attribution License, som tillader ubegrænset brug, distribution og reproduktion i ethvert medie, forudsat den oprindelige forfatter og kilde krediteres
Finansiering:. Dette arbejde blev støttet af National Institutes of Health giver 1R01CA129533-01A1 (MY), fond fra a sundere Wisconsin (YL), og en fond fra Institut for Laboratory Medicin og Patologi, Mayo Clinic (LB). De finansieringskilder havde ingen rolle i studie design, indsamling og analyse af data, beslutning om at offentliggøre, eller forberedelse af manuskriptet
Konkurrerende interesser:.. Forfatterne har erklæret, at der ikke findes konkurrerende interesser
Introduktion
Lungekræft er stadig den hyppigste årsag til kræft dødsfald for både mænd og kvinder i USA, selv om terapeutiske resultater gradvist blevet forbedret. I 2010 blev der anslået 222,520 nye tilfælde af lungekræft diagnosticeret og kun 15% af dem vil være i live efter 5 år [1]. Ikke-småcellet lungekræft (NSCLC) udgør omkring 85% af alle lungekræfttilfælde, med småcellet carcinom udgør de resterende 15%. Ca. 25% til 30% af patienter med NSCLC har stadium I-sygdom og modtage kirurgiske indgreb alene. Trods undergår helbredende operation, vil mere end 25% af patienter med stadium I NSCLC dør af tilbagevendende sygdom inden for fem år [2], [3]. Adjuverende cisplatin kemoterapi i fase I-III NSCLC forbedrer overlevelsen beskedent efter kirurgisk resektion [4], [5], [6]. Kræft og Leukæmi gruppe B (CALGB) 9633, et fase III-undersøgelse, som sammenlignede adjuverende behandling med carboplatin /paclitaxel versus kirurgi alene for helt reseceret fase IB NSCLC, viste en betydelig overlevelse fordele på adjuverende behandling efter 2,8 års median opfølgning [7 ], men efter 4,5 års opfølgning [8]. Pålidelige kliniske eller molekylære prognostiske faktorer, samt retningslinjer for behandling af recidiverende fase I NSCLC er ikke blevet godt belyst. På grund af heterogenitet i tilbagefaldsrater blandt cancerpatienter med det samme stadium, er det afgørende at isolere en pålidelig molekylær signatur i tumorer, som kunne anvendes til at identificere dem, der er tilbøjelige til at udvikle tilbagevendende sygdom og vil således drage fordel af adjuverende behandling. Desuden identifikation af gener og molekylære veje kritiske for udvikling af metastaser kan føre til fremskridt i terapi.
Fremskridt i menneskelige genomics og proteomics har genereret lister over kandidat biomarkører med potentielle kliniske værdier. Genekspressionsprofilering er blevet anvendt til at karakterisere prognosen i lungekræft, for det meste under anvendelse af samlet overlevelse (OS) snarere end tumortilbagevenden som et slutpunkt [9], [10], [11], [12], [13], [14 ]. Men manglede, de identificerede overlevelse gener sammenhæng mellem disse undersøgelser, sandsynligvis på grund af begrænsede patientprøver, sygdom heterogenitet, og /eller tekniske faktorer som forskelle i microarray platforme og prøvebehandling. Integration microarray data fra flere undersøgelser for at øge stikprøvestørrelsen lover for udvikling af mere robuste prognostiske tests. Vi derfor foretaget en meta-analyse af syv datasæt for at søge efter differentielt udtrykte gener relateret til den samlede overlevelsestid [15] og identificeret en 64-genekspression signatur, er yderst prædiktive af OS af fase I NSCLC patienter. Vores resultater viser, at genekspression signaturer er nyttig til at forudsige overlevelse fase I lungekræft, og meta-analyse af microarray datasæt øger statistisk styrke til påvisning af overlevelses-relaterede differentielt udtrykte gener.
I undersøgelser af effektiviteten af adjuverende terapi, er OS betragtes som guldstandarden slutpunktet. Er ulempen ved operativsystem er dog, at det kræver en udvidet opfølgning. For nylig flere undersøgelser udforskede sygdomsfri overlevelse (DFS) som et muligt alternativ slutpunktet for OS. Nogle beviser var blevet tilbudt for brug af DFS som et surrogat for OS i tarmkræft, brystkræft og mavekræft [16]. I disse undersøgelser den Pearsons korrelation mellem 5-års OS og 3-års DFS var 0,97 og Spearman rang korrelation var 0,92; Den Pearsons korrelation mellem hazard ratio til OS og DFS var 0,85 og Spearman rang korrelation var 0,87.
I denne undersøgelse, vi gennemførte en meta-analyse af microarray datasæt fra forskellige institutioner til at udvikle og validere en ny gen-ekspression signatur, der præcist kan forudsige tumor gentagelse af trin i NSCLC patienter. Den identificerede signatur har potentiale til at forfine den kliniske praksis i de patienter ledelse med opereret NSCLC.
Metoder
Dataindsamling
Direktørens Challenge Consortium for Molekylær Klassificering af Lung Adencarcinoma ( “Instruktørens Challenge konsortiet”) indsamlet mere end 300 lunge adenocacinoma prøver fra fire institutioner (HLM, mich, DFCI, og MSKCC) sammen med relevante kliniske data [17]. I vores undersøgelse har vi brugt i alt 142 patientprøver med fase I lunge adencarcinoma, der ikke blev givet adjuverende kemoterapi eller strålebehandling, som uddannelse prøver at identificere et gen-udtryk signatur for tilbagefald overlevelse. Dataene blev hentet fra https://array.nci.nih.gov/caarray/project/details.action?project.experiment.publicIdentifier=jacob-00182.
Other fire uafhængige datasæt (datasæt 2-5) blev brugt som test prøver til validering af den identificerede signatur. Dataset 2 omfattede 46 trins I lunge adenokarcinomer. Dataset 3 omfattede både adenokarcinomer og planocellulært karcinom med 64% af 138 prøver er trin I tumorer. Det er vigtigt at vide, om vores udviklet signatur kan anvendes til andre cancer subtype såsom pladecellecarcinomer eller ikke. Dataset 2 og 3 blev hentet fra GEO database (GSE5843 og GSE8894). Dataset 4 blev genereret af Mayo Clinic og omfattede 54 trin I NSCLC i aldrig rygere, og de fleste af dem var adenokarcinomer. Dataset 5 blev genereret af vores egen gruppe på Washington University, som blev brugt til at identificere vores 64-gen signatur for samlet overlevelse (data blev deponeret i GEO database GSE6253) [15]. Alle patienter i disse validering sæt blev ikke givet adjuverende kemoterapi eller strålebehandling.
PRISMA 2009 flowdiagram for udvælgelsen datasæt er vist i figur S1. Nærmere oplysninger om kliniske oplysninger om de emner i hvert datasæt er beskrevet i tabel 1. endepunkt var tid til tilbagefald, defineret som tiden fra kirurgisk resektion til den første tegn på tumor recidiv (lokalt, regionalt eller fjern). Patienterne blev censureret fra gentagelse analyse på det tidligste af følgende tidspunkter: død, udvikling af anden primær NSCLC, eller sidste medicinsk kontakt. De involverede microarray platforme inkluderet Affymetrix Hu133A (datasæt 1), Hu133plus2 (datasæt 3), HG_U95Av2 array (datasæt 5), 22 K Operon Human Genome Oligo Set V2.1 (https://www.operon.com) (datasæt 2) og Illumina DASL assay (datasæt 4).
data Processing
selvom uddannelsen datasættet er fra en undersøgelse, blev prøverne indsamlet og profileret i fire forskellige institutioner. Systematiske forskelle i genekspression fra disse institutioner kan være bemærkelsesværdigt, hvilket ville kompromittere integriteten af data fra forskellige laboratorier. Afstanden-vægtede forskelsbehandling (DWD) metode (https://genome.unc.edu/pubsup/dwd/index.html) blev anvendt til at identificere og justere systematiske afvigelser, der var til stede i denne microarray datasæt. Den DWD metode korrigerer for systematiske afvigelser på tværs af microarray partier ved at finde en adskillende hyperplan mellem de to partier og justering af data ved at projicere de forskellige partier på DWD flyet, finde partiet mener, og derefter trække ud DWD planet multipliceres med denne middelværdi [ ,,,0],18].
Statistisk analyse
Identificer differentielt udtrykte gener relateret til tilbagefald.
Multivariate Cox proportionel risiko regressions analyser (korrigeret for alder, køn og cancer etape) med 10.000 bootstrap resampling blev udført for hvert gen ved hjælp af alle de 142 prøver i Dataset 1. proportionale farer antagelse for disse variabler blev undersøgt ved at undersøge de skalerede Schoenfeld residualerne. Den kategoriske variable køn og kræft etape viste væsentlig afvigelse fra den proportionale farer antagelse og blev derfor taget som lag i regressionsmodeller. Generne blev derefter rangeret efter bootstrap frekvenser af P 0,01 for deres genekspression i regressionsmodeller. Vi derefter udført GO sigt berigelse analyse på disse differentielt udtrykte gener ved hjælp af Database til anmærkning, Visualisering og integreret Discovery (DAVID) bioinformatik ressourcer (https://david.abcc.ncifcrf.gov/home.jsp). Lignende statistiske analyser blev beskrevet i en tidligere undersøgelse [15].
Definer et gen-udtryk signatur for tilbagefald.
Følgende overlevelse analyser blev også baseret på alle de 142 prøver i Dataset 1 . Delvis Cox regression metode blev udført for at konstruere prædiktive komponenter [19]. Disse bestanddele blev derefter anvendt i Cox model for opbygning prædiktive modeller for fornyet overlevelse af cancerpatienter. Princippet komponenter blev valgt i modellen for at maksimere Somers ‘DXY rang korrelation. De risikoscorer blev beregnet ved, hvor repræsenterer antallet af gener; repræsenterer det estimerede koefficient af th genet; repræsenterer genekspressionsniveauer i th gen i alle prøverne, hvor er prøvestørrelsen og er genet ekspressionsniveauet af genet fra prøven. Alle prøverne blev klassificeret i høj og lav risikogrupper i henhold til de risikofaktorer scoringer. Patienter med risiko score mindre end nul potentielt har langsigtede tilbagefald-fri overlevelse og dem større end nul har kortsigtet tilbagefald overlevelse efter kirurgisk resektion. For at vælge en passende delmængde af gener til underskrift, vi foretaget en fremadrettet udvælgelsesprocedure for at optimere et gen-udtryk signatur: 1) øge ét gen hver gang baseret på rang af gener, der blev identificeret i ovenstående bootstrap analyser 2) udføre den delvise Cox regressionsanalyse og opnå forudsigelsen nøjagtighed ved hjælp af den valgte delmængde af gener; og 3) gentage trin 1 og 2, indtil forudsigelsesnøjagtighed maksimeres. Forudsigelsen nøjagtighed (diskrimination evne) blev vurderet ved Somers ‘DXY rang korrelation af anslået risikoscore og real overlevelsestid. Somers ‘DXY er relateret til C-indekset med DXY = 2 (C-0,5). C er den tilsvarende modtager operating characteristic (ROC) kurve område, som er en grafisk repræsentation af parrene af falsk positive testresultater (specificitet) og true-positive testresultater (følsomhed) for realisation af en kvantitativ test.
for at identificere et gen signatur håndfast forudsige tid til tilbagefald, leave-one-out cross-validering (LOOCV) blev anvendt. Kort fortalt blev 142 gentagelser af ovennævnte udvælgelsesprocedure fremad udføres således, at hver prøve blev udeladt en gang med et sæt gener i forhold til tid til tilbagefald beregnes ved hver iteration. Hyppigheden af de gener, der forekommer i underskrifterne blev rangordnet at identificere gener, der konsekvent og robust, korrelerede med resultatet. De gener, der passerede den indstillede kriterium (frekvens 50%). Blev udvalgt til at omfatte den endelige underskrift
For at evaluere den prædiktive ydeevne foreslåede gen signatur, vi ansat tidsafhængig ROC analyse for censurerede data og areal under kurven (AUC) som vores kriterier til vurdering returperioder forudsigelser. De tidsafhængige sensitivitet og specificitet funktioner er defineret som: og. Den tilsvarende ROC (t) kurve for enhver tid t er lig med afbildningen af {følsomhed (c, t)} versus {1 – specificitet (c, t)}, med cutoff punkt c varierende. X er kovariat og D (t) er den begivenhed indikator (her, gentagelse) på tidspunkt t. Arealet under kurven, AUC (t), er defineret som arealet under ROC (t) kurve. En nærmeste nabo estimator for bivariate fordeling funktion bruges til at estimere disse betingede sandsynligheder tegner sig for eventuel censur [20]. AUC kan anvendes som en nøjagtighed mål for diagnostisk markør; jo større AUC, jo bedre forudsigelsesmodel. AUC = 0,5 angiver ingen forudsigelseskraft, mens AUC = 1 repræsenterer perfekt prædiktiv ydeevne. Kaplan-Meier-overlevelse analyser blev gennemført efter prøverne blev klassificeret i to risikogrupper. Forskelle i den tilbagevendende risiko mellem de to risikogrupper blev vurderet ved hjælp af Mantel-Haenszel log rank test. Den større område mellem de to risikogrupper og dens tilhørende mindre p-værdi fra Mantel-Haenszel log rank test implicerer en bedre klassifikation model. Somers ‘DXY rang korrelation af anslået risikoscore og real overlevelsestid blev også beregnet.
Godkend signaturen i fire uafhængige microarray datasæt.
Efter undertegnelsen blev defineret, vi vurderet det i fire uafhængige datasæt (dvs. datasæt 2-5). De udtryk data af gener i signaturen blev anvendt til at estimere risikoen score for hver prøver i de uafhængige datasæt. Bemærk venligst, at gen-tal, der bruges til at estimere risikoscore var anderledes på grund af de forskellige microarray platforme, der anvendes i uddannelsen datasættet og afprøvning datasæt. Den delvise Cox regression blev redone for hver datasæt at få den estimerede koefficient for hvert gen for at beregne risikoen score for hver prøve. Somers ‘DXY rang korrelation af anslået risikoscore og real overlevelsestid blev beregnet og tidsafhængig ROC-analyse blev udført for hver test datasæt.
Identificer betydelige veje relateret til tilbagefald.
Delvis Cox regression metoden blev også udført for hver Kegg pathway. Risikofaktorerne scoringer blev beregnet ved hjælp af gen-sæt i hver sti. Alle prøverne blev klassificeret i høj og lav risikogrupper i henhold til de risikofaktorer scoringer. Forskelle i tilbagevendende risiko mellem de to risikogrupper blev vurderet ved hjælp af Mantel-Haenszel log rank test. P-værdier mindre end 10
-4 var brug for at definere væsentlige veje.
Alle data analyser blev gennemført ved hjælp af R statistisk pakke (www.r-project.org).
Resultater
differentielt udtrykte gener, der er forbundet med gentagelse
for at identificere en genekspression underskrift tumor tilbagefald, vi analyserede et træningssæt af 142 trins i lunge adencarcinomas fra direktørens Challenge Consortium, herunder 70 med stadie IA (T1N0M0) sygdom og 72 med scenen IB (T2N0M0). Ingen af the142 patienter i analysen blev givet adjuverende kemoterapi eller strålebehandling. Multivariate Cox proportionel risiko regressions analyser med bootstrap resampling tilgange blev udført for hvert gen at afgøre, om det i væsentlig grad var forbundet med kræft tilbagefald. Vi identificerede 104 probesets fra 98 kendte gener med bootstrap frekvenser større end 80% af deres genekspression i regressionsmodeller (tabel S1). Atten probesets var forbundet med godt resultat (hazard ratio 1,0), det vil sige patienter med højere udtryk for disse gener tendens til at have længere tilbagefald overlevelse. I modsætning hertil blev de andre 86 probesets forbundet med dårligt resultat (hazard ratio 1,0), der er, øget ekspression af disse gener resulterer i kortere gentagelse overlevelse for trin I patienter. GO sigt berigelse analyse på disse differentielt udtrykte gener indikeret en tredjedel af de gener, vi identificerede potentielt involveret i kendte cancer-relaterede veje. Blandt dem,
B4GALT1, CELSR1, CLDN4, CLDN9, COL2A1, ALCAM, ICAM4, MUC5AC og THBS1
er relateret til celleadhæsion;
NLRP2
,
CGB, LUC7L3, ELMO2, EIF2AK2, IFI6, MUC5AC, NFKBIL1, ppt1, PACS2, RHOT1, THBS1
er relateret til apoptose; og
CLEC11A, B4GALT1, BMP-2, EIF2AK2, FABP3, FGFR2, ING1, ITCH, MUC5AC, NFKBIL1, THBS1, TCF3
er relateret til regulering af celledeling.
Identifikation af et gen signatur for gentagelse i træningssættet
Dernæst forsøgte vi at identificere en håndterbar, robust sæt af gener, hvis udtryk kunne bruges til at forudsige primære tumorer sandsynligvis gentage sig. Vi ansat en partiel Cox regressionsanalyse med leave-one-out cross-validering i uddannelsen datasættet af 142 trin I patienter. I hver cross-validering, vi identificeret et gen, signatur, der giver den højeste forudsigelse nøjagtighed og optagede gener indtastet i identificerede signatur. Vi tælles derefter frekvensen af gener til stede i alle de krydsvalidering sæt. Gener med en frekvens 50% blev udvalgt til at omfatte den endelige signatur (tabel 2). Endelig blev risikoscorer estimeret for hver af 142 prøver i uddannelsen datasæt ved hjælp af udtryk data fra disse 51 gener. Baseret på de risikofaktorer scoringer, vi klassificeret disse patienter i høj og lav risikogrupper og udførte Kaplan-Meier overlevelse analyser på disse stratificerede stikprøver. Som vist i fig. 1, gentagelse overlevelse var signifikant forskellig mellem de høje og lave risikogrupper som defineret af risikoscorer anvendes udtryk data (P 1e-16). Kaplan-Meier overlevelseskurver kunne ikke skelne dårligere overlevelse blandt etape IB fra stadie IA NSCLC (P = 0,38). For at vurdere deres prædiktiv præstationer, vi yderligere beregnet den tidsafhængige område under ROC-kurver baseret på enten oplysninger scenen eller de anslåede risiko snesevis af patienterne (Fig. 1C). Udtrykket-baserede stratificeret tilgang udfører meget bedre end den patologiske iscenesættelse metoden. Vores tilgang opnår AUC tæt på 90%, mens Cox model med fase oplysninger resulterer i meget lave AUC’er . 60%
(A) Kaplan-Meier-overlevelseskurver for to grupper af patienter med stadie IA eller IB. (B) Kaplan-Meier-overlevelseskurver for de to grupper af patienter, defineret ved at have positive (høj risiko) eller negative risiko (lav risiko) snesevis af tilbagefald overlevelse. De risikoscorer blev estimeret med 15 principielle komponenter baseret på modellen med 51 gentagelse-fri overlevelse gener. (C) Arealet under kurven (AUC) for tidsafhængigt ROC analyse for overlevelse modeller baseret på oplysninger scenen eller 51-genekspression data hhv. Tiden angives i måneder på x-aksen, er kumulativ overlevelse angivet på y-aksen. Tick mærker, patienter, hvis data blev censureret omsider opfølgning.
Validering af tilbagefald signatur i uafhængige test sæt
For at afgøre, om 51-genet signatur kunne forudsige patienter sandsynlighed for at udvikle tumor tilbagefald i uafhængige stikprøver, vi anvendt det til fire uafhængige datasæt (tabel 1). Specifikt blev en risiko score for hver patient beregnes på basis af ekspressionsniveauerne af de 51-genet signatur; dårligt resultat blev defineret som risikoscore 0 og godt resultat blev defineret som risikoscore 0. Cox proportionel risiko modellering blev anvendt til at klassificere patienter i hver af de test datasæt. Den intelligente nøjagtighed gentagelse signatur blev bestemt ved AUC for tidsafhængig ROC analyse og Somers ‘DXY rang korrelation mellem anslået score risiko og real overlevelsestid.
Mayo Clinic datasæt omfattede 54 aldrig rygere med fase I NSCLC, og hvoraf de fleste var adenokarcinomer. De risikoscorer anslået ved ekspression af 46 gener præsenteret på Illumina DASL assay har høj korrelation med den virkelige overlevelsestid (DXY = -0,853). AUC fra tidsafhængig ROC analyse omkring 88% ved hjælp af risikoscorer og 57% ved hjælp af fase oplysninger. Predicted dårlig resultatmål patienter havde en signifikant dårligere gentagelse overlevelse (log-rank
P
= 4.37e-6) (fig. 2A). I test datasæt GSE5843 med 46 fase I adenocarcinom, genet signatur har en samlet nøjagtighed på 86%, og de forudsagte høj risiko score er signifikant associeret med kortere observerede tid til tilbagefald (log-rank P = 7e-9;. Fig 2B) . I modsætning hertil nøjagtigheden af forudsige tilbagefald ved hjælp etape oplysninger alene er 66%.
Kaplan-Meier overlevelsesanalyse blev udført i lav (
fuld rød linje
) og høj (
stiplet blå line
) risikerer patientgrupper defineret af 51-genet klassificeringen. AUC for overlevelse modeller baseret på scenen (
stiplet rød linje
) eller 51-gen klassificeringen (
fuld sort linje
) blev også sammenlignet. Afprøvningen datasæt GSE8894 ikke har oplysninger scenen og alle patienter i WUSTL datasættet er fase IB. Så den tidsafhængige ROC ved hjælp af oplysninger fase i disse to datasæt kunne ikke beregnes; alle sat til 0,5 i stedet. Tick mærker, patienter, hvis data blev censureret omsider opfølgning.
Kun 32 af 51 gener i tilbagefald signatur findes på den tidlige generation Affymetrix U95A microarray anvendes i WUSTL test datasæt. Trods ufuldstændig repræsentation, underskrift identificerede vi stadig har en god præstation med AUC omkring 85% forudsige recidiv. Kaplan-Meier analyse bekræftede, at den forventede højrisikogruppe har en betydeligt kortere tid til tilbagefald end lav-risiko gruppen (P = 7.36e-5) (Fig. 2C).
GSE8894 er den største test datasæt, herunder 62 adenocarcinomer og 76 planocellulært karcinom. Vi evaluerede effektiviteten af vores underskrifter forudsige recidiv overlevelse i adenokarcinomer og planocellulært karcinom separat. Cox model med risikoscorer anslået af udtryk data give en god prædiktiv ydeevne (DXY = -0,706) med AUC for mere end 85% for adenocarcinom (fig. 2D). I planocellulært karcinom, opnåede vi lidt mindre prædiktive AUC, men den forudsagte højrisiko gruppe stadig havde en betydeligt kortere tid til tilbagefald (DXY = -0,678 og P = 3.48e-7, fig. S2).
væsentlige veje relateret til tilbagefald
Pathway-baserede overlevelse analyser identificeret 97 væsentlige prognostiske Kegg veje relateret til tilbagefald (p 10
-5, tabel S2). Tabel 3 er angivet de øverste 30 vigtige veje, herunder flere vigtige cancer-relaterede veje såsom celleadhæsionsmolekyler, Jak-STAT signalvej, p53 signalvej, MAPK signalvejen, Wnt signalvejen, mTOR signalvejen og ErbB signalvejen. De differentielt udtrykte gener, der er forbundet med gentagelse identificeret ved vores overlevelse analyse blev også beriget med biologisk proces med celleadhæsion.
Diskussion
En væsentlig begrænsning af gældende kliniske prognostiske indikatorer er deres manglende evne til at forudsige, hvilke patienter med tidlig-stadie sygdommen vil udvikle sygdommen tilbagefald. Vi har tidligere beskrevet en 64-gen underskrift af den samlede overlevelse i fase I NSCLC stand til at forudsige udfaldet i uafhængige prøver [15]. I denne undersøgelse, søgte vi at bestemme, om en sammenlignelig signatur eksisterede i trin I adenocarcinomer at forudsige gentagelse overlevelse i lungekræft. Brug microarray datasæt under trin I lungekræft fra direktørens Challenge Consortium, vi videreudviklet et nyt gen-ekspression signatur prædiktiv for fornyet fase I NSCLC patienter. Vi brugte prøver fra fire institutioner i direktørens Challenge Consortium som uddannelsen datasættet til at identificere et gen-udtryk signatur for lungekræft tilbagefald. For at reducere sygdom heterogenitet og forstyrrende effekter fra behandlinger, vi brugte i alt 142 trin I lunge adencarcinomas patienter uden adjuverende kemo- eller strålebehandling-terapi som uddannelsen prøverne (tabel 1). At integrere genekspression data fra de fire institutioner, vi anvendte DWD metode til at fjerne systematiske forskelle, der var til stede i dette datasæt. Efterfølgende vi identificeret 104 gener, hvis udtryk var korreleret med recidiv overlevelse. Som forventet genet ontologi sammensætning af disse gener har biologisk relevans for sygdomstilbagefald, såsom celleadhæsion apoptose, og celleproliferation.
Brug en partiel Cox regression modelbaseret fremad udvælgelsesprocedure, identificerede vi et 51 -genet signatur fra 104 differentielt udtrykte gener. Den identificerede signatur er yderst prædiktive tumor tilbagefald hos patienter med trin I lunge adenokarcinomer. Et af de potentielle problemer i udviklingen af en prædiktiv signatur er model overfitting til uddannelsen datasættet. Dette kan resultere i en signatur, der afspejler de særlige kendetegn ved uddannelses- prøver og kan ikke præcist forudsige udfaldet i uafhængige prøver. For at undgå model overfitting, vi yderligere brugt cross-valideringsprocedure leave-one-out til at generere genet underskrift tilbagefald i uddannelsen datasættet. Følgelig er det også afgørende at validere forudsigelse signatur i uafhængige datasæt. Vi anvendte derfor vores signatur i fire uafhængige datasæt til at vurdere dets forudsigelse ydeevne. Generelt vores underskrift er særdeles prædiktiv for hvilke patienter med trin I lunge adenokarcinomer vil udvikle tilbagefald sygdom, og det opnår mere end 85% i AUC på tværs af forskellige uafhængige datasæt. Testen sæt GSE8894 omfattede både adenokarcinomer og planocellulært karcinom; 36% af prøverne blev avancerede patienter fase. En nylig undersøgelse viste, at lungekræft tilbagefald afhænger histologisk undertype i fase IA ikke-småcellet lungekræft, med højere satser forekommende blandt patienter med ikke-pladecarcinomer [21]. Interessant, de 51-genet signatur var også yderst prædiktive for fornyet overlevelse af planocellulært karcinom i datasættet GSE8894 selvom det oprindeligt stammer fra trin I adenokarcinom.
De identificerede differentielt udtrykte gener i denne undersøgelse kan tilvejebringe ny indsigt i terapeutiske mål og behandling for fornyet sygdom i trin i lunge tumorer. Blandt dem, FBXW7 målretter mTOR for nedbrydning og samarbejder med PTEN i tumor suppression [22]. Den lave FBXW7 udtryk gruppen viste en markant dårligere prognose end i den høje udtryk gruppen hos patienter med kolorektal cancer [23]. Dens nederste udtryk blev også forbundet med nedsat gentagelse overlevelse i trin I lunge adenokarcinomer (tabel S1). En anden interessant kandidat er FGFR2, som er en af transmembrane tyrosinkinasereceptorer involveret i signalering via interaktion med fibroblastvækstfaktor (FGF) -familien. Den fibroblast vækstfaktor (FGF) familie, der omfatter vigtige regulatoriske faktorer for cellevækst og differentiering er fundet, at være involveret i fosterudviklingen, angiogenese og tumorigenese. Det er blevet foreslået, at FGFR2 spiller en vigtig rolle i tumorigenese af gastrisk cancer. Vi fandt den øgede udtryk i FGFR2 er forbundet med dårlig resultat af trin I lungekræftpatienter. En nyudviklet lille-molekyle-virkende FGFR inhibitor, Ki23057, kan konkurrere med ATP for bindingsstedet i kinasen [24]. Det bliver interessant at se, om en sådan inhibitor kan forbedre resultatet af patienter, der forventes at være på et høj risiko for recidiv med genet-udtryk signatur. Desuden har vi også identificeret tre splejsningsfaktorer SFRS2IP, SFRS14 og SFRS18 forbundet med udfaldet sygdom. Alle tre splejsningsfaktorer er medlemmer af arginin /serin-rig familie og fortjener yderligere undersøgelse.
Vores forløb-baserede overlevelse analyser vist sig, at leukocyt transendothelial migration, protein forarbejdning i endoplasmatisk reticulum og celleadhæsionsmolekyler (CAM’er) er de tre øverste Kegg veje højt korreleret med recidiv-overlevelse (fig. S3). Det er ikke en overraskelse, at disse tre veje alle er signifikant relateret til gentagelse. Leukocytter krydser endotelet foring vaskulaturen initieret af chemokine- og adhæsionsmolekyle-induceret intracellulær signalering, der styrer adhæsion, spredning, og motilitet. Samtidig, adhærerende leukocytter udløse endotelet, manipulere barrieren for at fremme deres transmigration i det underliggende væv [25]. CAM er dørvogtere til leukocyt transendothelial migration. Endotelcelle intercellulære CAM’er ekspression er negativt korreleret med metastatisk potentiale i lungecancer [26]. L1 celleadhæsionsmolekyle (L1CAM) har potentiale prognostisk værdi i pulmonale neuroendokrine tumorer. Patienter med højt L1 udtryk har en højere risiko for recidiv sammenlignet med dem med lav L1 udtryk [27]. Det endoplasmatiske reticulum (ER) er et vigtigt organel involveret i mange cellulære funktioner, herunder proteinfoldning og sekretion. ER spiller en afgørende rolle i cellulær protein kvalitetskontrol ved at udtrække og nedværdigende proteiner, der ikke er korrekt foldede eller samles til indfødte komplekser, dvs. ER-associeret nedbrydning (ERAD) for at sikre, at kun korrekt foldet og samlet proteiner transporteres til deres endelige destinationer . ER er også en væsentlig organel for oxygen og næringsstoffer sensing som celler tilpasse sig deres mikromiljø. Udfoldet protein reaktion (UPR) er et cellulært stress respons relateret til ER.
Leave a Reply
Du skal være logget ind for at skrive en kommentar.