PLoS ONE: Opdagelsen af ​​en roman Immun Gene Signature med Gennemgribende prognostiske værdi i kolorektal cancer: En model af Kooperativitet Desorientering Lavet i processen fra udvikling til Cancer

Abstrakt

Immun respons gener spiller en stor rolle i kolorektal carcinogenese ved at mediere inflammation eller immun-overvågning unddragelse. Selv om der er gjort bemærkelsesværdige fremskridt for at undersøge den underliggende mekanisme, blev forståelsen af ​​den komplicerede carcinogenese processen enormt hæmmet af store tumor heterogenitet. Udvikling og carcinogenese deler slående ligheder i deres cellulære adfærd og de underliggende molekylære mekanismer. Sammenhængen mellem fosterudviklingen og carcinogenese gør fosterudvikling en levedygtig referencemodel for at studere kræft og derved omgå den potentielt vildledende kompleksitet tumor heterogenitet. Her foreslog vi, at immun gener, der er ansvarlige for desorientering intra-immun cooperativitet (defineret i denne undersøgelse som afbrydelse af udviklingsmæssige udtryk korrelation mønstre under carcinogenese), sandsynligvis indeholder uudnyttet prognostisk ressource af kolorektal cancer. I denne undersøgelse, vi bestemt mRNA udtryk profilen af ​​137 humane biopsiprøver, herunder prøver fra forskellige stadier af menneskets colon udvikling, kolorektal præcancer progression og kolorektal cancer prøver, blandt hvilke 60 også blev brugt til at generere miRNA udtryk profil. Vi oprindeligt etableret Spearman korrelation overgang model til at kvantificere cooperativitet desorientering forbundet med overgangen fra normal til præcancer til kræft væv, sammenholdt med miRNA-mRNA regulatoriske netværk og machine learning algoritme til at identificere gener med prognostisk værdi. Endelig blev en 12-gen signatur ekstraheret, hvis prognostisk værdi blev vurderet ved anvendelse Kaplan-Meier overlevelsesanalyse i fem uafhængige datasæt. Brug af log-rank test, blev 12-genet signatur tæt knyttet til den samlede overlevelse i fire datasæt (GSE17536, n = 177,

s

= 0,0054, GSE17537, n = 55,

p

= 0,0039, GSE39582, n = 562,

s

= 0,13, GSE39084, n = 70,

s

= 0,11), og signifikant associeret med sygdomsfri overlevelse i fire datasæt (GSE17536 , n = 177,

s

= 0,0018, GSE17537, n = 55,

s

= 0,016; GSE39582, n = 557,

s

= 4.4e-05; GSE14333, n = 226,

s

= 0,032). Cox regressionsanalyse bekræftede, at 12-genet signatur var en uafhængig faktor til at forudsige tarmkræft patientens samlede overlevelse (hazard ratio: 1,759; 95% konfidensinterval: 1,126-2,746;

s

= 0,013], samt sygdomsfri overlevelse (hazard ratio: 2,116; 95% konfidensinterval: 1,324-3,380;

s

= 0,002)

Henvisning:. En N, Shi X, Zhang Y, Lv N, Feng L, Di X, et al (2015) Opdagelsen af ​​en roman Immun Gene Signature med Gennemgribende prognostiske værdi i kolorektal cancer:.. en model af Kooperativitet Desorientering Lavet i processen fra udvikling til kræft PLoS ONE 10 (9): e0137171. doi: 10,1371 /journal.pone.0137171

Redaktør: Zhiqian Zhang, Peking University Cancer Hospital Institute, KINA

modtaget: april 30, 2015 Accepteret: 13 august, 2015; Udgivet : september 1, 2015

Copyright:. © 2015 An et al Dette er en åben adgang artiklen distribueres under betingelserne i Creative Commons Attribution License, som tillader ubegrænset brug, distribution og reproduktion i ethvert medie, forudsat den oprindelige forfatter og kilde krediteres

data Tilgængelighed: de rå og forarbejdede data er deponeret i National center for Biotechnology Information (NCBI) Gene Expression Omnibus database (GEO) med numrene serien tiltrædelse GSE71187 (mRNA-data ) og GSE71130 (miRNA data)

Finansiering:. Dette arbejde blev støttet af National High Technology Research and Development Program Kina (SS2014AA020801, https://www.863.gov.cn/) og Sci Tech Development Program i Beijing (D121100004712002, https://www.bjkw.gov.cn/n8785584/index.html) modtaget af KZ. De finansieringskilder havde ingen rolle i studie design, indsamling og analyse af data, beslutning om at offentliggøre, eller forberedelse af manuskriptet

Konkurrerende interesser:.. Forfatterne har erklæret, at der ikke findes konkurrerende interesser

Introduktion

Kolorektal cancer (CRC) er den tredje mest almindelige kræftform hos mænd (746.000 sager, 10,0% af alle kræfttilfælde) og det andet hos kvinder (614,000 sager, 9,2% af de alle kræftformer) på verdensplan [1]. Trods betydelige fremskridt i forståelsen af ​​dens molekylære mekanisme, CRC fortsat en væsentlig årsag til kræft dødelighed [2]. Tidligere undersøgelser foreslået storstilet heterogenitet forekom i CRC [3-5], såvel som i mange andre typer af cancer [6-8]. Tumor heterogenitet udvikler sig gennem en sekvens af hændelser, styret af klonselektion, hvor genomisk ustabilitet bidrager til at skabe et mangfoldigt celle befolkning, der er genstand for selektion i en mikro-miljø eller terapeutisk sammenhæng [9]. Derfor er der et presserende behov for en ny model, der deler ligheder med kræft i form af celle-adfærdsmæssige og molekylære egenskaber, men det er reelt mere “organiseret”.

Det har været mere end 150 år siden Rudolf Virchow først foreslået at neoplasmer opstår “i overensstemmelse med den samme lov, som regulerer fosterudvikling” i 1858. Sammenhængen mellem fosterudviklingen og carcinogenese er almindeligt rapporteret. Endvidere er visse vigtige udviklingsmæssige gener også involveret i carcinogenese gennem mutations aktivering [10]. Gennem udviklingsmæssige dyremodeller, har molekylære mekanismer for carcinogenese blevet afsløret, og en række nye kræftrelaterede molekyler, veje og biomarkører identificeret [11-13]. Embryonale udvikling og carcinogenese også deler mange andre ligheder med hensyn til cellulære adfærd, herunder epitel-til-mesenkymale overgang (EMT) [14], mesenchymale-til-epitelial overgang (MET) [15], og immun-overvågning unddragelse [16] . Tilsammen disse resultater giver overbevisende dokumentation for, at tumoren kan ses som en afvigende organ, der har erhvervet evnen til ubestemt proliferation gennem akkumulerede strejker [17], og at de molekylære begivenheder, som afviger tumorceller fra normale udviklingsmæssige sti, er sandsynligvis ansvarlige for kræft initiering og progression.

Parvis genekspression korrelationer (ved hjælp Pearson korrelation) anvendes ofte til at bestemme sammenhængen mellem gener i transkriptomisk undersøgelser [18-20]. De parvise genekspression korrelationer i udviklingsstadiet manifestere den fysiologiske tæt på eller fjernt foreninger gen til genregulering. Vores undersøgelse indikerer, at korrelationerne mellem gener i en given funktionel gruppe (immunrespons) viser en bemærkelsesværdigt kompakt og synkroniseret mønster af genekspression, der sikrer tæt regulering af colon udvikling. For en given gen, blev rangordenen af ​​dets overensstemmelse med de resterende medlemmer af dette gen gruppe, der repræsenterer den biologiske forening topologi, formentlig forstyrret under carcinogenese (regulatoriske forhold blev trinvis skiftet fra fysiologiske til patologisk tilstand). Vi antager, at, hvis man ser en tumor som en afvigende udvikling orgel, de skyldige gener der er ansvarlige for at forstyrre integriteten af ​​denne koordinerede genekspression korrelationsmønstret og mere specifikt, forstyrre rangordenen af ​​sammenhængen mønster i denne bestemt gen gruppe under carcinogenese, sandsynligvis holde dyb prognostisk information. Vi definerede dette begreb som “kooperativitet desorientering”, og oprindeligt bygget et Spearman overgang model til at kvantificere kooperativitet desorientering, der opstår under progression fra colon udvikling til præcancer progression til cancer, frem for blot at koncentrere sig om differentielt udtrykte gener med specifikke fænotyper.

MikroRNA’er (miRNA) er en klasse af små ikke-kodende RNA, ~ 22 nt i længde, der regulerer genekspression ved binding til 3′-utranslaterede region (3′-UTR) af målgener fører til nedbrydning eller protein oversættelse inhibering af målgener [21]. MiRNA forudsiges at regulere mere end 60% af alle protein-kodende gener i pattedyr [22] for derved at regulere næsten alle cellulære proces [23, 24]. Vi antager, at miRNA spiller en central rolle i CRC patient overlevelse og at de efterfølgende mål for disse miRNA kan have prognostisk værdi; denne strategi blev også vedtaget af Yang et al. [25], som viste, at ekspressionen af ​​219 miRNA-associerede gener var forbundet med en mesenkymale undertype af serøs ovariecancer forbundet med dårlig samlet overlevelse (OS) [25].

Selvom sammenhængen mellem kooperativitet desorientering, embryonale udvikling og carcinogenese er stadig ikke klart, er det plausibelt, at visse miRNA regulerede gener, som spiller en vigtig rolle i udviklingsfasen og bidrage til cooperativitet desorientering under carcinogenese, kan have en betydelig indvirkning på transformation kræft. Disse gener kan lovende kandidat prognostiske biomarkører.

I denne undersøgelse har vi fokuseret på immunrespons-gener. Immunresponset og mere specifikt, inflammation, har en stor indflydelse på carcinogenese, som enten kan dræbe tumorceller, eller i nogle tilfælde kan mobiliseres for at lette carcinogenese [26]. Betydningen af ​​immunresponset i carcinogenese fået os til at bestemme prognostiske biomarkører for CRC. Vores er den første undersøgelse for at undersøge en række prøver, fra human colon fosterudvikling, kolorektal præcancer progression, at CRC prøver, for at simulere bane af human colon udvikling og carcinogenese. Den Spearman Overgangen model, vi foreslog her er det første skridt i at identificere de skyldige gener [differentielt udtrykte gener (degs) med en ny fortolkning på grundlag af udtrykket korrelationsmønstret] ansvarlig for at forstyrre den organiserede korrelationsmønstret blandt immun-relaterede gener under carcinogenese. Brug af microarray teknologi og bioinformatik analyser identificerede vi et 12-gen signatur med betydelig prognostisk værdi, som kan være klinisk relevant i fremtiden.

Materialer og metoder

En skematisk for undersøgelsen er afbildet i figur 1.

CRC

kolorektal cancer,

DVIG

udvikling varierende immun gen,

OS

samlet overlevelse,

DFS

sygdomsfri overlevelse

Patienter og prøver

i overensstemmelse med principperne i mave udviklingsmæssige biologi [27], udvikle kolon prøver blev opnået fra 20 abort sager ved Maternal Child Health Care Hospital i Hai Dian mellem 2007 og 2009. Prøverne omfattede hele embryoner (WE) på tre til fem postovulatory uger (PWS), tidlige embryonale koloner (EØF) på otte til ti PWS og mellemledere embryonale koloner (MEC) ved 14 til 22 PWS. Inden for 10 minutter af abort, blev vævene skyllet med normalt saltvand, og hele embryoner eller embryonale koloner blev omhyggeligt adskilt fra føtale væv med vejledning af et Nikon stereomikroskop SMZ1500 (Japan). Embryoner /fostre med kendte eller mistænkte genetiske sygdomme blev udelukket.

Normale kolorektale slimhinder prøver blev indsamlet fra patienter med hæmorider, der fik kirurgisk excision ved Institut for Colon og rektal kirurgi af Beijing Shi Ji Tan Hospital mellem 2009 og 2010 . Fifty-to CRC prøver med OS oplysninger blev opnået under kirurgisk resektion fra Zhe Jiang University School of Medicine. Koloskopi biopsiprøver, herunder kolorektale adenomer og adenocarcinomer blev opnået fra Institut for endoskopi, Cancer Hospital, Chinese Academy of Medical Sciences, mellem 2008 og 2011. Patienter med historien om familiær adenomatøs polypose, arvelig ikke-polypose CRC, eller inflammatorisk tarmsygdom blev udelukket. Adenom er defineret som dysplasi, carcinoma in situ, mistanke for invasiv karcinom og intramucosal carcinoma; den adenocarcinom defineres som submukøst invasion ved adenocarcinom [28]. Fire til seks områder blev udskåret fra colorektale neoplasi prøver, herunder kanterne og midten af ​​læsionen, ifølge ASGE retningslinje [29]. Vævsprøver blev alle snap-frosset i flydende nitrogen umiddelbart efter biopsi eller kirurgi og opbevaret ved -80 ° C. En portion af alle prøverne blev underkastet patologisk analyse udført af to uafhængige, blindede og erfarne patologer. Prøver tilfredse med de diagnostiske kriterier for normal slimhinde og neoplasi (neoplastiske celler 70%) blev inkluderet. Hvis mere end en biopsiprøve taget fra den samme patient, blev disse prøver poolet. Alle donorer underskrevet informeret samtykke formularer. Brugen af ​​humane vævsprøver og de eksperimentelle procedurer for denne undersøgelse blev gennemgået og godkendt af den etiske komité for Cancer Institute og Hospital, Chinese Academy of Medical Sciences.

RNA isolering

Total RNA blev ekstraheret fra frosne væv under anvendelse af TRIzol RNA-isolering reagens (Invitrogen, Carlsbad, CA, USA) i overensstemmelse med producentens specifikationer. RNA integritet blev evalueret ved anvendelse af en 2100 Bioanalyzer (Agilent Technologies, Santa Clara, CA, USA). Hvis RNA integritet nummer var ≥ 5, det totale RNA blev yderligere oprenset under anvendelse af RNeasy Mini Kit (Cat No.74106, Qiagen, Tyskland). RNA-koncentrationer blev bestemt med en NanoDrop ND-1000 spektrofotometer (NanoDrop Technologies, Wilmington, USA).

Microarray udtryk profilering og data normalisering

Efter histopatologisk evaluering og RNA integritet analyse, alle prøver var analyseret under anvendelse Agilent microarrays. Biopsiprøver herunder 6 WE, 6 EØF, 8 MEC, 12 normal, 58 adenom og 47 adenocarcinom prøver blev anvendt til mRNA microarray analyse; af disse blev 60 prøver (2 WE, 6 EØF, 8 MEC, 11 normal, 9 adenom og 24 adenocarcinom prøver) anvendes også til miRNA microarray analyse. Oprensede samlede RNA-prøver blev mærket og hybridiseret til Agilent 4 × 44K Whole Human Genome Oligo Microarrays (G4112F) ifølge producentens instruktioner. For miRNA arrays, blev total RNA analyseret med en Agilent 8 × 15K Menneskelig miRNA Microarray V3 (G4470C).

mRNA og miRNA microarray rådata blev normaliseret ved hjælp af GeneSpring GX-software version 11.5 (Silicon Genetics, Redwood City, CA, USA). For mRNA-ekspression data, opnåedes i alt 41,091 enkelt prober ifølge GeneSpring standardindstilling. Udtrykket værdi for et bestemt gen blev bestemt som middelværdien af ​​alle prober kortlægning til dette gen. Til sidst blev opnået udtrykket værdier på 18,986 gener. Målte miRNA blev anset stede, hvis deres signal kunne detekteres i mindst 50% af prøverne inden for hver prøvetype. Udtrykket profiler blev erhvervet i 96 miRNA. De rå og behandlede data er deponeret i National Center for Biotechnology Information (NCBI) Gene Expression Omnibus database (GEO) med numrene serien tiltrædelse GSE71187 (mRNA data) og GSE71130 (miRNA-data).

Affymetrix microarray dataindsamling, forbehandling, og normalisering

De rå data for fem menneskelige kolorektal cancer mRNA microarray studier (tabel 1) blev hentet fra GEO. Den kombinerede sæt data indeholdt i alt 1.094 prøver blev behandlet på Affymetrix HG-U133A Plus2 (GPL570) arrays, som indeholder 52,475 sonder. Normaliserede udtryk værdier blev opnået via den robuste multi array gennemsnit (RMA) algoritme og yderligere fraktil normaliseret ved hjælp af “affy” BioConductor pakke. Combat algoritme blev benyttet for at eliminere potentielle batch effekter med BioConductor pakken “inSilicoMerging”. Ekspressionsniveauerne af 20,184 gener blev opnået som medianværdien af ​​alle prober kortlægning til et bestemt gen. Alle kliniske oplysninger blev ekstraheret fra de oprindelige udgivelser. Blandt disse fem datasæt, GSE17536, GSE17537 og GSE39582 indeholder både OS og sygdomsfri overlevelse (DFS) oplysninger. GSE39084 indeholder OS kun data, mens GSE14333 indeholder kun DFS oplysninger.

Identifikation “udviklingsorienterede varierende immun-relaterede gener” (DVIGs)

WE, EØF, MEC og normale prøver repræsenteret prøver på forskellige stadier af menneskets colon udvikling; adenomer blev betragtet som forstadier til kræft; og adenocarcinomer repræsenterede kræft stadium. Gener, der faldt under Gene ontologi (https://www.geneontology.org) udtrykket GO: 0.006.955 blev anset immunrespons-gener; dette resulterede i 1028 gener hvoraf 972 var til stede i vore mRNA microarray data. ANOVA blev anvendt til at hente 665 DVIGs der var forskelligt udtryk under udviklingsstadiet (FDR 0,0001).

Etablering af Spearman overgangen model

En detaljeret beskrivelse af Spearman overgangen model præsenteres i S1 Metoder.

Konstruktion af en miRNA-mRNA regulatoriske netværk

en miRNA-mRNA regulatoriske netværk blev genereret baseret på sekvens algoritmer (Miranda [30], Targetscan [31], PicTar [32] ) og microarray data (60 biopsi prøver med både miRNA og mRNA microarray data). En miRNA-mRNA regulatoriske par blev betragtet som fast, hvis de opfyldte mindst to sekvens algoritmer og hvis deres udtryk niveauer blev betydeligt, og omvendt korreleret (FDR 0,01).

Etablering af en CRC-gen signatur ved hjælp machine learning anvendt til mRNA ekspression profiler af primære kliniske prøver

af de 52 kirurgisk udtaget CRC prøver, valgte vi 19 og 22 tilfælde, hvor patienter overlevede længere ( “Good gruppe”) eller kortere ( “Poor gruppe”) end fem år ( efter kirurgi) til at træne en tilfældig skov machine learning model. Kort fortalt blev gener bestilt af gennemsnitlige fald Gini (MDG) kriterium, hvor gener sorteret efter deres grad af indflydelse på udførelsen af ​​den tilfældige skove klassificering; forlade en ud krydsvalidering (LOOCV) at estimere “Poor stemme” andel af prøvesag, som blev yderligere behandlet som prædiktor i receiver opererer karakteristik (ROC) test. Generne blev derefter rekursivt elimineret baseret på det oprindelige gen ranking, indtil arealet under ROC-kurven (AUC) blev optimeret. Denne algoritme er klart beskrevet i tidligere forskning som AUC-RF algoritme [33].

Kaplan-Meier overlevelsesanalyse og Cox regressionsanalyse

Principal komponent analyse (PCA) blev udført ved hjælp af gener af interesse i hver downloadet Affymetrix datasæt. Den første principale komponent (PC1) fanger den største mængde af den samlede varians i profilerne og blev beregnet for hver patient. Patienterne blev derefter delt i to lige store grupper baseret på rangordenen af ​​PC1 på tværs af deres tumor profiler. Kaplan-Meier overlevelsesanalyse og log-rank testen blev anvendt til at evaluere den prognostiske forskel mellem de to PC1-tildelt grupper [12]. Cox proportional hazards regression model blev brugt til at evaluere uafhængighed prognostiske faktorer på en trinvis måde. Prøver i den kombinerede Affymetrix datasæt (1.094 prøver) med fuldstændige oplysninger om alder, køn, American fælles udvalg om kræft (AJCC) (stadium), patologisk bedømmelse (klasse) og overlevelse oplysninger blev anvendt (213 prøver til OS Cox analyse og 213 prøver til DFS Cox-analyse), og en værdi på

s

0,05 blev betragtet som signifikant.

Gene signaturvalidering brug af vilkårlig gen prøveudtagning

Vores strategi var at vælge en lille gen signatur med betydelig prognostisk værdi ved at indsnævre gener af interesse i en trinvis måde. For at bevise, at denne metode virkelig forudsagt overlevelse resultat, n-genet (hvor den endelige gen signatur indeholder n-gener) stikprøver blev udført 2000 gange i hver genpulje. Kaplan-Meier overlevelse analyse blev udført med tilfældigt udvalgte n-gener, og blev registreret det antal gange, der tilfældigt udvalgte gener samtidigt kunne diskriminere alle de mål overlevelse datasæt.

Statistiske analyser Salg

Alle statistiske analyser blev henrettet ved hjælp af R-projektet software (Version 2.15.1), og BioConductor (Version 2.11). R pakker “randomForest” (Version 4,6-7) [34] og “PROC” (Version 1.7.1) [35] blev anvendt til konstruktion AUC-RF model. Differentielt udtrykte gener blev opnået ved anvendelse af R-pakken “SAMR”. Kaplan-Meier overlevelse analyse blev udført ved hjælp af R-pakken “overlevelse”. Den BioConductor annotation pakke “org.Hs.eg.db” (Version 2.8.0) blev anvendt til at hente immunrelaterede gener [36]. Afbildninger mellem Affymetrix prober og Entrez gen identifikatorer blev udført under anvendelse af biologisk leder pakke “hgu133plus2.db”. Meta-analyse blev udført med R-pakken “meta”, og skov plots blev foretaget ved hjælp af R-pakken “rmeta”. Netværk visualisering blev udført i Cytoscape (Version 3.2.0) [37].

Resultater

Gener differentielt udtrykte mellem normal og CRC væv er signifikant beriget til Reactome udtrykket “signalering i immunsystemet”

differentielt udtrykte gener (degs) mellem normale og CRC væv blev identificeret ved hjælp af SAM-algoritmen (FDR 1e-07). Degs omfattede 3.226 og 2.538 markant op- og nedreguleret gener i CRC. Brug Reactome berigelse analyse, udført med DAVID Bioinformatik Resources 6.7 (https://david.abcc.ncifcrf.gov/), vi fandt, at Reactome udtrykket “signalering i immunsystemet” var signifikant beriget i CRC’er (Bonferroni-justeret

p Drømmeholdet værdi = 0,004), hvilket tyder på en signifikant sammenhæng mellem carcinogenese og immun-relaterede gener (S1 tabel).

Pearson korrelation heatmaps

Parvis Pearson korrelationer blandt de 665 DVIGs blev beregnet, og korrigeres for at eliminere bias (justeret fremgangsmåde blev beskrevet i S1 fremgangsmåder). Pearson korrelation heatmaps (665 × 665) blev konstrueret til kolon prøver under colon udvikling (Fig 2A), progression (Fig 2B) og kræft (fig 2C) etaper. Under udviklingsstadiet, blev tre forskellige klynger opnået. Tydelige klynger var dog ikke tydeligt i løbet af progression og kræft etaper. Ved at overlejre de tre Pearson korrelation tæthed kurver (Fig 2D), blev en klar bimodal fordeling ses for udviklingsstadiet, i modsætning til de unimodal fordelinger af de progression og kræft etaper. Endvidere kræft scenen havde en højere maksimal tæthed ved en Pearson korrelation på nul i forhold til progression eller udviklingsstadier.

Heatmaps af justerede Pearson korrelationer for 665 DVIGs i (A) udvikling, (B) præcancer progression og (C) kræft hhv. Gener blev grupperet i tre klynger (fremhævet med forskellige farver) af UCA. (D) Density plot af parvise justerede Pearson korrelationer for alle tre faser. Kurven for udviklingsstadiet er bimodal fordeling, men unimodal i progression og kræft etaper. For at gøre intra-immune vektorer sammenlignelige, blev generne omorganiseret i progression og kræft fase heatmaps at matche ordre i udviklingsfasen Heatmap, at generere (E) omstruktureret progression Heatmap og (F) genbestilles kræft Heatmap.

DVIG

, udvikling varierende immun gen;

UCA

, uden opsyn klyngedannelse algoritme.

“Lydige gener” blev filtreret ved hjælp Spearman overgang model

Pearson korrelation heatmaps af DVIGs løbet af progression og kræft stadier var genbestilles at gøre alle tre faser (fig 2E og 2F, der er beskrevet i S1 Methods). Som vist i fig 3A, blev 665 DVIGs projiceret på en Spearman overgang koordinatsystem, med Spearman overgangen mellem udvikling og progression (STD-P, S1 Metoder) og mellem progression og cancer (STP-C, S1 metoder) som x og y-aksen koordinater hhv. Gener blev farvet på samme måde som i den udviklingsmæssige Heatmap clustering i fig 2A. Af de 665 DVIGs, 385 (betegnet “lydige gener”) faldt inden for kvartalet cirkels bue, mens de resterende 280 (betegnet “omdirigering gener”) faldt uden for denne bue og blev brugt som kandidater til nedstrøms udvælgelsesprocedurer.

(a) de 665 DVIGs blev projiceret op på en Spearman korrelation overgang koordinatsystem baseret på deres kooperativitet desorientering mellem de på hinanden følgende etaper. Gener blev farvet på samme måde som i udviklingen Heatmap. (B) AUC-RF algoritme blev anvendt til gen-signatur optimering. Gener blev rekursivt fjernet fra en betydning bestilt gen listen, indtil den største AUC værdi blev opfyldt. (C) Den største AUC for 0,904 (95%

CI

: 0,799 ~ 1,000) blev opnået når antallet af gener blev reduceret til 12, med 81,8% følsomhed (95%

CI

: 0,636-0,955) og 89,5% specificitet (95%

CI

: 0,737-1,000).

Dev

, udvikling;

Prog

, progression;

TPS

teoretisk stabilt punkt;

AUC

, areal under kurven;

DVIG

, udvikling varierende immun gen;

CI

, interval tillid.

viderestilling gener med en eller flere miRNA regulatorer opholdt sig i genpuljen

Brug af parrede mRNA og miRNA data, der var tilgængelige for 60 af CRC biopsiprøver, konstruerede vi en miRNA-mRNA tilsynsnetværk at vælge omdirigering gener, der havde mindst én miRNA regulator (S1 fremgangsmåder). Dette resulterede i 59 omdirigering gener, blev potentielt reguleret af 37 miRNA (Fig 4, S2 tabel).

Mørke gule knuder repræsenterer miRNA. Rød og safir noder repræsenterer mRNA, blandt hvilke røde er gener i 12-genet signatur. Instrueret massive kanter repræsenterer miRNA-mRNA regulering.

Gene signatur optimering af AUC-RF algoritme

De 59 omdirigering gener blev yderligere indsnævret disse 59 gener for at opnå den delmængde af gener giver den bedste prognostiske ydeevne. Disse gener blev først beordret efter deres betydning i diskriminerende tilfælde af OS (længere eller kortere end 5 år) ved hjælp af tilfældige skov algoritme; gener blev derefter rekursivt fjernet fra bunden af ​​listen, indtil området under ROC-kurven (AUC) blev optimeret (AUC = 0,904, 95%

CI

: 0,799-1,000, Fig 3B). Dette resulterede i en optimeret 12-gen signatur, havde 81,8% sensitivitet (95%

CI

: 0,636-0,955) og 89,5% specificitet (95%

CI

: 0,737-1,000) i diskriminerende fattige fra god OS i 52 kirurgi prøver med en “fattige” stemmeberettigede andel af 0.560 (figur 3C). Denne 12-gen signatur består af

AXL

,

BCI3

,

COLEC12

,

ABR

,

PXDN

,

EP300

,

JAM3

,

MAP3K1

,

CASP8

,

RPS6KA1

,

CHUK

, og

RPS6KA2

, og reguleres af 16 miRNA (Fig 4).

Kaplan-Meier overlevelse og Cox regressionsanalyse bekræftede gyldigheden af ​​12-genet signatur

Kaplan-Meier overlevelsesanalyse blev udført for at evaluere den prognostiske værdi af 12-genet signatur i fem Affymetrix datasæt hentet fra GEO database. Af log-rank testresultater bekræftede, at 12-genet signatur blev tæt knyttet til OS i fire datasæt (Fig 5A, GSE17536, n = 177,

s

= 0,0054, GSE17537, n = 55,

p

= 0,0039, GSE39582, n = 562,

s

= 0,13, GSE39084, n = 70,

s

= 0,11). Desuden blev denne 12-gen signatur signifikant associeret med DFS i fire datasæt (Fig 5B, GSE17536, n = 177,

s

= 0,0018, GSE17537, n = 55,

s

= 0,016 ; GSE39582, n = 557,

s

= 4.4e-05, GSE14333, n = 226,

s

= 0,032). Cox regressionsanalyse bekræftede også, at 12-genet signatur var en uafhængig faktor i at forudsige CRC patientens OS [Tabel 2; hazard ratio (

HR

): 1,759; 95%

CI

: 1,126-2,746;

s

= 0,013], samt DFS (tabel 2;

HR

: 2,116; 95%

CI

: 1,324-3,380;

s

= 0,002). Meta-analyse blev udført for at evaluere sammenhængen mellem hver af de 12 gener og overlevelse (OS: GSE17536, GSE17537, GSE39582 og GSE39084, og DFS: GSE17536, GSE17537, GSE39582 og GSE14333) i CRC patienter med fast effekt model (Fig 6A ) og random-effekt model (figur 6B).

Kaplan-Meier overlevelse analyser og log-rank test blev udført for at vurdere den prognostiske værdi af 12-genet signatur. (A) Udførelsen af ​​12-genet signatur i OS diskrimination. Datasæt med OS oplysninger var GSE17536, GSE17537, GSE39582 og GSE39084. (B) Udførelsen af ​​12-genet signatur i DFS diskrimination. Datasæt med DFS oplysninger var GSE17536, GSE17537, GSE39582 og GSE14333.

OS

, samlet overlevelse;

DFS

, sygdomsfri overlevelse.

(A) Forest plot af sammenhængen mellem de enkelte gener og OS med en fast effekt model i datasæt indeholdende OS oplysninger (GSE17536, GSE17537 , GSE39582 og GSE39084). Meta-analyse af disse 12 gener i fire uafhængige datasæt blev gennemført, og

HR

, 95%

CI

af hvert gen og tilsvarende

s Drømmeholdet værdi blev beregnet og afbildet i skoven plot. (B) Forest plot af sammenhængen mellem de enkelte gener og DFS med en tilfældig-effekt model i fire datasæt indeholder DFS oplysninger (GSE17536, GSE17537, GSE39582 og GSE14333).

CRC

, kolorektal cancer;

HR

, hazard ratio;

CI

; konfidensinterval;

OS

, samlet overlevelse;

DFS

, sygdomsfri overlevelse.

Tilfældig gen sampling verificeret gyldigheden af ​​vores metode

For at bekræfte gyldigheden af ​​vores underskrift udvælgelsesproces, en 12-gen panel blev udtaget prøver 2000 gange over de 972 immunrelaterede gener, 665 DVIGs, 280 omdirigering gener og 59 miRNA-regulerede gener hhv. Det antal gange, at en tilfældigt udvalgt 12-gen panel samtidigt kunne diskriminere overlevelse datasæt (OS og DFS i GSE17536 og GSE17537, DFS i GSE39582 og GSE14333), var 0, 0, 9 og 33 for de førnævnte fire gen-grupper, henholdsvis , der giver stærke beviser for gyldigheden af ​​vores hypotese og gen signatur-udvalg rørledning (fig 7A).

(A) Bar plot af det antal gange, at 12 tilfældigt udvalgte gener samtidigt kunne diskriminere fire overlevelse datasæt (OS og DFS i GES17536 og GSE17537, DFS i GSE39582 og GSE14333). (B) Heatmap af 137 biopsiprøver oprettet med mRNA-ekspression profil af den 12-genet signatur. MRNA rådata blev normaliseret og derefter filtreret (se “Materialer og metoder”). Rækker repræsenterer gener, og kolonnerne repræsenterer biopsiprøver. Rækker, snarere end kolonner, blev omorganiseret under anvendelse UCA, mens prøver af samme type blev anbragt sammen.

DVIG

, udvikling varierende immun gen;

UCA

, uovervåget clustering algoritme;

OS

, samlet overlevelse;

DFS

, sygdomsfri overlevelse.

Diskussion

Den intime sammenhæng mellem fosterudviklingen og carcinogenese gør fosterudvikling en levedygtig referencemodel for at studere kræft, der omgår den potentielt vildledende kompleksitet forbundet med tumor heterogenitet.

Be the first to comment

Leave a Reply