PLoS ONE: Neural Network Cascade optimerer MicroRNA Biomarkør Selection for nasopharyngeal Cancer Prognosis

Abstrakt

MikroRNA’er (miRNA) har vist sig at være lovende biomarkører forudsige kræft prognose. Dog kan upassende eller dårligt optimeret behandling og modellering af miRNA udtryk data negativ indflydelse forudsigelse ydeevne. Her foreslår vi en holistisk løsning for miRNA biomarkører udvælgelse og forudsigelse model bygning. Dette arbejde introducerer brugen af ​​et neuralt netværk kaskade, en kaskade forfatning af små kunstige neurale netværk enheder, for at vurdere miRNA udtryk og patient resultat. En miRNA microarray datasæt af nasopharyngeal carcinoma blev hentet fra Gene Expression Omnibus at illustrere metoden. Resultaterne viste en ikke-lineær sammenhæng mellem miRNA udtryk og tålmodig dødsrisiko, hvilket indebærer, at direkte sammenligning af udtryk værdier er uhensigtsmæssig. Men denne metode udfører, transformation af miRNA udtryk værdier i en miRNA score, som lineært måler dødsrisiko. Spearman korrelation blev beregnet mellem miRNA scores og overlevelse status for hver miRNA. Endelig blev en ni-miRNA signatur optimeret til at forudsige dødsrisiko efter nasofaryngealt karcinom ved at etablere et neuralt netværk kaskade bestående af 13 kunstige neurale netværk enheder. Området under ROC var 0,951 for det indre validering sæt og havde en forudsigelse nøjagtighed på 83% for ekstern validering sæt. Især blev det etablerede neurale netværk kaskade sig at have en stærk immunitet mod støj interferens, der forstyrrer miRNA udtryk værdier. Denne undersøgelse giver en effektiv og let at bruge metode, der har til formål at maksimere den kliniske anvendelse af miRNA i vurdering af patienter med kræft prognostisk risiko

Henvisning:. Zhu W, Kan X (2014) Neural Network Cascade Optimerer MicroRNA biomarkør Udvælgelse til nasopharyngeal Cancer Prognose. PLoS ONE 9 (10): e110537. doi: 10,1371 /journal.pone.0110537

Redaktør: Raffaele A. Calogero, University of Torino, Italien

Modtaget: August 7, 2014 Accepteret: September 15, 2014; Udgivet: 13. oktober 2014

Copyright:. © 2014 Zhu, Kan Dette er en åben adgang artiklen distribueres under betingelserne i Creative Commons Attribution License, som tillader ubegrænset brug, distribution og reproduktion i ethvert medie , forudsat den oprindelige forfatter og kilde krediteres

data tilgængelighed:. forfatterne bekræfter, at alle data, der ligger til grund resultaterne er fuldt tilgængelige uden restriktioner. Alle relevante data er inden for papir og dens Støtte Information filer

Finansiering:. Dette arbejde blev støttet af National Natural Science Foundation of China (nr 31.301.136). Den bidragyder havde ingen rolle i studie design, indsamling og analyse af data, beslutning om at offentliggøre, eller forberedelse af manuskriptet

Konkurrerende interesser:.. Forfatterne har erklæret, at der ikke findes konkurrerende interesser

Introduktion

MikroRNA’er (miRNA) tilhører en klasse af små (-22 nt) endogene ikke-kodende RNA-molekyler. MiRNA spiller afgørende roller i reguleringen mRNA-ekspression og finjustering protein niveauer posttranscriptionally [1], [2]. Betydelige beviser har vist, at miRNA kan tjene som lovende terapeutiske mål for klinisk behandling af kræft i den nærmeste fremtid [3] – [5]. I mellemtiden er de potentielle kliniske anvendelser af diagnostiske og prognostiske biomarkører også nøje undersøgt og tyder stærkt anvendeligheden af ​​at måle cirkulerende og biopsi væv miRNA [6] – [8]. På grund af stadige teknologiske nyskabelser i de seneste år, har high-throughput metoder såsom miRNA microarray haft succes med identifikation af potentielle biomarkører fra tusindvis af modne miRNA hos mennesker [9], [10]. Som følge heraf har sådanne bestræbelser har ført til en stigende ophobning af miRNA ekspression data i den offentlige Gene Expression Omnibus (GEO) database [11].

samtidig påvisning af mange miRNAer genererer en enorm datasæt af biologiske data, som kræver betydelig beregningsmæssig analyse. Selvom de nuværende miRNA detektion teknologier er allerede meget veletableret, er der stadig ingen bredt anerkendt metode til at analysere den massive mængde data opnået ved high-throughput metoder [12]. Langt størstedelen af ​​tidligere studier antages en lineær sammenhæng mellem miRNA ekspression og sygdom fænotype [13] – [15]. Dette førte til bred anvendelse af enkle statistiske metoder såsom Students

t

-test eller analyse af varians test for mellem-gruppe sammenligning af miRNA udtryk værdier. Men denne antagelse er ikke blevet specifikt undersøgt, eller viste sig at være gyldig. Alternativt, i stedet for et lineært forhold, vi spekuleret på, at en ikke-lineær forening kan være muligt mellem miRNA ekspression og sygdom fænotype. Denne antagelse er primært baseret på den viden, at miRNA spiller mangefacetterede og komplekse roller i mange biologiske processer [16]. Hvis den ikke-lineære forhold er gyldigt, kan det betyde, at traditionelle miRNA udtryk databehandling, analyse og modellering med lineære metoder er utilstrækkelige.

forkert udvælgelse af statistiske eller modellering metoder kan skade den potentielle ydeevne miRNA som biomarkører og resultere i dårlig diskrimination af patienterne [17], [18]. Vi foreslår en mulig måde at løse dette problem gennem transformere miRNA udtryk værdier til en lineær variabel før etablere en diagnostisk eller prognostisk model. Ved hjælp af denne foreslåede metode, nærværende undersøgelse har til formål at sikre en helhedsorienteret og generisk løsning for miRNA biomarkører udvælgelse og forudsigelse model byggeri. I de senere år har kunstigt neuralt netværk (ANN) modellering med held været anvendt i cancer diagnosticering og behandling [19] – [21]. Heri blev en roman kunstigt neuralt netværk (ANN) modellering metode oprettet til formålet: det neurale netværk kaskade (NNC), en Extensible og pyramide-lignende kaskade af små ANN enheder. Hver lille ANN enhed har enkel netværksarkitektur og er begrænset til at håndtere med kun én opgave, såsom transformation data, dataintegration, eller forudsigelse output. I teorien kan en NNC model samtidig rumme og behandle store mængder information i parallel. Selv hvis en enkelt indgang har dårlig prædiktiv ydelse, så længe tilstrækkelige oplysninger input er givet, er en nøjagtig endelige forudsigelse garanteret. Antallet af inputparametre indgår i modellen afhænger af nøjagtigheden krav til den endelige forudsigelse.

For bedre at illustrere vores metode, vi udviklet en NNC prognostisk model for død risikovurdering hos patienter med nasofaryngealt karcinom (NPC) ved anvendelse af en miRNA ekspression datasæt hentet fra GEO (datasæt ID: GSE32960). Vores resultater tyder på en ikke-lineær sammenhæng mellem miRNA ekspression og død risiko for patienter diagnosticeret med NPC. Den etablerede NNC model viste god forudsigelse ydeevne ved præcist at identificere højrisikopatienter, selv i det tilfælde, hvor miRNA ekspressionsniveauerne blev kunstigt forstyrret. Sammenfattende sigter en sådan indsats for at analytisk forbedre anvendeligheden af ​​miRNA som kliniske biomarkører for at opnå præcis diagnose og individualiseret kræftbehandling. Vores succesfulde casestudie analyse af NPC prognose hjælp romanen NNC-modellen viser, at denne model også vil være gældende for diagnose og prognose af andre humane sygdomme

Materialer og metoder

miRNA udtryk data:. Erhvervelse og forbehandling

miRNA udtryk datasæt for patienter med NPC (GSE32960) blev hentet fra GEO. Kun de 312 NPC prøver blev inkluderet i vores undersøgelse. Vi hentede de præprocesserede microarray udtryk værdier for 873 miRNA for hver prøve og registreres overlevelse status (i live: 0 eller død: 1) af den tilsvarende patient. De oprindelige microarray udtryk værdier af hver miRNA blev derefter normaliseret som tal mellem 0 og 1 som beregnet nedenfor:

MAX_VALUE og MIN_VALUE er de maksimale og minimale oprindelige miRNA udtryk værdier i hel samling af prøver, hhv. Derefter blev prøverne tilfældigt opdelt i to sæt: et model træningssæt (n = 208) og en ekstern validering sæt (n = 104). For prøver i træningssættet blev ANN software Statistica Neural Networks (SNN, Slip 4.0E), der anvendes til at bygge ANN enheder, som omdanner miRNA udtryk værdier i miRNA scores for hver af de 873 miRNA. Ann enheder har tre lag: input variable, output variable, og en funktion til at forbinde de to. Vi brugte de importerede normaliserede miRNA udtryk værdier som input variabel og overlevelse status som output variabel. For det midterste lag, blev den avancerede version af Intelligent Problem Solver (IPS) værktøj anvendes til at opbygge en radial basis funktion (RBF) -Ann med 11 skjulte enheder. Netværk output værdier blev omtalt som miRNA scoringer, der blev anset for at være lineært forbundet med død risiko for patienterne. Den ikke-parametrisk Spearman korrelationskoefficienten (Spearman R) blev beregnet til at vurdere den lineære sammenhæng mellem de normaliserede miRNA score og overlevelse status for hver enkelt patient.

miRNA biomarkør udvælgelse og ANN modelbygning

Formodede miRNA biomarkører blev rangordnet og udvalgt på basis af Spearman R værdier. I denne undersøgelse har vi valgt at beholde kun de ni miRNA med de højeste R værdier og kassér de andre. De normaliserede miRNA udtryk værdier og normaliserede miRNA score på tre miRNA med de bedste Spearman R værdier (miR-29c, miR-34c-5p, og miR-93) blev brugt til at bygge ikke-transformerede neurale netværksmodeller (Unn) og transformeres neurale netværk (TNN) hhv. Begge modeller havde samme netværksarkitektur (3-11-1). Alle de miRNA scoringer af de ni miRNA blev derefter brugt til at bygge romanen ANN-modellen, som vi navngivet det neurale netværk kaskade (NNC). En NNC er sammensat af mange ANN enheder. Hver ANN enhed er en selvstændig ANN-model. I en NNC model, blev de primære ni ANN der bruges til de udvalgte ni miRNA at omdanne dem fra miRNA ekspressionsniveauerne i miRNA scoringer. Hver enhed havde en 1-11-1 netværksarkitektur. Derefter blev en sekundær ANN enhed med en 3-11-1 ramme derefter bygget til at integrere udgangene af de tre datatransformation enheder. var behov I alt tre sådanne sekundære enheder de ni miRNA. Endelig blev en tertiær ANN enhed bygget til at kombinere outputtene af de tre ovennævnte sekundære ANN enheder. Den ultimative output er en numerisk forudsigelse af død risiko for patienter med NPC baseret på deres miRNA genekspression signaturer. Især vi navngivet alle modeloutput som miRNA scoringer, uanset deres oprindelse fra ANN enheder eller de sammensatte modeller. Derudover blev en detaljeret beskrivelse af NNC model bygning leveres i tekst S1.

Intern og ekstern validering

holdout krydsvalidering metode blev brugt til at udføre intern validering for hver ANN enhed ved hjælp af standardindstillinger for IPS værktøj. De 208 uddannelse model prøver blev tilfældigt opdelt i tre sæt, herunder uddannelse sæt, verifikation sæt, og test sæt i forholdet 02:01:01. Lineær regression blev anvendt til at vurdere konsekvensen af ​​de uddannelses- og test sæt udgange. Lignende korrelationskoefficienter for uddannelse og afprøvning sæt indebærer givet ANN enhed har god generalisering evne og

omvendt

. Endvidere blev et uafhængigt sæt, der bestod af 104 prøver, der anvendes til at udføre ekstern validering af forudsigelse nøjagtighed i NNC-modellen. Foruden lineær regression, blev en receiver operating characteristic (ROC) kurveanalyse også udført for at vurdere forudsigelse virkninger af UNN, TNN, og NNC modeller ved hjælp af softwaren MedCalc (version 13.0). Den positive prædiktive værdi (PV) ved hver miRNA score kriterium blev beregnet og anvendt til at estimere sandsynligheden for dårlig prognose for de 104 patienter i den eksterne validering sæt.

Statistisk analyse

Studerendes

t

-test blev anvendt til sammenligninger mellem to overlevelse status grupper af patienter med NPC fra forskellige aspekter, herunder miRNA udtryk, miRNA score, og sandsynligheden for dårlig prognose. Analyse af arealet under ROC-kurven (AUROC) blev anvendt til sammenligning hver risiko forudsigelse ydeevne ved miRNA snesevis af forskellige miRNA, miRNA udtryk, og snesevis af samme miRNA, eller endelige output af forskellige ANN modeller [22]. Forskelle blev betragtet som statistisk signifikant, når

s

. 0,05 for alle de statistiske metoder, der anvendes i denne undersøgelse

Resultater

Ni miRNA blev valgt som NPC prognostiske biomarkører fra 873 målte miRNA

først, vi normaliseret og behandlet de oprindelige miRNA udtryk værdier der blev hentet fra GEO datasæt af genekspression i patienter med NPC (GSE32960). Dernæst blev 312 patientprøver tilfældigt opdelt i en model træningssæt og en ekstern validering sæt i et forhold på 2:01. I modellen træningssæt, var små ANN modeller med netværksarkitektur af 1-11-1 anvendes til at omregne miRNA udtryk værdier i miRNA scores for hver miRNA analyseret. Den software GraphPad Prism 6.0 blev derefter anvendt til at beregne Spearman R mellem miRNA scores og patient overlevelse status for hver af de 873 miRNA. Endelig blandt de 873 miRNA, ni miRNA med de højeste Spearman R værdier blev fremhævet: miR-93, miR-29c, miR-34c-5p, miR-202, miR-145-stjerne, miR-1292, miR-26a, miR-30e, og miR-15b (i faldende rækkefølge af Spearman R-værdi). MIR-93 miRNA score viste den bedste lineær sammenhæng med overlevelse status (figur 1A, Spearman R = 0,3091). Sammenligneligt, blev lad-7-stjernede miRNA score fundet at være relateret med NPC patient overlevelse (figur 1B, Spearman R = 0,0075). Dette resultat blev yderligere bekræftet ved vores ROC-analyse (figur 1C). Den AUROC af forudsigelsen model ved hjælp af miR-93 miRNA score var signifikant højere end for forudsigelsen model ved hjælp af miRNA score på lad-7e-stjerne (

s

= 0,0001). Desuden vi beregnet AUROCs for de andre otte miRNA, der blev valgt som potentielle biomarkører for NPC prognose. Et stringent korrelation forholdet blev afsløret mellem værdierne af Spearman R og de AUROCs (figur 1D). Dette resultat tyder beregning Spearman R eller AUROC fører til lignende effekt i evnen til at opdage foretrukne biomarkører fra miRNA microarray eksperimenter.

A) Der er en signifikant lineær sammenhæng mellem de normaliserede miR-93 scores og patient overlevelse status. Spearman R = 0,3091;

s

0,0001. B) Ingen signifikant lineær sammenhæng blev fundet mellem normaliserede Lad-7e-stjernede scoringer og patientens overlevelse status. Spearman R = 0,0075;

s

0,895. C) AUROC sammenligning mellem de prognosemodeller risiko død ved hjælp af MIR-93 og lad-7e-stjernede scoringer. En signifikant forskel blev observeret (

s

= 0,0001). D) En perfekt lineær korrelation sammenhæng blev fundet mellem Spearman R værdier og AUROCs (n = 9).

s

. 0,0001

Angivelse af ni kandidatlande miRNA biomarkører blev lineært relateret til overlevelse status

Scatter plots blev trukket til at illustrere forholdet mellem miRNA udtryk og miRNA scorer (Figur 2A). Som et resultat blev noget lineært forhold detekteret mellem miRNA ekspression og miRNA scorer for de ni udvalgte kandidat miRNA biomarkører. Da miRNA score er en lineær variabel vurdere død risiko for patienter med NPC, et sådant resultat indikerer en ikke-lineær sammenhæng mellem miRNA udtryk og patientens overlevelse status. Dette fund antyder også, at direkte mellem patient sammenligning af miRNA ekspression ikke kan være egnet til at forudsige prognose. Den miRNA miR-15b blev anvendt til yderligere at undersøge dette punkt. Efter Spearman R værdi blev MIR-15b valgt som en af ​​de ni foretrukne miRNA biomarkører angiver NPC prognose. Men vi fandt ikke nogen forskel i miR-15b udtryk mellem de to patientgrupper med forskellige overlevelse status af Students

t

-test (figur 2B). I modsætning hertil vores fremgangsmåde til transformation af miRNA genekspression værdier i miRNA score aktiveret os at kunne skelne mellem de to patientgrupper (figur 2C). Sammenlignet med miRNA udtryk, miRNA score gav en positiv forudsigelse, som blev yderligere bekræftet af ROC-analyse (figur 2D). Lignende resultater blev også observeret i miR-34c-5p, miR-145-stjerne, miR-202, og miR-1292 (figur S1).

A) Illustration af forholdet mellem normaliseret miRNA udtryk og normaliseret miRNA snesevis af de udvalgte ni miRNA-biomarkører. B) Ingen signifikant forskel blev observeret i normaliseret miR-15b udtryk mellem patienter med overlevelse status af “levende” og “døde”. Middelværdi ± SEM;

s

= 0,61. C) De miRNA snesevis af miR-15b var signifikant forskellige, når patienter med overlevelse status af “live” og “døde” blev sammenlignet. Middelværdi ± SEM;

s

0,0001. D) AUROC sammenligning mellem de prognosemodeller risiko død ved hjælp af miRNA-ekspression og miRNA snesevis af miR-15b, hhv. En signifikant forskel blev fundet (

s

= 0,0011).

Den NNC model viste den bedste forudsigelse af risiko patientens død

I denne undersøgelse har vi bygget tre ANN-modeller for yderligere at demonstrere betydningen af ​​lineære transformation af miRNA udtryk værdier i en miRNA score. Den UNN model var en traditionel ANN model med en 3-11-1 netværk ramme konstrueret ved hjælp af de normaliserede miRNA udtryk værdier af miR-29c, miR-34c-5p, andmiR-93 som input variable. Med det samme netværk rammer den TNN model, der anvendes de normaliserede miRNA scoringer af disse tre miRNA som input variable. ROC-analyse afslører en bedre prædiktiv ydeevne TNN model end den UNN model (figur 3A). Den sidste ANN model, vi byggede var en NNC model, som havde den mest komplekse netværk rammer, der omfatter 13 ANN-enheder, som vist i figur 3B. Den NNC model har en AUROC af 0,951, hvilket indikerer denne model har den bedste forudsigende evne til at skelne patienter med forskellige overlevelse status (figur 3A). Intern validering viser, at det har god generalisering evne til prognose forudsigelse af patienter uden for modellering uddannelse sæt (figur 3B)

UNN: transformeret neurale netværk;. TNN: transformeret neuralt netværk; NNC: neurale netværk kaskade. Tr og Te repræsenterer korrelationskoefficienter mellem output variable og miRNA score på uddannelse sæt og prøver fastsættes i hver ANN enhed, hhv.

Den NNC model viste stærk immunitet mod forstyrret miRNA udtryk

Scatter plots mere klart vise den diskriminerende effekt af forskellige ANN-modeller (figur 4A). Sammenlignet med UNN eller TNN, er det let at identificere, at NNC havde den bedste ydeevne, trods det faktum, at alle tre modeller i væsentlig grad kan skelne patienter med overlevelse status som “døde” fra dem med den “levende” status (

s

0,0001). Den høje prædiktive ydeevne NNC blev bekræftet, da testet på de 104 patienter, der anvendes til ekstern validering (figur 4B). Yderligere ROC-analyse viste, at forudsigelsen nøjagtighed var 83% for at identificere højrisikopatienter ved hjælp af NNC model etableret her. I betragtning af mangfoldigheden af ​​de faktiske patienter i klinikken, vi undersøgte også anti-indblanding evne forskellige modeller ved at udskifte miR-93 miRNA udtryk værdier med de lad-7e-stjernet. I denne undersøgelse havde Lad-7e-star miRNA score vist ingen forbindelse med død risiko for patienter diagnosticeret NPC (figur 1B og C). Resultatet af denne swap fandt, at UNN ikke kunne overleve, hvis Mir-93 ekspression værdier alvorligt blev forstyrret (figur 4C). Der er ingen signifikant forskel i miRNA score mellem to patientgrupper i denne model (

s

= 0,20). Sammenligneligt, de to andre modeller, især NNC model, viste stadig robust ydeevne skelne patienternes status.

Sammenligninger af miRNA scoringer blev udført mellem patienter med forskellige overlevelse statusser i modellen træningssættet (A) og den ekstern validering sæt med normal mIR-93 ekspression indgang (B) og med forstyrret mIR-93 ekspression indgang (C). UNN: transformeret neurale netværk; TNN: transformeret neuralt netværk; NNC:. Neurale netværk kaskade

Desuden har vi vurderet sandsynligheden for en dårlig prognosisfor hver patient med NPC. Den gennemsnitlige sandsynlighed for patienterne med overlevelse status af ‘live’ var 0,50, hvilket indikerer, at der eksisterer dødsrisikoen stadig for denne gruppe af patienter (figur 5A). Sammenlignet med UNN eller TNN, NNC mest præcist anslået dødsrisikoen for patienter med overlevelse status af ‘døde’, selv i den situation, hvor ekspressionen af ​​miR-93 blev alvorligt forstyrret (figur 5B). Dette fund tyder på, at NNC model kan have en stærk immunitet mod støj interferens forårsaget af ukendte faktorer.

A) Normal miR-93 udtryk input. B) Disturbed MIR-93 ekspression input. UNN: transformeret neurale netværk; TNN: transformeret neuralt netværk; NNC: neurale netværk kaskade. Alle data er udtrykt som middelværdi ± SEM.

Diskussion

miRNA er almindeligt menes at være den mest lovende klasse af endogene stoffer til kliniske diagnostiske og prognostiske biomarkører for kræft [23]. Denne overbevisning har bedt forskere fra hele verden til at udføre sygdomsspecifikke miRNA udtryk profilering i en omfattende inden for kræftforskning [24], [25]. I denne undersøgelse, vi forsøger for første gang at præsentere et generisk metode til at oversætte miRNA udtryk data i klinisk relevant sprog, såsom muligheden for at have kræft eller risikoen for dårlig prognose på grund lider af kræft. Kort fortalt blev en beregningsmæssige model konstrueret ved at integrere mange små enkelt-funktion ANN-enheder i et kaskade netværkssystem. Vi kaldte den neurale netværk kaskade. Vi viste, at det neurale netværk kaskade var effektiv til at identificere død risiko for patienter diagnosticeret med NPC.

Den teoretiske hjørnesten for NNC model etableret her er den antagelse, at miRNA udtryk ikke kan være lineært forbundet med kliniske fænotype indikatorer . Denne hypotese er rimeligt og realistisk betragtning af kompleksiteten af ​​miRNA involvering i humanbiologi [16], [26], [27]. Baseret på denne antagelse, bør miRNA udtryk blive omdannet til en lineær variabel, før du bruger den til at vurdere muligheden for kliniske konsekvenser, såsom at uanset om en patient er i høj risiko for dødsfald på grund af kræft. Vores resultater støtter gyldigheden af ​​hypotesen. Vi fandt en ikke-lineær sammenhæng mellem miRNA udtryk og dødsrisikoen for patienter med NPC. Dette fund antyder vigtigheden af ​​miRNA udtryk data forbehandling før eventuelle miRNA-baserede kliniske beslutninger træffes

forskel fra traditionelle kunstige neurale netværk, der tidligere er anvendt i kræft diagnose og forvaltning [19] -. [21], den NNC gjorde ikke direkte bruge miRNA udtryk. Snarere NNC første transformerer miRNA genekspression i en miRNA score, en lineær variabel til vurdering klinisk fænotype. Som et resultat, den miRNA score i stedet for miRNA udtryk blev anvendt med det formål at udvælge potentielle miRNA-biomarkører og endelig beslutningstagning. I NNC-modellen blev transformation og integration af data og endelig forudsigelse output opnås trinvis. Dette sikrer overordnede beregningsmæssige forenkling af modellens drift. En anden fordel ved NNC er, at hver miRNA er tildelt en uafhængig kanal til information input. Ved en sådan konstruktion, hvis der er behov flere miRNA for bedre forudsigelse, kan man udvide omfanget af NNC modellen uden at øge netværket kompleksiteten af ​​en enkelt enhed. Dette gør NNC model frit kan udvides i henhold til specifikke krav. Ekspressionsdata af forskellige miRNA kan betragtes som forskellige oplysninger bidrager til vores nuværende viden om død risiko for patienterne. I vores undersøgelse blev medtagelse af flere miRNA resulteret i bedre forudsigelser. Den TNN indeholdt tre miRNA og havde en AUROC på 0,862. I modsætning hertil NNC modellen havde en AUROC af 0,951, som indeholdt 9 miRNA. Det er imidlertid også muligt, at et større NNC model for NPC prognose kunne indeholde mere end ni miRNA. De ni miRNA, der anvendes i NNC modellen her blot fungerede som en metode illustration.

Vores eksterne valideringsresultater af UNN og TNN indikerer, at lineær transformation af miRNA udtryk især forbedrer forudsigelse effekten af ​​modellen. Vigtigere er, at denne procedure ikke øge antallet af miRNA biomarkører nødvendige, hvilket indebærer fordelen ved at anvende en kaskade struktur ANNs. Derudover fandt vi, at kaskader ANN forfatning havde en mere robust ydelse end den traditionelle ANN model, hvor uforklarlig variation i miR-93-ekspression forårsagede en ANN enhed funktionsfejl. Selvom ikke at vurdere graden af ​​en sådan interferens på sygdom prognose i egentlige kliniske omgivelser, er det fortsat muligt, at denne variation vil være en vigtig faktor, der hindrer miRNA-baserede forudsigelse modeller i praksis. Sammenligning af TNN og NNC modeller tyder på, at inddragelse af flere miRNA vil øge robustheden af ​​det etablerede ANN-model mod støjgener.

Som konklusion, vores undersøgelse forudsat en rationel og realistisk metode til miRNA biomarkører udvælgelse og forudsigelse model etablering . Fordelen ved en kaskade konstruktion af små kunstige neurale netværk enheder reflekteres fra flere aspekter, herunder skalerbar kapacitet og fleksibel kombination af miRNA udtryk input, bedre forudsigelse med robust stabilitet, og større muligheder for meningsfuld modellering, hvis antallet af miRNA-biomarkører er ubegrænset. I fremtiden bør flere forsøg gøres for yderligere at validere anvendelsen af ​​vores tilgang ved at oversætte miRNA udtryk data i klinisk relevant information til diagnose og prognose af kræft.

Støtte oplysninger

figur S1. Sammenligning af miRNA udtryk og miRNA score mellem de to patientgrupper med forskellige overlevelse status

. A) MIR-26a; B) MIR-29b; C) MIR-30e; D) miR-34c-5p; E) miR-93; F) miR-145-star; G) MIR-202; H) MIR-1292. Alle data er udtrykt som middelværdi ± SEM

doi:. 10,1371 /journal.pone.0110537.s001

(TIF)

Text S1.

En trin-for-trin procedure for NNC modelbygning

doi:. 10,1371 /journal.pone.0110537.s002

(DOCX)

Be the first to comment

Leave a Reply