PLoS ONE: Nøjagtig og pålidelig Cancer Klassifikation Baseret på Probabilistic inferens af Pathway Activity

Abstrakt

Med fremkomsten af ​​avanceret teknologi til måling af genom-dækkende udtryk profiler, er der blevet foreslået en lang række metoder til opdage diagnostiske markører, der nøjagtigt kan skelne mellem forskellige klasser af en sygdom. Men faktorer som den lille stikprøve af typiske kliniske data, den iboende støj i high-throughput målinger, og heterogenitet på tværs af forskellige prøver, ofte gør det vanskeligt at finde pålidelige genmarkører. For at overvinde dette problem, har flere undersøgelser foreslået anvendelse af pathway-baserede markører, i stedet for individuelle genmarkører, til opbygning af klassificeringen. Givet et sæt af kendte veje, disse metoder bestemme aktiviteten for hver vej ved at sammenfatte udtrykket værdier dets medlemslande gener, og bruge pathway aktiviteter for klassificering. Det er blevet vist, at pathway-baserede klassifikatorer giver typisk mere pålidelige resultater sammenlignet med traditionelle genbaserede klassifikatorer. I dette papir, foreslår vi en ny klassifikation metode baseret på probabilistisk følgeslutning af pathway aktiviteter. For en given prøve, beregner vi log-likelihood ratio mellem forskellige sygdomsfænotyper baseret på ekspressionsniveauet af hvert gen. Aktiviteten af ​​en given pathway derefter udledes ved at kombinere de log-likelihood forhold af de indgående gener. Vi anvender den foreslåede metode til klassificering af brystkræft metastaser, og vise, at det opnår højere nøjagtighed og identificerer mere reproducerbare pathway markører sammenlignet med flere eksisterende sti aktivitet inferensmetoder

Henvisning:. Su J, Yoon BJ, Dougherty ER (2009) Nøjagtig og pålidelig Kræft Klassifikation Baseret på Probabilistic inferens af Pathway aktivitet. PLoS ONE 4 (12): e8161. doi: 10,1371 /journal.pone.0008161

Redaktør: Gustavo Stolovitzky, IBM Thomas J. Watson Research Center, USA

Modtaget: September 18, 2009; Accepteret: November 13, 2009; Udgivet: December 7, 2009

Copyright: © 2009 Su et al. Dette er en åben adgang artiklen distribueres under betingelserne i Creative Commons Attribution License, som tillader ubegrænset brug, distribution og reproduktion i ethvert medie, forudsat den oprindelige forfatter og kilde krediteres

Finansiering:. Edward R . Dougherty støttes delvist af National Science Foundation, CCF-0.634.794. De finansieringskilder havde ingen rolle i studie design, indsamling og analyse af data, beslutning om at offentliggøre, eller forberedelse af manuskriptet

Konkurrerende interesser:.. Forfatterne har erklæret, at der ikke findes konkurrerende interesser

Introduktion

indførelsen af ​​overkommelige microarray teknologier til måling genom-dækkende udtryk profiler har ført til udviklingen af ​​en lang række metoder til at skelne mellem forskellige klasser af en kompleks sygdom, såsom cancer, gennem transkriptom analyse [1] – [4 ]. Især har der været en betydelig forskningsindsats for at identificere differentielt udtrykte gener på tværs af forskellige fænotyper [5] – [9], som kan anvendes som diagnostiske markører for at klassificere de sygdomstilstande eller forudsige udfaldet af medicinske behandlinger [1] – [4] , [10] – [12]. Men at finde pålidelige genmarkører er en udfordrende problem, og flere nyere undersøgelser har sat spørgsmålstegn ved pålideligheden af ​​mange klassificører baseret på individuelle genmarkører [13] – [19]. Den lille prøvestørrelse på typisk klinisk data, der bruges til at opbygge en sorterer er en af ​​de vigtigste faktorer, der gør dette problem vanskeligt. Vi ofte nødt til at søge efter en lille række gode markørgener blandt tusinder af gener baseret på et begrænset antal prøver, som gør gennemførelsen af ​​traditionelle funktion udvælgelsesmetoder ganske uforudsigelige [20]. Den iboende måling støj i højt gennemløb forsøgsdata og heterogenitet på tværs prøver og patienter gøre problemet endnu mere frygtindgydende.

En mulig måde at løse dette problem er at fortolke udtrykket data på niveau med funktionelle moduler, såsom signalveje og molekylære komplekser, i stedet for på de enkelte gener. Faktisk er en af ​​svaghederne ved mange metoder genbaserede klassifikation er, at markørgener ofte er valgt uafhængigt, selv om deres funktionelle produkter kan interagere med hinanden. Derfor kan de udvalgte genmarkører indeholde redundant information, og de kan ikke synergistisk forbedrer den samlede stilling ydeevne. Vi kan afhjælpe dette problem ved i fællesskab at analysere ekspressionsniveauerne af grupper af funktionelt relaterede gener, der kan opnås på grundlag af transkriptom analyse [21] – [23], GO anmærkninger [24], eller andre kilder. Faktisk flere undersøgelser [23], [25] – [28] har vist, at vej markører er mere reproducerbare forhold til enkelte genmarkører og de kan give vigtige biologiske indsigt i de underliggende mekanismer, der fører til forskellige sygdomsområder fænotyper. Desuden pathway-baserede klassificører ofte opnå sammenlignelige eller bedre klassifikation ydeevne i forhold til traditionelle genbaserede klassificører.

For at bruge pathway-baserede markører i klassificering, vi har brug for en måde at udlede aktiviteten af ​​en given vej baseret på ekspressionsniveauerne af de konstituerende gener. For nylig er der blevet foreslået en række sti aktivitet inferensmetoder til dette formål. Fx Guo et al. [25] foreslået at anvende middelværdien eller medianen udtryk værdi af medlemslandene gener for at udlede vejen aktivitet. Tomfohr et al. [28] og Bild et al. [23] bruges den første hovedkomponent af ekspressionen profilen af ​​de deltagende gener for at bestemme aktiviteten af ​​en given pathway. For nylig Lee et al. [26] foreslået en metode, der forudsiger pathway aktivitet ved hjælp af kun en delmængde af gener i pathway’en, kaldet betingelsen-responsive gener (CORGs), hvis samlede ekspressionsniveauer kan præcist skelne de fænotyper af interesse.

dette papir, foreslår vi en ny metode til probabilistisk inferens af pathway aktiviteter. For en given vej, den foreslåede metode anslår log-likelihood ratio mellem forskellige fænotyper baseret på ekspressionsniveauet af hvert medlem gen. Aktivitetsniveauet af vejen derefter udledes ved at kombinere de log-sandsynlighedsforhold af generne, der hører til vejen. Vi anvender vores metode til klassificering af brystkræft metastaser, og vise, at det kan opnå større nøjagtighed i forhold til flere tidligere pathway tilgange. Desuden viser vi, at den foreslåede vej aktivitet inferens metode kan finde mere reproducerbare pathway markører, der bevarer den diskriminerende effekt på tværs af forskellige datasæt.

Metoder

Datasæt

Vi opnåede to uafhængige brystkræft datasæt fra store genekspressionsstudier af Wang et al. [11] (benævnt “USA” datasæt i dette arbejde) og van’t Veer et al. [10] (benævnt “Nederlandene” datasæt). Wang et al. S datasæt [11] indeholder genekspression profiler af 286 brystkræftpatienter fra USA, hvor metastaser blev påvist i 107 af dem, mens de resterende 179 var metastase-fri. Den anden datasæt undersøgt af van’t Veer et al. [10] indeholder genekspression profiler af 295 patienter fra Holland, hvor 79 havde metastaser og 216 var metastase-fri. I denne undersøgelse har vi ikke overveje opfølgningen tid eller forekomsten af ​​fjernmetastaser.

For at få det sæt af kendte biologiske veje, der er nævnt vi til MSigDB (Molecular Signatures Database) version 2.4 (opdateret April 7, 2008) [21]. Vi hentede de kanoniske veje i C2 kurateret gen-apparater, som indeholder 639 gen sæt opnået fra flere pathway databaser, herunder Kegg (Kyoto Encyclopedia of Gener og genomer) database [29] og GenMAPP [30]. Disse gen-sæt er udarbejdet af domæne eksperter og de giver kanoniske repræsentationer af biologiske processer. Sættet af veje opnået fra MSigDB dækker mere end 5.000 forskellige gener, hvor der kan findes 3271 af dem i begge microarray platforme anvendes af de to brystkræft genekspressionsstudier i [10], [11].

probabilistisk Inferens af pathway Aktivitet

for hver vej, vi først identificeret de gener, der indgik i udtrykket profiler i de to brystkræft datasæt. De gener, der ikke indgik i disse datasæt blev fjernet fra genet sat for den givne bane. Overvej en vej, der indeholder gener efter fjernelse af gener, hvis ekspression værdier var ikke tilgængelig. Givet en prøve, der indeholder ekspressionsniveauerne af medlemslandenes gener, vurderer vi vejen aktivitet som følger (1) hvor er log-likelihood ratio (LLR) mellem de to fænotyper af interesse for genet. LLR er givet ved (2) hvor er den betingede tæthedsfunktion (PDF) af ekspressionsniveauet af genet under fænotype 1, og er den betingede PDF under fænotype 2. Forholdet er en probabilistisk indikator, der fortæller os, hvilken fænotype er mere sandsynligvis baseret på ekspressionen af ​​den th element genet. Vi kombinerer de beviser fra alle medlemslandene gener for at udlede den samlede pathway aktivitet. Den vej aktivitet kan tjene som en diskriminerende score for klassificering af prøven i forskellige fænotyper baseret på aktiveringen af ​​den given pathway. Begrebsmæssigt kan vi se denne tilgang som beregning af relative støtte til de to forskellige fænotyper ved hjælp af en Naive Bayes model [31], [32] baseret på genekspressionsprofilen af ​​vejen.

For at beregne den LLR værdi, er vi nødt til at estimere PDF for hver fænotype. Vi antager, at genet ekspressionsniveauet af genet under fænotype følger en Gauss-fordeling med middelværdi og standardafvigelse. Disse parametre blev estimeret på basis af alle tilgængelige prøver, der svarer til fænotypen. De estimerede PDF’er kan derefter anvendes til beregning af log-likelihood-forhold. I praktiske anvendelser, vi ofte ikke har nok træningsdata til pålidelig estimering af PDF-filer og. Dette kan gøre beregningen af ​​LLR følsomme for små ændringer i genekspressionsprofilen. For at undgå dette problem, normalisere vi som følger (3), hvor og er middelværdien og standardafvigelsen for på tværs af alle prøver, hhv. Figur 1 illustrerer den overordnede procedure for udledning af aktiviteten af ​​en given vej.

For hvert gen i vejen, vurderer vi de betingede sandsynlighedsfordelinger funktioner (PDF-filer) under forskellige fænotyper. Baseret på de anslåede PDF-filer, vi omdanne udtrykket værdier medlemslandene gener i log-likelihood ratio (LLR) for at opnå en LLR matrix fra genekspression matrix. LLR matrix er så normaliseret, og vejen aktivitet udledes ved at kombinere de normaliserede LLR af sine medlemsvirksomheder gener.

diskriminerende Power of Pathway Markers

For at kunne sammenligne den foreslåede vej aktivitet inferens ordning med andre eksisterende metoder, vi udførte følgende eksperimenter. I vores første forsøg, valgte vi de 50 differentielt udtrykte veje ved hjælp af den foreslået af Tian et al. [22]. For at vurdere evnen af ​​en given vej hos diskriminere mellem forskellige fænotyper, Tian et al. beregner -test statistik scores for alle medlemslande gener og tage deres gennemsnit til at beregne en aggregeret score, der kan tjene som en indikator af vejen er diskriminerende magt. Efter prescreening top 50 veje, der har de største absolutte værdier, beregnet vi aktiviteten score for hver af disse veje ved hjælp af den foreslåede inferens metode såvel som andre metoder. De opnåede pathway aktivitet scoringer blev derefter anvendt til at beregne de -test statistikker score for hver pathway markør. . De -test scoringer blev anvendt til at vurdere diskriminerende magt pathway markører og sammenligne forskellige inferensmetoder

I dette arbejde, vi sammenlignet fem forskellige pathway aktivitet inferensmetoder: middelværdien og den mediane metoder [25], PCA-metode [23], [28], den CORG-baserede metode [26], og den følgeslutning, der foreslås i dette dokument. For de gennemsnitlige, median og CORG-baserede metoder, beregnet vi score ved at tage gennemsnittet af de -test snesevis af udtrykket værdier medlemslandenes gener. For PCA-baserede metode, vi opgøres ved gennemsnit

absolutte

-test snesevis af de genekspressionssystemer værdier, da PSA naturligt kan kombinere ekspressionssystemer værdier, uanset om de er positivt korreleret eller negativt korreleret med fænotypen af interesse. Til vores foreslåede metode, vi beregnet ved at tage gennemsnittet af de -test snesevis af de LLR medlemslandenes gener, da vi skønnede vejen aktivitet score baseret på LLR i stedet for de oprindelige udtryk værdier.

Vi vurderede også robusthed hver inferens metode til at identificere gode pathway markører, ved rangordne forløbene ved hjælp af en af ​​de to brystcancer datasæt, og derefter vurdere evnen til skelnen af ​​de veje baseret på den anden datasæt. Igen blev -test statistik over pathway aktivitet scores bruges til at sammenligne forskellige inferensmetoder.

I vores andet eksperiment, vi beregnede de -test statistik score for alle 639 veje uden prescreening, og sammenlignede virkningen af ​​forskellige pathway aktivitet inferensmetoder baseret på de beregnede scoringer. Som i det første eksperiment, vurderede vi også robustheden af ​​hver inferens metode til at finde effektive pathway markører, ved at rangordne veje efter de -Test scorer anslåede hjælp af en af ​​datasæt, og derefter evaluere deres evnen til skelnen på den anden datasæt.

Evaluering af Classification Resultat

for at vurdere klassificeringen ydeevne foreslåede pathway aktivitet inferens metode, vi udførte følgende krydsvalidering eksperimenter.

for

inden -dataset eksperimenter

, prøverne i et datasæt blev tilfældigt inddelt i fem delmængder af samme størrelse, hvor prøverne i fire af disse delmængder blev brugt til at træne klassificeringen og den resterende delmængde blev anvendt til vurdering af klassificering ydeevne. Dette er blevet gentaget ved hjælp af hvert delmængde som testsættet at opnå mere pålidelige resultater. Uddannelsen sæt blev delt igen i tre lige store delmængder. To tredjedele blev brugt til at rangordne de pathway markører og opbygge klassificeringen (den “markør-evaluering” datasæt), og en tredjedel af træningssættet blev brugt til funktionen valg (den “feature-valg” datasæt). Alle prøver i træningssættet blev anvendt til at estimere PDF’erne af genekspressionen værdier under forskellige fænotyper. At opbygge klassificeringen, vi vurderet hver vej baseret på diskriminerende magt dets aktivitet score at klassificere prøver. De veje blev sorteret i stigende orden af-værdien. Efter ranking veje, vi byggede klassificeringen, enten baseret på logistisk regression eller LDA (lineær diskriminant analyse), som følger. Baseret på markør-evaluering datasæt, vi først konstrueret sorteringsenheden med kun én funktion, nemlig pathway markør med den laveste -værdien. Udførelsen af ​​klassificeringen blev derefter målt ved at beregne AUC (arealet under ROC Curve) [33] på feature-udvælgelse datasæt. Dernæst vi udvidet sæt af funktioner ved at vælge vejen markør med den laveste -værdien blandt de resterende veje. En ny klassifikatør blev uddannet ved hjælp af de valgte funktioner på markør-evaluering datasæt og dets klassificering præstationer blev igen vurderet på feature-udvælgelse datasæt. Den ekstra vej markør blev holdt i funktionen indstillet, hvis AUC øges, og det blev fjernet på anden måde. Vi gentog den ovennævnte fremgangsmåde for alle pathway markører for at optimere klassificeringen. Udførelsen af ​​den optimerede klassificeringen blev evalueret ved at beregne AUC på test datasæt. Disse forsøg er blevet gentaget for 100 tilfældige skillevægge i hele datasættet. Vi rapporterer AUC, i gennemsnit over 500 eksperimenter, som de samlede resultater foranstaltning af metoden klassifikation ved hånden. Den samlede fremgangsmåde ifølge den indenfor-dataset eksperiment er illustreret i fig. 2A.

(A) i inden-datasæt eksperimenter, en del af træningssættet, benævnt som markør-evaluering sæt, der bruges til at rangordne de pathway markører efter deres diskriminerende magt og opbygge klassificeringen. Den optimale sæt af funktioner vælges på grundlag af den resterende del af træningssættet, benævnt feature-udvælgelse sæt. Udførelsen af ​​den resulterende klassificeringen vurderes ved hjælp af test datasæt. (B) på tværs af datasæt eksperimenter, er en af ​​de datasæt bruges til at finde den optimale sæt af funktioner, og det andet datasæt bruges til at bygge en klassifikatør baseret på de forudvalgte funktioner og vurdere klassificeringen.

for at vurdere reproducerbarheden af ​​pathway markører på tværs af forskellige datasæt, vi udført

cross-datasæt eksperimenter

, hvor den ene datasæt blev brugt til at vælge antallet af pathway markører, og det andet datasæt blev brugt til bygning klassificeringen er baseret på de valgte markører og evaluere dens ydeevne. Først valgte vi den optimale sæt af funktioner (dvs. pathway markører) baseret på en datasæt, ved at optimere AUC metriske. Processen for valg af funktionen sæt lignede den, der bruges i de inden-datasæt eksperimenter. Prøverne i den anden datasættet blev inddelt i fem undergrupper af samme størrelse. Fire femtedele af prøver blev anvendt til at træne klassificeringen med de valgte funktioner, og en femtedel af prøver blev brugt til at evaluere resultaterne af den beregnede klassificeringen. Vi gentog dette forsøg ved anvendelse af hver af de fem delmængder som testsættet og bruge resten til træning. Ovenstående forsøg blev gentaget for 100 tilfældige skillevægge i hele datasættet, og den gennemsnitlige AUC over de 500 eksperimenter blev rapporteret som udførelsen foranstaltning. Det er vigtigt at bemærke, at funktionen selektion udføres udelukkende baseret på den første datasæt. I løbet af de cross-validering eksperimenter med det andet datasæt, er uddannelsen sæt (der består af fire femtedele af prøver i samme datasæt) simpelthen bruges til at bygge klassificeringen baseret på forudvalgte sæt af funktioner. Det overordnede mål med disse cross-dataset eksperimenter er at vurdere reproducerbarheden af ​​funktionen sæt, vælges med foreslåede inferens ordningen pathway aktivitet på tværs af forskellige datasæt. Figur 2B illustrerer den overordnede proces for cross-datasæt eksperiment.

For at sammenligne den foreslåede metode med andre eksisterende metoder, vi udførte beskrevet indenfor-datasæt eksperimenter og på tværs af datasæt eksperimenter med andre pathway aktivitet inferensmetoder ( middelværdi, median, PCA, og CORG). Desuden har vi evalueret også udførelsen af ​​en gen-baserede klassificeringen, der bruger enkelte gener som diagnostiske markører, efter en tilsvarende procedure. I denne undersøgelse har vi inkluderet de 50 pathway markører i den oprindelige markør sæt, som blev udvalgt i overensstemmelse med fremgangsmåden i Tian et al. [22], som uddybet i det foregående underafsnit. For det gen-baserede klassificeringen, vi medtaget de 50 genmarkører med de laveste -værdier i den indledende markør sæt, for at holde det maksimale antal funktioner identiske.

Computer området under ROC Curve

i dette arbejde, evaluerede vi udførelsen af ​​en klassifikatør baseret på AUC (arealet under ROC Curve). AUC metriske har været meget anvendt til evaluering af metoder for klassificering, da det kan give et nyttigt oversigtsstatistikker ydeevne klassificeringen over hele spektret af specificitet og sensitivitet værdier. For at beregne AUC vedtog vi foreslået i [33] metoden. For en given klassifikator, lad være outputtet af klassificeringen for positive prøver, og lad være output for negative prøver. Derefter AUC metriske for klassificeringen givet ved: (4) hvor er indikator funktion. AUC er faktisk den empiriske sandsynlighed for, at en tilfældigt udvalgt positiv prøve er placeret højere end et tilfældigt udvalgt negativ prøve. Det kan vises, at AUC foranstaltning svarer til Mann-Whitney-test (også kaldet Wilcoxon rank-sum test) statistik.

Resultater

Probabilistic Pathway Aktivitet Inferens Forbedrer diskriminerende Power af Pathway Markers

Vi evaluerede diskriminerende magt pathway markører, hvor pathway aktiviteter blev udledt ved hjælp af den foreslåede metode såvel som andre inferensmetoder. Til effektiv sammenligning af den foreslåede inferens metode med andre eksisterende metoder, vi udført tilsvarende forsøg som dem udført i [26] for at vurdere diskriminerende magt pathway markører. For hver brystcancer datasæt anvendte vi først fremgangsmåden ifølge Tian et al. [22] for at vælge de 50 veje blandt de 639 veje opnået fra MSigDB [21] (se metoder). Vi beregnede den faktiske aktivitet snesevis af top 50 veje baseret på hver vej aktivitet inferens ordningen, og rangeret veje efter deres diskriminerende magt. Figur 3 viser evnen til skelnen af ​​de øverste veje, hvor aksen svarer til antallet af top pathways, der blev overvejet, og aksen viser den gennemsnitlige absolutte -Score af de øverste baner. Vi sammenlignede fem pathway aktivitet inferensmetoder, nemlig CORG-baserede metode [26], PCA-baserede metode [23], [28], mener og median metoder [25], og LLR-baserede metode foreslået i dette papir. Til sammenligning vurderede vi også evnen til skelnen af ​​de øverste 50 single genmarkører, som blev valgt blandt de 3.271 gener er omfattet af de 639 pathways anvendt i denne undersøgelse. De opnåede fra Holland brystkræft datasæt [10] og USA brystkræft datasæt [11] Resultaterne er vist i fig. 3A og fig. 3B henholdsvis. Som vi kan se ud fra disse resultater, den foreslåede sti aktivitet inferens ordning, der beregner vejen aktivitet score ved at kombinere de log-likelihood ratio af medlemslandene gener, væsentligt forbedret magt pathway markører til at skelne mellem metastatiske prøver og ikke-metastatiske prøver . Interessant, den øverste genmarkører ofte sammenlignet positivt til pathway markører. På den nederlandske datasæt, ekspressionsniveauerne af de øverste gener havde større diskriminerende magt end de pathway aktivitet scoringer udledt af CORG, PCA, betyde, og median metoder. Kun pathway aktivitet scoringer anslået af den foreslåede metode var mere diskriminerende end genekspression værdier. På USA datasæt, genmarkører var mere diskriminerende end pathway markører baseret på middelværdien, medianen, og PCA metoder, men mindre diskriminerende i forhold til pathway markører baseret på den foreslåede metode og CORG metoden.

(A) Mean absolut -Score af de øverste markører for Nederlandene brystkræft datasæt. Pathway aktiviteter er blevet udledt ved hjælp fem forskellige metoder: CORG, PCA, middelværdi, median, og LLR (foreslåede metode). Evnen til skelnen af ​​de øverste genmarkører blev estimeret til sammenligning (mærket som “Gene”). (B) Den gennemsnitlige absolutte -Score af de øverste markører for USA brystkræft datasæt. (C) De markører blev rangeret baseret på det nederlandske datasæt og den gennemsnitlige absolutte -Score af de øverste markører blev beregnet på grundlag af USA datasættet. (D) Markørerne blev rangeret baseret på USA datasæt og den gennemsnitlige absolutte -Score af de øverste markører blev beregnet på grundlag af den nederlandske datasættet.

For at vurdere reproducerbarheden af ​​pathway markører, vi rangeret markører baseret på et datasæt og evalueret deres gennemsnitlige absolutte -Score med den anden datasæt. Figur 3C viser resultatet for rangordning markørerne baseret på det nederlandske datasæt og beregning af gennemsnitlige absolutte -Score af de øverste markører ved hjælp af USA datasættet. Tilsvarende viser fig. 3D viser resultatet for rangordning markørerne baseret på USA datasæt og beregne middelværdien score af de øverste veje ved hjælp af Holland datasættet. Disse resultater viser klart, at pathway markører udvalgt på grundlag af den foreslåede inferens metode bevarer betydeligt store diskriminerende effekt på tværs af forskellige datasæt. I virkeligheden, i begge cross-dataset eksperimenter, de pathway aktivitet scoringer beregnes af LLR-metoden var meget mere diskriminerende end nødvendigt for aktiviteten scorer beregnes af andre inferensmetoder samt ekspressionsprodukterne værdier af de bedste genmarkører. Tilsammen disse resultater indebærer, at den foreslåede metode kan finde bedre diagnostiske markører med højere reproducerbarhed. Bemærk også, at de enkelte genmarkører, som havde betydeligt stort diskriminerende magt inden et datasæt (se fig. 3A og 3B), mistet det meste af den diskriminerende magt i en anden datasæt.

Dernæst udførte vi tilsvarende forsøg for alle 639 veje og alle 3.271 gener der er omfattet af disse veje, uden prescreening (se metoder). Resultaterne af disse forsøg er vist i fig. 4, hvor aksen angiver forholdet af de øverste veje, der blev brugt til at beregne den gennemsnitlige absolutte -Score, og aksen svarer til den forventede gennemsnitlige absolutte -Score af de øverste baner. Evnen til skelnen af ​​vejen markører og de enkelte genmarkører på det nederlandske datasæt er vist i fig. 4A, og evnen til skelnen af ​​markørerne på USA datasæt er vist i fig. 4B. De opnåede fra cross-dataset eksperimenter er opsummeret i fig. 4C og 4D. I fig. 4C, markører blev rangeret efter deres diskriminerende magt på det nederlandske sæt, og deres gennemsnitlige absolutte -scores blev beregnet ved hjælp af USA datasættet. Resultaterne for ranking markørerne baseret på USA datasæt og beregning af scores ved hjælp af Holland sæt er vist i fig. 4D. Alle disse forsøg viser, at pathway aktivitet scoringer målt ved den foreslåede LLR metode er meget mere diskriminerende end scorerne beregnes af andre inferensmetoder og også ekspressionssystemer værdier individuelle gener. Desuden kan vi se, at pathway markører, der blev valgt baseret på LLR-baserede pathway aktivitet scoringer er mere reproducerbar og deres aktivitet scoringer bevarer betydelig mængde diskriminerende kapacitet på tværs uafhængige datasæt

(A) Mean absolut. – score på de øverste markører for Nederlandene datasættet. (B) Den gennemsnitlige absolutte -Score af de øverste markører for USA datasættet. (C) De markører blev rangeret baseret på det nederlandske datasæt og den gennemsnitlige absolutte -Score af de øverste markører blev beregnet på grundlag af USA datasættet. (D) Markørerne blev rangeret baseret på USA datasæt og den gennemsnitlige score på de øverste markører blev beregnet på grundlag af den nederlandske datasættet.

Foreslået Pathway Aktivitet Inferens Scheme fører til mere præcise og pålidelige Klassificører

Vi brugte den foreslåede inferens ordningen pathway aktivitet for klassificering af brystkræft metastase, at vurdere dens anvendelighed i at diskriminere forskellige kræft fænotyper. For en retfærdig og effektiv sammenligning med andre inferens ordninger, vi igen vedtaget en lignende eksperimentelle opstilling, der blev brugt i [26] for at evaluere resultaterne af den CORG-baserede metode, en state-of-the-art pathway aktivitet inferens ordning der kun bruger tilstanden-responsive gener i en given pathway. For hver brystcancer datasæt, foretaget fem-fold krydsvalidering eksperimenter, hvor fire femtedele af prøver blev benyttet til fremstilling af klassificeringen og den resterende femtedel af prøverne blev anvendt til evaluering klassificering ydeevne (se fremgangsmåder). Mens konstruere klassifikatoren anvendte vi LLR-baserede pathway aktivitet inferens metode til vurdering af evnen til skelnen af ​​hver pathway markør og vælge den optimale sæt af markører, der skal anvendes i klassificeringen. Den beregnede klassifikator brugte også vej aktivitet scores beregnet af den foreslåede inferens metode til at skelne metastatisk brystkræft prøver fra ikke-metastatiske prøver. I vores eksperimenter, vi definerede det indledende sæt pathway markører som top 50 veje vælges med den metode, Tian et al. [22] (se fremgangsmåder). Vi vurderede klassificeringen ydelse med AUC metriske. Vi gentog fem gange krydsvalidering for 100 tilfældige skillevægge af den givne datasæt, og i gennemsnit de resulterende 500 AUC for at opnå en pålidelig præstation mål for metoden klassificering. For at sammenligne klassificeringen effektiviteten af ​​forskellige inferensmetoder, gentog vi også de tidligere eksperimenter ved hjælp af CORG, PCA, betyde, og median metoder til at udlede de pathway aktiviteter. Til sammenligning vurderede vi også udførelsen af ​​gen-baserede metode klassificeringen. Vi inkluderede de 50 diskriminerende gener i den indledende markør sæt, for at holde det maksimale antal funktioner identiske for alle metoder klassificering.

Figur 5 opsummerer resultaterne af de cross-validering eksperimenter. I det første sæt eksperimenter anvendte vi logistisk regression til klassificering prøverne. klassificeringsresultaterne for forskellige fremgangsmåder baseret på logistisk regression de er vist i fig. 5A. De to søjlediagrammer til venstre i fig. 5 svarer til de to inden-datasæt eksperimenter baseret på USA brystkræft datasæt (mærket som “USA”) og Nederlandene datasæt (mærket som “Holland”), hhv. I disse inden-datasæt eksperimenter, har det første sæt af top 50 markører blevet valgt ved hjælp af hele datasættet, for at reducere effekten af ​​følsomhed i markør valg, når man sammenligner forskellige pathway-baserede metoder. er blevet udført på tværs af validering eksperimenter baseret på den valgte første sæt af markører (se metoder). Som vi kan se i disse søjlediagrammer, den foreslåede metode opnåede den højeste klassifikation nøjagtighed blandt alle metoder, i begge forsøg. Den CORG-baserede metode sammenlignet positivt til andre pathway-baserede metoder, selvom overgået af den foreslåede metode. Vi kan også se, at genet-baserede klassifikatør udført meget godt i inden datasæt eksperimenter, hvilket ikke er overraskende, hvis vi betragter den høje diskriminerende effekt af de øverste genmarkører observeret i fig. 3A og 3B.

Baren diagrammer viser de gennemsnitlige AUC for forskellige metoder klassificering. Fem pathway-baserede metoder, der bruger forskellige pathway aktivitet inferens ordninger (LLR, CORG, PCA, mener, og median) og et gen-baseret metode blev sammenlignet. (A) Klassificører blev bygget på grundlag af logistisk regression. Resultater af inden-datasæt eksperimenter baseret på USA og den nederlandske datasæt er vist i de to diagrammer til venstre. De to diagrammer til højre viser resultaterne af de cross-dataset eksperimenter. (B) Udførelsen af ​​forskellige metoder klassifikation baseret på LDA (lineær diskriminant analyse).

Resultaterne af cross-dataset forsøg er vist i de to søjlediagrammer på højre side af fig. 5A. Diagrammet mærket som “USA-Nederlandene” viser resultaterne for udvælgelse af funktioner ved hjælp af USA datasættet, og træning /evaluering af klassificeringen ved hjælp af Holland datasættet.

Be the first to comment

Leave a Reply