Abstrakt
human sygdom studier anvender mikromatrice i både kliniske /observationelle og eksperimentelle /kontrollerede undersøgelser har stigende indflydelse på vores forståelse af kompleksiteten af humane sygdomme. En grundlæggende koncept er brugen af genekspression som en “fælles valuta”, der forbinder resultaterne af
in vitro
kontrollerede eksperimenter til
in vivo
observationelle humane undersøgelser. Mange undersøgelser – i kræft og andre sygdomme – har vist lovende i at bruge
in vitro
cellemanipulationer at forbedre forståelsen af
in vivo
biologi, men eksperimenter ofte blot undlader at afspejle den enorme fænotypiske variation set i humane sygdomme. Vi løse dette med en ramme og metoder til at dissekere, forbedre og udvide
in vivo
nytte af
in vitro
afledte genekspression signaturer. Fra et eksperimentelt defineret genekspression signatur bruger vi statistisk faktor analyse til at generere
flere
kvantitative faktorer i human cancer genekspression data. Disse faktorer bevarer deres forhold til det oprindelige, endimensionale
in vitro
signatur, men bedre at beskrive mangfoldigheden af
in vivo
biologi. I en brystkræft analyse, viser vi, at faktorer kan afspejle fundamentalt forskellige biologiske processer knyttet til molekylære og kliniske træk ved menneskelige kræftformer, og at der i kombination de kan forbedre forudsigelse af kliniske resultater
Henvisning:. Lucas JE, Carvalho CM, Chen JL-Y, Chi JT, West M (2009) Cross-Undersøgelse Fremskrivninger af genomisk Biomarkører: en evaluering i Cancer Genomics. PLoS ONE 4 (2): e4523. doi: 10,1371 /journal.pone.0004523
Redaktør: Sridhar Hannenhalli, University of Pennsylvania School of Medicine, USA
Modtaget: September 1, 2008; Accepteret: December 31, 2008; Publiceret: 19 feb 2009
Copyright: © 2009 Lucas et al. . Dette er en åben adgang artiklen distribueres under betingelserne i Creative Commons Attribution License, som tillader ubegrænset brug, distribution og reproduktion i ethvert medie, forudsat den oprindelige forfatter og kilde krediteres
Finansiering: Forskning delvist støttet af National Science Foundation (DMS-0.342.172) og National Institutes of Health (NCI U54-CA-112.952). Eventuelle udtalelser, resultater og konklusioner eller anbefalinger udtrykt i dette arbejde, er dem af forfatterne og afspejler ikke nødvendigvis synspunkter NSF eller NIH
Konkurrerende interesser:.. Forfatterne har erklæret, at der ikke findes konkurrerende interesser
Introduktion
Microarray teknologi tillader indfangning af forskellige aspekter af genetiske, miljømæssige, onkogene og andre faktorer, som afspejles i den globale mRNA udtryk og åbner muligheden for at tilpasse behandling af sygdom [1], [2 ]. Flere undersøgelser har taget en “top-down” tilgang til profilering af genekspression i humane kræftformer, og dette har ført til identifikation af tumor undertyper ikke indregnes tidligere samt gen-signaturer forudsiger forskellige kliniske fænotyper [3] – [7]. Alternativt har andre undersøgelser taget en “bottom-up” tilgang til at bestemme ændringen af genekspression forårsaget af specifikke manipulationer af dyrkede celler
in vitro
. I disse studier genekspression fungerer som en fælles fænotype til at genkende lignende funktioner i humane kræftformer
in vivo
og give en direkte kobling mellem det kendte biologiske forstyrrelse og de kliniske sammenhænge [8] – [12].
Selvom mange sådanne undersøgelser har vist lovende i at bruge
in vitro
cellemanipulationer at forstå
in vivo
biologi, denne tilgang kan ikke fuldt ud afspejler den enorme fænotypiske variation ses i humane kræftformer. Fra sådanne undersøgelser, kan man udlede
signaturer
. Disse vi definerer at være lister over gener, der udtrykkes forskelligt sammen med deres tilknyttede niveauer af forskellig ekspression (som vi kalder vægte). Men der er næsten altid en dårlig kamp mellem disse underskrifter og ekspressionsmønstre af de samme gener
in vivo
. Derfor er der behov for en konceptuel ramme for yderligere dissekere, forbedre og udvide
in vivo
nytte af
in vitro
afledt signatur. Her præsenterer vi en teknik til at opnå dette formål. Vi foreslår at udlede flere faktorer, baseret på menneskelige kræft genekspression studier, fra en eksperimentelt defineret signatur. Disse afledte faktorer vil bevare deres forhold til den originale underskrift, men repræsenterer forskellige biologiske processer. Vigtigt er det, viser vi, at forskellige afledte faktorer kan kombineres til at give meget bedre prædiktive værdier for de kliniske resultater. Forskellige faktorer afspejler også forskellige biologiske processer og er knyttet til forskellige aspekter af molekylære og kliniske træk ved menneskelige kræftformer.
Der er en række mulige tilgange til dette problem. En populær fremgangsmåde har været at sammenligne identiteten af de differentielt udtrykte prober til databaser af foruddefinerede pathways. Beskrivelser af sådanne fremgangsmåder kan findes i [13] – [15]. Mens disse tilgange er tiltalende for deres for fortolkning, de er afhængige af de passende pre-definerede veje snarere end strukturen af data under studiet. Alternativt kan man blot definere signatur aktivitetsniveauet for en prøve som det vejede gennemsnit af
in vivo
udtryk niveauer (hvor generne end at beregne vægte og vægtene selv er hentet fra den originale underskrift). Selv om nogle undersøgelser har vist effekt af dette begreb, er det klart, at man ikke kan håbe på at fange heterogenitet
in vivo
biologi fra endimensionale kontrollerede biologiske respons på
in vitro
signatur afspejler.
Den iboende heterogenitet miljø og celletype i vævsprøver betyder, at generne i en signatur potentielt kan involvere mange ekstra aktiviteter ikke indlysende
in vitro
. Endvidere kan eksperimenter på klonede cellelinier af en enkelt celletype dyrket under stramt kontrollerede forhold for en fast (og forholdsvis kort) tid kontrast skarp med kliniske prøver udvundet af levende organismer indeholder flere celletyper, der har været i et dynamisk miljø for måneder eller år. Der er ikke nogen klart “korrekt” metode til at tage, hvad der læres af microarray eksperiment i kultur og anvende det til at vurdere pathway aktivitet i vævsprøver. Nogle gener kan være fattigere repræsentanter for pathway aktivitet
in vivo
fordi de er mere tilbøjelige til at blive involveret i andre veje, fordi de reagerer på miljømæssige forhold, der ikke er til stede
in vitro
, eller for et utal af andre årsager. Det er derfor vigtigt at give et statistisk og begrebsmæssig ramme, der kan gøre det muligt for os at bruge
in vivo
udtryk data til yderligere dissekere, forfine og forbedre de
in vitro
-afledte gen signaturer .
Signature Factor profilanalyse
(SFPA), baseret på sparsomme statistiske faktor modeller, [16], [17] er en ramme for kortlægning
in vitro
signaturer til en samling af
in vivo
faktorer. Selvom det lyder ligner hierarkisk clustering (som er blevet standard metode til denne type problemer), er der vigtige forskelle. Først mens hierarkisk klyngedannelse kan bruges til at bryde et sæt prøver i grupper, inden for hvilken ekspressionsmønstre er ens i en eller anden måde, er det ikke tal på denne lighed. For det andet, hierarkisk klyngedannelse kræver, at hver observation (gen) være medlem af bare én klynge. Dette udelukker tildeling af klynger til biologiske veje, fordi mange kombinationer af pathway aktivitet er mulige. Endelig fordi de faktorer genereres inden for en statistisk model, er det muligt at fastlægge det niveau af aktivitet i hver af de faktorer på en nyligt målte prøve uden redoing den statistiske analyse. Mens der er andre end hierarkiske clustering teknikker, som behandler nogle af disse spørgsmål, for eksempel soft-clustering [18] og k-midler klyngedannelse [19], vores algoritme henvender dem alle inden for en enkelt sammenhængende statistiske rammer. SFPA bestemmer:
Robust statistisk modellering af både eksperimenterende genekspression og vævsprøven udtryk
Identifikation og korrektion af assay artefakter, som er kendt for at være et vigtigt spørgsmål i forbindelse med brugen af microarray teknologi. .
en kortlægning fra en enkelt underskrift, genereret
in vitro
, til en samling af faktorer, der bevarer de relevante karakteristika for signaturen, mens bedre afspejler heterogenitet
in vivo
forbundet med den biologiske forstyrrelse signaturen repræsenterer.
En model for at tilregne værdierne af faktorer i nye kollektioner af vævsprøver selv om disse prøver kan stamme fra forskellige grupper og på forskellige tidspunkter.
Vi udforsker denne analyse tilgang i at oversætte en samling af gen underskrifter afspejler cellulært respons til fem kendte tumor microenvironmental faktorer, opdagede
in vitro
[8], med særlig vægt på signaturen i forbindelse med svar på lactacidose. Vi viser, at flere forhold, der indtræder i en brystkræft sammenhæng forbliver repræsentative for de enkelte microenvironmental pathway svar fra hvilke de er afledt. Desuden er disse faktorer differentiere vigtige biologiske fænotyper i brystkræft, er i stand til at forbedre kliniske forudsigelser på tværs af flere kræft datasæt, og bevarer deres prædiktive evne selv når den anvendes på prøver udtaget på vidt forskellige tidspunkter eller på forskellige studiecentre.
Resultater
Kontekst, data og Analyse strategi
Vi begynder med fem underskrifter defineret af transkriptionelle svarene fra dyrkede humane mammae bryst epitelceller til fem microenvironmental forstyrrelser: hypoxi, laktatacidose, hypoxi plus mælke- acidose, lactosis, og acidose. Hver af disse ses i humane cancere og bærer prognostisk information med hensyn til kliniske resultater [8]. Signaturerne repræsenterer ændringer i ekspression af gener mellem et sæt af kontrolpunkter observationer og celler dyrket i nærvær af mælkesyreacidose (25 mM mælkesyre, pH 6,7), hypoksi (2% O2), mælkesyre plus hypoxi, lactosis (25 mM natrium lactat, neutral pH), og acidose (pH 6,7 uden lactat). Ekspressionsassays anvendte Affymetrix U133 + 2,0 mikroarrays og underskrifter afspejler hver af microenvironmental faktorer er blevet beskrevet [8]. Som det fremgår af [8], hypoxi, lactacidose og acidose har stærke prognostisk betydning i flere studier af brystkræft. Vores mål her er at udforske de forskellige komponenter i de originale gen underskrifter for at vurdere muligheden for yderligere at fremme deres prognostiske værdier og dissekere dem i forskellige biologiske pathway-relevant faktorer med klinisk relevans.
Vi bruger Bayesian Factor Regression Modeling (BFRM) [20] for at definere og anslå faktorer baseret på en given signatur. Det begynder med en lille samling af gener, som er stærkt reagerer på den oprindelige intervention (stærkt differentielt udtrykt mellem kontrol- og forsøgsgrupper i cellekultur) og derefter iterativt forædler gensæt, baseret på co-ekspression i en in vivo-datasæt, i forbindelse med en statistisk faktor analyse. Først fælles mønstre af udtryk (faktorer) opdaget i den delmængde af gener i øjeblikket under overvejelse. Dernæst sammenhængen mellem disse faktorer og det fulde sæt af gener på array giver os mulighed for at identificere yderligere gener, der skal indgå i en revision af faktor analyse. Begrundelsen for dette er, at mens vurdere faktorer ligger til grund for indledende udvalgte signatur gener giver os mulighed for at belyse
in vivo
variabilitet, der ikke er til stede
in vitro
, tilføjer gener fra uden for den oprindelige signatur kan forbedre karakteriseringen af disse faktorer samtidig med forbindelser til andre relevante veje. Kører SFPA på hver af de fem underskrifter uafhængigt opnår vi 11 hypoxi faktorer, 10 laktacidose faktorer, 20 hypoxi plus mælkesyre acidose faktorer, 17 lactosis faktorer og 9 acidose faktorer. SFPA stopper opdage faktorer, når det meste af variationen i den oprindelige gen sæt er blevet forklaret.
Signatur-Factor Relationships
Vi vil fokusere, for nu, om de ti mælkesyre acidose faktorer. Undersøgelse af gener i hver af de faktorer (figur 1A) viser, at alle faktorer har repræsentanter fra den originale underskrift foruden gener tilsat under processen til montering af faktor model. Det er vigtigt at være sikker på, at i opdagelsen af disse ti faktorer, har vi ikke mistet vores originale underskrift. Vi kontrollere dette ved regression de 10 sæt af afledte faktorresultater på laktatacidose signatur scoringer. (Beregning af en underskrift score er beskrevet i afsnittet Metoder.) Witin en enkelt multivariat regressionsmodel, finder vi, at 7 af de 10 er signifikante på 0,01-niveau, og at når vi fjerne de resterende tre faktorer fra den multivariate regression, dem syv fortsat betydelige. Således, mindst syv af de faktorer, viser en signifikant association til den originale underskrift.
(a) Forbindelser mellem gener og de 10 mælkesyre acidose faktorer i den statistiske faktor analyse af dataene brystkræft fra [21]. Generne indbefatter de indledende valgte signatur gener (sort) og dem tilsat ved den iterative berigelse analyse (rød), med sort eller rød angiver, at et gen (række) er stærkt forbundet med en faktor (kolonne), og hvid indikerer ringe eller ingen association. Krydstale mellem formodede pathway-relaterede faktorer og gener er indlysende. (B) Laktatacidose signatur (lodret akse) er forudsagt af en lineær regression fit (vandret akse) i de syv faktorer signifikant forbundet med mælkesyreacidose signatur. (C) Billede af tærskel-korrelationer mellem 67 faktorer (lodret) og de 10 mælkesyre acidose faktorer (vandret), med sorte angiver par af faktorer, hvis parvis prøve korrelation overstiger 0,9 i absolut værdi.
Figur 1b viser de monterede værdier fra regression af laktatacidose signatur score på mælkesyre acidose faktorer fra analysen af tumor eksempeldata 251 sæt fra [21]. Den for denne regression er høj (0,74), men det er muligt disse ti faktorer kan være i stand til at forklare mange forskellige signaturer. For at vise, at dette ikke er en falsk forening tester vi den hypotese, at dette niveau er uafhængigt af, hvilke gener der er tildelt hvilke vægte. Vi re-samplet vægtene 10.000 gange, hver gang regression signaturen score vektor beregnet ud fra disse vægte på de 10 mælkesyre acidose faktorer og computing en værdi. Af de 10.000 værdier så beregnet under nulhypotesen, den maksimale var 0,48 sikre, at p-værdi «10
-4. Hvis vi tilnærme fordelingen af værdier ved en beta distribution (beregnet ved momentmetoden) får vi en meget tæt pasning (se figur S1) og estimere p-værdien til at være ≈10
-13. Fordi kun en liste over meget differentielt udtrykte gener fra mælkesyreacidose signatur, og ikke de vægte, der anvendes i faktor opdagelse, og fordi vægtene er kritiske for beregningen af de mælkesyreacidose signatur scoringer, evnen til at genvinde signatur scores fra faktorer er stærke beviser for forholdet mellem de to.
de tre faktorer afledt af lactacidose signatur, ikke var vigtige i forudsigelsen af signatur scoringer kan stadig repræsentere aktivitet relevant for tilstedeværelsen af mælkesyre, men de er ikke stærkt prædiktive for den originale underskrift. De kan også simpelthen repræsentere aktiviteten af biologiske veje, der involverer meget store sæt af gener, og er således opdaget fra mange forskellige mulige udgangspunkter. Ikke desto mindre, de repræsenterer betydelige struktur i ekspression af det udvidede signatur gensæt i tumordata, og ingen af disse faktorer vil være detekterbar ved at studere signaturen alene som en fænotype. Salg
Faktorer kan afspejle forskellige aspekter af biologisk aktivitet. Figur 1c viser, hvilke af de 67 faktorer (alle faktorer opdaget fra hver af de fem startende underskrifter) har høj korrelation med de 10 mælkesyre acidose faktorer fra bryst dataanalyse Miller [21]. Bemærk, at ikke to af de mælkeprodukter acidose faktorer er stærkt korreleret, således disse faktorer ser ud til at beskrive forskellige processer. Nogle af de 10 faktorer, såsom mælkesyreacidose faktor 8 for eksempel er stærkt korreleret med flere andre faktorer, hvilket indikerer, at disse faktorer er blevet identificeret fra flere indledende signaturer. De fleste viser dog lave niveauer af parvis korrelation. Blandt de 67 faktorer, der 40 hovedkomponenter forpligtet til at tegne sig for 95% af den observerede variabilitet (supplerende figur S2) antyde, at en relativt høj biologisk “dimension”, ligger til grund for 67 faktorer – de afspejler et bredt sæt af biologiske aktiviteter, og formentlig veje ændret på de cellulære reaktioner på laktatacidose inden humane brysttumorer. Figur 1a viser forbindelserne mellem gener og de 10 mælkesyre acidose faktorer i analysen. Generne indbefatter de oprindelige udvalgte signatur gener og dem, tilsat ved den iterative berigelse analyse. De SFPA-afledte faktorer bevarer en høj procentdel af gener, der er blevet vist at udvise en ændring i ekspression, når cellerne udsættes for tilstedeværelsen af mælkesyre
in vitro
, der viser på en anden måde, at disse faktorer stadig opretholde deres forbindelse med den originale underskrift. Den cross-talk mellem faktorer, i form af gener definerer mere end én faktor, er også indlysende.
Faktorer Forudsige Molekylære funktioner
SFPA-afledte faktorer kan repræsentere forskellige aspekter af biologiske processer, der er forbundet med kliniske fænotyper. For at evaluere dette, vi udforskede undergruppe regressionsmodeller til at forudsige en række kliniske fænotyper i Miller datasættet [21] – de fænotyper, herunder ER og PgR status, p53 status og overlevelse gange. De molekylære statusindikatorer blev modelleret med binære probit regressioner på de faktorer, og overlevelse med standard Weibull overlevelse modeller. Vi udnyttede den shotgun Stochastic Search (SSS) metoden [22], [23] for at identificere små delmængder af de faktorer, der viser prædiktiv værdi med hensyn til hver af disse fænotyper. SSS er en variabel udvælgelse model, som tillader anvendelse af modellen gennemsnit (baseret på posterior sandsynlighed) for forudsigelse. Model gennemsnit har vist sig at klare sig bedre end algoritmer, der benytter det fælles bedste model for forudsigelse (såsom AIC eller BIC), fordi det giver et mere retvisende vurdering af usikkerhed [24]. Denne analyse blev udført på datasæt fra [21], og derefter de resulterende monteret /trænede regressionsmodeller blev brugt til at forudsige fænotyper i hver af fem separate og biologisk mangfoldige brystkræft datasæt [25] – [28]. Alle datasæt er tilgængelige fra Gene Expression Omnibus (GEO).
Faktorer forudsige ER status.
Analysen viser, at højt scorende regressionsmodeller til forudsigelse af ER status udnytte en af de faktorer – acidose 1, Hypoxi 4, lactacidose 2 eller Lactosis 5. fra figur 2a, kan man se, at sammenhængen mellem to af disse faktorer er høj, så vi vil henvise til dem kollektivt som de eR faktorer. Figur 3a viser evnen af denne faktor til at forudsige ER status på træningssættet [21] og 3b viser forudsigelse på en tydelig og helt uafhængige test sæt [27]. For at undersøge genet ontologi (GO) sammensætning af listen over gener involveret i ER faktorer, vi anvendte INDSAMLING analyse [29], og opdager, at GO vilkår forbundet med cellecyklus, proliferation og og mitose er stærkt beriget med disse faktorer (tabel 1), der bekræfter velkendte forbindelse mellem celle progression og ER. Det forventes også, at tilstedeværelsen af mælkesyre eller hypoksi virker til at lukke ned cellecyklus og ER-faktor synes at direkte forbinde de to processer.
Hvert punkt i disse plots repræsenterer en enkelt patient fra datasættet i [21]. (A) Parvis scatterplots faktorer acidose 1, hypoksi 4, laktatacidose 2, og Lactosis fem af de tres-syv faktorer. Hver af disse faktorer er afledt af et andet startpunkt signatur, og de er vigtige og udskiftelige i forudsigelsen af ER status. Graferne på de diagonale akse viser histogrammer af scorer på de respektive faktorer. (B) Tre er ingen signifikant korrelation mellem ER og PgR faktorer. (C) Det ER og p53 faktorer vise nogle tegn på et forhold, men har tydeligvis forskellige strukturer (værdier vist er for aktivitet af de respektive faktorer i data fra [21]).
ER og PgR faktorer forudsige progesteronreceptor status: (a) uddannelse datasæt [21]; (B) projiceret ind i Wang data. Resultater er PgR- (blå, obs = 0) og PgR + (rød, obs = 1). De ER faktorer (acidose 1, hypoksi 4, lactacidose 2 eller Lactosis 5): (c) uddannelse sæt [21], stærkt forbundet med ER status (D) projiceret ind i tumoren udtryk data fra en helt anden undersøgelse – Wang datasæt i dette tilfælde 25 – er i stand til at forudsige ER status. Resultater er ER- (blå, obs = 0) og ER + (rød, obs = 1). (E) p53 status forudsigelse, med resultater p53 vildtype (blues, OBS = 0) og mutant (røde, obs = 1) delt mellem uddannelse (mørkeblå og rød) og test /validering (lyseblå og lyserød) prøver.
faktorer forudsige PgR status.
østrogen og progesteron er kendt for at være antagonister, så det forventes, at eR-faktorer kan forudsige progesteronreceptor status. Brug SSS finder vi, at de meget scoring regressionsmodeller for PgR status inddrage ER faktor i tillæg til lactacidose faktor 10 – vi mærker denne PGR specifik faktor. Fig 3c og 3d viser den monterede og prædiktive evnen af disse to faktorer, der anvendes i en binær regressionsmodel egnet til at progesteronreceptor status. Der er ingen signifikant korrelation i tumor-ekspression mellem PgR og ER faktorer (figur 2b). Gene ontologi for generne i PGR specifik faktor (tabel 2) bekræfter nogle af de kendte forbindelser mellem progesteron og RNA stofskifte i brystkræft [30].
Faktorer forudsige p53 status.
Den tredje binære fænotype, vildtype versus mutant p53-gen, er til stede i kun datasættet fra [21]. SFPA blev igen kørt på en tilfældigt udvalgt 50% af disse data og bruges til at forudsige de øvrige 50% (figur 3). Meget scorede modeller for p53 involverer ER faktor, PGR specifik faktor, og en af enten Hypoxi 1 eller laktatacidose 3. Sammenhængen mellem de to sidstnævnte faktorer er 99%, så vi mærke dem kollektivt som p53 specifik faktor. Gene ontologi for denne faktor er identisk med den for skadestuen faktor med de undtagelser, at “celledeling” og “DNA-replikation indvielse” erstattes af “nuklear division” og “M fase”. For alle gen ontologier opført i top otte for disse to faktorer, de Bayes faktorer er ≥10. På grund af den høje grad af lighed i genet ontologi, er det fristende at forsøge at sidestille disse to faktorer. Figur 2c viser et scatterplot af aktiviteten af tumorerne i data fra [21] på hver af de to faktorer. P53 faktor er signifikant bimodal, og det milde korrelation kan man se skyldes udelukkende denne bimodalitet, som tumorprøver med høj ER faktor aktivitet er mere tilbøjelige til at være i den anden tilstand af p53 faktor. Vi teorier om, at denne bimodalitet er forbundet med en særlig undertype af p53-mutationen. Der er imidlertid ingen tegn på multimodalitet i ER faktor og p53 specifik faktor forudsiger ER status dårligt. På grund af disse forskelle, og fordi celle replikation er en kompleks proces, er det sandsynligt, at disse to faktorer er relateret til forskellige funktioner i celle udvikling.
Vi understreger, at hvis vi begrænse os til at overveje den oprindelige
in vitro
lactacidose signatur, har vi ingen mulighed for at passe eller forudsige nogen af disse biologiske fænotyper (tabel 3). Derudover blev disse faktorer genereret helt uden hensyn til skadestuen status, PgR status eller p53 status af prøverne. Dette er i modsætning til en mere typisk design, hvor signaturer knyttet til fænotyper defineres strengt baseret på gener med udtryk profiler, der matcher disse fænotyper (f.eks [21]). Denne type design er plaget med problemer, der opstår fra det store antal gener, ud af de titusinder på et array, med ekspressionsmønstre, der matcher enhver vilkårlig fænotype. Med SFPA, vi søger efter gener, som udtrykkes sammen uden hensyn til fænotype, og vi er derfor meget mindre tilbøjelige til at blive plaget af falsk opdagelse (som dokumenteret af vores ud af prøve prædiktiv nøjagtighed).
faktorer forudsige klinisk fænotyper
SFPA tilbyder en teknik til afhøre en enkelt uafhængig tumor prøve mod et vilkårligt antal biologisk betingede underskrifter, og derefter deraf sammenkædning af faktorer for fænotyper kan omfatte klinisk relevante resultater, såsom patientens overlevelse udfald og lægemiddelrespons .
faktorer forbedre prognosen af brystkræft overlevelse.
undergrupper af den 67 faktorer blev evalueret i Weibull overlevelse regressionsmodeller ved hjælp af SSS metode til at identificere og score modeller forudsiger overlevelse. Hver model i et resulterende sæt af stærkt scoringsmodeller frembringer indbyggede overlevelseskurver og kan også anvendes til at forudsige overlevelse for nye prøver. Bayesianske analyse mandater gennemsnit forudsigelser fra sådan et sæt af modeller, og dette blev gjort for at resultere i figur 4a. Dette viser anfald af overlevelseskurver for uddannelse datasættet [21], sammen med ud af prøven forudsigelser i fire af de andre datasæt for hvilke der findes oplysninger om overlevelse. Husk på, at disse er datasæt fra helt forskellige og forskelligartede undersøgelser, så vi vurderer en model monteret på et datasæt på fire ganske udfordrende ud af prøven validering datasæt. Selv om det ikke beskrevet nærmere her, den BFRM statistiske model analyse bruges af SFPA behandler også spørgsmål om gen-prøve-undersøgelse specifikke virkninger inden for analyse og er i stand til at korrigere nok af de idiosyncracies og partiskhed iboende i microarray-analyser til at beholde prædiktive nøjagtighed [19 ], [31]. Resultaterne viser, at factorprofiles af disse
in vitro
miljømæssige signaturer kan forbedre overlevelsen forudsigelse betydeligt på tværs af flere test datasæt. Lignende resultater er opnået for forudsigelse af metastase overlevelse.
(a) Forudsagt overlevelsestid fra et gennemsnit på Weibull overlevelse modeller, hvor der anvendes til at opdele 251 prøver fra [21] i henhold til over /under median forudsigelser , og de resulterende empiriske overlevelseskurver (Kaplan Meier-kurver) er vist. Det røde /blå lagdeling af patienter er fra analyse under anvendelse delmængder af de 67 faktorer (rød – høj risiko 50%, blue lav risiko 50%); de grå kurver er fra samme analyse ved hjælp af alle de oprindelige fem underskrifter (der er således ingen kompensation for over-montering her). De p-værdier i hvert af de parceller svarer til stratificering efter faktoranalyse (top, sort) og lagdeling hjælp underskrifterne (nederst, grå). Data fra [21] blev anvendt til at identificere de overlevelse modeller, derfor dette plot repræsenterer tilpassede værdier. De fire ekstra plots repræsenterer forudsigelse i de fire forskellige bryst tumor prøver baseret på en analyse af kun uddannelsen data. Den prædiktive relevans, og betydning, af de faktorer, er tydelig og konsekvent på tværs af studierne, og konsekvent forbedrer der opnås ved brug af underskrifter alene. (B) Den første laktatacidose faktor forudsiger overlevelse hos patienter, som blev behandlet med Tamoxifen (venstre halvdel), men viser ingen prædiktiv værdi hos patienter, der ikke modtog lægemidlet (højre halvdel). I alle disse tal, p-værdier repræsenterer betydning i en Cox proportionel risiko model.
Faktorer forudsige Tamoxifen respons.
Fire af brystkræft datasæt har klinisk anmærkning vedrørende behandling med Tamoxifen. Selvom de 67 faktorer er på ingen måde specifikt rettet mod Tamoxifen, vi ved, at de er forbundet med relevante biologiske veje. Fra vores 67 faktorer, fandt vi, at lactacidose 1 er prædiktiv for Tamoxifen modstand. Det adskiller metastase overlevelse hos patienter, der fik lægemidlet, og viser ingen prædiktiv evne hos patienter, som ikke gjorde (figur 4b, analysen bag denne fulgte samme fremgangsmåde som for overlevelse omtalt ovenfor). Fordi alle de patienter, der fik Tamoxifen var ER positiv, skal lægemiddelresistens i forbindelse med denne faktor være uafhængig af den antagonistiske virkning af lægemidlet på østrogenreceptorer. Da ingen af disse datasæt blev brugt i uddannelsen af faktor model, evnen af disse faktorer til at skelne resistens over for Tamoxifen er bemærkelsesværdigt og viser, at de er robuste til indsamling bias ofte ses i microarray eksperimenter. Vi anvendes igen samles for at studere ontologi af generne indeholdt i denne faktor (tabel 4). Dette forbinder med kendte sammenslutninger af Tamoxifen med fosfat transport [32], [33] samt celleadhæsion [34], [35]. Især Cowell et al. rapporterer, at p130Cas /BCAR1 er et celleadhæsionsmolekyle, der fremmer resistens over for Tamoxifen via et bestemt phosphorylering pathway. Ud over disse forbindelser til de sekundære virkninger af Tamoxifen er den velkendte forbindelse mellem overlevelse af patienter på Tamoxifen og giftighed forbundet med blodkoagulering [36]. Yderligere undersøgelse af generne i denne faktor kan føre til indsigt i mekanismen bag Tamoxifen modstand i ER positiv brystkræft.
Discovery of organspecifikke faktorer fra mælkesyre acidose signaturer.
mens de samme biologiske processer kan bidrage til tumor-fænotyper i forskellige kræftformer, kan den proces, hvorved dette sker være helt anderledes, idet den særlige cellulære kontekst, vævsspecifik genekspression og epigenetiske påvirkninger. Da SFPA kan udnytte
in vivo
kræft genekspression at dissekere den
in vitro
-generated gen signatur, det giver mulighed for at identificere væv og organ-specifikke faktorer i forbindelse med det samme gen signaturer. Denne applikation har potentiale til at skelne sub-pathways, som er konserverede på tværs af mange vævstyper fra dem, der er organspecifik. For at illustrere dette punkt udnytter vi lungekræft datasæt offentliggjort i [11] og ovariecancer datasæt fra [10]. Vi opnåede lungekræft data fra GEO og ovariecancer data fra Duke Integrativ Cancer Biology Program (ICBP) hjemmeside (https://data.cgt.duke.edu/platinum.php).
Leave a Reply
Du skal være logget ind for at skrive en kommentar.