Abstrakt
Integration højt gennemløb data fra forskellige molekylære niveauer er afgørende for at forstå mekanismerne i komplekse sygdomme som kræft. I denne undersøgelse har vi integreret methyleringen, microRNA og mRNA data fra lungekræft væv og normale lungevæv ved hjælp funktionelle gensæt. For hver Gene Ontology (GO) sigt blev tre sæt defineret: methylering sæt, den microRNA sæt og mRNA sæt. Den udslagsgivende evne hvert gen sæt blev repræsenteret af Matthews korrelationskoefficienten (MCC), som bedømt ved leave-one-out krydsvalidering (LOOCV). Dernæst blev den MCC’er i methylering sæt, de microRNA-apparater og mRNA sæt rangeret. Ved at sammenligne MCC rækker methylering, microRNA og mRNA for hver GO sigt vi klassificeret GO sætter i seks grupper og identificeret den dysfunktionelle methylering, microRNA og mRNA gen sæt i lungekræft. Vores resultater giver en systematisk udsigt over de funktionelle ændringer under tumorigenese, der kan bidrage til at belyse de mekanismer i lungekræft og føre til bedre behandlinger for patienter
Henvisning:. Huang T, Jiang M, Kong X, Cai YD ( 2012) dysfunktioner associeret med methylering, MicroRNA Ekspression og genekspression i lungekræft. PLoS ONE 7 (8): e43441. doi: 10,1371 /journal.pone.0043441
Redaktør: Daotai Nie, Southern Illinois University School of Medicine, USA
Modtaget: 8. december 2011; Accepteret: 23, 2012; Udgivet: 17 august, 2012 |
Copyright: © Huang et al. Dette er en åben adgang artiklen distribueres under betingelserne i Creative Commons Attribution License, som tillader ubegrænset brug, distribution og reproduktion i ethvert medie, forudsat den oprindelige forfatter og kilde krediteres
Finansiering:. Dette arbejde blev støttet af tilskud fra National Basic Research Program Kina (2011CB510102, 2011CB510101, 2011CB910200 og 2010CB912702), National Natural Science Foundation of China (90.913.009), Research Program af det kinesiske Academy of Sciences (KSCX2-EW-R-04) og Innovation Program for Shanghai Municipal Education Kommissionen (12ZZ087). De finansieringskilder havde ingen rolle i studie design, indsamling og analyse af data, beslutning om at offentliggøre, eller forberedelse af manuskriptet
Konkurrerende interesser:.. Forfatterne har erklæret, at der ikke findes konkurrerende interesser
Introduktion
Kræft er en systembiologi sygdom [1], der involverer dysregulering af flere veje på flere niveauer [2]. High-throughput teknologier, såsom genomisk sekventering og transkriptom, proteomisk og metabolomiske profilering, har givet store mængder eksperimentelle data. Men systembiologi kræver ikke blot nye high-throughput “omics” data-generations teknologier, men også integrationsfremmende analysemetoder, der kan belyse de mulige mekanismer komplekse sygdomme. Lungekræft er en af de førende årsager til kræft død på verdensplan [3]. Der er i øjeblikket kendt genetisk, epigenetiske, transkriptom, proteomiske og metabolomiske og microRNA markører for lungekræft [4]. Fordi epigenetiske ændringer sker tidligt under tumorigenese, bør overvejes methylering markører [4]. Proteinet er den endelige, funktionelle form af den genetiske information; derfor, proteomiske markører er også vigtige. Transkriptom markører er lette at måle, og mRNA-niveauer bruges ofte som en proxy for protein overflod [5]. MicroRNA, som en vigtig regulerende bidragsyder, er også en fremragende lungekræft biomarkør [6], [7]. Om en methylering markør, mRNA markør, eller microRNA markør anses disse markører funktion ved at påvirke biologiske veje eller netværk. De funktionelle veje er de fælles broer mellem forskellige markører og sygdommen
I øjeblikket er der flere undersøgelser på multidimensional dataintegration [8] -. [11]. De fleste af dem var baseret på regression mellem forskellige dimensioner [10] og kræver hver prøve at have flere niveau data [11]. De dysfunktionelle veje blev identificeret ved berigelse analyse af afvigende gener [9].
I denne undersøgelse har vi direkte analysere dysfunktioner af ikke-småcellet lungecancer (NSCLC) ved at sammenligne de funktionelle sæt methylering, microRNA og mRNA data mellem lungekræft væv og normale lungevæv. Alle de funktionelle sæt svarer til en Gene Ontology (GO) [12] sigt. Tre sæt denne funktionelle enhed er defineret: methyleringen indstillet, microRNA sæt og mRNA sæt. Matthews Korrelationskoefficienten (MCC), vurderet ved leave-one-out krydsvalidering (LOOCV), anvendes til at repræsentere den udslagsgivende evne hvert gen sæt. MCC rækker i hver methylering sæt, microRNA sæt og mRNA sæt analyseres. Seks grupper af GO-apparater er klassificeret, og 20 dysfunktionelle methylering, identificeres microRNA og mRNA gen sæt i lungekræft. Disse dysfunktionelle sæt karakteriserer de processer af tumorigenese. Med en præcis karakteristik af tumorigenese, kan vi bedre forstå mekanismerne for lungekræft og forbedre tidlig diagnose, evaluering behandling effektivitet, og prognose af lungekræft.
Materialer og Metoder
Datasæt
Vi hentede de methylering profiler af 1.413 gener i 57 NSCLC patienter og 52 kontrolprøver [13] fra GEO (Gene Expression Omnibus) med tiltrædelse nummer GSE16559. De microRNA udtryk profiler af 549 microRNA’er i 187 NSCLC patienter og 188 kontrolprøver [14] blev hentet fra GEO med tiltrædelsen nummer GSE15008. MRNA genekspressionsprofiler af 19.700 gener i 46 NSCLC-patienter og 45 kontrolprøver [15] blev opnået fra GEO under accessionsnummer GSE18842.
Da methylering data, microRNA data og mRNA data blev opnået fra forskellige NSCLC undersøgelser sammenlignede vi den kliniske information af patienter fra disse tre studier. De to typer af klinisk information, som blev givet i mindst to undersøgelser var alder og grad af differentiering. Den kliniske oplysninger fra disse tre studier er vist i tabel 1. Den gennemsnitlige alder for patienter fra methylering undersøgelsen er 68,2, og deres standardafvigelse er 11,4; i mellemtiden, den gennemsnitlige alder for patienter fra microRNA undersøgelsen er 59,9, og standardafvigelsen er 9,8. Alderen af patienter i disse to undersøgelser er ens. Procentdelen af vel-, moderately- og dårligt differentierede kræftpatienter i microRNA undersøgelse og mRNA studiet wereand henholdsvis. Fordelingerne af kvaliteter af differentiering i disse to undersøgelser var meget ens. På grundlag af de tilgængelige kliniske oplysninger om disse NSCLC patienter, mener vi, at disse tre datasæt kan repræsentere nogle almindelige dysfunktioner i NSCLC.
De målgener af microRNA
Vi definerer målet gener af de microRNA til at være dem, der blev forudsagt af mindst tre af de følgende seks softwareværktøjer: miRBase [16] (https://microrna.sanger.ac.uk/targets/v5/), Targetscan [17] ( https://www.targetscan.org/), Miranda [18] (https://www.microrna.org/microrna/), TarBase [19] (https://diana.cslab.ece.ntua.gr/tarbase /), mirTarget2 [20] (https://mirdb.org/miRDB/download.html), og PicTar [21] (https://pictar.mdc-berlin.de/). Tabel S1 giver microRNA -. Mål genpar, der er forudsagt af mindst tre værktøjer
De GO gen sæt til methylering, microRNA og mRNA
For hver GO sigt vi definerer tre gen-sæt til at repræsentere det: for det første methylering gen sæt, som består af de gener, der er annoteret til GO sigt og for hvilke der er målt methylering niveau; sekund, microRNA gensæt, som består af microRNA der har målgener kommenteret dette begreb; og tredje, mRNA gen sæt, som består af alle de gener, kommenteret dette begreb.
Den kritiske evne gen sæt
Vi evaluerede diskriminerende evne af gen-apparater ved at konstruere en forudsigelse model . Først nærmeste nabo Algorithm (NNA) [5], [22] – [30] blev anvendt til at bygge forudsigelsesmodellen. Derefter blev prognosemodeller testet ved hjælp LOOCV [5], [22] – [31]. Endelig Matthews korrelationskoefficienten (MCC) [26], [30] af LOOCV blev anvendt som måling af genet apparatets diskriminere evne
NNA [5], [22] – [30]. Er en udbredt maskine indlæringsmetode. Den NNA gør sin forudsigelse ved at sammenligne afstandene mellem forespørgslen prøve og prøverne med kendte klasser, dvs. lungekræft prøver eller kontrolprøver. Forespørgslen prøve blev forudsagt at have samme klasse som nærmeste nabo, dvs. prøven med kendt klasse, der har den mindste afstand. I denne analyse, er afstanden mellem to prøver og blev defineret som et minus cosinus lighed mellem de to prøver [5], [23] – [27], [30], [32] – [34] 🙁 1)
NNA programmet kan downloades fra https://pcal.biosino.org/NNA.html.
Under LOOCV [32], [35], [36], hver prøve i benchmark datasæt vil blive valgt som den test, der én gang og testet af forudsigelse model trænet af resten af prøverne.
Matthews korrelationskoefficienten (MCC) er en afbalanceret måling af forudsigelse præstation, der anser både sensitivitet og specificitet [26], [30]. Det beregnes ved hjælp af følgende formel:. (2), hvori TP, TN, FP og FN er antallet af sande lungekræft prøver, sande kontrolprøver, falske lungekræft prøver og falske kontrolprøver henholdsvis
Klassifikation af gen-apparater baseret på deres dysfunktionelle niveau: methylering, microRNA eller mRNA
Efter vi beregnet MCC af hvert gen sat på hvert niveau, vi rangeret gen sæt af hvert niveau baseret på deres MCC’er og sammenlignet rækker af de tre niveauer, methylering, microRNA og mRNA, i hvert gensæt. Med visse værdier viser sig at være lige, blev deres rækker erstattet af deres gennemsnitlige rækker. Som et eksempel på en GO sigt havde hvis dens methylering niveau havde ændret mellem normal og cancer væv, men dens microRNA og mRNA-niveauer ikke ændret, det blev defineret som en methylering dysfunktionel GO gensæt. Tilsvarende kan vi definere andre typer af GO gensæt. I alt har vi defineret seks grupper af gen-sæt, en for hver mulig rang bestilling af methylering, microRNA og mRNA.
Arbejdet strøm af dysfunktionelle methylering, microRNA og mRNA gen sæt analyse
Vores strategi dysfunktionel methylering, er microRNA og mRNA gen sæt analyse viste i figur 1. først for hver GO sigt definerede vi tre sæt: methylering sæt, den microRNA sæt og mRNA sæt. Dernæst vi beregnet hvert gen sæt s MCC, som vurderet ved LOOCV. Vi rangeret MCC’er i methylering sæt, de microRNA sæt og mRNA sæt. Dernæst vi sammenlignede MCC rækker methylering, microRNA og mRNA i hver GO sigt og klassificeret GO sætter i seks grupper baseret på disse rækker. Endelig har vi identificeret den dysfunktionelle methylering, microRNA og mRNA gen sæt i lungekræft
Først for hver Gene Ontology (GO) sigt definerede vi tre gen-sæt:. Methylering indstillet, microRNA sæt og mRNA sæt. Dernæst vi beregnet Matthews korrelationskoefficient (MCC), som bedømt ved leave-one-out krydsvalidering (LOOCV), for hvert gen sæt. Dernæst vi rangeret MCC’er i methylering sæt, de microRNA sæt og mRNA-apparater, og vi sammenlignede MCC rækker methylering, microRNA og mRNA for hver Gene Ontology (GO) sigt og klassificeret GO sætter i seks grupper. Endelig har vi identificeret den dysfunktionelle methylering, microRNA og mRNA gen sæt i lungekræft.
Resultater og Diskussion
De GO gen sæt methylering, microRNA og mRNA
Vi krydsreferencer de tre datasæt, hvor man målte methylering, microRNA og mRNA af lungekræft væv og kontrol væv med GO og fundet 4.381 GO gen-apparater, der har methylering, microRNA og mRNA-data. De tre niveauer af gen-sæt til disse 4.381 GO vilkår blev opgjort som følger: det sæt for hver GO sigt består af de gener, der havde methylering data og blev kommenteret dette begreb methylering, at microRNA sættet består af microRNA, der havde målgener kommenteret til dette udtryk, og mRNA sæt består af alle de gener, der blev kommenteret dette begreb. De 4.381 GO sæt mRNA, microRNA og methylering kan findes i Dataset S1, Datasæt S2 og Dataset S3 henholdsvis.
Den kritiske evne til methylering, microRNA og mRNA gen sæt
Vi målt evne genet sæt at skelne mellem kræft og normalt væv ved hjælp af Matthews korrelationskoefficienten (MCC) i NNA forudsigelsesmodel evalueret af LOOCV. Vi sammenlignede MCC’er af methylering, microRNA og mRNA. Figur 2 viser MCC fordelinger af methylering, microRNA og mRNA gensæt. Den gennemsnitlige MCC’er af mRNA, microRNA og methylering gen sæt er 0,897, 0,702 og 0,561 henholdsvis. Den ene-side-større t-test p-værdi for mRNA og microRNA sættene er mindre end 2.2E-16. Den ene-side-større t-test p-værdi for microRNA og methylering sæt er også mindre end 2.2E-16. Disse resultater viser, at MCC’er af mRNA sæt er signifikant større end MCC’er af microRNA sæt, som er til gengæld væsentligt større end MCC’er af methylering sæt.
Middelværdien MCC’er af mRNA’et, microRNA og methylering gen sæt var 0,897, 0,702 og 0,561 henholdsvis. Den MCC’er af mRNA sæt var signifikant større end MCC’er af microRNA sæt med en ensidet t-test p-værdi på mindre end 2.2E-16, og den MCC’er af microRNA sæt var til gengæld væsentligt større end den MCC’er af methylering sæt med en ensidig t-test p-værdi på mindre end 2.2E-16.
de grønne søjler angiver tumor prøver og de blå søjler angiver de normale prøver. Tumor og normale prøver blev klart adskilles fra de højfrekvente generne.
De grønne knudepunkter betegne højfrekvente microRNA. De røde knuder betegne højfrekvente gener i både methylering og mRNA dysfunktionelle sæt. De gule knuder angiver højfrekvente gener i kun mRNA dysfunktionelle sæt. Der er ingen specifik højfrekvens-genet i methylering dysfunktionelle sæt. De hvide knudepunkter indikerede ikke-højfrekvente gener. De sorte kanter viser interaktioner fra Kegg sti “hsa05223 Ikke-småcellet lungekræft”. De grønne kanter viser regulering af højfrekvente microRNA på deres målgener
Klassifikation af gen-apparater baseret på deres dysfunktionelle niveau:. Methylering, microRNA eller mRNA
Ved at sammenligne MCC rækker gen sæt ved methylering, microRNA eller mRNA-niveau, vi definerede seks grupper af gen-sæt. Der er 960 gensæt hvori methylering rang microRNA rang mRNA rang; 638 gen-apparater, hvor methylering rang mRNA rang microRNA rang; 721 gen-apparater, hvor microRNA rang methylering rang mRNA rang; 684 gen-apparater, hvor microRNA rang mRNA rang methylering rang; 584 gen-apparater, hvor mRNA rang methylering rang microRNA rang; og 794 gen-apparater, hvor mRNA rang microRNA rang methylering rang. Tabel S2 viser methylering, microRNA og mRNA dysfunktion grupper af 4.381 GO gen sæt.
De dysfunktionelle gen sæt i lungekræft
Vi klassificeret de dysfunktionelle gen sæt i lungekræft baseret på den summerede MCC rangerer af methylering, microRNA og mRNA. De øverste 20 dysfunktionelle gen sæt i lungekræft vist i tabel S3 blev analyseret. Disse 20 dysfunktionelle gen sæt i lungekræft er GO: 0.048.585 (negativ regulering af respons på stimulus), GO: 0.007.517 (muskel orgel udvikling), GO: 0.048.514 (blodkar morfogenese), GO: 0.051.146 (tværstribede muskler celledifferentiering), GO : 0001525 (angiogenese), GO: 0.045.595 (regulering af celledifferentiering), GO: 0.007.162 (negativ regulering af celleadhæsion), GO: 0.060.191 (regulering af lipase aktivitet), GO: 0.006.275 (regulering af DNA-replikation), GO: 0.061.061 (udvikling muskel struktur), GO: 0.022.008 (neurogenese), GO: 0.008.543 (fibroblast vækstfaktor receptor-signalvejen), GO: 0.035.107 (vedhæng morfogenese), GO: 0.035.108 (lemmer morfogenese), GO: 0.001.568 (blodkar udvikling), GO: 0005576 (ekstracellulær region), GO: 0.050.793 (regulering af udviklingsprocesser), GO: 0.010.648 (negativ regulering af celle kommunikation), GO: 0.023.057 (negativ regulering af signalering), og GO: 0.019.216 (regulering af lipid metaboliske processer) . Mange af disse GO termer er blevet rapporteret at være associeret med lungecancer. Vi analyserer flere GO sæt som eksempler
GO:. 0.045.595 (regulering af celledifferentiering, rangeret 6
th) og GO:. 0.050.793 (regulering af udviklingsprocesser, rangeret 17
th)
udviklingsmæssige processer og celledifferentiering reguleres af en række lignende gener i normale væv. Derfor er ændringer i disse gener ofte forbundet med carcinogenese. Naveen Babbar et al. rapporterede, at TNFa kan aktivere NFKB signalering i NSCLC-celler [37], hvilket resulterer i nedsat cellevækst og forøget apoptose [37]. En rolle for FGF /FGFR familiemedlemmer er også blevet angivet i lungekræft. For eksempel blev hyppige amplifikation af FGFR1 identificeret i human planocellulært lungecancer [38]. Derudover blev somatiske mutationer i flere af disse gener identificeret i lungecarcinomer, herunder FGFR1, FGFR2, og FGF2 /10 [39] – [42]. Normalt tumorsuppressorgener, såsom P53, CDKN2A /B, og STK11, der nedreguleres, og onkogener (såsom KRAS og ERBB2 /4) er opreguleret i lungecancer [40]. MikroRNA’er er involveret i lungekræft grundet de epigenetiske forandringer, der sker i cancerceller. Den lave ekspression af MIR-200 og MIR-205 er forbundet med epitel-mesenkymale overgang (EMT) og spindel-celle-lignende egenskaber hos cancerceller og fremmer invasion og translokation [43] – [45]. Den tvungen udtryk for miR-29 familiemedlemmer i lungekræft celler kan genoprette normale mønstre af DNA methylering, inducere re-ekspressionen af methylering-lyddæmpet tumorsuppressorgener, såsom FHIT og WWOX, og hæmme tumorgenicitet [46].
GO: 0.022.008 (neurogenese, rangeret 11
th)
Flere gener kommenteret dette GO sigt er forbundet med acantha og hjernemetastaser;. for eksempel blev mutationer i aktiverende epidermal vækstfaktor receptor (EGFR) findes i mange lungekræftpatienter [47]. Menneskelig lungekræft har omfattende ændringer af microRNA udtryk, der kan deregulere cancer-relaterede gener; for eksempel HSA-miR-125a-5p tavshed ureguleret rock1, miR-34b methylering forårsagede c-Met overekspression, og miR-200c blev stille ved methylering og nedreguleret TCF8 og E-cadherin, hvilket resulterede i kræft invasion og forringelse [48] – [50]. Demethylering og mutation af gener (erbB2, KRAS) kan også forårsage carcinogenese [51], [52]. Methylering af død-associeret proteinkinase (DAPK) promotor og opioidet bindende protein /celleadhæsionsmolekyle-lignende gen (OPCML) er blevet fundet i både adenokarcinom og pladecellekræft [53], [54].
GO: 0.005.576 (ekstracellulær region, rangeret 16
th)
Epithelial Mesenchymale Transition (EMT) er det vigtigste proces kræves for tumor invasion og translokation.. Mutationer i TIMP3, LAMA /B /C, TMEFF2, CDH13 og andre gener er involveret i nedbrydning lungekræft [55]. IL-8 kan initiere en luftvej epithelial signalvej, og dereguleringen af dette gen kan forårsage tobak lungekræft [56]. Fem microRNA (HSA-miR-155, HSA-miR-17-3p, HSA-lad-7a-2, HSA-miR-145, og HSA-miR-21) ses at være udtrykt forskelligt i lungekræft væv versus tilsvarende noncancerous lungevæv. Blandt disse microRNA’er, lad-7a kan regulere RAS aktivitet [57]. Epigenetisk aktivering af menneskelig kallikrein 13 (KLK13) øger malignitet af lunge adenocarcinom ved at fremme N-cadherinekspression og laminin nedbrydning [58]. For nylig blev MMP1 rapporteret at være associeret med lungecancer. Den -16071G-2G polymorfi af MMP1 resultater i transkriptionelle opregulering [58]. X Xiang et al. rapporterede, at den stabile ekspression af MIR-155 reducerer aggressivitet formidling tumorceller væsentligt ved at forhindre EMT af tumorceller in vivo [59]. Endvidere MIR-155 direkte undertrykker ekspressionen af transskriptionsfaktoren TCF4, som er en vigtig regulator af EMT [59].
De højfrekvente gener og microRNA i top dysfunktionelle gensæt
Vi beregnede hyppighed af gener eller microRNA i top 300 dysfunktionelle gen sæt. Generne i enten mRNA eller methylering gensæt med frekvens højere end 50 blev defineret som højfrekvente gener. Ligeledes blev de højfrekvente microRNA’er defineret som microRNA, der har frekvens højere end 50 i top 300 dysfunktionelle gen sæt. De højfrekvente gener og microRNA’er er angivet i tabel S4.
Vi testede diskriminere evnen af disse højfrekvente gener i et uafhængigt datasæt, som omfatter 58 lungekræft prøver og 58 hosliggende normale prøver. Den uafhængige datasæt blev hentet fra GEO med tiltrædelsen nummer GSE32863. Det konstateredes, at de højfrekvente gener perfekt kan differentiere lungekræft væv fra tilstødende normale væv. Forudsigelsen MCC var 1, hvilket betyder, at alle prøver var korrekt klassificeret i deres faktiske gruppe, tumor eller normal. Den Heatmap af de højfrekvente gener og tumor /normale prøver er vist i figur 3. tumor og normale prøver blev klart adskilles fra de højfrekvente generne.
Vi gjorde en hypergeometric test [5], [24 ], [25], [32], [36] for at undersøge, om de højfrekvente gener er betydeligt overlappede med Kegg sti “hsa05223 Ikke-småcellet lungekræft”. Den hypergeometric test p-værdi var en yderst signifikant 1.61E-26. Dette resultat tyder på, at mange højere frekvens gener er kendt “hsa05223 Ikke-småcellet lungecancer” gener.
I figur 4, vi fremhævet de højfrekvente gener, vi opdagede i Kegg sti “hsa05223 Ikke-småcellet kræft”. Mange hub gener af Kegg sti “hsa05223 Ikke-småcellet lungekræft” var højfrekvente dysfunktionelle gener, såsom KRAS, EGFR, ERBB2, CDKN2A og RB1. Og navet højfrekvente gener tendens til at være dårligt fungerende ved både methylering og mRNA-niveauer. Det er kendt, at KRAS kan initiere tumorgenese ved at påvirke endodermal stamfader [60]. Kopitallet ændringer af KRAS er stærkt forbundet med kliniske resultater af patienter med lungecancer [61]. EGFR er en receptor for epidermal vækstfaktor familie. Binding af EGFR til en ligand vil inducere celleproliferation [62]. EGFR-mutationer er meget almindelige i lungekræft [63] og er forbundet med prognosen for NSCLC [64]. De kan ændre signalering kaskader af NSCLC [65]. ERBB2 er muteret i 4% af NSCLC [66] og polymorfier øger risikoen for lungekræft [67]. Methylering af CDKN2A forekommer hyppigere i NSCLC væv end i ikke-tumorvæv [68]. CDKN2A er involveret i p16 /pRb /cyclin-D1-vejen [69]. RB1 kan regulere celleproliferation, differentiering og apoptose i human NSCLC [70]. I avancerede NSCLC-patienter, hyppigheden af Rb tab er høj [71].
i figur 4, er der nogle højfrekvente microRNA, såsom HSA-MIR-495, HSA-MIR-96, har-miR -106a, har-mIR-137, har-mIR-372, HSA-mIR-183, HSA-mIR-182, HSA-mIR-203, HSA-mIR-15a, HSA-mIR-15b og HSA-mIR-7 . HSA-miR-495 regulerer to højfrekvente dysfunktionelle gener, STK4 og PRKCB. Det blev rapporteret, at miR-495 er opreguleret i KRAS-positiv NSCLC [72]. HSA-MIR-96 nedreguleres i NSCLC [73]. har-MIR-106a er relateret til lungekræft patientoverlevelse [56]. Patienter med høj ekspression af har-MIR-106a tendens til at have en dårligere prognose [56]. har-miR-137 og har-miR-372 er begge opreguleret i NSCLC og deres udtryk niveauer er forbundet med overlevelse og tilbagefald i NSCLC patienter [74]. har-miR-183 er en potentiel metastase-inhibitor af lungekræft og kan regulere migration og invasion gener [75]. HSA-miR-183 og HSA-miR-182 blev rapporteret som den mest differentielt udtrykte microRNA mellem lungekræft væv med tilstødende normale væv [76]. HSA-miR-203 er opreguleret i lungekræft væv [56]. HSA-MIR-15a ofte slettet eller nedreguleret i NSCLC [77] og dets ekspression omvendt korrelerer med ekspression af cyclin D1 [77]. HSA-MIR-15 b er differentielt udtrykt i tumornekrosefaktor (TNF) relateret apoptoseinducerende ligand (TRAIL) resistente NSCLC-celler [73]. HSA-miR-7 nedreguleres i lungekræft, og det kan regulere epidermal vækstfaktor receptor signalering [78].
De fordele og begrænsninger ved vores metoder
At opnå en systematisk forståelse af patologisk forandring er et væsentligt problem i medicinske og farmaceutiske undersøgelser. Tumorigenese involverer ændringer af mange proteiner, molekyler og veje. Til sidst, men alle disse ændringer fremkalde kræft gennem funktionelle effekter. I denne undersøgelse, vi brugte på GO for at beskrive biologiske funktioner og stratificeret funktionerne i tre niveauer: methylering, microRNA og mRNA. I hvert niveau, vi beregnet og rangeret den udslagsgivende evne funktionelle sæt for dette niveau, der blev målt ved MCC korrekt klassificering cancer og normale væv. For hvert funktionelle sæt, vi sammenlignede MCC rang af hvert niveau, og vi efterfølgende grupperet de funktionelle sæt i seks mønstre baseret på forholdet af MCC rækker de forskellige niveauer. Nogle funktionelle sæt kan fungere på methylering niveau; andre kan fungere på microRNA-niveau. Tager alle tre niveauer i betragtning, vi rangeret de funktionelle sæt baseret på deres samlede rækker på de tre niveauer. Den samlede placering af de funktionelle sæt forekommer rimeligt og er i overensstemmelse med adskillige offentliggjorte undersøgelser.
Der er stadig flere begrænsninger for denne forskning. For det første methylering, microRNA og mRNA data for lungekræft og normale væv opnås fra forskellige undersøgelser, der kan påvirke resultaterne. Ideelt ville alle data afledes fra den samme undersøgelse. Til delvist at overvinde dette problem har vi benyttet MCC rang, i stedet for MCC selv, når man sammenligner mellem de forskellige niveauer. For det andet er forbindelserne mellem microRNA og deres målgener baseret på forudsigelser. På grund af den lave andel af eksperimentelt bekræftede microRNA og target genpar, vi brugte microRNA og target genpar, der blev forudsagt af mindst tre populære microRNA target-gen prædiktorer. For det tredje, ikke alle funktionelle sæt blev analyseret. Methyleringen, blev microRNA og mRNA data vi bruges genereret med microarray teknologi. Visse gener eller microRNA blev ikke målt, navnlig med hensyn til status for methylering af gener. Med udviklingen af sekventering teknologi og sekvens capture-teknologi, stigende antal gener kan måles, hvilket giver os mulighed for at analysere mere funktionelle sæt og få et mere samlet overblik over tumorigenese.
Samlet set vores metoder giver et middel til at udføre “multi-omik” dysfunktionelle sæt analyse, som kunne være nyttige i studiet af komplekse sygdomme. Vores resultater giver en systematisk syn på tumorigenese, der kan kaste lys over diagnose og prognose af lungekræft.
Støtte oplysninger
Datasæt S1.
Den 4381 Gene ontologi (GO) sæt af mRNA. Hver linje beskriver et gensæt. Det første felt indeholder Gene Ontology (GO) sigt navn, det andet felt indeholder antallet af mRNA’er i sættet, og de resterende felter liste over de mRNA i sættet
doi:. 10,1371 /journal.pone.0043441.s001 Hotel (TXT)
Datasæt S2.
Den 4381 Gene ontologi (GO) sæt af microRNA. Hver linje beskriver et microRNA sæt. Det første felt indeholder Gene Ontology (GO) sigt navn, det andet felt indeholder antallet af microRNA i sættet, og de resterende felter liste over de microRNA i sættet
doi:. 10,1371 /journal.pone.0043441.s002 Hotel (TXT)
Datasæt S3.
4381 Gene Ontology (GO) sæt methylering. Hver linje beskriver et gensæt. Det første felt indeholder Gene Ontology (GO) sigt navn, det andet felt indeholder antallet af gener i sættet, og de resterende felter listen generne i sættet
doi:. 10,1371 /journal.pone.0043441.s003 Hotel (TXT)
tabel S1.
microRNA – target genpar, der blev forudsagt af mindst tre værktøjer.
doi: 10,1371 /journal.pone.0043441.s004
(XLSX)
tabel S2.
methylering, microRNA og mRNA dysfunktion grupper af 4381 Gene ontologi (GO) gen sæt.
doi: 10,1371 /journal.pone.0043441.s005
(XLSX)
tabel S3.
De øverste 20 dysfunktionelle gen sæt i lungekræft.
doi: 10,1371 /journal.pone.0043441.s006
(PDF)
Tabel S4.
Den højfrekvente gener og microRNA’er.
doi: 10,1371 /journal.pone.0043441.s007
(XLSX)
Leave a Reply
Du skal være logget ind for at skrive en kommentar.