PLoS ONE: Integrativ Analyse af Normal Lang intergenisk ikke-kodende RNA i prostatakræft

abstrakt

For nylig har et stort antal normale humane væv blevet profileret for ikke-kodende RNA’er og mere end fjorten tusinde lange intergeniske ikke-kodende RNA’er (lincRNAs) findes udtrykt i normale humane væv. De funktionelle roller disse normale lincRNAs (nlincRNAs) i reguleringen af ​​protein kodning gener i normal og sygdom biologi er endnu ikke fastslået. Her har vi profileret to RNA-seq datasæt, herunder kræft og matchede ikke-neoplastiske væv fra 12 personer fra forskellige demografi for både kodning gener og nlincRNAs. Vi finder 130 nlincRNAs betydeligt reguleret i kræft, med 127 reguleres på samme retning i de to datasæt. Interessant ifølge Illumina Krop Kort betydelige antal af disse nlincRNAs vise baseline null ekspression i normale prostatavæv men er specifikke for andre væv, såsom skjoldbruskkirtel, nyre, lever og testis. En række af de regulerede nlincRNAs aksjer loci med kodning gener, som enten co-regulerede eller modsat reguleret i alle kræft prøver studerede her. For eksempel i alle cancer prøver i) nlincRNA, TCONS_00029157, og en tilstødende tumor suppressor faktor, SIK1, er begge nedreguleret; ii) flere skjoldbruskkirtel-specifikke nlincRNAs i nabolaget af skjoldbruskkirtlen-specifikt gen TPO, er begge opreguleret; og iii) TCONS_00010581, en isoform af HEIH, er nedreguleret, mens den nærliggende EZH2 genet opreguleres i cancer. Adskillige nlincRNAs fra en prostatacancer associeret kromosomale locus, 8q24, er opreguleret i cancer sammen med andre kendte prostata cancer forbundne gener herunder PCAT-1, PVT1, og PCAT-92. Vi observerer, at der er en betydelig skævhed i retning af opregulering af nlincRNAs med så højt som 118 ud af 127 opreguleret i cancer, selvom regulering af kodning gener skæv retning nedregulering. I betragtning af at alle rapporterede kræft forbundet lincRNAs (clincRNAs) er forudindtaget mod opregulering, konkluderer vi, at denne skævhed kan være funktionelt relevant

Henvisning:. Bawa P, Zackaria S, Verma M, Gupta S, Srivatsan R, Chaudhary B, et al. (2015) Integrativ Analyse af Normal Lang intergenisk ikke-kodende RNA i prostatakræft. PLoS ONE 10 (5): e0122143. doi: 10,1371 /journal.pone.0122143

Academic Redaktør: Xia Li, Harbin Medical University, KINA

Modtaget: November 13, 2014 Accepteret: 10. februar, 2015; Udgivet: 1. maj 2015

Copyright: © 2015 Bawa et al. Dette er en åben adgang artiklen distribueres under betingelserne i Creative Commons Attribution License, som tillader ubegrænset brug, distribution og reproduktion i ethvert medie, forudsat den oprindelige forfatter og kilde krediteres

Data Tilgængelighed: Alle relevante data er inden for papir og dens Støtte Information filer

Finansiering:. Denne undersøgelse blev finansieret af Institut for Bioteknologi, Indiens regering; Institut for Informationsteknologi, Indiens regering; DST-FIST, Indiens regering; og Institut for Informationsteknologi, regering Karnataka. De finansieringskilder havde ingen rolle i studie design, indsamling og analyse af data, beslutning om at offentliggøre, eller forberedelse af manuskriptet

Konkurrerende interesser:.. Forfatterne har erklæret, at der ikke findes konkurrerende interesser

Introduktion

løftet om human Genome Project var at levere hundredtusindvis af proteiner til brug som lægemiddelkandidater. Men til alles overraskelse, store annotation indsats store konsortier, såsom KODE projektet [1], leveret titusinder af lægemiddelkandidater af anden art; ikke-kodende RNA. Det er nu kendt, at størstedelen af ​​det humane genom transkriberes selvom kun en lille brøkdel udslag i proteiner. Det er nu klart, at et stort antal af ikke-kodende RNA, både lange og korte, spille kritiske roller i den komplekse regulering af det relativt lille antal kodning proteiner, der er afgørende for livet.

Af de forskellige typer af ikke-kodende RNA’er, lange intergeniske ikke-kodende RNA’er (lincRNA) er attraktive, fordi de let kan opdages med høj tillid fra eksisterende RNA-seq datasæt og korreleret med genekspression information fra den samme datasæt ved hjælp af eksisterende bioinformatiske værktøjer. For nylig, titusinder af lincRNAs er blevet opdaget fra RNA-seq datasæt fra forskellige normale humane væv, her nævnt nlincRNAs såsom Illumina Krop Map [2]. De funktionelle roller disse nlincRNAs er endnu ikke fastslået.

På trods af at lincRNAs er nye til kræft biologi og deres molekylære mekanismer stadig i sin vorden, har flere oversigtsværker allerede optrådt i litteraturen beskriver fremskridt på dette område til dato [3] [4]. Af de omkring 60 + lincRNAs der har vist sig at være forbundet med forskellige kræfttyper, de fleste af dem er opreguleret i cancer [3] [4], og kun nogle få lincRNAs viser sig at være nedreguleret i cancer prøver herunder GAS5 [5] og MEG3 [6].

De seneste rapporter forbinder ekspressionsniveauer af lincRNA med kræft tilbyder en fremragende mulighed for at etablere funktionelle rolle af lincRNAs i reguleringen af ​​genekspression. En af de mest udtømmende søgning efter lincRNAs forbundet med prostatakræft omfatte, identifikation af 121 lincRNAs, kaldet PCATs (prostatakræft Associated Afskrifter) opdaget fra 102 sygdom stratificeret prostata væv og cellelinier [7]. Ud af disse er PCAT-1-inhibering med siRNA vist sig at reducere proliferation af celllines udtrykker høje-niveauer af PCAT-1. Siden offentliggørelsen af ​​denne rapport, har PCAT-1 overekspression vist sig at være en biomarkør i kolorektal cancer [8]. For nylig er lincRNAs fra RNA-seq data fra et stort antal prøver lungekræft fra offentligheden repository blevet anvendt til at identificere 111 lungecancer associeret lincRNAs, kaldet LCALs [9]. Den skævhed af lincRNAs mod opregulering i kræft kræver forhør.

Det er fristende at konkludere, at bias i retning af opregulering af lincRNAs i kræft, i de store indsats dommen, kan resultater fra praksis opdage lincRNAs fra prøver kræft. Her var det vores mål at udføre en integrativ analyse af både kodning og ikke-kodning nlincRNAs (lincRNAs opdaget fra normale humane væv) på tværs af flere RNA-seq datasæt vedrørende prostatakræft fra offentlig opbevaringssted til både adresse denne skævhed og opdage nye samregulering af gener og nlincRNAs.

Materialer og metoder

datasæt anvendes

Vi har brugt to RNA-seq datasæt fra NCBI offentlige arkiv genereres af to uafhængige grupper med tiltrædelse id’er for SRP002628 og ERP000550. Som vist i tabel 1, er 5 tumor-normal par fra SRP002628 og 7 fra ERP000550 datasæt betragtes i denne undersøgelse, enten fordi de tilsvarende par var ikke tilgængelig for nogle individer eller dybden af ​​sekventering var ikke forenelige at opnå gode statistikker. Disse to datasæt er fra to forskellige demografi. For eksempel valgte patienter til at generere data inden tiltrædelsen ERP000550 er kinesere i oprindelse, og selv om demografi af patienterne i SRP002628 datasæt ikke er kendt, er det sikkert at antage, at de personer, der anses for at generere data inden tiltrædelsen SRP002628 er ikke kinesisk . Tabel 1 giver den dybde, individuelle tiltrædelse id’er og kortlægning procenter for hver prøve i disse datasæt.

For profilering kendte og nye lincRNAs vi brugte GENCODE (https://www.gencodegenes.org/) og lincRNA-katalog (https://www.broadinstitute.org/genome_bio/human_lincrnas/?q=lincRNA_catalog). Også for genekspression analyse har vi anvendt bordet browseren fra URL https://genome.ucsc.edu/cgi-bin/hgTables for hg19 med sporet som refseq gener og output format som BED.

For baseline udtryk for kodning gen data, vi har brugt både E-mtab-513 med 16 og E-mtab-1733 med 27 normale humane væv fra Expression Atlas under ArrayExpress. I denne undersøgelse har vi brugt en FPKM værdi på mindre end 0,5 til at foretage baseline null opkald og FPKM værdi større end 100 at kalde dem vævsspecifik.

Beregningen udskrift udtryk

udvalgte datasæt blev kortlagt til hg19 henvisning genom under anvendelse Bowtie [10] med procentdel kortlagt vist i tabel 1. på læser under accessionsnummer SRP002628 hele længden af ​​den læser, der er 36mer, blev kortlagt. til læser Men under ERP000550 25 baser blev trimmet fra begge ender af læsninger af længde 90, der fører til kortlægning af 40mers fra midten. Værktøjet coverageBed fra BEDTools blev brugt til at udvinde optælling pr udskrift per prøve ved hjælp af annotationsfiler og lincRNA-katalog, der er nævnt i ovenstående afsnit. Disse individuelle tæller filer blev indsamlet i en tabel med rækker repræsenterer udskrifter.

Computer forskellen udtryk

For computing forskellen udtryk vi udvalgt to udbredte tæller-baserede R pakker, Edger [11] og DESeq [12]. Selv om disse to metoder er meget ens de adskiller sig i brugen af ​​dispersionen. Pakken kantskærer anvender enkelt fælles dispersion faktor i modsætning til en fleksibel varians estimering anvendes af pakken DESeq. Den vigtige forskel for Edger er, at det er anti-konservativ for lave udtrykte gener og mere konservativ for højt udtrykte gener. Når som, den fleksible spredning model, der anvendes af DESeq giver mulighed for mindre skævhed i udvælgelsen af ​​gener baseret på deres udtryk niveauer. Denne måde DESeq og Edger supplerer hinanden i udvælgelsen af ​​differentielt udtrykte gener. Med andre ord Edger er mere følsom over for outliers hvor som DESeq er mindre følsom over for outliers, men tilbyder uvildige resultat gennem det dynamiske område [13].

DESeq og Edger begge accepterer en sammenstillet tæller fil som input og producere enkelt p -værdi og log fold-ændring pr udskrift pr datasæt repræsenterer den samlede forskellen udtryk tilstand udskrifter i annotation fil mellem to givne tilstande, tumor og matchede ikke-neoplastiske væv. Til opnåelse cancerspecifikke transkripter, der er statistisk signifikant vi anvendte en p-værdi cutoff på mindre end 0,05 og en abs (log fold ændring til basen 2) større end 1,0 til kodning gener og større end 0,59 for nlincRNAs. Variationen i filtreringskriterier valgt til fold ændring er at afspejle de relativt lavere niveauer af nlincRNA udtryk i forhold til kodning gener rapporteret i litteraturen [2].

Clustering Heatmap

For at generere heatmaps vi brugte Pearson korrelationskoefficienten og for dendrogrammer vi brugte euklidisk afstand ved hjælp af “pheatmap” og “hclust ‘funktioner fra R statistisk pakke hhv. For at fremstille heatmaps for prøver tværs datasæt yderligere normalisering var forpligtet til at redegøre for variationen i dispersionen i genekspressionsniveauer mellem datasæt skyldes forskellige prøveforberedelse protokoller, der anvendes af forskellige undersøgere. Selvom RPKM værdier er beregnet til at normalisere ekspressionsniveauer tværs prøver, denne normalisering er tilstrækkelige til at forklare variationer i prøvefremstilling protokol. Normalisere ved rækker, der repræsenterer udskrifter, mellem datasæt ved at dividere dem ved rækken gennemsnit blev brugt til at håndtere forskellen spredningen mellem de to datasæt stammer fra variation i prøveforberedelse protokoller. En sådan tilgang er allerede blevet implementeret i DESeq pakke til prøver inden for en given datasæt [12].

Validering af datasæt

For at vise, at de to udvalgte datasæt er velegnede til profilering ikke-kodende RNA , ekspressionsniveauerne af kendte lincRNAs, som præsenteres som impliceret i cancer, er blevet profileret på tværs af de to RNA-Seq datasæt udvalgt til denne undersøgelse. Vi har identificeret, at flere prostata-cancer associeret lincRNAs er opreguleret i en tumor-specifik måde i begge disse datasæt. For eksempel PCAT-1, en prostata cancer associeret lincRNA fra genet-ørkenen locus i kromosom 8q24 er signifikant opreguleret i alle tumorprøver fra begge datasæt sammenlignet med tilstødende ikke neoplastiske væv. Flere andre prostata og andre cancerspecifikke lincRNAs, såsom PVT1, PCA3, CCAT-1 PCAT-92, PCAT-114, PCAT-120, PCAT-19, PCAT-27, PCAT38, PCAT-39, PCAT-43, PCAT -59, PCAT-72, PCAT-80, og PCAT-83 er også fundet at være opreguleret i begge datasæt i en cancer-specifik måde. Disse resultater, godkender ikke kun brugen af ​​disse to datasæt for nlincRNA profilering, men giver yderligere validering af disse nyslåede lincRNAs i prostatakræft.

Gene Netværk

Gene netværk i dette manuskript er skabt af GeneMANIA, en pakke under Cytoscape [14].

Resultater og diskussion

profilering Coding Gener

Gen-ekspression profilering af de to RNA-seq datasæt, SRP002628 [15] og ERP000550 [16], blev udført ved hjælp af to almindeligt brugte R statistisk analyse pakker, kantskærer [11] og DESeq [12]. Gener med p-værdier på mindre end 0,05 og absolutte log fold ændringer (base 2) større end 1,0 bruges til at lave et opkald, at et gen er reguleret i prostatacancer. Konvergerende antal betydeligt regulerede gener i hver fase af analysen pipeline præsenteres i figur 1. Brug kantskærer, er 4449 og 5034 udskrifter fundet forskelligt reguleret fra de to datasæt, SRP002628 og ERP000550 hhv. Ud af disse er 1358 udskrifter, der repræsenterer 786 gener fundet almindeligt reguleres mellem de to datasæt med 302 gener opreguleret og 455 gener nedreguleret i cancer. Interessant nok viste kun 29 gener modsatte ekspressionsmønster i de to datasæt. Ligeledes bruger DESeq pakke 2942 og 4260 udskrifter identificeret som forskelligt reguleret i prostatakræft fra de to datasæt, SRP002628 og ERP000550 hhv. De 881 almindelige udskrifter repræsenterer 497 gener, som er reguleret i prostatakræft med 180 gener op- og 313 gener nedreguleret. Igen, kun 4 gener vise modsatte regulering i de to datasæt baseret på DESeq pipeline.

Listen over differentielt udtrykte gener (degs) fra de to datasæt ved hjælp af to metoder, kantskærer og DESeq, er opført i S1 tabel, som indeholder 366 kodning gener med 117 op- og 249 nedreguleret i prostatakræft. Interessant, med undtagelse af et enkelt gen, alle er reguleret i samme retning i begge cancer datasæt (fig 2). I figur 2 er det også vist, at rækken-wise normaliseret RPKM værdier fra de to datasæt for alle de 366 DEGS, klynger alle 12 kræft og 12 normale prøver i to forskellige clader. Også vist i figur 2, er den gruppering af fem yderligere prøver fra tiltrædelsen ERR000550, ikke brugt i udvinding signaturen, i de respektive clader.

Gene berigelse undersøgelser af 366 gener tyder inaktivering af gener i både 17q21 og 19q13 loci, der både rapporteret som prostatakræft modtagelighed loci [17], [18], [19]. Fig 3 viser genet netværk for loci 17q21 og 19q13. Interessant, generne inaktiveret i 17q21, herunder KRT15, ​​ITGA, AOC3, HOXB3, RND2, SGCA, WFKKN2, ARHGAP27, NGF, og NOG, er impliceret i celle-celle interaktion, cytoskeletal reorganisering, ekstra-cellulær matrix og celledød; mangel på der kunne lokke epitelial til mesenkymale transformation og migration.

Profilering nlincRNAs

I alt fjorten tusinde tre hundrede og halvtreds-tre (14,353) lincRNAs henviste her til som nlincRNAs, er blevet rapporteret at blive udtrykt i forskellige normale humane væv [2]. Ud af disse er der 9.600 nlincRNAs der viser meget lav beviser for transkription i prostata normal og så lav som 196 nlincRNAs rapporteres som specifikke for prostatavæv.

Som vist i figur 1, ved hjælp edger, 1140 (773 op og 367 nedreguleres) og 1702 (1258 op- og 444 nedreguleres) nlincRNAs er fundet forskelligt reguleret fra de to datasæt, SRP002628 og ERP000550 hhv. Ud af disse er 316 nlincRNAs (252 op og 42 ned) almindeligvis reguleret i prostatakræft i begge datasæt. Lignende analyse ved hjælp DESeq pipeline resulterede i 576 (383 op og 193 ned) og 988 (867 op og 121 ned) nlincRNAs reguleret i prostatakræft i begge datasæt, SRP002628 og ERP000550 hhv. Antallet af almindeligt forskelligt regulerede nlincRNAs i begge datasæt ved hjælp DESeq pakke er 135 med 124 up- og 9 nedreguleret i cancer.

Antallet af nlincRNAs, der findes forskelligt reguleret i kræft i begge datasæt ved hjælp af både kantskærer og DESeq metoder er 130 med 118 up-, 9 ned- og så lavt som 3 modsat reguleret. Figur 4 viser Heatmap af de 127 nlincRNAs, opført i S2 tabel, som er forskelligt reguleret i kræft. Med undtagelse af C13_5, en af ​​kræft prøve fra tiltrædelsen SRP002628, de 127 nlincRNAs tillader gruppering af alle de kræft og normale prøver i de respektive clader. Brug af principal komponent analyse, er vist i figur 4, bekræftes det, at C13_5 er mere normal-lignende.

Ud af de 127 differentielt regulerede nlincRNAs, 58 har null baseline ekspression i prostata normalt væv ifølge både in-house indsats og rapporten fra Broad Institute [2]. Af disse nlincRNAs, mange er testis-specifikke og en række af dem er thyroid-specifikke. Som det fremgår af S2 tabel, profilering af disse nlincRNAs i prostata cellelinjer fra RNA-seq datasæt med tiltrædelse id’er for SRP004637 [7], viser, at 12 ud af 58 display betydelige udtryk i en eller flere af de tre prostata celllines. Overholdes denne tendens i prostatacancer forbundet kodende gener, såsom EZH2 [20], som er differentielt opreguleret i tumor prøver fra begge datasæt vise baseline null ekspression i prostata. Som vist i S3 tabel, mange rapporterede prostatacancer forbundet lincRNAs, ligesom PCAT-1, PCA3, PCAT-92, PCAT-114, PCAT-120-PCAT-27, PCAT-38, PCAT43, PCAT72, og PCAT-80 [7], som også forskelligt opreguleret i cancer i begge datasæt, har ingen overlappende nlincRNAs henhold UCSC spor.

der er mange nlincRNAs fra kromosom 8q24 locus, der er anført i tabel 2, som udtrykkes ved normal humane væv. Mens en række nlincRNAs deler exons med kendte lincRNAs, såsom PVT1 og CCAT1, flere andre herunder TCONS_00014535 (BC042052, CASC11), TCONS_00015171 (BC106081), TCONS_00015167 (PCAT2), TCONS_00015170 og TCONS_00015168 (JX003871), TCONS_00015498, TCONS_00015165 og TCONS_00015166 er hidtil ukendte nlincRNAs der er differentielt opreguleret i prostatacancer hos mindst en af ​​de to datasæt anvendt i denne undersøgelse. Igen, mange af disse er specifikke for testiklerne og lever og er ikke udtrykt i normal prostata.

Co-regulering af lincRNAs og tilstødende gener

Som vist i figur 5, 15 forskelligt regulerede nlincRNAs ud af de 127 er i nærheden af ​​12 forskelligt regulerede gener på forskellige kromosomer. Tabel 3 giver betydning nlincRNAs og deres respektive kodende gen. For eksempel nlincRNA, TCONS_00029157, og en kendt tumor suppressor faktor, SIK1, er begge nedreguleret i alle cancer prøver. Reduceret SIK1 udtryk er korreleret med dårlig prognose i to store menneskelige brystkræft datasæt og er forbundet med p53-afhængige anoikis der kan omfattes under tumerogenesis [21].

Skjoldbruskkirtlen-specifikke TPO-gen er opreguleret i prostatakræft sammen med et par skjoldbruskkirtel-specifikke nlincRNAs, TCONS_00004663-4666 og TCONS_00004668-4669. TPO er et af generne, der vides at være associeret med oxidativt stress. Det er blevet påvist, at linsen epitelial vækstfaktor p75 (LEDGF) i PC3 resulterer i ændringen i TPO-ekspression [22]. Denne ændring kan forventes at spille en beskyttende rolle mod oxidativt stress og kemoterapeutiske lægemidler.

TCONS_00010581, en isoform af HEIH, der vides at være opreguleret i hepatocellulært carcinom [23], er i nærheden af gen EZH2 af Polycomb kompleks-2 [24] genet EZH2 findes også opreguleret i alle cancer prøver sammenlignet med tilstødende ikke neoplastiske væv i begge datasæt.

En testis-specifik nlincRNA, TCON_00025002, er i nabolaget af genet TOX3 på kromosom 16, som begge er opreguleret i en cancer-specifik måde i vores undersøgelse. TOX3 er en høj motilitet gruppe box protein involveret i mediering af calcium-afhængig transskription. TOX3 kort til den kendte triple-negativ brystkræft modtagelighed locus; en mutation i dette locus i impliceret i udviklingen af ​​brystcancer [25]. En SNP i TOX3 gen er også impliceret i bugspytkirtlen [26] og lungekræft [27].

Prostata-specifikke nlincRNAs, TCONS_00017728 og TCONS_00010086, findes at være i nærheden af ​​GATA3 og ADAMTS19 gener hhv. Alle fire, herunder nlincRNAs og gener, er nedreguleret i en cancer-specifik måde i denne undersøgelse. GATA3 er en vigtig transkriptionsfaktor vides at være involveret i androgen regulering af PSA-genet [28]. En global methylering mønster i androgen følsomme og androgenuafhængig prostatacancer viser en væsentlig forskel i methyleringsmønsteret i GATA3 under disse to betingelser [29]. Tumor biopsier og forskellige cancer cellelinjer har viser høje niveauer af ekspression af ADAMTS19 i osteosarkomer [30].

Et par lever-specifikke nlincRNAs, TCONS_00014531, TCONS_00015169 og TCONS_000015171, er alle opreguleret i prostatakræft i dette undersøgelse sammen med den tilstødende pseudogen POU5F1, som støder op til myc locus i større prostatacancer modtagelighed locus i 8q24 [31]. En anden leveren specifik TCONS_00016903 er sammenstillet til gen EGFL7, både registreret som nedreguleret i vores analyse. I modsætning til vores resultater EGFL7 har vist sig at have en forhøjet ekspression i forskellige cancertyper, herunder lungecancer, brystcancer, prostatacancer og hepatocellulært carcinom [32]. Imidlertid har der været en rapport af et microRNA, miR-126, som ligger i intron af EGFL7, som er vist at være nedreguleret i cancer-cellelinjer og i primære blære og prostata tumorer [33].

Blandt de mere interessante nlincRNAs, TCONS_00028940, i nabolaget af genet TMPRSS2, er stærkt udtrykkes forskelligt i alle kræft prøver undersøgt her. Den TMPRSS2-ERG genfusion er en af ​​de mest udbredte kromosomale omlejringer i carcinomer [34], selv om genet TMPRSS2 ikke udtrykkes i en cancer-specifik måde i prøver undersøgt her Vi finder, at denne nlincRNA viser signifikant ekspression i VCap og ikke i PC3 og LNCaP.

Konklusion

for nylig har mere end fjorten tusinde lincRNAs blevet opdaget fra mange normale humane væv, hvilket tyder på, at disse normale lincRNAs (nlincRNAs) spiller en rolle i normal biologi . Det kan antages, at nlincRNAs med gen-regulatoriske funktioner i normale forhold faktisk kan være nedreguleret i cancer. Til dette formål, her har vi forsøgt at tage to uafhængigt genererede RNA-seq datasæt fra demografisk forskelligartet kohorte at profilere både protein-kodende gener og nlincRNAs. Vi har identificeret 127 nlincRNAs, der ikke blot i væsentlig reguleret i tumor prøver fra begge datasæt, men kunne anvendes til at klynge data fra prøver, der ikke anvendes i denne undersøgelse, ved sygdom sammenhæng. I modsætning til vores hypotese, profilering af kodende gener og nlincRNAs antyder, at et flertal af de nlincRNAs er opreguleret i cancer selvom 2 gange mere protein-kodende gener nedreguleret i cancer. Dette sammen med aktiveringen af ​​mange ikke-kodende gener i 8q24 og inaktivering af mange kodende gener i 17q21 og 19q13 loci vil foreslå systemer aktivering af mange nlincRNAs niveau under kræft.

Vi har fundet, at en række af kodende gener og nlincRNAs specifikke for andre væv med baseline null ekspression i prostatavæv er opreguleret i prostatacancer. Måske er disse gener og nlincRNAs er ansvarlige for tab af cellulære identitet fører til tumerogenesis. Så vidt vi ved er dette første forsøg på at profilere nlincRNAs sammen med kodning gener i cancer. Vi mener, at den tilgang, der anvendes her til funktionel karakterisering af nlincRNAs vil give forskere til at fremme forståelsen af ​​den rolle, nlincRNAs i normal og sygdom biologi i almindelighed.

Støtte Information

S1 Table. Gener forskelligt reguleret i prøver kræft fra begge datasæt er identificeret ved hjælp af både DESeq og Edger analyse rørledninger.

Kolonner 2-5 giver de gennemsnitlige p-værdier og fold forandring fås fra DESeq og Edger pipeline for både SRP002628 og ERP000550.

Doi : 10,1371 /journal.pone.0122143.s001

(XLS)

S2 tabel. Lister p-værdi og fold-ændring for alle nlincRNAs forskelligt reguleret i begge datasæt ved hjælp af begge metoder.

Tabellen viser tilstødende gener sammen med deres respektive p-værdi og fold-ændring i de to datasæt. Sidste tre kolonner viser de RPKM værdier for disse lincRNAs i tre prostata celllines

doi:. 10,1371 /journal.pone.0122143.s002

(XLS)

S3 tabel. Lister p-værdi og log fold-ændring for kendte lincRNAs der er forskelligt reguleret i begge datasæt sammen med status for udskrift overlappende med nlincRNAs på UCSC browser

doi:. 10,1371 /journal.pone.0122143.s003

(XLS)

Tak

forfatterne ønsker at anerkende Institut for Bioteknologi, New Delhi, Indien for støtte til SS via Ramalingaswamy Fellowship (Ref nr: BT /HRD /35/02 /17/2009). Forfattere også erkende Institut for Informationsteknologi, Indiens regering, for deres støtte til instituttet under “Center of Excellence i bioinformatik Uddannelse og forskning«. Forfatterne ønsker at anerkende DST-FIST, Indiens regering og Institut for Informationsteknologi, regering Karnataka, for infrastrukturelle tilskud til IBAB.

Be the first to comment

Leave a Reply