PLoS ONE: MiRComb: En R-pakke til Analysere miRNA-mRNA Interactions. Eksempler på tværs Fem Digestive Kræft

Abstrakt

MikroRNA’er (miRNA) er små RNA, der regulerer ekspressionen af ​​target mRNA ved specifik binding på mRNA 3’UTR og fremme mRNA nedbrydning i de fleste tilfælde. Det er ofte af interesse at kende de specifikke mål for en miRNA for at studere dem i en bestemt sygdom sammenhæng. I den forstand har nogle databaser er designet til at forudsige potentielle miRNA-mRNA interaktioner baseret på hybridisering sekvenser. Men en af ​​de vigtigste begrænsninger er, at disse databaser har for mange falske positiver og ikke tager højde for sygdomsspecifikke interaktioner. Vi har udviklet en R pakke (miRComb) kunne kombinere miRNA og mRNA-ekspression af data med hybridisering information, for at finde potentielle miRNA-mRNA-mål, som er mere pålidelige til at forekomme i et specifikt fysiologisk eller sygdom sammenhæng. Denne artikel opsummerer rørledningen og de vigtigste resultater af denne pakke ved som eksempel TCGA data fra fem gastrointestinale kræftformer (tyktarmskræft, endetarmskræft, leverkræft, mavekræft og kræft i spiserøret). De opnåede resultater kan anvendes til at udvikle et stort antal testbare hypoteser af andre forfattere. Globalt viser vi, at miRComb pakken er et nyttigt værktøj til at håndtere miRNA og mRNA udtryk data, som hjælper til at filtrere den høje mængde af miRNA-mRNA interaktioner opnået fra de allerede eksisterende miRNA target forudsigelse databaser, og det præsenterer resultaterne i en standardiseret måde (pdf rapport). Desuden er en integrativ analyse af miRComb miRNA-mRNA interaktioner fra de fem fordøjelsesfremmende kræftformer præsenteret. Derfor miRComb er et meget nyttigt værktøj til at begynde at forstå miRNA genregulering i en konkret sammenhæng. Pakken kan hentes i https://mircomb.sourceforge.net

Henvisning:. Vila-Casadesus M, Gironella M, Lozano JJ (2016) MiRComb: En R-pakke til Analysere miRNA-mRNA Interactions. Eksempler på tværs Fem Digestive kræftformer. PLoS ONE 11 (3): e0151127. doi: 10,1371 /journal.pone.0151127

Redaktør: Moray Campbell, Roswell Park Cancer Institute, UNITED STATES

Modtaget: 15 oktober, 2015; Accepteret: 24. februar, 2016 Udgivet: 11 Mar 2016

Copyright: © 2016 Vila-Casadesus et al. Dette er en åben adgang artiklen distribueres under betingelserne i Creative Commons Attribution License, som tillader ubegrænset brug, distribution og reproduktion i ethvert medie, forudsat den oprindelige forfatter og kilde krediteres

Data Tilgængelighed:. Alle relevante data er inden for papir og dens støtte Information filer

Finansiering:. den nuværende arbejde blev støttet af tilskud fra Instituto de Salud Carlos III (PI13 /02.192; medfinansieret af EFRU-EU), og fra Fundación Científica de la Asociación Española contra el cancer (GCB13131592CAST) til MG. CIBEREHD er finansieret af Instituto de Salud Carlos III. MVC er finansieret af Ministerio de Educación Cultura y Deporte (FPU12 /05138). De finansieringskilder havde ingen rolle i studie design, indsamling og analyse af data, beslutning om at offentliggøre, eller forberedelse af manuskriptet

Konkurrerende interesser:.. Forfatterne har erklæret, at der ikke findes konkurrerende interesser

Forkortelser : BH, Benjamini Hochberg; COAD, colon-adenocarcinom; ESCA, esophageal carcinoma; FDR, False Discovery Rate; H, sund; LIHC, lever hepatocellulært carcinom; MiRNA, microRNA; MRNA messenger RNA; QRT-PCR, kvantitativ revers transkription-PCR; NGS, Next-Generation Sequencing; LÆS, endetarm adenocarcinom; STAD, mave-adenocarcinom; TCGA, The Cancer Genome Atlas

Introduktion

MikroRNA’er (miRNA) er ikke-kodning, enkelt-strengede RNA af 18-25 nukleotider og udgør en ny klasse af gen-regulatorer, der findes i både planter og dyr. De regulerer negativt deres mål (messenger RNA -mRNAs-) i en af ​​to måder afhængigt af graden af ​​komplementaritet mellem miRNA og målet. En måde at handling (der tegner sig for omkring 80% af tilfældene) er fremme mRNA nedbrydning [1], er den anden hæmmende mRNA translation.

Tidligere forfattere har brugt parret miRNA og mRNA-data til at forudsige miRNA-mål i specifikke sygdomme. De baserer deres analyse på korrelere miRNA og mRNA-ekspression, og skærer det med kendte databaser [2,3]. Selv om disse undersøgelser er nyttige, er der ingen software til at reproducere resultaterne. R [4] er en software miljø for statistisk databehandling og grafik. Det har været bredt anvendt i det videnskabelige samfund, fordi der arbejder med enhver platform, er gratis, tillader at bygge dine egne pakker og funktioner og dele det med andre forskere, er det veldokumenteret og holdes opdateret. BioConductor [5] er en R-pakke repository fokuseret på pakker til formål at analysere biologiske data. Der er nogle R /BioConductor pakker, der er i stand til at gøre miRNA-mRNA korrelationer, skærer med kendte databaser og analysere netværk, blandt andre funktionaliteter, såsom

RmiR

,

Corna

,

miRNApath

,

microRNA

,

MultiMiR

[6,7]. Ingen af ​​disse fremgangsmåder tillader at udføre en hel komplet analyse på en ligefrem måde. Vores mål var at designe en R-pakke, kaldet miRComb, stand til at kombinere miRNA og mRNA udtryk data (fra alle formater) med hybridisering oplysninger, for at finde potentielle miRNA-mRNA mål, der sandsynligvis vil forekomme i en bestemt fysiologisk eller sygdom kontekst . Dette genererer en liste over resultater, der kan danne grundlag for at udvikle flere hypoteser skal eksperimentelt afprøvet i en våd laboratorium. En anden merværdi er at præsentere resultaterne af analysen i en standardiseret måde med en pdf-rapport.

Vi har brugt som eksempler offentligt tilgængelige data fra The Cancer Genome Atlas (TCGA) [8] til forskellige fordøjelsesforstyrrelser kræftformer. Resultaterne fremhæver potentielle miRNA-mRNA interactomes af fem fordøjelsessystemet kræftformer og tilbyde en uvildig udsigt over miRComb funktioner. Så vidt vi ved, er der stadig ingen samlet analyse af denne art i gastrointestinale kræftformer.

Materialer og metoder

Vi har brugt TCGA data fra 1645 prøver blandt 5 forskellige fordøjelsesforstyrrelser kræftformer (tyktarmskræft , rektal cancer, levercancer, mavekræft og kræft i spiserøret), der havde samtidig miRNA-seq og RNA-seq data. Alle data er blevet behandlet med den samme procedure

Som udgangspunkt for vores pakke brugte vi tre bredt accepterede antagelser:..

miRNA negativt regulere udtryk for deres mRNA-mål

miRNA /mRNA interaktioner, da de er baseret på RNA hybridisering, kan forudsiges med bionformatic tilgange.

miRNA og mRNA, der spiller en rolle i en specifik sygdom er dereguleret i denne sygdom.

fig 1 viser omridset af den anvendte procedure. Rå data behandles med henblik på at finde relevante miRNA-mRNA-interaktioner i et specifikt biologisk sammenhæng for at kunne fortolke dem. Pakken er skrevet i R og indeholder nogle kode C ++ for at fremskynde nogle beregninger. LaTeX [9] og Sweave [10] pakker anvendes til at generere den endelige PDF-rapport. MiRComb er tilgængelig på https://mircomb.sourceforge.net/.

miRNA og mRNA udtryk data kan komme fra forskellige kilder (microarrays, NGS, QRT-PCR …). Pakken antager, at miRNA og mRNA data er korrekt normaliseret. I tilfælde af QRT-PCR data, vi foreslår at bruge -dCt enheder (eller Ct enheder), for mikroarrays vi foreslår at bruge log2 (normaliseret) intensitet, og for NGS vi foreslår at bruge log2 (normaliserede) tæller.

Data kilder

data blev hentet fra TCGA data portal (https://tcga-data.nci.nih.gov/tcga/dataAccessMatrix.htm). Vi valgte følgende kræftformer til at studere: Colon adenocarcinom (COAD); Esophageal carcinoma (ESCA); Liver hepatocellulært carcinom (LIHC); Endetarm adenocarcinom (LÆS); Mave adenocarcinom (STAD).

Vi valgte kun de prøver, der havde parrede miRNA og mRNA oplysninger og kom fra centre (korrekt identificeret med deres tilsvarende Tissue Source steder-TSS- koder), der har indsamlet mere end én prøve. Primær solid tumor og Solid væv Normal blev brugt. MiRNA uden id (på mirbase17) eller median udtryk 10 raw tællinger blev fjernet. MRNA’er uden gen-id eller median ekspression 10 raw tællinger blev fjernet. Voom transformation [11] og fraktil normalisering blev anvendt, og derefter batch korrektion med Combat [12] i henhold til TSS-centre blev anvendt.

Differential ekspressionsanalyse

Differential udtryk mellem cases og kontroller blev beregnet med limma-trend procedure. Pakken gennemfører også T-test, Wilcoxon Test, LIMMA, LIMMA-trend [11], og RankProd [13] til at teste forskelle mellem de to grupper. Dog kan andre metoder til differentieret udtryk anvendes, og resultaterne kan også importeres til

miRComb

(de funktioner, der er nødvendige er miRNA eller mRNA, logratio, betyder udtryk,

s Drømmeholdet værdi og justeres

s Drømmeholdet værdi). Flere testprocedurer kan være: Benjamini Hochberg (BH), Bonferroni eller andre (selvom RankProd antager kun BH (som kontrollerer False Discovery Rate (FDR)).

For parametriske metoder, hypotesen er, hvis den gennemsnitlige udtryk for gruppens prøver Kontrol (H) er forskellig fra den gennemsnitlige ekspressionen af ​​kræft-relaterede gruppe prøver. i tilfælde af ikke-parametriske metoder-Wilcoxon test og RankProd-, medianen (i stedet for middelværdien) testes.

Correlation analyse

Vi beregnede Pearson korrelationskoefficienter for alle miRNA-mRNA par til rådighed i hver kræft. pakken understøtter også Spearman og Kendall korrelation (Kendall kun for små datasæt). Pearson korrelation er velegnet, hvis både miRNA og mRNA data kommer fra den samme kan antages platform analyse (begge microarrays eller log2-normaliseret tæller data, for eksempel), og en lineal relation mellem miRNA og mRNA. Hvis begge analyse platforme er anderledes eller ikke kan antages hypoteserne af en lineal relation, så Spearman (eller Kendall ) korrelation er ønskelige. Hvis der er en negativ sammenhæng mellem miRNA (X

1, …, X

n) og mRNA (Y

1, …, Y

n) korrelationskoefficienten vil være negativ, så:

Hvor ∈ {

Pearson

,

Kendall

,

Spearman

}. Derefter flere test korrektion (Bonferroni og BH er til rådighed, blandt andre muligheder) anvendes for at kontrollere de falske positiver, der kunne opstå.

Vejkryds med miRNA target forudsigelse databaser

Næste skridt blev at matche de signifikante korrelationer med target information. Valget af en database er en tricky spørgsmål. Flere databaser har til formål at beregningsmæssigt forudsige miRNA mål [14]. De primært tage hensyn til mindst ét ​​af disse parametre: frø komplementaritet, miRNA-mRNA kompleks stabilitet (termodynamik) og mellem arterne websted bevaring. Flere databaser begynde at integrere miRNA-mRNA korrelation som en prædiktiv værdi, men det er blevet gjort i nogle datasæt (GenMiR ++) [15].

Vi valgte mikrokosmos [16,17] og Targetscan [18]. Mikrokosmos omfatter 690 forskellige miRNA og 22107 forskellige mål, med i alt 563179 interaktioner er beskrevet. Mikrokosmos beregner målene med miranda algoritme, behøver perfekt komplementaritet ved 5 ‘; derefter udelukker ikke-stabile konformationer ved hjælp af Wien-RNA folde tilgang [19] og kræver websted bevaring accross flere arter. På den anden side, Targetscan [18] er formentlig en af ​​de mest opdaterede dem. Den indeholder oplysninger om 1537 forskellige miRNA og 15031 mål, med i alt 520354 interaktioner er beskrevet. Den er baseret på frø komplementaritet og differentierer mellem konserverede og ikke-konserverede sites. For at gøre det mere sammenlignelig med Mikrokosmos, og mere rimelig, vi valgte kun konserverede sites. Pakken gør det muligt at bruge en eller begge databaser (og også bruge brugerdefinerede databaser, hvis det ønskes), og fastsætte et minimumsantal af optrædener på databasen. De endelige vilkår, der definerer en miRNA-mRNA interaktion er:

Funktionel analyse

Selvom hovedformålet med pakken er at generere en liste over potentielle miRNA-mRNA par,

miRComb

implementerer også nogle funktioner, der kan bidrage til fortolkningen af ​​data. Blandt andre funktioner er angivet i følgende punkter, borde og barplots med antallet af mål eller antal miRNA kan fås. Pakken plotter et netværk med de ønskede miRNA-mRNA interaktioner (knuder repræsenterer miRNA og mRNA, og pile markerer samspillet). Farverne er nøje udvalgt til at hjælpe fortolkning: miRNA er repræsenteret som firkanter, mRNA som cirkler. Endvidere farven på knudepunktet afspejler FoldChange retningen af ​​knudepunktet (rød: opreguleres, grøn: nedreguleret). En score beregnes med det formål at afspejle virkningen af ​​miRNA på kræft (højere score betyder, at både miRNA og mRNA er højt dereguleret i denne sygdom)

pile er også informativ:. Farven repræsenterer

score

af interaktionen (rød betyder modsatte og stærk modstående FC mellem miRNA og mRNA, mens grøn ville repræsentere stærk overensstemmende FC mellem miRNA og mRNA), og bredden repræsenterer det antal databaser, hvor målet har vist sig (flere databaser: bredere pil). Netværket kan også nemt eksporteres til cytoscape i “Sif” format [20], samt node og kant attributter.

GOstats

pakke [21] blev anvendt til at beregne, om enhver funktion er forbundet med mål i et konkret miRNA eller et sæt af miRNA. Dette medvirker til at forudsige funktionen af ​​en miRNA eller et sæt af miRNA hvis antallet af mål er stor nok.

RamiGO

R pakke [22] kan også bruges til at plotte de betydelige GO vilkår og deres forbindelser.

Circlize

pakke [23] anvendes til at lave en Circos plot af de udvalgte miRNA-mRNA par. Startende fra grænsen af ​​plottet, er placeringen af ​​mRNA repræsenteret i en første spor, så en anden bane repræsenterer miRNA stilling, og endelig en sidste spor (med links) viser miRNA-mRNA par. Dette vil bidrage til at identificere, hvis nogle miRNA mål mere specifikt placeret i et kromosom eller region.

Rapport generation

Et af formålene med projektet er at præsentere en standardiseret måde at præsentere resultaterne . Ved afslutningen af ​​analysen er muligt at generere en PDF-rapport, der indeholder alle de nævnte dele.

Resultater og Diskussion

MiRComb analyse af miRNA-mRNA interaktioner mellem 5 forskellige fordøjelses kræftformer

Fem miRComb rapporter for COAD, LÆS, ESCA, STAD og LIHC blev genereret, og de tilsvarende pdf-filer kan findes i S1-S5-filer, hhv. Som et eksempel, figur 2 viser de vigtigste tal fra LIHC rapporten.

A) Principal Components Analysis (PCA) (baseret på korrelation matrix) af miRNA prøver. B) Volcano plot, der viser de miRNA henhold til dens logratio mellem kræft og kontrol. C) Heatmap af de øverste 50 mest deregulerede miRNA i henhold til dens FDR. D) Density plot af Pearson korrelationskoefficienter på alle mulige miRNA-mRNA interaktioner. Linjer vise forskellige cutoff: p-værdi 0,05, p-værdi 0.01, FDR 0.05 og FDR 0,01. E) Korrelation af miR-139-5p og CCNB1 som et eksempel. F) Venn diagram, der viser det totale antal sigifnicant korrelationer (FDR 0,05), det samlede antal forudsete vekselvirkninger i mindst én database (Targetscan eller mikrokosmos), og skæringspunktet mellem begge. G) Netværk af udvalgte interaktioner. Hver miRNA-mRNA interaktion er negativt korreleret (FDR 10-33) og forudsagde mindste én database (Targetscan eller mikrokosmos). Cirkler repræsenterer miRNA og firkanter mRNA; rød fyld betyder opreguleret miRNA /mRNA, mens grøn fyld betyder nedreguleret miRNA /mRNA; linjer angiver de miRNA-mRNA par; rød linje betyder positiv score og grøn linje betyder negativ score; pil bredde er proportional med antallet af optræden på databaserne (Targetscan eller mikrokosmos). H) Lagkagediagram der viser antallet af mRNA’er reguleret af 0, 1, 2, 3, 4, 5, og 5 miRNA. I) Barplot viser antallet af mål pr miRNA og procentdelen af ​​mRNA’er, der kumulativt reguleret af miRNA. J) Circos plot af de øverste 45 miRNA-mRNA interaktioner Frygteligt FDR, en linje betyder en miRNA-mRNA par. Blå linjer er placeringen af ​​miRNA og appelsin linjer er placeringen af ​​mRNA.

Oversigt over datasæt sammensætning.

Tabel 1 viser antallet af prøver til rådighed for hvert kræft og det samlede antal signifikante korrelationer. COAD, LIHC og STAD kræft havde mere end 400 prøver til rådighed for analyse, mens ESCA kræft og LÆS kræft datasæt havde 191 og 160 prøver, hhv. Endvidere er forholdet mellem tilfælde og kontroller er også et udtryk for at tage hensyn til. Mens ESCA, LIHC og STAD afhændet en “rimelig” mængde af kontroller (ca. 1:13 for ESCA, 1: 7 for LIHC og 1:10 for STAD), i COAD og LIHC vi bortskaffes kun 8 og 3 kontroller henholdsvis ( et forhold på aproximately 01:50). Antallet af tilgængelige prøver påvirker antallet af korrelationer med FDR 0.05 fundet: Jo flere prøver, vi har, jo højere er den magt til påvisning af sammenhænge forskellig fra 0. Antallet af signifikante korrelationer fundet er højere end 15% (selv efter FDR korrektion) i datasæt med mere end 400 prøver (STAD, LIHC, COAD), mens denne procentdel ikke når 10% i de tilfælde af LÆS og ESCA (mindre end 200 prøver til rådighed). Kort sagt, ser det ud til, at et datasæt med en større stikprøve og en afbalanceret design skal give et større antal korrelationer som en, der er mindre og ikke er afbalanceret.

Selvom 20.531 mRNA og 1025 miRNA blev sekventeret kun ca. 32-34% af miRNA blev anset udtrykt (median tæller 10 på tværs af alle prøver) i hvert kræft datasæt. I modsætning hertil blev 70-90% af mRNA’erne detekteret med en median 10 tæller. Generelt PCA analyse (side 1 og 2 af de rapporter, som mkReport funktion, for eksempel S1-S5-filer) af prøver afslørede en virkelig svag kontrol clusterization (med undtagelse af miRNA datasæt i COAD, LÆS og i begge datasæt i LIHC) . Samlet set fører dette til tanken om, at den største ulempe ved datasættet er manglen på et rimeligt antal kontroller, styrke de tanker, der forskellen udtryk mellem begge grupper kan beregnes og bruges som informativ post, men ikke som en filtrering trin (at kunne føre til fejl i den forstand, falsk negative).

Volcano plots (side 3 og 4 af de underretninger eller fig 2B) højdepunkt i røde de udvalgte miRNA og mRNA. Heatmaps også plottet (side 3 og 4 i de rapporter). Heatmap af LIHC som eksempel er også vist i figur 2C.

Analyse af miRNA-mRNA interaktioner.

Side 5 af de pdf rapporter viser en sammenfatning af de beregnede korrelationer. Det næste skridt er at skære de signifikante korrelationer med forudsagte miRNA-mRNA potentielle interaktioner fra Mikrokosmos eller Targetscan forudsigelse databaser (side 6 og 7 af rapporterne). For tilfældet med LIHC (Fig 2F), observerede vi, at det forudsagte antal miRNA-mRNA interaktioner blev reduceret fra 258233 til at 57675, derfor kunne vi anslår, at omkring 80% af den oprindelige miRNA-mRNA forudsagde interaktioner fra databaser var falske positiver for denne sygdom, fordi de ikke viser en negativ sammenhæng mellem den specifikke miRNA og den specifikke mRNA-ekspression

in vivo

i vævet.

desuden fig 3 viser, at vi også kan skildre den andel af falsk positive forudsagte mål for hver miRNA fra databaser i en given situation. Vedrørende LIHC, antallet af falske postives varierer fra 22% til 99%. I tilfælde af MIR-122, MIR-122 * eller MIR-378c disse procentsatser er ganske lav i forhold til de andre (22%, 27% og 24%), hvorfor disse miRNA viser et højt forhold af forudsagte mål bekræftet af miRComb . Interessant MIR-122 er den hyppigste miRNA i den voksne leveren og spiller en central rolle i leveren biologi og leverkarcinom sygdom [24].

plot, der viser forholdet mellem negativt korreleret forudsagte mål for alle forudsagte mål i henhold til de databaser for hver miRNA. Intensiteten af ​​den grå farve prik er relateret med procentdelen af ​​falske postive miRNA-mRNA forudsagte interaktioner. I parentes, de nøjagtige procentdele af falske positivesfrom udvalgte miRNA (MIR-122; mir-122 *; miR-378c).

Side 6 af pdf rapport viser de øverste 15 miRNA-mRNA interaktioner ( ordnet efter justeret p-værdi under hensyntagen til, at de skal have været forudsagt i mindst én database) i hvert kræft. Side 9 af pdf rapport viser netværket af alle de miRNA-mRNA interaktioner. Alle interaktioner plottes som standard, og dette kan resultere i en meget tæt figur vanskelige at fortolke, som det er tilfældet i vore eksempler. For det drejer sig om alle de interaktioner LIHC (S5 File side 9) kan vi se to mønstre: til venstre, vi kan finde det meste nedreguleret miRNA i LIHC (plottet som grønne cirkler) sammen med deres korrespondent mRNA mål (plottet som røde firkanter ). Til højre rollerne er vendt, og de fremherskende miRNA-mRNA interaktioner vist består på opreguleret miRNA med nedreguleret mRNA. Dette generelle mønster er gengivet i alle de undersøgte kræftformer (S1-S5-filer). For at løse dette problem, foreslår vi at tilpasse sig i alle tilfælde antallet af interaktioner der skal plottes afhængigt af målet med figuren. I figur 2G har vi plottet en reduceret mængde af interaktion, og vi kan se nogle af detaljerne. For eksempel er to mål (DNMT3A og mybL2) af HSA-MIR-29c (nederst til højre) forudsagt af to databaser, mens målet FAM136A er forudsagt af én database (pilen er thiner). Desuden vedrørende målene i HSA-let7c, at AURKB er mere dereguleret i LIHC end NME6, og samspillet mellem HSA-miR-122 eller HSA-miR-122 * (øverst til venstre) har lavere score (lavere intensitet af pil farve ) end samspillet mellem HSA-miR-139-3p og HSA-miR-139-5p (højere intensitet af pilen farve,. øverst til højre)

i LIHC mere end 75% af de udtrykte mRNA bliver målrettet med mindst en miRNA (fig 2H og 2I og side 10 i pdf rapporten), i COAD og STAD at antallet er mellem 70% og 60%, mens den i READ og ESCA er mindre end 50%. Men vi er nødt til at tage hensyn til, at disse procentsatser delvist påvirkes af det samlede antal miRNA-mRNA forudsagde interaktioner: jo højere antal interaktioner, jo højere antal miRNA pr mRNA (og omvendt). For eksempel er mere end 25% af de miRNA i LIHC forventes at blive ramt af mere end fem miRNA. Denne procentdel er lavere i de andre kræftformer, men det er stadig 8% i LÆS. Det er værd at nævne, at dette er en første metode, som kræver interaktioner skal eksperimentelt bekræftet i en våd lab. Denne usædvanlige antal miRNA rettet mod samme mRNA kunne tilskrives det faktum, at miRComb ikke tager hensyn til konkurrencedygtighed mellem forskellige miRNA hybridiserer til det samme mål.

Side 11 af pdf rapporten viser de første 20 miRNA sorteret efter antal af mål. Som et eksempel, miR-106a har 766 interaktioner forudsagt i COAD, miR-27a har 450 interaktioner i ESCA, miR-27b har 792 interaktioner i LIHC, miR-106a har 582 interaktioner i LÆS, og miR-29a har 798 interaktioner i STAD . Selvom miRNA forventes at regulere op til flere hundrede gener, bør disse interaktioner eksperimentelt valideret, således at kassere falsk positive eller indirekte forbindelser, som nævnt ovenfor. Farver i disse sider viser retningen af ​​miRNA deregulering (rød: opreguleret, grøn: nedreguleret). Mens der i COAD, læse og ESCA toppen miRNA generelt opreguleret i LIHC og STAD de er for det meste nedreguleret. MRNA kan også sorteres efter antallet af miRNA, der er rettet mod dem (side 12 i rapporten) og er også farvet i henhold til retningen af ​​deregulering. Samlet set mRNA ikke have mere end 50 miRNA herom. Undtagelsesvis i STAD er der nogle mRNA med mere end 60 miRNA (f.eks. 74 for FOXP2). Det er dog værd at tage i betragtning, at langt størstedelen af ​​mRNA’er, der er reguleret af mindst 1 miRNA, samtidigt reguleres med op til 4 miRNA.

Generelt hovedretningen af ​​de øverste mRNA’er (sorteret ud fra antallet af miRNA målrette dem, rapporten side 12) er den inverse af den vigtigste retning af de øverste miRNA (sorteret ud fra antallet af mål, rapport side 11).

Funktionel berigelse analyse af miRNA i henhold til deres mål.

i siderne 13-15 i rapporten, kan vi finde den Gene Ontology (GO) og Kegg funktionel analyse af resultaterne. Som et eksempel, vi testede, om mRNA, der er reguleret af miRNA er beriget i nogen af ​​GO og Kegg kategorier. Resultaterne af dette afsnit er ret ens mellem alle fordøjelses cancer datasæt fordi de omfatter alle mRNA’er, der er målrettet ved hjælp af mindst én miRNA og det omfatter mere end 50% af de udtrykte mRNA’er i gennemsnit. Afhængig af målet med undersøgelsen forskellige filtre kunne anvendes (forskellen udtrykt miRNA og /eller mRNA, mål fra en bestemt miRNA …) og derefter, resultater ville være anderledes. I dette tilfælde, BP (biologisk proces) overrepræsenteret udtryk omfatter cellulær proces og andre regulerende og signalanlæg processer. CC (Cellular Component) overrepræsenterede vilkår er for det meste forbundet med intracellulære-cytoplasma rum. MF (Molecular Function) overrepræsenteret termer er centreret i proteinbinding og andre bindende (enzym, anion bindende) handlinger. Kegg veje er mere kortfattet og alle af dem omfatter udtrykket “Pathways i kræft”. COAD omfattede også prostatacancer og kronisk myeloid leukæmi og gliom, ESCA også småcellet lungecancer, LIHC inkluderet prostatacancer, colorektal cancer, pancreascancer, kronisk myeloid leukæmi og nyrecellecarcinom; LÆS inkluderet renalcellecarcinom, STAD omfattede også småcellet lungekræft og prostatakræft. Dette tyder på, at, som det er kendt, mange kræftformer deler lignende mønstre. Andre veje, der deles på tværs af de forskellige studerede datasæt er: Focal vedhæftning, Fc-gamma R-medieret fagocytose (COAD, ESCA, STAD), eller TGF-beta signalvejen (COAD, LÆS)

Mere. målrettede resultater kan opnås ved at teste for berigelse målene for en specifik miRNA. For eksempel er målene for MIR-148a i leverkræft beriget i antigenbearbejdning og præsentation Kegg Pathway (FDR = 0,006) (S1 Fig). I en praktisk forstand betyder dette, at denne vej er involveret i leverkræft gennem en deregulering af MIR-148a, og at denne vej kunne være, i det mindste delvist, moduleret ved at modificere MIR-148a ekspression. Andre involverede veje i leverkræft, der kunne moduleres ved at ændre miRNA udtryk er RNA transport (FDR = 0,030), Cell cyklus (FDR = 0,031) og Ubiquitin medieret proteolyse (FDR = 0,031) for miR-424, eller lysin nedbrydning (FDR = 0,006) for miR-29c.

Integrativ analyse af miRComb miRNA-mRNA interaktioner fra de 5 fordøjelsessystemet kræftformer

Delt og specifikke miRNA-mRNA interaktioner.

fig 4 viser antallet af delte miRComb miRNA-mRNA par blandt de 5 undersøgte fordøjelsessystemet kræft datasæt. 1570 miRNA-mRNA interaktioner deles for alle 5 sæt, men en mere relevant tal deles i mindst to eller flere af dem, bliver kun mindre end 40% af miRNA-mRNA par specifikke for hvert kræft datasæt. STAD er den ene med flere miRNA-mRNA interaktioner fundet

Venn diagram, der viser miRComb miRNA-mRNA interaktioner. (FDR 0,05 og forudsagde i mindst én database), der er til stede i mindst én kræft. 1570 miRNA-mRNA interaktioner vises i 5 undersøgte fordøjelsessystemet kræftformer.

I S2 Fig et netværk repræsenterer de 1570 almindelige miRNA-mRNA interaktioner blandt de fem undersøgte nævnte datasæt. Vi kan se to netværk: den store netværk til venstre indeholder det meste downregulted miRNA med deres opreguleret mRNA-mål (780 miRNA + mRNA og 1305 miRNA-mRNA par), mens de mindre netværk til højre indeholder det meste opreguleres miRNA og deres nedreguleret mRNA mål (173 miRNA + mRNA og 187 miRNA-mRNA par). Vi har spottet de mRNA, der har Kegg udtryk relateret til kræft, såsom Cell Cycle (rød), veje i Cancer (gul) og MAPK Signaling Patway (blå). Kombinationer af disse termer vises også i forskellige farver. Netværket til højre indeholder nogle mRNA relateret til Cell Cycle, mens den store til venstre er for det meste relateret til MAPK Signalering Pathway, veje i kræft, eller begge termer (grøn).

De fælles interaktioner kan være relateret til veje, der er fælles for alle de undersøgte fordøjelsessystemet kræftformer. Imidlertid er det også interessant at studere de interaktioner, der kan være specifikke for hver enkelt. I S1 tabel, er alle de specifikke miRComb miRNA-mRNA interaktioner for hver kræft datasæt vist (en specifik interaktion er den, der har vist sig signifikant negativt korreleret i et datasæt, men ikke i de andre). Tabel 2-6 viser de 10 miRNA med flere miRComb miRNA-mRNA specifikke interaktioner for hver kræft.

Target mRNA sorteres efter dens negative korrelation værdi (top 20 er dislplayed).

Target mRNA sorteres efter dens negative korrelation værdi (top 20 er dislplayed).

Target mRNA sorteres efter dens negative korrelation værdi (top 20 er dislplayed).

Target mRNA sorteres efter dens negative korrelation værdi (top 20 er dislplayed).

Target mRNA sorteres efter dens negative korrelation værdi (top 20 er dislplayed).

fig 5 viser også antallet af specifikke interaktioner afhængigt af de involverede i LIHC miRNA. MiRNA på linjen for forholdet 1: 1 er dem, der kun udtrykkes i leveren. De andre er udtrykt i det mindste en anden cancer, men de har nogle specifikke interaktioner i LIHC, jo tættere på forholdet 1: 1 linje er, jo højere specificitet er

Antal total miRNA mål i LIHC versus nummer. miRNA mål der kun findes i LIHC men ikke i COAD, ESCA, LÆS eller STAD. Størrelse af punkterne er proportional med den gennemsnitlige miRNA udtryk på LIHC prøver inkluderet.

Cluster analyse af miRNA-mRNA interaktioner.

Globalt er der 106.426 miRNA-mRNA interaktioner målt i alle cancer datasæt, og signifikant negativt korreleret i mindst én af dem. For at klassificere dem i lignende mønstre, vi anvendte klyngedannelse metoder for at sammenfatte de vigtigste tendenser. Vi brugte K-midler metode med 4 klynger, da det gav en rimelig fortolkning af resultaterne (Fig 6). Interessant, hierarkisk gruppering af kræft i henhold til de gennemsnitlige korrelationskoefficienter af klyngerne giver følgende resultat: STAD og ESCA først grupperes, samt LÆS og COAD.

Be the first to comment

Leave a Reply