Abstrakt
MikroRNA’er (miRNA) er små regulatoriske RNA, der virker ved at blokere oversættelse og øge nedbrydningen af mål udskrifter. MiRNA spiller en kritisk rolle i mange biologiske processer, herunder udvikling og differentiering og mange undersøgelser har vist, at større ændringer i miRNA forekommer ved cancer. Da miRNA forringe mål beskeder, vi brugte denne egenskab til at udvikle en ny beregningsmetode tager sigte på at bestemme den faktiske biologiske aktivitet af miRNA ved hjælp af variationer i genekspression. Under anvendelse af fremgangsmåden beskrevet her, vi kvantificeret miRNA aktivitet i papillær thyreoideakarcinom og brystcancer, og fundet en stærk og karakteristisk signal af øget global miRNA aktivitet, indlejret i de tilhørende genekspression målinger. Interessant fandt vi, at i disse to cancertyper, er miRNA aktivitet globalt steget, og er forbundet med en global nedregulering af miRNA målgener. Denne downreguation af miRNA regulerede gener er især tydeligt for gener transporterer flere mål sites for miRNA. Blandt de miRNA-undertrykte gener, fandt vi en signifikant berigelse af kendte tumorsuppressorer og dermed antyder, at den øgede miRNA aktivitet var faktisk tumorigen
Henvisning:. Israel A, Sharan R, Ruppin E, Galun E (2009) Øget MicroRNA Aktivitet i Human kræftformer. PLoS ONE 4 (6): e6045. doi: 10,1371 /journal.pone.0006045
Redaktør: Joseph Alan Bauer, Bauer Research Foundation, USA
Modtaget: 9. februar 2009; Accepteret: 26 maj 2009; Udgivet: 25 juni 2009
Copyright: © 2009 Israel et al. Dette er en åben adgang artiklen distribueres under betingelserne i Creative Commons Attribution License, som tillader ubegrænset brug, distribution og reproduktion i ethvert medie, forudsat den oprindelige forfatter og kilde krediteres
Finansiering:. AI er støttet af en bevilling fra Fondation Erich et Regine Loewenthal. EG er støttet af den israelske Ministeriet for Videnskab, gennem et tilskud til National Gene Therapy Videncenter og gennem EF giver LSHB-CT-2004-512034 (MOLEDA), LSHB-CT-2008-223317 (LIV-ES), og LSHB -CT-2005-018961 (INTHER). EG støttes også af tilskud fra Blum, at Harold Grinspoon, Barbara Fox Miller støtte, den Horowitz og Wolfson Fonde. RS og ER understøttes af en forskningsbevilling fra Ministeriet for Videnskab og Teknologi, Israel. De finansieringskilder havde ingen rolle i studie design, indsamling og analyse af data, beslutning om at offentliggøre, eller forberedelse af manuskriptet
Konkurrerende interesser:.. Forfatterne har erklæret, at der ikke findes konkurrerende interesser
Introduktion
MikroRNA’er er enkeltstrengede ikke-kodende RNA-molekyler på ca. 22 nucleotider, der parrer med messenger RNA’er (mRNA’er), der bærer en komplementær sekvens [1]. MikroRNA’er binder til target mRNA’er i RNA-inducerede silencing kompleks (RISC), som indeholder et medlem af Argonaute proteinfamilien. Denne binding forhindrer oversættelse og accelererer nedbrydningen af de målrettede mRNA’er [2]. I de sidste par år har miRNA vist sig at spille en central rolle i reguleringen af genekspression, og der er tegn på, at miRNA er involveret i centrale biologiske processer, herunder udvikling, organogenese, væv differentiering, cellecyklus, og metabolisme [3 ] – [5]. Bemærkelsesværdigt, den rumlige og tidsmæssige udtryk for miRNA er karakteristisk for væv og udviklingsstadier, og flere undersøgelser har vist en sammenhæng mellem miRNA udtrykt i bestemte vævstyper og regulering af vævsspecifikke gener [6].
Ændringer i miRNA udtryk har vist sig at forekomme i kræft [7] Men arten og virkningen af de fleste af disse ændringer tilbage, uklar. Især findes modstridende resultater i spørgsmålet om, hvorvidt miRNA niveauer er globalt nedsat eller forøget i kræft. Modne miRNA er blevet vist i nogle undersøgelser for at være nedsat i kræft [8], mens andre undersøgelser har påvist opregulering af miRNA i mange tumorer [9]. En mulig forklaring på disse divergerende resultater kan være forskelle mellem tumortyper, analyserede væv, eller endda måleteknikker. En anden formodet forklaring er, at deregulering, at miRNA undergår i kræft er en kompleks proces. Det vil sige, resultatet af miRNA forordning om genekspression afhænger ikke kun på niveauet for miRNA, men også på en række andre faktorer, der medierer indflydelsen af miRNA på deres målgener, såsom komponenter af RISC-komplekset. Derfor kunne tilgængeligheden af disse faktorer markant modulere den samlede påvirkning af miRNA effekt på deres målgener, og som et resultat, give yderligere feedback på niveauerne af miRNA selv. Sådanne globale variationer af miRNA-aktivitet er foreslået af undersøgelser, der har vist, at Argonaute2 (
EIF2C2
) gen, som er indarbejdet i RISC-komplekset, ofte duplikeres i tumorer [10]. Da dette gen ikke er direkte involveret i miRNA biogenese, kunne man forvente, at når dette gen er duplikeret, vil nedbrydningen af miRNA målgener stige, uden tilhørende stigning i miRNA niveauer. Derfor forsøgte vi at bestemme den samlede virkning af miRNA på deres målgener, deres
biologisk aktivitet
, og designet en fremgangsmåde til måling herpå direkte fra de tilsvarende målgen ekspressionsniveauer.
Vores metode, kaldet Mirabelle (MicroRNA Activity baseret på ekspressionsniveauer), er baseret på den iagttagelse, at miRNA er kendt for at accelerere nedbrydningen af deres mål transkripter, og at denne aktivitet efterlader en underskrift på mRNA-niveauer af deres målgener. kan detekteres Et fald i ekspressionsniveauerne af mRNA’er bærer et bindingssted for et miRNA arter ved transfektion med de beslægtede miRNA [11]. Derudover har flere undersøgelser vist en klar sammenhæng mellem miRNA, der er stærkt udtrykt i et givet væv og nedregulering af deres mål transkripter [6], [12], [13]. Således et skift af udtryk for sæt gener målrettet efter en miRNA i en prøve er en indikation af, at den biologiske aktivitet af en tilsvarende miRNA arter ændringer i denne prøve.
Mirabelle tilgang bygger på princippet om, at genet ekspressionsniveauerne afspejler den regulatoriske effekt af højere orden moduler, og derfor kunne man vurdere virkningen af disse moduler, ved at observere transkriptionelle ændringer [14], [15]. Især har de seneste rapporter vist, at variation i aktiviteten af miRNA kan påvises ved sammenligning af den miRNA målgener tværs af forskellige væv [16], [17]. Vores metode, selvom ens i sit koncept, afviger fra tidligere offentliggjorte tilgange i at det er designet til at fange karakteristiske træk ved miRNA forordning om mRNA-transkripter.
Det er almindeligt accepteret, at miRNA binding bestemmes primært af 3 ‘ utranslaterede region (UTR) af mRNA’er. Tilstedeværelsen af en 7-mer komplementær til en miRNA frø (nucleotiderne 2-8) i 3’UTR af et gen er en nøglefaktor af miRNA anerkendelse; og flere algoritmer, såsom Targetscan [18], [19], er lykkedes at identificere miRNA-gen foreninger ved omhyggeligt at identificere gener med konserverede sekvenser svarende til MIR anerkendelse mønstre. Ikke desto mindre en etableret sammenhæng mellem en miRNA og et mål gen ikke, at alle udskrifter er fremstillet af dette gen vil være omfattet af miRNA regulering. Omkring halvdelen af de menneskelige gener kan undergå polyadenylering på flere steder, eller være genstand for alternativ splejsning påvirke deres sidste exons [20], [21], og dermed producere udskrifter, der afviger i deres 3’UTR-sekvenser. Blandt mRNA’er transkriberet fra sådan loci, kun dem, der bærer miRNA anerkendt sekvens mellem stopkodonen og polyA halen ville blive påvirket af miRNA regulering. Denne egenskab, bemærkelsesværdigt adskiller miRNA virkning fra transskription regulering opstår på gen-promoter site, og som påvirker alle isoformer af genet. Vi brugte denne egenskab til at designe en metode, som specifikt vil vurdere effekten af miRNA regulering.
Denne fremgangsmåde er muliggjort af, at nogle microarray platforme, ligesom Affymetrix, måle udskrift overflod ved hjælp af flere sekvenser taget fra 3 ‘enden af genet. Affymetrix genekspression data er opsummeret i probe-sæt, og der er flere probe-sæt til rådighed for de fleste gener. Nogle af disse probe-sæt er pålidelige indikatorer for miRNA aktivitet, hvilket betyder, at de opdager sekvenser, der kun kunne vises i isoformer af et gen, der omfatter et bindingssted for en given miRNA: alle de opdages af disse probe-sæt udskrifter ville være påvirket af en ændring i aktiviteten af en given miRNA. Det første skridt i vores analyse var således at identificere disse probe-sæt og miRNA, som de opdager aktivitet. Vi gjorde dette ved at kortlægge rækkefølgen af sonder, og bestemme deres position i genet med hensyn til miRNA target sites forudsagt for genet.
Mirabelle bruger udtrykket værdier målt af disse probe-sæt til at beregne en biologisk aktivitet score for hver miRNA frø. Dybest set, det tager som input en genekspression datasæt og sammenligner, i hver prøve, ekspressionsniveauerne af probe-sæt, der er pålidelige indikatorer for aktivitet af en given miRNA frø “miR-frø”, med ekspressionsniveauerne af andre probe-sæt stede på array’et, der tjener som reference. Produktionen af Mirabelle er en “miR aktivitet matrix”, forudsat at aktiviteten scores for hver miRNA familie (identificeret af frø sekvens), og hver prøve. Konventionelt er positive scores gives, når mål for en miRNA familie display nedregulering, hvilket indikerer, at den biologiske aktivitet af de beslægtede miRNA øges i prøven, mens der opnås negative værdier for opregulering af mål, hvilket tyder på en nedsat aktivitet.
Metoder
Mirabelle værktøj
Mirabelle tager som input et udtryk datasæt og producerer en miR-seed aktivitet matrix, og som for hver prøve i datasættet, de aktivitet scores beregnes for hver af de miRNA arter, for hvilke der findes forudsigelser. opnås positive værdier, når mål for en given miR-seed display mere nedregulering end referencen, hvilket indikerer, at aktiviteten af dette miR-frø øges i prøven, mens der opnås negative værdier for opregulering af mål, hvilket tyder på en nedsat aktivitet. Dette værktøj er skrevet i Perl.
MIR-frø aktivitet score beregning
Mirabelle første standardiserer de genekspressionsniveauer rapporteret i input datasæt ved hjælp Z-scores, for at korrigere for varierende følsomhed sonde bruges til at vælge, og forskelle mellem gennemsnitlige niveau af transkripter til stede i vævet. Næste, bruger den t-statistik til at beregne aktivitet scoringer, sammenligning, i hver prøve, Z-scoringer af probe-sæt, der er pålidelige detektorer af en given miR-frø, med Z-snesevis af andre probe-sæt. Vi brugte to-halet, to stikprøver t-statistik, med ulige varians (to prøve Welch t-statistik). På en tilfældigt blandet genekspression datasæt, variansen af denne statistik er en, og dens fordeling er normalt, når baseret på mindst 20 detektor probe-sæt.
miRNA henvender forudsigelser
I denne undersøgelse vi brugte Targetscan 4,0 forudsigelser (juli 2007) af miRNA-mål [18], [19]. Targetscan 4.0 bruger både evolutionær bevaring, og specifikke kontekst determinanter at forudsige miRNA mål. Targetscan 4,0 forudsigelser er tilgængelige for omkring 158 forskellige konserverede miRNA frø, repræsentant for omkring 450 modne miRNA i den menneskelige. Blandt disse MIR-frø, blev fire pålideligt opdaget af mindre end 20 probe-sæt i microarray, og blev dermed udelukket fra analyserne.
Kortlægning af probe-sæt til MIR-frø
i Affymetrix genekspression microarrays, er det almindeligt at have flere probe-sæt for det samme gen, hver genkender en anden sekvens. Ifølge placering af sekvenserne genkendes af probe-sæt, er det muligt at bestemme, om en given probe-sæt registrerer kun isoformer, der bærer en miR-seed målsted, eller også isoformer, der kan være fritaget for miR-seed målsted . Probe-sæt udelukkende afsløre udskrifter bærer en miR-seed mål er stærkere påvirket af miRNA regulering end probe-sæt, der registrerer en region af genet deles af udskrifter, der ikke bærer miR målsekvensen. Således er en forudgående trin til vores analyse var at tildele hver probe-sæt til rådighed på mikroarrayet en liste over MIR-frø, der vil påvirke alle isoformerne detekteret af sonden-sættet. Vi anvendte følgende regel for tildeling probe-sæt til MIR-frø: når sekvensen svarende til en given MIR-frø er direkte genkendes af en probe-sæt eller er placeret opstrøms til sekvenserne detekteret af sonden-sæt i genet og på den samme exon, mener vi, at dette sonde-indstillet til at være en pålidelig indikator for aktivitet for denne miR-frø. Men hvis sekvensen svarer til denne miR-seed er placeret nedstrøms for de genkendt af sonden-sæt, kan sonden-sæt opdage korte mRNA, der ikke indeholder en miRNA target sites, og vi ikke tildele den til den miR -frø. Vi udførte denne kortlægning ved hjælp af UCSC genom browser database [22], menneskelig build 17 (https://genome.ucsc.edu). Vi hentede de Targetscan forudsigelser fra hjemmesiden (https://www.targetscan.org) og kortlagt dem til UCSC genom; vi brugte “knownGene” bord til kortlægning kromosomale placeringer til gener; vi brugte “affyU133Plus2” og “affyU133” tabeller for at finde placeringen af sekvenser genkendes af probe-sæt i generne (Tekst S1).
Datasæt analyseret
Pappilary thyreoideakarcinom og brystkræft datasæt blev hentet fra GEO-databasen [23], tiltrædelse GSE3467, GSE3744, og ArrayExpress database [24], tiltrædelse E-MEXP-882. Vi anvendte de normaliserede ekspressionsniveauer værdier fra databasen. Når rå data var tilgængelige, vi hentede den, og renormalized det ved hjælp GCRMA, RMA og MAS 5,0 pakker på BioConductor [25]. Mirabelle forudsigelser og berigelse af nedreguleret mål blev ikke signifikant påvirket af den normalisering algoritme, der anvendes. Valideringsforsøg af transfektion med microRNA og antagomirs blev hentet fra GEO databasen tiltrædelse GDS1858, GDS2657, og GSE3425.
TF berigelse analyse
Bindende sites (BS) for TF blev bestemt ved at scanne initiativtagere til alle probe-sæt til stede i Affymetrix microarray for kampe med Transfac matricer, som er beskrevet i [26]. I hver promotoren, blev de 500 basepar (bp) umiddelbart før transcription start sites scannet, i overensstemmelse med det faktum, at de fleste aktive TFBS frem i nærheden af transkriptionsstartsitet [27]. Den hypergeometriske fordeling blev anvendt til at vurdere berigelse mellem baggrunden sæt probe-sæt og et prøvesæt.
GO anmærkninger
Vi brugte GO biologisk proces anmærkninger for U133Plus2 vifte fra Affymetrix hjemmeside ( https://www.affymetrix.com).
Statistik
Vi brugte to-tailed, to stikprøver t-test med samme varians for at identificere de MIR-frø viser de væsentligste afvigelser i tumorer vs. normale væv, og rangeret disse Mirs ifølge denne test. Denne test blev udført i Excel. Vi udførte en prøve Kolmogorov-Smirnov (KS) test til vurdering af normalitet af fordelingen af MIR aktivitet scores beregnet af Mirabelle på datasættet, og to-sample KS test til sammenligning af fordelingerne af MIR aktivitet scoringer regnet fra den oprindelige og en tilfældigt blandet datasæt. KS test og de tilknyttede histogrammer blev udført i Matlab 7 (Mathworks). De berigelse blev udført ved hjælp af den hypergeometriske kumulative fordelingsfunktion i Matlab.
Berigelse af nedreguleret gener med stigende antal MIR target sites (tabel 1)
For det givne sæt af miR -seeds, vi udførte berigelse tests iterativt for hver
jeg
mellem 0 og det maksimale antal målwebsteder, som følger. Den samlede befolkning størrelse (N) var antallet af informative probe-sæt, der har mindst
jeg
målrette sites for den betragtede sæt MIR-frø, blev antallet af probe-sæt rapportering nedregulering tælles som succeser (m ). Vi testede for berigelse af nedregulering i prøven af probe-sæt afsløre mindst
i + 1
målområder for disse MIR-frø.
Berigelse af GO anmærkninger (tabel S6)
Vi brugte hyper-geometrisk fordeling for at identificere de mest betydeligt beriget anmærkninger i prøven af 9542 probe-sæt er forbundet med de 77 MIR-frø, med hensyn til befolkningen i alle probe-sæt på array (A). 5069 af disse MIR mål blev effektivt nedreguleret i tumorer. I den anden analyse, vi identificeret de betydeligt beriget anmærkninger i prøven af 5069 nedreguleret probe-sæt, med hensyn til befolkningen i de 9542 forudsagte mål (B).
Resultater
Validering af Mirabelle metode
Vi valideret først Mirabelle metoden i væv, hvor den overflod af en bestemt miRNA var blevet eksperimentelt steget. Lim et al. [11] transficerede HeLa-celler med MIR-124, MIR-1, og MIR-373, og målt genekspression efter 12 og 24 timer. Wang et al. [28] transficerede HepG2 celler med MIR-124 og måles genekspression med forskellige tidsintervaller. Vi udsatte de genekspression data i Mirabelle analyse, som beregnet den MIR-frø aktivitet for hver prøve. I de prøver, der blev transficeret med microRNA, vores værktøj korrekt identificeret meget betydelige stigninger i microRNA aktivitet, specielt til MIR-frø miR-124, MIR-1, og MIR-373, i de tilsvarende eksperimenter (Tekst S1). For at sikre, at Mirabelle er egnet til påvisning af ændringer i miRNA aktivitet forekommende
in vivo
, analyserede vi de genekspression data genereret i forsøget på Krutzfeldt et al., Hvor miR-122 blev bragt til tavshed af systemisk injektion af en antagomir [29]. Vi fandt, at vores værktøj korrekt identificeret det betydelige fald i aktivitet for miR-122 forekommende efter behandling med antagomir (Tekst S1).
formode MicroRNA aktivitet i Human papillære thyreoideakarcinom
papillære thyreoideakarcinom (PTC) er en malignitet, der tegner sig for -80% af humane skjoldbruskkirtelkræft. To uafhængige undersøgelser har rapporteret specifikke ændringer af miRNA niveauer i PTC. Det var derfor interessant at kvantificere den biologiske aktivitet af miRNA i PTC vha Mirabelle værktøjet og sammenligne disse med de ændringer i miRNA ekspressionsniveauer rapporteret i disse to undersøgelser.
He et al. [30] målte miRNA niveauer i vævsprøver fra 15 PTC patienter, der anvender miRNA microarrays. Samtidig hermed de også anvendes Affymetrix microarrays til bestemmelse af genekspression i ni tumorer (T-PTC) og ni parrede omgivende væv (N-PTC). Vi analyserede genekspression data ved hjælp af Mirabelle at udlede en miR-seed aktivitet matrix (tabel S1). Som det fremgår af denne tabel, MIR-seed aktivitet scoringer var væsentligt højere i tumorer end i normale væv, hvilket antyder, at PTC-tumorer er karakteriseret ved en intensivering af miRNA aktivitet. Faktisk medianen miRNA aktivitet score i tumorer er højere end medianen aktivitet score i normale prøver til 97% af MIR-frø. For at bestemme de MIR-frø, som stigningen i aktivitet er den mest udtalte i tumorer, brugte vi to stikprøver t-test til at sammenligne aktiviteten scores opnået fra normale og tumor prøver (tabel S2). Han et al., Rapporterede, at MIR-146, MIR-221, MIR-222 og MIR-21, vises den mest dramatiske overekspression i tumorer med niveauer 19- til 4 gange højere i tumorer end i tilstødende væv. T-testen anvendt til vores aktivitet scoringer (ved brug kun den delmængde af frø, der blev brugt af He et al., I deres microRNA array) har med succes identificeret de 3 MIR-såsæd af disse 4 microRNA blandt de seks mest signifikante
s
-værdier (ud af 65 forskellige frø). Således, i PTC tilfælde toppen MIR-frø identificeret af deres biologiske aktivitet falder sammen med de øverste overudtrykte miRNA.
Kampen mellem vores forudsigelser og de biologiske målinger er ikke tilfældig, og som vi viser nedenfor, resultater fra et meget stærkt signal til stede i genekspression. Aktiviteten scores beregnet af Mirabelle værktøjet er baseret på t-statistik, og i mangel af en fælles regulering af disse gener, disse statistikker følger en normalfordeling. Figur 1A viser fordelingen af MIR-seed aktivitet scoringer i normale væv og tumorvæv. Det kan ses, at aktiviteten scoringer er signifikant højere i tumorer end i normale væv (
s Restaurant 10
-125 af en Kolmogorov-Smirnov (KS) test). Som en kontrol, vi beregnede hypotetiske aktivitet scorer på samme datasæt efter tilfældig blander af probe-sæt (fig. 1B). I sidstnævnte tilfælde har KS testen ikke registrere en signifikant forskel mellem fordelingen af aktivitet scores i tumor og normalt væv, som man kunne forvente.
(A) Histogram viser fordelingen af miR-frø aktivitet scores beregnet for tumor (rød) og normale prøver (cyan) i papillære thyreoideakarcinom datasæt. Aktivitet af miRNA er globalt højere i tumorvæv i forhold til normale væv. KS testen afviser hypotesen om lighed mellem fordelingerne af aktivitet scorer i tumor og i normalt væv, med en p-værdi P≈10
-126. Normalitet af aktivitet scores afvises med P 10
-300. (B) For at vise, at afvigelsen mellem scores beregnet til normale og tumorvæv er ikke på grund af vores metode til beregning af aktivitet scoringer, vi beregnet disse scoringer fra en tilfældig permutation af probe-sæt fra PTC datasættet. For både normale og tumorvæv, aktivitetsdata scoringer følger ca en normalfordeling, som forventet for en t-statistik. Der er ingen observerbar afvigelse mellem tumor og normalt væv, og KS testen afviser ikke lige de to fordelinger. (C) Histogram viser fordelingen af MIR-seed aktivitet scoringer beregnet for tumor (rød) og normale prøver (cyan) i brystcancer datasæt. MiRNA aktivitet er betydeligt højere i tumorvæv i forhold til normale væv. KS testen afviser hypotesen om lighed mellem fordelingerne af aktivitet scorer i tumor og i normalt væv, med en p-værdi P 10
-298. (D) Histogram viser fordelingen af miR-frø aktivitet scoringer efter en tilfældig permutation af probe-sæt fra brystet datasæt.
formode MicroRNA aktivitet i brystkræft
Efter at have fundet at microRNA aktivitet er globalt steget i papillær skjoldbruskkirtlen karcinom, vi fortsatte med at undersøge miRNA aktivitet i brystkræft, som er den anden mest almindelige form for kræft, og en genstand for omfattende undersøgelser af genekspression, med nogle meget værdifulde datasæt tilgængeligt på offentlige arkiver . Richardson et al., Offentliggjort en genekspression undersøgelse af brystcancer [31], som er baseret på et datasæt, der omfattede syv normale vævsprøver og 40 brysttumorer, hvoraf 18 var basal-lignende cancere (BLC), et dårligt differentieret og særdeles aggressiv form for kræft. Aktiviteten matrix udledt for dette datasæt vises i tabel S3. Som vist i figur 1C, niveauet af miRNA biologisk aktivitet i tumorprøver er her også signifikant højere end i normale prøver; KS testen viser, at aktivitet scorer i tumor og normale prøver har en klar fordeling (
s
10
-298). Sammenligning af median aktivitet scorer i kræft og normale vævsprøver alle men fire MIR-frø synes at have højere aktivitet i kræft end i normalt væv. Selv efter at vælge en restriktiv afskæring af
s
3 · 10
-4 (svarende til en 0,05 signifikansniveau efter en Bonferroni korrektion for multiple test), finder vi, at 77 (ud af 150) MIR-frø har en væsentlig forøget aktivitet i tumorer (tabel S4). Tilsammen er de microRNA svarende til disse 77 MIR-frø forudsagt af Targetscan at regulere omkring 6.000 gener. Den øgede miRNA aktivitet observeret er faktisk afspejlet i et markant fald i ekspressionen af disse målgener. Ud af de 9,542 probe-sæt forbundet med transkripter reguleres af en af disse 77 MIR-frø, 5069 (53,1%) har lavere gennemsnitlig ekspression i tumorer (dvs. at de tilsvarende målgener nedreguleret) end i normalt væv, sammenlignet med 41,6% af alle de 40,539 probe-sæt i array (
s
10
-147 af en hypergeometriske test, figur 1)
for at give yderligere støtte til vores konklusion, at microRNA. er den vigtigste årsag til den massive nedregulering af disse gener, vi undersøgte omfanget af gen target nedregulering som en funktion af antallet af de tilhørende bindingssteder for MIR-frø. Undersøgelsen er blevet motiveret af tidligere observationer tyder på, at mRNA nedbrydning efter binding af miRNA er mere effektiv for afskrifter transporterer flere mål sites for miRNA [32] – [34]. Tabel 1 opsummerer udtrykket tendenser observeret for probe-sæt, der er mappet til de 77 MIR-frø, der viser den største stigning af aktivitet i tumorer. Som nævnt ovenfor 9,542 probe-sæt detektere transkripter, der har mindst et bindingssted for MIR-frø, 53,1% af dem vise nedregulering i tumorer. Når man tænker på de 6.574 probe-sæt afsløre udskrifter med mindst 2 mål sites, procentdelen forbedres til 54,4% (p 1,3 · 10
-4 af en hypergeometriske test), og det fortsætter med at stige for probe-sæt afsløre udskrifter bærer flere steder for miRNA binding, nåede omkring 70% for de 228 probe-sæt afsløre udskrifter med mere end 15 målområder. Det er bemærkelsesværdigt, at selvom MIRABELLE algoritme ikke anvende antallet af miRNA bindende steder i sine beregninger-aktivitet scoringer blev beregnet fra probe-sæt identificeret som indikatorer for en miR-frø, uanset antallet af bindingssteder de kan bære-the miRNA, at det er identificeret som undergår en væsentlig ændring aktivitet, viste en klar dosis-respons effekt. Derfor er den gradvise stigning i andelen af nedreguleret gener med antallet af mål sites giver stærk støtte til den opfattelse, at nedsat ekspression af målgener er faktisk skyldes øget miRNA aktivitet.
Da mange gener er reguleret af flere miRNA arter, vi har ønsket at sikre, at den påviste globale nedregulering af miRNA målgener ikke var på grund af stigningen i bare et par specifikke arter af miRNA (som deler målgener med de andre miRNA arter) ud af dette sæt af 77 aktive miR -frø. Til dette formål har vi udført den hypergeometriske berigelse testen beskrevet tidligere (dvs. ,. testning for berigelse af nedregulerede gener blandt probe-sæt, der registrerer mål af mindst en MIR-frø i sættet undersøgt) på iterativ måde. I den første iteration, undersøgte vi hypergeometriske berigelse opnås, når man overvejer udtrykket mønstre af målene i kun den første miR-frø. I den anden iteration undersøgte vi hypergeometric berigelse opnås, når man overvejer ekspressionsmønstrene af målene i den første og anden MIR-frø, og så videre. Bemærkelsesværdigt, blev den bedste score opnået, når man overvejer målene for de første 74 MIR-frø, der bekræfter, at, ja, næsten alle de oprindelige 77 biologisk aktive miRNA arter bidrager til den observerede ekspression nedregulering. For at sikre, at disse resultater ikke var på grund af særlige forhold i de analyserede data, undersøgte vi andre brystkræft datasæt, såsom E-MEXP-882 [35], og behandlet dem med forskellige normalisering ordninger (GC-RMA, MAS5.0) . Brug den hypergeometriske test, fandt vi en tilsvarende signifikant nedregulering af miRNA målgener (81 biologisk aktive MIR-frø, s 10
-134 hypergeometriske berigelse test), fremme styrke den hypotese, at den globale nedregulering af miRNA målrettede gener observeret i brystcancer er ikke specifik for en bestemt undersøgelse.
en potentiel årsag til den observerede nedregulering af microRNA målgener kan være virkningen af transkriptionsfaktorer (TFS), som co-regulering af disse gener [36]. Søgning efter kendte TF bindingssteder i promotorområder af target udskrifter af hver af de 77 MIR-frø, fandt vi en signifikant berigelse (
s
0,05) for 82 TF’er (metoder). Bindingssteder for disse TF’er blev fundet i 30% af probe-sæt til stede i opstillingen. Efter at have udelukket alle udskrifter med formodede bindingssteder for disse TFS vi stadig observeret en meget betydelig p-værdi for berigelse af nedreguleret gener blandt miRNA mål (p 10
-96).
Dernæst satte vi at liste de gener, der har forudsagt target sites for de 77 MIR-frø, og derfor forventes at blive påvirket af den øgede miRNA aktivitet (tabel S5). Vi funktionelt karakteriseret dem ved hjælp af gen-ontologi (GO) kommentering, og så til statistisk berigelse af specifikke anmærkninger (tabel S6). Denne analyse viser, at flere biologiske processer blev overrepræsenteret blandt gen mål for disse miRNA: regulering af transskription, udvikling og differentiering, ubiquitin cyklus, signaltransduktion, transport, og tumor undertrykkelse (synonym kategori: regulering af progression gennem cellecyklus) (FDR
s
10
-9). Som vi så tidligere, de fleste af disse gener viste reduceret ekspression værdier i tumorer, men ikke alle. Vi kiggede for funktionelle anmærkninger, der kunne karakterisere de probe-sæt, der blev nedreguleret i tumorer, sammenlignet med de andre forventede mål, der ikke effektivt nedreguleret. Vi fandt, at celle-cyklus anholdelse var den mest markant beriget annotation (FDR
s
2 · 10
-2), hvilket tyder på, at miRNA-regulerede gener, der forårsager celle-cyklus anholdelse er faktisk nedreguleret i tumorer.
Da effektiviteten af gendæmpning af microRNA forbedres med antallet af målwebsteder, vi kiggede efter gener, der bærer det højeste antal mål sites for vores 77 MIR-frø. Dette svarer til toppen af tabel S5. I overensstemmelse med de øverste identificeret GO anmærkninger, finder vi gener, der regulerer gen transskription:
CPEB4
(cytoplasmatisk polyadenylering element binding 4), som koder for et protein menes at styre polyadenylering-induceret oversættelse tidlige udvikling, har det højeste antal af mål sites (38), og nedreguleres. To andre medlemmer af CPEB familien,
CPEB2
CPEB3
, vises også højt på listen med 26 og 25 målwebsteder henholdsvis og er også nedreguleret;
DDX3X
(DEAD kasse polypeptid 3, X-bundet), et RNA helicase, har 33 målområder, og de tilhørende probe-sæt også rapportere nedregulering (p = 0,002, 0.00001);
Leave a Reply
Du skal være logget ind for at skrive en kommentar.