PLoS ONE: miRConnect: Identificering Effekt Gener af miRNA og miRNA familier i cancerceller

Abstrakt

micro (mi) RNA er små ikke-kodende RNA, der negativt regulerer ekspressionen af ​​de fleste mRNA. De er kraftige regulatorer af forskellige differentieringstrin, og forventes ekspressionen af ​​gener, der enten negativt eller positivt korrelerer med udtrykte miRNA at holde oplysninger om biologiske tilstand af cellen og dermed af funktionen af ​​de udtrykte miRNA. Vi har sammenlignet den store mængde af tilgængelige gen array-data på steady state ordningen for NCI60 cellelinjer til to forskellige datasæt, der indeholder oplysninger om ekspressionen af ​​583 individuelle miRNA. Derudover har vi genereret brugerdefinerede datasæt, der indeholder udtryk information af 54 miRNA familier deler den samme frø kamp. Vi har udviklet en ny strategi for at korrelere miRNA med enkelte gener baseret på en opsummerede Pearson Correlation Coefficient (SPCC), der efterligner en

i silico

titrering eksperiment. Ved at fokusere på de gener, der korrelerer med ekspression af miRNA uden nødvendigvis at være direkte mål for miRNA har vi grupperet miRNA i forskellige funktionelle grupper. Dette har resulteret i identifikationen af ​​tre nye miRNA, der er knyttet til epitel-til-mesenkymale overgang (EMT) ud over de kendte EMT regulatorer af

miR-200

miRNA familie. Derudover en analyse af gen signaturer knyttet til EMT, c-MYC-aktivitet, og ribosomale protein genekspression tilladt os at tildele forskellige aktiviteter til hver af de funktionelle klynger af miRNA. Alle korrelationsdata er tilgængelige via en web interface, der tillader forskere til at identificere gener, hvis ekspression korrelerer med ekspressionen af ​​enkelte miRNA eller hele miRNA familier. miRConnect.org vil hjælpe med at identificere veje reguleret af miRNA uden at kræve specifik viden om miRNA mål

Henvisning:. Hua Y, Duan S, Murmann AE, Larsen N, Kjems J, Lund AH, et al. (2011) miRConnect: Identificering Effekt Gener af miRNA og miRNA familier i kræftceller. PLoS ONE 6 (10): e26521. doi: 10,1371 /journal.pone.0026521

Redaktør: Lin Zhang, University of Pennsylvania School of Medicine, USA

Modtaget: September 16, 2011; Accepteret: September 28, 2011; Udgivet: 26 okt 2011

Copyright: © 2011 Hua et al. Dette er en åben adgang artiklen distribueres under betingelserne i Creative Commons Attribution License, som tillader ubegrænset brug, distribution og reproduktion i ethvert medie, forudsat den oprindelige forfatter og kilde krediteres

Finansiering:. Disse forfattere har ingen støtte eller finansiering til at rapportere

konkurrerende interesser:.. forfatterne har erklæret, at der ikke findes konkurrerende interesser

Introduktion

Micro (mi) RNA er små, 19- 22 nukleotid lange, ikke-kodende RNA’er, der regulerer genekspression primært ved at målrette 3’UTR af mRNA’er resulterer i reduceret translation af proteiner eller nedbrydning af mRNA’erne. miRNA er grundlæggende regulatorer af celledifferentiering og udviklingsprocesser. De har også været kendt for at være yderst relevante i formation kræft og progression [1]. For nylig blev det påvist, at næsten alle humane gener er under kontrol af miRNA [2]. Men fordi miRNA regulere ekspressionen af ​​hundredvis af målgener [3], og mange gener er målrettet af flere miRNA [4], tildele biologiske funktioner til miRNA eller miRNA familier har været en vanskelig opgave.

miRNA indeholder ved deres 5’afslutte en kort strækning på 6-8 nukleotider komplementære til frøet match i target mRNA. Denne komplementaritet er tilgængeligt for beregningsanalyse og flere algoritmer er blevet udviklet til at forudsige miRNA mål [5]. Men target forudsigelser med disse algoritmer er ikke præcis nok til at udlede biologiske funktion miRNA udelukkende baseret på listerne over forudsagte mål. Målvalidering gøres normalt ved enten overudtrykker miRNA eller ved at hæmme deres funktion efterfulgt af måling af ændringer i mRNA eller proteinniveauer i transficerede celler [2], [6]. Men både overekspression og hæmning af miRNA har forbehold, [7], og det er ikke klart, om de observerede ændringer på mRNA og protein niveau er resultatet af direkte regulering af miRNA eller er resultatet af ændringer nedstrøms af miRNA-målrettede gener.

Vi har for nylig brugt NCI60 celler [8], at et panel af 60 cancer cellelinjer vedligeholdes ved NCI, identificere og validere forbindelser mellem miRNA og deres mål. Uforstyrrede vifte datapunkter på ekspressionsniveauer af hundredvis af miRNA og mere end et hundrede tusinde genprober på flere array-platforme gøre NCI60 celler et unikt system til at identificere kræft relevante forbindelser mellem miRNA og gener reguleret af miRNA. Brug af NCI60 system, vi tidligere har valideret

HMGA2

IMP1

som mål for

Lad-7

familie af miRNA [9], [10]. Desuden har vi identificeret de medlemmer af

miR-200

familie og valideret to E-box bindende transkriptionsfaktorer,

ZEB1

og

ZEB2

som mål [11]. Senest vi valideret tyrosin fosfatase

FAP1

som

miR-200

målrette [12]. Disse eksempler viser magt NCI60 datasæt til at forbinde miRNA med deres mål. , Identifikation af enkelte miRNA mål uden en cellulær kontekst eller kendskab til alle mål for en miRNA gør det imidlertid vanskeligt at forbinde miRNA med biologi eller patologi. Vore undersøgelser af

Lad-7

og

miR-200

i NCI60 cellerne også tilladt forudsigelse og bekræftelse af den biologiske funktion af disse miRNA.

Lad-7

viste sig at være en markør for differentierede kræftceller [9], [13], og

miR-200

blev identificeret som en kraftig markør og regulator af epitel-til -mesenchymal overgang (EMT) [11], [14].

de fleste af vores resultater blev foretaget ved at sammenligne miRNA og mRNA-ekspressionsniveauer, som på det tidspunkt var overraskende, i betragtning af, at miRNA i pattedyrceller mentes at hovedsagelig virke ved translationel lyddæmpning uden at påvirke mRNA-ekspressionsniveauer. Men det havde også blevet påvist, at mRNA overflod af størstedelen af ​​de målrettede gener noget påvirket af miRNA [15], [16]. Mens der stadig er uenighed om den fremherskende måde, hvorpå miRNA regulere genekspression [17], en nylig undersøgelse foreslået, at for et betydeligt antal gener er omfattet af miRNA, destabilisering af mRNA er den vigtigste mekanisme af protein undertrykkelse af miRNA [18] , en observation, der gør NCI60 mRNA /miRNA datasæt et værdifuldt værktøj til at studere miRNA funktion i kræftceller.

transfektion af celler med enten miRNA eller miRNA-hæmmere normalt resulterer i ændringer i overflod af et stort antal mRNA. Interessant er mRNA’er der er negativt reguleret af miRNA, samt et stort antal mRNA’er, der positivt korrelerer med miRNA ekspression. Disse ændringer i mRNA-niveauer er generelt blevet anset for at være forårsaget af gener coregulated med miRNA eller være sekundære begivenheder. Faktisk er det sandsynligt, at størstedelen af ​​gener, hvis ekspression reagerer på ændringer i ekspressionen af ​​miRNA er ikke direkte mål for miRNA

per se

, men er biologiske effektorer relevante for funktionen af ​​miRNA. Især når opdages med steady state ordningen for NCI60 celler, kan disse biologiske effektor gener holde vigtige oplysninger om den endogene funktion af miRNA. Dette var mest oplagt for

miR-200

. En lille ændring i

miR-200

udtryk (ca. 2 gange) resulterede i en moderat ændring i mRNA niveauer af sine mål

ZEB1

og

ZEB2

(ca. 5-7 fold), hvilket resulterede i en massiv ændring i

E-cadherin

/

vimentin

forhold (over 8 størrelsesordener) [11]. Den enorme positiv korrelation mellem ekspression af

miR-200

og

E-cadherin

/

Vimentin

forholdet tilladt os at tildele funktionen af ​​”epitelial regulator” til miR-200 familien endnu før vi havde identificeret

ZEB1

og

ZEB2

som mål. Opmuntret af denne analyse har vi nu anvendt NCI60 systemet at identificere sekundære korrelatorer af miRNA (som kan være i tusindvis som i tilfældet med EMT [19]) i et genom-dækkende analyse som de kan holde vigtige oplysninger om den biologiske tilstand af en celle.

Vi har udviklet en ny metode til at klynge miRNA eller miRNA familier i henhold til deres biologiske korrelatorer snarere end deres forudsagte mål eller deres kromosomale colokalisering eller deres vævsspecifik ekspression. miRNA blev grupperet i forskellige funktionelle grupper efter udtryk for deres biologiske effektor gener. Vi har valideret aktiviteten af ​​et af disse klynger, som indeholder alle medlemmer af

MIR-200

familie, i regulering af epitel karakter af celler. Dette resulterede i identifikationen af ​​tre nye miRNA,

miR-7

,

miR-203

og

miR-375

, at fungere i epitelial vedligeholdelse. Derudover har vi identificeret klynger af kræft relevante miRNA, der enten vækstfremmende eller vækst undertrykke karakter baseret på korrelationen af ​​deres ekspression med ekspressionen af ​​enten ribosomale proteiner eller

c-MYC

regulerede gener. Vi har skabt et web-baseret interface, miRConnect.org, som giver en robust og nem at bruge værktøj for efterforskerne at identificere nye forbindelser mellem miRNA eller miRNA familier og grupper af gener, der er markører for forskellige biologiske tilstande.

Resultater

Generering af sammenhænge mellem miRNA og genekspression

for at udforske biologiske aktiviteter af miRNA vi først etableret korrelationerne mellem ekspressionen af ​​miRNA og gener. Vi gjorde brug af flere datasæt til rådighed for NCI60 celler (59 cellelinier): 1) udtrykket profilen af ​​208 menneskelige miRNA kvantificeret ved real-time PCR ( “Q” datasæt) [20]; 2) fire datasæt af menneskelig genekspression profiler (Stanford, GENELOGIC_U95, GENELOGIC_U133 og Novartis) tilgængelige på NCI Developmental Therapeutics Program (DTP) server. I sættet Q-data blev 136 miRNA defineret som udtrykkes ved detekterbare niveauer (som vurderet ved real-time PCR) i mindst 30 af 59 cellelinier (tabel S1). De NCI60 celler repræsenterer 9 forskellige kræftformer. Den cutoff på 30 cellelinjer blev valgt til at omfatte mindst halvdelen af ​​cellelinjer, og at sikre, at mindst fire forskellige væv oprindelser var repræsenteret. En fordel ved NCI60 systemet er evnen til at kombinere individuelle endogen miRNA ekspression i en måde repræsenteres ved at korrelere genekspression med ekspressionen af ​​en hel miRNA familie (dvs. alle 9 Lad-7 aktiviteter er repræsenteret i Q datasæt). De 136 miRNA indeholdt medlemmer af 24 frø familier (miRNA, der deler den samme frø sekvens med mere end ét familiemedlem, tabel S2). Desuden, på grund af deres forudsagte overlappende funktion, genereres vi en yderligere brugerdefinerede familie af alle MIR-200 familiemedlemmer; miR-200 falder i to forskellige frø familier, miR-141 /200a og miR-200BC /429, udmærker sig ved kun ét nukleotid forskel i midten af ​​frøet sekvens [11], [14].

mest almindelige og veldefineret strategi for at udforske miRNA-gen foreninger er Pearson korrelationskoefficient (PCC) [21], [22]. Mens PCC er et effektivt værktøj til at detektere korrelationer, har det begrænsninger. F.eks PCC giver lige vægt til hver prøve, der skal måles (fx en cellelinie, et specifikt væv eller en patientprøve). Det betyder ikke skelne mellem prøver med høj ekspression og dem med lav udtryk. Dette kan føre til forvridning af korrelationsanalysen, fordi: 1) ekspressionsniveauet af miRNA holder vigtige oplysninger om regulering; og 2) støj er mere tilbøjelige til at eksistere i prøver indeholdende gener af lav ekspression. Vi troede derfor en måde at overvinde nogle af disse begrænsninger. En løsning ville være at tildele forskellige vægte til høje og lave ekspressionsniveauer. Men fordi beregningen PCC ikke er en lineær proces, er det ikke praktisk at tilføje vægte direkte til hver prøve. I stedet vægtning på niveau med udvælgelsen prøve blev fundet at være mere praktisk, da PCC’er af forskellige opstillinger af cellelinje data kunne tilsættes op og den tilsvarende modellering ville igen være lineær. Ud fra denne betragtning, udviklede vi en hidtil ukendt fremgangsmåde, den “opsummerede PCC” (SPCC). En standard (direkte) PCC (dPCC), blev den SPCC og et randomiseret SPCC (rsPCC) anvendes til at generere sammenhænge mellem ekspressionen af ​​miRNA og gener, for at teste reproducerbarheden af ​​de sammenhænge og udforske særlige biologi hvordan miRNA arbejde.

Direct (d) PCC

i denne fremgangsmåde udføres vi en standard COMPARE analyse [23], som producerer PCC’er, at identificere mRNA’er, der korrelerede med ekspression af hver af de 136 miRNA. I denne og alle efterfølgende SAMMENLIGN analyser vi sat 30 som det minimale antal påviselige cellelinjer. At normalisere detekterings- variation blandt prober henholdsvis indgår i de fire gen array-platforme blev PCC’er midlet for hvert gen. Denne metode gav en PCC værdi for hvert mRNA, signifikant korreleret med ekspressionen af ​​en miRNA.

Opsummerede (r) PCC

I denne metode (illustreret i figur S1) vi ændret beregningen proces af miRNA-mRNA korrelation ved at tilføje en række PCC værdier efterligner en “titrering” af miRNA ved rangordning cellelinjer i henhold til deres udtryk for miRNA. For hver miRNA-mRNA par, vi sorteret miRNA udtryk i 59 cellelinjer fra højest til lavest, og udvalgt de 30 bedste cellelinier som den oprindelige tilstand, fordi disse 30 cellelinier repræsenterede den øverste halvdel af alle cellelinjer og omfattede celler fra mindst 4 forskellige væv oprindelser. Vi udførte en SAMMENLIGN analyse for disse 30 cellelinier (mønster 30). Dernæst blev cellelinien med rang No. 31 inkluderet og en COMPARE analyse blev gentaget for disse 31 cellelinier (pattern 31). Gentagne SAMMENLIGN analyser blev udført, indtil alle de 59 cellelinier blev inkluderet i en trinvis måde, og i alt 30 PCC værdier blev genereret (mønster 30 til mønsteret 59). Vi brugte ikke en glidende vindue af en fast størrelse (1 til 30 2 til 31, … 30 til 59), fordi vi altid ønsket at medtage cellelinjer med det højeste udtryk for en miRNA forventer at have den største effekt på målet /effektor-gener i disse cellelinier. Dette tilsætningsstof metode tildeles vægte i en gradient (eller titrering) måde baseret på miRNA ekspressionsniveauerne. De 30 cellelinjer med det højeste udtryk var altid inkluderet i hver SAMMENLIGN beregning og tildelt højeste vægte, da vi forventede de største effekter på mål /effektor gener fra disse cellelinjer. De PCC beløb blev midlet for hvert gen blandt de fire gen array-platforme.

Randomiserede summeres (rs) PCC

For at teste stabiliteten og reproducerbarhed af SPCC-metoden, vi designet et randomiseret fra af SPCC som en intern kontrol. Den eneste forskel mellem denne metode og den SPCC metode var, at cellelinier blev sorteret i en randomiseret måde. For hver miRNA-mRNA par, blev randomiserede sortering gentaget 10 gange, og de 10 rsPCCs blev gennemsnit.

Den SPCC-metoden præcist registrerer både nedstrøms effektor gener og forudsagde mål korrelerer med miRNA

Det er kendt fra flere undersøgelser, at selv ændre miRNA ekspressionsniveauerne i kræftceller forårsager både op og ned regulering af gener, miRNA overvejende arbejde gennem negativ regulering af downstream effektor gener [15], [16]. For at teste denne observation med vores metoder blev log2 forholdsværdier af alle negative vs. alle positive korrelationer beregnes for 136 miRNA henholdsvis med de tre metoder (dPCC, SPCC og rsPCC). En sammenligning af fordelingen af ​​136 forholdsværdier viste, at negative korrelationer betydeligt undertal positive i SPCC analyse, men ikke i de to andre analyser (figur 1A). Den log2 Forholdet med SPCC metoden flyttet markant til højre i forhold til dPCC metoden. Et større antal miRNA i SPCC-metoden haft negative korrelerende gener, som blev annulleret af tilfældig støj i dPCC metoden (medianværdien var omtrent nul). Den kumulative kurve af rsPCC var ligner dPCC, men var signifikant forskellig fra den for SPCC. Dette viser, at SPCC metode var mere effektiv i detektering af negative korrelationer end både dPCC eller rsPCC metoden.

(A) Akkumuleret plot af log2 forholdet negativt vs. positivt korrelerer gen numre for 136 miRNA beregnes med dPCC, SPCC og rsPCC metoder hhv. X-aksen angiver de log2 forholdsværdier af 136 miRNA efter deres placering fra laveste til højeste, og Y-aksen angiver den kumulative fraktion på 136 miRNA. Forskellene i de kumulative kurver blev målt ved ensidig Kolmogorov-Smirnov test. Sammenligning (B) af de tre metoder til at identificere den mest sandsynlige bevarede Targetscan forudsagde mål i det menneskelige genom (i alt 33.535 forudsagt arrangementer rettet). Target forudsigelser blev rangeret efter samlet kontekst score fra højeste til laveste. Gradvist fra top 50 til top 500 miRNA-genpar med den højeste samlede kontekst scoringer blev forholdet værdier af negativ vs. positiv korrelation tal beregnet og plottet for de tre metoder.

Næste vi søgt at sammenligne effektiviteten af ​​de tre metoder i detektion forudsagte mål. Vi valgte Targetscan, et meget anvendt mål forudsigelse algoritme, at samle en liste over alle menneskelige miRNA-genpar involverer 136 miRNA. Listen blev sorteret ved total kontekst score (defineret ved Targetscan for de bevarede mål) fra højeste til laveste (tabel S3). Så trinvist fra top 50 til top 500 miRNA-genpar, blev forholdene mellem negativ vs. positiv korrelation tal beregnes og plottes. Kun med SPCC-metoden, dette steg sammen med stigningen i den samlede kontekst score (figur 1B). , Resultater for alle sammenhænge og korrelationer med hensyn til forventede mål begge foreslog derfor, at SPCC-metoden udføres væsentligt bedre på det teoretiske niveau end både dPCC eller rsPCC metoden.

Den SPCC-metoden detekterer udtryk for miRNA præcist som er forbundet med enkelt vært gener samt til klynger af

HOX

gener

Ud over det teoretiske niveau, var det nødvendigt at teste evnen af ​​SPCC metode til identificering miRNA /gen forbindelser, der er etableret i kendte biologiske systemer. Vi gjorde derfor brug af både værten gener og homeobox (

HOX

) gener, der har godt karakteriserede links til udtryk visse miRNA.

Mange miRNA er kodet inden for co-beliggende gener (værtsgener ) og dele initiativtagere med dem. Angivelse af disse miRNA er drevet af initiativtagerne til deres vært gener, og er blevet rapporteret positive korrelationer mellem udtryk for miRNA og deres værtsgener [22], [24]. Ved at udnytte denne information, vi analyserede, hvor ofte co-transskription af miRNA og deres værtsgener kan føre til positive korrelationer i NCI60 datasæt. Af de 136 miRNA, er 65 indkodet i værtsgener (Figur 2). I både SPCC og dPCC analyserer antallet af positive korrelationer mellem værten gener og deres co-beliggende miRNA langt ud nummererede dem fra negative korrelationer (figur 2A og 2B). I modsætning analysen med rsPCC metode resulterede i en tilfældig fordeling af positive og negative korrelationer (data ikke vist). Resultaterne af SPCC /dPCC metoder var sammenlignelige, hvilket antyder, at reproducerbarheden af ​​NCI60 datasæt var høj og SPCC metode til identificering korrelationer var så god som den dPCC metode i tilfælde af enkelt vært gener.

(

A

) SPCC og (

B

) dPCCs værdier er givet for de 73 miRNA /host genpar repræsenteret i Q datasæt og genekspression datasæt, der forekom med mindst en af ​​de metoder. Reanalyse af dataene ved at sammenligne SPCC /30 med dPCC værdier med en afskæring på 0,2 viste, at de to metoder ikke er forskellige i deres evne til at forudsige værtsgener (enten ved parret t-test eller Wilcoxon parret test).

Næste, vi ønskede at afgøre, om SPCC metode ville klare sig bedre end den dPCC metode til at identificere specifikke co-transskription. Vi tog fordel af

HOX

gener som et unikt system af fire gen-klynger, der hver indeholder mindst én intergenisk miRNA.

HOX

gener regulerer fosterudvikling og i pattedyr, de er grupperet i 4 klynger (

Hoxa-D

), herunder 9 til 11 gener [22], [24]. De fleste af HOX-gener blev positivt korreleret med co-lokaliserede miRNA (rød kasser i figur 3A). Interessant,

Hoxa

,

HOXC

, og

Hoxd

klynger havnen en miRNA gen hver og

HOXB

indeholder to (figur 3A). Vi først beregnet dPCCs og sPCCs mellem de fire miRNA (

miR-10a

,

-10b

,

-196a

,

-196b

), der er kodet inden HOX klynger, og alle menneskelige gener. Vi observerede, at i SPCC metoden, i tre af

4

af klynger et HOX gen ved siden af ​​de co-lokaliserede miRNA haft den højeste positive korrelation med disse miRNA ud af ~18,000 humane gener (

miR -196b

/

HoxA9

,

miR-196a-service /

HOXC10

miR-10b-service /

HOXD8

; fed røde kasser i figur 3A). Men i dPCC metoden, kun var tilfældet for to klynger (

miR-196b-service /

HOXA10

miR-196a-service /

HOXC10

) (data ikke vist). For hver af de 136 miRNA, beregnede vi SPCC værdier med gener i 4

HOX

genklynger. De sPCCs af alle

HOX

gener inden for en klynge blev sat op, og miRNA blev rangordnet efter den kumulative SPCC for hver

HOX

klynge (Figur S2). Bemærkelsesværdigt, for hver klynge der var én miRNA der tydeligst korreleret med ekspressionen af ​​

HOX

gener i denne klynge (rød søjle i figur S2), og i hvert tilfælde var det miRNA kodes inden for denne klynge. For yderligere at sammenligne effektiviteten af ​​de SPCC og dPCC metoder, vi plottede de kumulative SPCC og dPCC scores for hver

HOX

genklynge versus korrelerende miRNA (figur 3B og 3C). Den kumulative SPCC og dPCC af den negativt korrelere

HOX

gener er også vist, men var ubetydelig. Vi inkluderede også

miR-99a /99b

miR-100

i denne analyse, fordi de deler omfattende homologi med

miR-10a

miR-10b

[25]. Igen, klaret sig bedre end den dPCC metoden detektere den korrekte

HOX

genklynge for hver korrelere miRNA mod en minimal baggrund signal fra andre klynger.

(

En

SPCC ) struktur af de fire pattedyr

HOX

gen klynger med placeringen af ​​de hostede miRNA.

blev opdaget HOX

gener boxed i rødt som positivt korreleret med den hostede miRNA ved hjælp af SPCC-metoden. For hver klynge

HOX

gen stærkest korreleret med miRNA, der er på denne klynge er indrammet med fed rød. (

B

) sPCCs af alle individuelle

HOX

gener i hver klynge blev kumuleret og plottet mod medlemmer af

miR-10

/

miR-196

familie og

miR-99a

,

-99b

og

-100

. (

C

) Samme som

B

men genereres ved hjælp af dPCC metoden.

Sammenfattende viser disse data, at steady state system NCI60 mRNA og miRNA data er nyttige i forbindelse med afsløring biologisk meningsfulde forbindelser mellem miRNA og deres vært gener. Den SPCC-metoden, der er designet til at efterligne en miRNA titrering eksperiment, var overlegen i forhold til dPCC metoden i to analyser (negativ korrelation med udtrykte mRNA’er og

HOX

gen klynge korrelation), der anvendes til at karakterisere vores tilgang. Den SPCC metoden blev derfor anvendt i de efterfølgende analyser.

miRConnect.org, en søgbar web interface til at udforske forbindelser mellem miRNA og deres biologiske effektor gener

Som introduceret ovenfor, ud over faktiske målgener, gener, der ikke forventedes at have miRNA mål såvel som det store antal af både positivt og negativt korrelerende gener kan have vigtige oplysninger med hensyn til status af miRNA cellulære ekspressionsniveauer, som kan give indsigt i de biologiske aktiviteter af miRNA. Alle negativt og positivt korrelerende gener for 136 miRNA og de 25 miRNA familier bestemt med både dPCC og SPCC metoden i Q datasæt, samt oplysninger om, hvor mange af dem er forudsagt mål ved Targetscan 5.0, kan findes under miRConnect-Q på en søgbar webinterface: miRConnect.org (eller miRConnect.net)

Gruppering af miRNA baseret på overlap af deres korrelerende gener

Vores data foreslog, at bruge de NCI60 datasæt og SPCC metoden kunne være nyttigt at opdage biologisk relevante forbindelser mellem miRNA og deres nedstrøms effektor gener, som kan give ny indsigt i biologiske aktiviteter af miRNA. Vi hævdede, at gener enten negativt eller positivt korreleret med en bestemt miRNA vil være lige så vigtigt, fordi hvert sæt kan indeholde markører for en biologisk status reguleret i modsatte retninger. For eksempel,

E-cadherin

Vimentin

, som positivt og negativt korrelere med ekspression af

miR-200

familie, henholdsvis (

CDH1

og

VIM

i tabel 1), både punkt på EMT-relaterede funktion af

miR-200

. , Foreslog derfor vi, at enten negative eller positive korrelationer selvstændigt kan definere en specifik biologisk status som miRNA eller en gruppe af miRNA.

For at teste denne antagelse, valgte vi top 2000 positive og top 2000 negative korrelationer og de tilsvarende gener for hver af 136 miRNA og udført en hierarkisk klyngedannelse at gruppere de 136 miRNA. Vi valgte 2000 som et cutoff, fordi dette tal dækkede omkring 10% af alle gener, som skulle resultere i fjernelsen af ​​de fleste baggrundsstøj. Til gruppering, som er baseret på parvise sammenligninger repræsenterer skæringen af ​​de gener, der i væsentlig grad korrelerer i deres ekspression med ekspressionen af ​​to forskellige miRNA (figur 4 og figur S3). Når positivt korrelerende gener blev vurderet en række miRNA tæt klynge (figur 4). Tilsvarende mange af de samme miRNA grupperet sammen, når negativt korrelerende gener blev anvendt (fig S3). Selvom mange mekanismer kan være ansvarlig for denne klyngedannelse, vil vi henvise til disse som “funktionelle klynger”.

De miRNA blev inddelt i 13 funktionelle klynger (I-XIII). Information er givet for hver miRNA på væv særligt udtryk, genomisk co-lokalisering, og frø familie. Stiplet linje:. Grænse på 12,5% af grupper, der blev valgt til definerede de 13 klynger

Interessant, alle 5 medlemmer af

miR-200

familie var stramt grupperet i overensstemmelse med deres lignende biologisk aktivitet (klynge i i figur 4 og klynge VI i fig S3). Foruden

MIR-200

, en række andre strukturelt beslægtede miRNA dannede funktionelle klynger ifølge de delte antal af deres effektor-gener. Adskillige frø familier, såsom

miR-181abc

,

miR-19ab

,

miR-221/222

,

miR-103/107

og

miR-135ab

blev grupperet sammen stramt. I modsætning hertil blev der medlemmer af adskillige andre frø familier fundet spredt på tværs af forskellige funktionelle klynger (fx

Lad-7

eller

miR-30

familie). Dette fænomen antydede, at grupperingen af ​​miRNA delvis var baseret på, men ikke begrænset til miRNA frø sekvenser.

gruppering af miRNA i denne analyse blev delvist skyldes, at nogle familiemedlemmer er en del af den samme transkriptionelle enhed. miRNA at aksjer kromosomal co-lokalisering og også findes i de samme funktionelle klynger omfattede transkriptionelle enheder af

miR-106b /93/25

,

miR-17~92

,

miR -194-2 /​​192

,

miR-183~182

,

miR-99b /lad-7e /125a

,

miR-206 /133b

.

i nogle tilfælde miRNA klyngedannelse var baseret på hverken frø match eller den genomiske lokalisering. For eksempel, medlemmerne af både den

miR-141 /200a

miR-200BC /429

frø familier blev grupperet sammen, selv om de udgør to gen-klynger på separate kromosomer (klynge jeg, ” Gene klynge “kolonnen i figur 4).

NCI60 cellelinjer repræsenterer 9 forskellige menneskelige kræftformer. For at bestemme, om den observerede klynger af miRNA skyldtes delvis væv specifik ekspression af enten miRNA eller mRNA, vi identificeret miRNA, der blev fortrinsvis givet udtryk for i en hvilken som helst af de 9 mennesketyper kræft (Tabel S4; Tabel S5). Nogle korrelationer med væv af oprindelse blev fundet. For eksempel, både klynger I (herunder

miR-200

familie og

miR-194

) og XI (herunder

miR-30

familie) indeholdt de fleste af miRNA der er beriget i colon cancerceller (figur 4). Coloncancerceller kan have en mere epitel-lignende karakteristik end de fleste andre cancercellelinjer.

Sammenfattende foreslog disse data, at medens fælles frø sekvenser, kromosomale co-lokalisering og vævsspecifik ekspression sandsynligvis påvirket co- udtryk for miRNA med visse gener og dermed deres gruppering, var mange miRNA grupperet af andre grunde. En vigtig faktor, der bestemmer clustering kunne være den biologiske funktion af en miRNA, da clustering er baseret på skæringspunktet mellem gensæt der positivt korrelerer signifikant med to parrede miRNA. For eksempel,

miR-200

,

-203

,

-375

og

-7

, som er samlet i figur 4 og figur S3 , har ikke den samme frø sekvens, genomisk colokalisering eller specifik ekspression i samme væv. Årsagen til dem at samle synes at være, at de deler lignende biologisk funktion i EMT regulering.

Identifikation af miRNA familier involveret i cellevækst regulering

c-myc

er ikke kun en generel regulator af miRNA funktion og udtryk, men også selv reguleret af miRNA [26], [27]. For at bestemme om gruppering miRNA ifølge identiteten af ​​korrelere gener ville finde forbindelsen mellem miRNA og

c-MYC

anvendte vi lister af gener, der enten opreguleres (460 gener) eller nedreguleret (211 gener) ved

c-MYC

(opnået fra https://www.myc-cancer-gene.org/) og bestemt, hvor mange af dem blev enten positivt eller negativt korreleret med ekspressionen af ​​hver af de 136 miRNA. Resultatet er visualiseret i figur 5. Betydningen af ​​berigelse af korrelerende gener blev bestemt ved udførelse af en Wilcoxon Rank-Sum Test. Signifikansniveauet er angivet ved kasser med forskellige farver. Det er klart, visse klynger af miRNA var positivt, og andre blev negativt korreleret med enten

c-myc

induceret eller

c-myc

undertrykt gener.

Be the first to comment

Leave a Reply