PLoS ONE: Transkriptomet-Wide Analyse af UTR’er i ikke-småcellet lungekræft afslører kræftrelaterede gener med SNV-inducerede ændringer på RNA sekundær struktur og miRNA Target Sites

Abstrakt

Traditionelle metoder mutation vurdering generelt fokus på at forudsige forstyrrende ændringer i protein-kodende regioner snarere end ikke-kodende regulatoriske regioner som utranslaterede regioner (UTR’er) af mRNA’er. De UTR’er, er imidlertid kendt for at have mange sekvens og strukturelle motiver, der kan regulere translationel og transkriptionel effektivitet og stabilitet af mRNA’er gennem interaktion med RNA-bindende proteiner og andre ikke-kodende RNA’er som microRNA (miRNA). I en nylig undersøgelse, transcriptomes af tumorceller huser mutant og vildtype

KRAS

(V-Ki-ras2 Kirsten rotte sarkom viral onkogen homolog) gener hos patienter med ikke-småcellet lungekræft (NSCLC) har været sekventeret for at identificere enkelte nucleotidvariationer (SNVs). Ca. 40% af de samlede SNVs (73,717) er konstateret kortlagt til UTR’er, men udeladt i den foregående analyse. For at imødekomme denne indlysende behov for analyse af de UTR’er, vi designet en omfattende rørledning til at forudsige effekten af ​​SNVs på to store regulatoriske elementer, sekundær struktur og miRNA target sites. Ud af 29.290 SNVs i 6462 gener, vi forudsige 472 SNVs (i 408 gener), der påvirker den lokale RNA sekundær struktur, 490 SNVs (i 447 gener) påvirker miRNA target sites og 48, der gør begge dele. Sammen disse forstyrrende SNVs var til stede i 803 forskellige gener, hvoraf 188 (23,4%), som tidligere var kendt for at være kræft-associerede. Især er dette forhold signifikant højere (ensidet Fishers eksakte test p-værdi = 0,032) end forholdet (20,8%) af kendte cancerassocierede gener (n = 1347) i vores indledende sæt data (n = 6462). Netværk analyse viser, at de gener, huser forstyrrende SNVs var involveret i molekylære mekanismer i kræft, og de signalveje i LPS-stimuleret MAPK, IL-6, iNOS, EIF2 og mTOR. Afslutningsvis har vi fundet flere hundrede SNVs som er meget forstyrrende i forhold til ændringer i den sekundære struktur og miRNA target sites inden UTR’er. Disse ændringer holder potentialet til at ændre ekspressionen af ​​kendte cancer gener eller gener forbundet med cancer-associerede veje

Henvisning:. Sabarinathan R, Wenzel A, Novotny P, Tang X, Kalari KR, Gorodkin J (2014) transkriptom-Bred Analyse af UTR’er i ikke-småcellet lungekræft afslører kræftrelaterede gener med SNV-inducerede ændringer på RNA sekundær struktur og miRNA Target steder. PLoS ONE 9 (1): e82699. doi: 10,1371 /journal.pone.0082699

Redaktør: Akio Kanai, Keio Universitet, Japan

Modtaget: August 2, 2013; Accepteret: 26 oktober 2013; Udgivet: 8. januar 2014

Copyright: © 2014 Sabarinathan et al. Dette er en åben adgang artiklen distribueres under betingelserne i Creative Commons Attribution License, som tillader ubegrænset brug, distribution og reproduktion i ethvert medie, forudsat den oprindelige forfatter og kilde krediteres

Finansiering:. Dansk Center for Scientific Computing (DCSC, DeiC); Danske Strategiske Forskningsråd (Programkomiteen for Strategiske Vækstteknologier); Danske Frie Forskningsråd (Teknologi og Produktion). De finansieringskilder havde ingen rolle i studie design, indsamling og analyse af data, beslutning om at offentliggøre, eller forberedelse af manuskriptet

Konkurrerende interesser:.. Forfatterne har erklæret, at der ikke findes konkurrerende interesser

Introduktion

Næste generations genomsekvensering er nu almindeligt anvendt til identifikation af genetiske variationer i kræft genomer [1], [2]. Ikke-småcellet lungekræft (NSCLC) er den mest almindelige form for lungekræft, og det findes ofte med aktiverende mutationer i

KRAS

onkogen som forårsager tumorcellerne at være aggressiv og modstandsdygtig over for kemoterapi [3] – [5]. I en nylig undersøgelse, Kalari et al. [6] udførte transkriptom hele sekventering af NSCLC og identificerede differentielt udtrykte gener, alternative splejsning isoformer og enkelt nukleotid varianter (SNV) for tumorer med og uden

KRAS

mutationer. Et netværk analyse blev udført med de gener, som viser differentiel ekspression (374 gener), alternativ splejsning (259 gener) og SNV-relaterede ændringer (65 gener), som er differentielt stede i lunge tumor grupper med og uden

KRAS

mutationer . Integreret pathway analyse identificeret NFKB, ERK1 /2 og AKT veje som de væsentligste veje forskelligt liberaliseret i

KRAS

vildtype i forhold til

KRAS

muterede prøver.

A enkelt nukleotid variant (SNV) er en ændring nukleotid i en enkelt base position, der optræder ved en lav frekvens (også omtalt som en sjælden variant). SNVs observeret i tumorceller er for det meste somatiske varianter og meget få er kim-line varianter. Genom-dækkende forening undersøgelser (GWAS) rapporterer, at SNVs meste optræder i ikke-kodende regioner i forhold til kodning (exon) regioner i RNA [7]. I fortiden, men de fleste undersøgelser har været fokuseret på effekten af ​​SNVs i kodning regioner (kendt som cSNVs eller nsSNVs) [8] snarere end effekten af ​​SNVs de lovgivningsmæssige ikke-kodende DNA eller ikke-kodende RNA (rSNV) . I tilfælde af NSCLC, Kalari et al. [6] identificerede i alt 73,717 unikke SNVs stede i og omkring (+/- 5 kb) RefSeq gener. Af disse 23.987 var cSNVs og deres indvirkning på kodende områder er tidligere blevet forudsagt (se [6] for flere detaljer). Virkningerne af rSNVs der er placeret i uoversatte regioner (UTR’er) af protein-kodende gener, dog skal analyseres.

Det er velkendt, at UTR’er spiller afgørende roller i post-transkriptionel regulering herunder mRNA stabilitet [ ,,,0],9], transport [10], lokalisering [11], [12], translationel aktivering [13] og undertrykkelse [14], [15]. Disse funktionelle regler udføres af

cis

reguleringsmyndigheder elementer til stede i 5 ‘og 3’ UTR’er. Navnlig nogle af de

cis

reguleringsmyndigheder er struktureret, fx jern-responsive element (IRE), internt ribosomindtrængningssite (IRES) og selenocystein insertion sekvens (SECIS). Den primære struktur af

cis

reguleringsmyndigheder elementer er også vigtigt for bindingen af ​​

trans

virkende RNA-bindende proteiner eller andre ikke-kodende RNA. F.eks microRNA (miRNA) er små ikke-kodende RNA’er (ca. 22 nt), der binder til målsteder hovedsagelig til stede i 3′-UTR’er. Denne interaktion resulterer i enten spaltningen af ​​mål-mRNA’er eller undertrykkelse af deres oversættelse. Adskillige undersøgelser har rapporteret, at miRNA-medieret genregulering spiller en stor rolle i cancerceller og sådan regulering er blevet betragtet som potentielt mål lægemiddel (se gennemgang [16]). Alt dette beviser understøtter både sekvens og strukturelle motiver af UTR’er værende vigtige for kontrol af genekspression.

Forekomsten af ​​genetisk variation (r) i UTR’er potentielt kunne påvirke deres sekvens og /eller strukturelle motiver og dermed føre til ændringer i post-transkriptionel regulering [17] – [20]. For eksempel kan en SNP i en Lad-7 miRNA målsted (miRTS) i 3’UTR af

KRAS

er blevet identificeret til at påvirke bindingen af ​​lad-7 miRNA. Dette resulterer i overekspression af

KRAS

, hvilket fører til den øgede risiko for NSCLC [21]. Derudover rapporterer nyere undersøgelser, at genetisk variation potentielt kan skabe, ændre eller ødelægge miRNA mål sites, hvilket resulterer i dysregulering af mål-mRNA’et [22], [23]. Især dette er blevet identificeret i tumorceller samt [24]. Desuden er en cancer-drevet tilstedeværende mutation i et IRES i human

p53

mRNA ændrer strukturen af ​​IRES element, som inhiberer binding af en trans-agerende faktor afgørende for oversættelse [25]. Den nylige antal web-servere og databaser, der er udviklet til at håndtere varianter påvirker miRTSs viser også den voksende betydning af målsted varianter [22], [26] – [28].

I denne undersøgelse vi forudsige mulige virkninger af 29.290 SNVs forbundet med NSCLC, der er placeret i de UTR regioner mRNA. Den lokale effekt af SNVs på den sekundære struktur af UTR’er forudsiges ved hjælp RNAsnp [29], og effekten af ​​SNVs på miRTSs i UTR forudsiges ved hjælp Targetscan [30] og Miranda [31], som viste sig at være blandt de mere pålidelige miRNA target forudsigelse metoder [32]. De eksperimentelt identificeret miRNA-mRNA kort, der bruger Argonaute (siden) krydsbinding immunopræcipitation kombineret med high-throughput sekventering (CLIP-Seq), er yderligere anvendes til at reducere de falske positive forudsigelser af miRTSs [33].

Materialer og metoder

Datakilder

De SNVs identificeret ved RNA-sekventering af 15 primære lunge adenocarcinom tumorer (8 med

KRAS

mutation og 7 uden

KRAS

mutation) blev ekstraheret fra Kalari et al. [6]. Det skal bemærkes, at den tidligere undersøgelse [6] havde ingen RNA-sekventering data på normale celler, så det ikke var muligt at adskille SNVs afledt fra kimlinjekonfiguration eller somatisk mutation. Således datasættet opnået, 29.290 UTR SNVs i 6462 kodning gener, der stammer fra både kim-line og somatiske varianter, der blev udtrykt i lunge adenocarcinom tumorer. Baseret på overlapningen af ​​disse SNVs med dbSNP (135 build), kunne vi anslår, at 40% af de 29.290 SNVs er kim-line varianter. For de SNVs der overlapper med dbSNP poster vi også udvindes den SNPs i kobling dis-ligevægt ved hjælp af SNAP-serveren [34] (version 2.2, med default parametre: r

2≥0.8, limit afstand 500 kb, SNP data sæt 1000 Genomer pilot 1, og befolkningen panel CEU).

RefSeq mRNA sekvenser svarende til de 6462 gener (hg19 Build) blev hentet fra UCSC genom browser (https://genome.ucsc.edu) [35 ]. For gener med flere transkripter, blev alle isoformer overvejet. Ved kortlægning af 29.290 SNVs til disse RefSeq mRNA-sekvenser, vi opnåede 3646 i 5 ‘UTR’er, 25.627 i 3’UTR’er og 17 i både 5’ og 3 ‘UTR af overlappende transkripter. Disse SNVs blev yderligere underkastet vores omfattende pipeline (figur 1) til at forudsige deres virkning på RNA sekundære struktur og miRNA målsteder, som er beskrevet i de følgende afsnit.

En liste over cancerassocierede gener blev opnået fra COSMIC [36] og Qiagen /SABioSciences [37]. Listen omfatter 1347 af de 6462 gener overvejes i denne analyse. For at finde den berigelse af gener, der bærer forstyrrende SNVs, som har virkning på sekundær struktur og /eller miRTSs, ved cancer, udførte vi en ensidig Fishers eksakte test. Dette blev beregnet ud fra en 2 × 2 kontingenstabel (n = 6462) med antallet af gener, der bærer /ikke transporterer forstyrrende SNVs på den ene side og antallet af cancerassocierede /andre gener på den anden side. Tilsvarende blev berigelse for forstyrrende SNVs i cancer-associerede gener beregnes ved at klassificere det samlede antal SNVs (n = 29.290) i forstyrrende /ikke-forstyrrende SNVs på den ene side, og dem er og ikke er til stede i cancer-associerede gener på den anden.

Et sæt af eksperimentelt verificerede eksempler på SNPs med virkninger på miRNA target sites er blevet udvundet fra litteraturen (se tabel S1). Disse 19 SNP’er (påvirker 25 miRNA-mRNA interaktioner) er blevet anvendt til at teste filtrering kriterier, der anvendes i miRNA del af vores pipeline.

Forudsigelse af SNVs ‘effekt på RNA sekundær struktur

virkning SNVs på RNA sekundære struktur blev forudsagt ved anvendelse RNAsnp (version 1.1) [29]. De vildtype mRNA sekvenser og SNVs blev givet som input sammen med standard parametre RNAsnp. For hver SNV, RNAsnp betragtes et vindue på +/- 200 nts omkring SNV position til at generere den vildtype (WT) og mutant (MT) undersekvenser og beregnet deres respektive basepar sandsynlighed matricer og. Derefter blev forskellen mellem basepar sandsynligheden for vildtype og mutant struktur målt ved anvendelse euklidiske afstand (d) og Pearson korrelationskoefficient (r) for alle lokale regioner i undersekvensen. For fuldstændighedens skyld vi kort opsummere disse to foranstaltninger som følger. Den første beregner forskellen mellem to matricer direkte af (1) hvor er sandsynligheden for baser

jeg

og

j

bliver parret. Den anden foranstaltning bruger positions–wise par sandsynligheder. For en lokal region, indeholder vektoren elementerne. Så forskellen mellem to vektorer og måles ved (2)

Endelig en lokal region forudsagt med maksimal euklidiske afstand (d

max) eller minimum Pearson korrelationskoefficient (r

min) og den tilsvarende p-værdi derefter indberettes. Vi anvender begge foranstaltninger uafhængigt som begge foranstaltninger holde deres respektive styrker og svagheder (se [29] for detaljer). Vi genererede to lister (hver med p 0,1) af kandidater, d

max og r

min, og hver af dem udsættes for en multiple-test korrektion ved hjælp af Benjamini-Hochberg procedure [38], som begrænser den falske opdagelse sats at være noget mere end en valgt tærskel (typisk 10%).

for at analysere, om RNAsnp forudsagde lokale region er strukturelt bevaret, brugte vi de anmærkninger af bevarede RNA sekundær struktur forudsigelser fra vores in- hus rørledning [39], som gør brug af en række værktøjer, herunder CMfinder [40] og RNAz [41] programmer.

Forudsigelse af SNVs ‘effekt på microRNA målområderne

for hver SNV i datasættet blev en undersekvens af 30 NTS på hver side af SNV position hentes. Desuden blev alle 2042 humane modne miRNA-sekvenser fra miRBase (v19) [42] bruges til at scanne for eventuelle målsteder i vildtype og mutant (med SNV) subsekvenser. Som et første skridt blev Targetscan (version 6.0) [30] bruges til at identificere par SNVs og miRNA for som typen af ​​frø match adskiller mellem vildtype og mutant eller er kun til stede i nogen af ​​dem. De forskellige frø, der anvendes af Targetscan er 7mer-1a, 7mer-m8, og 8mer-1a (i stigende styrke), hvor ‘1a’ refererer til en adenosin i miRTS 3 ’til frø match (dvs. modsat den første nukleotid af miRNA) og “-m8« betegner en Watson-Crick-matchede nukleotidet i position 8. Efterfølgende blev interaktionen energi af disse par beregnet ud Miranda (version 3.3a) [31]. Som et frø match ændring allerede kræves af Targetscan filtrering, blev parametrene for Miranda indstillet til ikke veje frø regionen for høj ( “-skala 2 ‘i stedet for standard 4) og med afslappede cutoffs (score 45, energi -5 kcal /mol), for at fange de tilfælde, hvor en dårlig frø match kan kompenseres. For at klassificere en interaktion som arbejder vi senere anvende en mere konservativ energi grænse på -11 kcal /mol baseret på vores tidligere undersøgelse [43]. For hvert par af miRNA og 61mer, kun de stærkeste bindingssted (lavest), der adskiller sig mellem WT og SNV sekvensen bevares. Formodede interaktioner er klassificeret som

skabt

,

ødelagt

eller

ændret

ved mutation baseret på miranda forudsigelser.

skabe

sæt indeholder mål websteder, der er fremkaldt af SNV, dvs, har en interaktion energi på -11 kcal /mol eller lavere i SNV variant mens ingen interaktion er forudsagt i vild-type (enten grund til at score eller tærskel energi). Tilsvarende vil et tab af målområde registreres i

ødelægge

sæt, hvis interaktionen er forudsagt for vild-type, men ikke med SNV. Endelig

ændre

Sættet består formodede samspil, der forudsiges med en bindingsenergi på højst -11 kcal /mol for mindst én variant. For disse blev energiforskellen observeret for binding af miRNA før og efter SNV introduktion målt som deres log-forhold

LR

= ld (/), for 0.

lr

er 0, hvis der ikke er nogen ændring i energi; negativ, hvis vildtype har stærkere interaktion (lavere energi), positiv ellers. I betragtning af størrelsen af ​​datasættet, vi fokuserer på (øverst) kandidater, hvis absolutte

lr

værdien er over gennemsnittet (μ) af absolut

lr

værdier fra alle par, der er klassificeret som alter. Effektiviteten af ​​denne tærskel klart varierer med de data, men det vil altid beholde de øverste kandidater med højeste relative energi forskel. Selv om det ikke skal ses som en fast cut-off, vi anvendt det til vores sæt af kendte eksempler, hvor 14 ud af 23 interaktioner overskrider den værdi, vi anvendte her (se tabel S1). Tærskelværdier baseret på den fordeling af MFE ændringer er blevet brugt på en lignende måde før [24].

For at reducere falske positive forudsigelser, de miRNA target sites forudsagt for vildtype (

ødelægge

eller

ændre

) blev krydstjekket med eksperimentelt identificerede microRNA-target interaktion kort. Disse data, der er afledt gennem Ago CLIP-Seq, blev hentet fra starbase [44]. Kun SNVs, der er placeret inde i strenge Ago CLIP-Seq peak klynger med et biologisk kompleksitet (BC) på mindst to blev tilbageholdt. Dette filter kan ikke bruges til interaktionerne fra

oprette

sæt, som CLIP-Seq data er tilgængelige for den eneste vildtype.

Endelig sæt miRNA blev filtreret for dem, der udtrykkes i luftvejene (lunge og trachea) ifølge miRNA organ kort [45]. Oversigten for miRNA-analyse er beskrevet i figur 2.

flowdiagram viser de forskellige trin i forudsigelse og filtrering med antallet af individuelle SNVs, miRNA, og par af disse på hver etape.

Fra PhenomiR [46] database, vi hentede oplysninger om miRNA, der har vist sig at være op- eller nedreguleret i lungekræft. Dette sæt består af 264 individuelle miRNA stem-loop tiltrædelser, hvoraf 3 er “døde poster”. De resterende 261 stamceller-loops giver anledning til 430 modne miRNA produkter, som vi refererer til som

lungekræft-associerede miRNA

. I dette datasæt, 27 miRNA er specifikke for NSCLC [47] -type ifølge miRNA organ kort [45]. Den senere datasæt er nævnt som

NSCLC-associerede miRNA

.

Opfindsomt Pathways Analyse

Interactome netværk af kandidatgener blev konstrueret ved hjælp Ingenuity Pathway Analysis (IPA) software (Opfindsomhed ® Systems, www.ingenuity.com; opbygge udgave: 220.217; indhold udgave: 16.542.223). Netværk generation er baseret på den globale Molekylær Network “i IPA, som omfatter en omfattende, manuelt kurateret sæt gen-gen relationer baseret på resultaterne fra den videnskabelige litteratur. Generne af interesse (kandidater sat ud af vores pipeline og bruges som input til IPA), der også er til stede i dette globale netværk er de såkaldte fokus gener. Meget-sammenkoblet fokus gener er udgangspunktet i netværk generation. Yderligere ikke-fokus gener fra Global Molekylær Network kan anvendes som linker gener mellem små netværk. Netværk er forlænget til en omtrentlig størrelse på 35 gener, som anses for optimal for visualisering og fortolkning (for detaljer se [48]). Den p-værdi beregnes for hvert netværk repræsenterer sandsynligheden for at finde den samme (eller højere) antal fokus gener i en tilfældigt udvalgt sæt af gener fra det globale netværk. Det beregnes ved en højre-tailed Fisher Exact Test med (ikke-) fokus molekyler på den ene side og molekyler (ikke) i netværket på den anden side af en 2 × 2 kontingenstabel. Dette omdannes til en score, som er den negative log af p-værdien. Endvidere blev IPA anvendes til at identificere de bedste sygdomme og lidelser, molekylære og cellulære funktioner og kanoniske pathways associeret med generne i vores kandidat sæt (såkaldte »Focus gener”). P-værdi for en given (sygdom, funktion eller pathway) annotation beskriver sandsynligheden for, at associationen mellem input gensæt og annoteringen skyldes tilfældig chance. Dette er også baseret på en højre-tailed Fishers eksakte test som specificeret ovenfor.

Resultater

Effekt af SNVs på RNA sekundær struktur

De strukturelle effekter af 29.290 UTR SNVs var forudsiges ved hjælp RNAsnp (v1.1). Både den euklidiske afstand (d

max) og Pearson korrelationskoefficient (r

min) foranstaltninger af RNAsnp (mode 1) blev uafhængigt anvendt til at forudsige effekten af ​​SNVs på lokal RNA sekundære struktur. Fordelingen af ​​p-værdier beregnet for 29.290 UTR SNVs er vist i figur S1A. På et signifikansniveau på 0,1 (valgt fra vores tidligere undersøgelse [29]), blev 3237 og 3062 SNVs forudsagte henholdsvis ved d

max og r

min foranstaltninger. Endvidere justering for multiple sammenligninger (ved hjælp Benjamini-Hochberg procedure [38]), forudsat 3204 og 1813 SNVs respektive til d

max og r

min foranstaltninger. Efter at sammensmelte disse to lister, fik vi 3561 unikke SNVs i 2411 gener.

Desuden vi beregnet afstanden mellem placeringen af ​​disse 3561 SNVs og den forudsagte lokale område, hvor blev opdaget den maksimale strukturelle ændringer (figur S1B) . Det viser, at størstedelen af ​​de SNVs forårsager strukturelle ændringer i og omkring SNV position. Desuden er længden fordeling af den forudsagte lokale region viser, at størstedelen af ​​SNVs har virkning på den lokale region af størrelse 50 til 100 nts imidlertid visse SNVs (n = 47) har effekt på en global struktur, hvor størrelsen af ​​forudsagte lokale region overstiger 300 NTS (figur S1c). Desuden kontrolleres vi om disse forstyrrende SNVs er beriget i GC eller AU rige regioner, som sekvenser med sådan forudindtaget nukleotid indhold har vist mere følsomme over for strukturelle ændringer forårsaget af mutationer [49]. For hver SNV beregnet vi GC indholdet af flankerende regioner (som tidligere bruger 200 NTS op- og nedstrøms), se Materialer og metoder. Dette viste, at både data sæt SNVs og forstyrrende SNVs er stærkt beriget i regionerne med GC-indhold spænder fra 40 til 60 procent (se figur S2), som derfor bør gøre dem mindre følsomme over for variationer. Desuden fandt vi, at der var ingen signifikante forskelle mellem GC indhold fordelinger af forstyrrende SNVs og data sæt SNVs (se figur S2 med Kolmogorov-Smirnov).

Det er kendt, at UTR’er af mRNA harbour evolutionært bevaret regulatoriske elementer ([50] – [52], gennemgår se også [53], [54]). Således har vi krydstjekket for overlapning mellem forstyrret lokale region forudsagt af RNAsnp og den bevarede RNA sekundære strukturer forudsagt ved hjælp af vores in-house pipeline [39] (se Materiale og Metoder sektioner for detaljer). Interessant, den lokale region forudsagt for 472 SNVs (p-værdi 0,1) overlapper med de forudsagte bevaret RNA sekundære strukturer. Disse 472 SNVs svarer til 408 gener; hvoraf 111 SNVs svarer til 98 gener, der er involveret i kræft-associerede veje (se Fil S1.xlsx)

Baseret på p-værdi, blev ovennævnte 111 SNVs yderligere inddeles i to grupper:. 28 som high-tillid, for hvilke både d

max og r

min p-værdi 0,05 (tabel 1), og den anden 83 som medium-tillid (enten d

max eller r

min p -værdi 0,1) (se File S2.xlsx). Vi forudser, at de SNV-inducerede strukturelle ændringer i UTR regioner potentielt kan påvirke stabiliteten af ​​mRNA eller forstyrre funktionen af ​​regulatoriske elementer til stede i UTR’er. For eksempel SNV A2304C (tabel 1) til stede i 3’UTR af

MAPK14

mRNA viser en væsentlig strukturel ændring (p-værdi: 0,0076) i den lokale RNA sekundære struktur, som er strukturelt konserveret i henhold til både CMfinder og RNAz forudsigelser fra vores interne pipeline [39]. Denne strukturelle bevaring viser, at regionen er under evolutionære pres for at opretholde den struktur, som forventes at have en vis funktionel betydning. Proteinet kodet af

MAPK14

gen er et medlem af MAP-kinase-familien, som er kendt for at være involveret i mange veje relateret til celledeling, modning og differentiering (gennemgået i [55]). Også er det blevet forudsagt til at være en af ​​de centrale aktører i lungekræft interactome [6]. Således ændring i genekspression af

MAPK14 dele på en post-transkriptionel niveau på grund af SNV-inducerede strukturændringer kan potentielt påvirke MAKP14-relaterede signalveje.

Som en anden eksempel genet

GPX3

er ansvarlig for kodning af plasma glutathionperoxidase, en antioxidant enzym, der indeholder selenocystein i sin aktive sted og katalyserer reduktionen af ​​hydrogenperoxid. Aminosyren selenocystein kodes af UGA codon, som normalt fungerer som en stopkodon. I

GPX3

mRNA, den alternative anerkendelse af en UGA-codon som selenocystein codon medieres af

cis

virkende regulatorisk element, selenocystein indsættelse sekvens (SECIS), til stede i 3 ‘ UTR og andre

trans

virkende co-faktorer [56]. Den SNV U1552G (tabel 1) placeret i 3’UTR af

GPX3

mRNA blev forudsagt at forårsage betydelig strukturel effekt (p-værdi: 0,0474) i den lokale region, som indeholder SECIS regulatoriske element. Figur 3 viser basepar sandsynligheder svarende til den lokale region (NM_002084: 1544-1692) af vildtype og mutant mRNA. Det kan ses, at vild-type har højere basepar sandsynligheder for at danne stabile stamme-loop-struktur i SECIS (fremhævet med en cirkel i figur 3), mens den i den mutante form er forstyrret på grund af SNV, som er placeret uden for SECIS region. Tidligere undersøgelse har vist, at den karakteristiske hårnåle-struktur SECIS er afgørende for effektiviteten af ​​UGA omkodning

in vivo

in vitro

[56]. Baseret på dette, vi spekulere, at SNV U1552G inducerede strukturelle ændringer i secis-element kan påvirke effektiviteten af ​​UGA omkodning.

dot plot fra RNAsnp webserver [67] viser basepar sandsynligheder svarer til den lokale region forudsiges med signifikant forskel (

d

max

p-værdi: 0,0474) mellem vildtype og mutant. Den øverste trekant repræsenterer de basepar sandsynligheder for vildtype (grøn) og den nedre trekant for mutanten (rød). På siderne er den mindste fri energi (MFE) struktur vildtype og mutanter vises i plane grafisk repræsentation. Den SECIS region er fremhævet i blå cirkel og SNV positionen er angivet med pilen.

Desuden overvejer både sæt af høj selvtillid og mellemstore tillid SNVs, fandt vi, at generne (n = 15) anført i tabel 2 havn mere end én forstyrrende SNV i den forudsagte konserverede strukturelle region af mRNA. For eksempel genet

ID2

koder for DNA-bindende protein inhibitor ID-2, som er en kritisk faktor for celleproliferation og differentiering i normalt hvirveldyr udvikling. Overekspression af ID-2-protein ofte observeres i forskellige humane tumorer, herunder NSCLC [57]. I mRNA sekvens af

ID2

gen, to SNVs placeret i 5 ‘UTR region blev uafhængigt forudsagt at forårsage betydelig lokal strukturel ændring i den konserverede region. Tidligere undersøgelser har vist, at SNP eller mutation induceret strukturelle ændringer i 5’UTR’er kan føre til ukontrolleret oversættelse eller overekspression af de respektive proteiner [58], [59]. Vi forudser, at de to SNVs der forårsager betydelig ændring i strukturelt konserverede region kan påvirke translationseffektiviteten af ​​

ID2

mRNA.

Ud af de 472 forstyrrende SNVs opnået fra den sekundære struktur analyse (før skærer med kræft-associerede gener), 199 overlapper med SNPs fra dbSNP (bygge 135). Af disse 199 SNVs, 17 er i kobling dis-ligevægt (LD) med andre SNPs, der er placeret proksimalt (+/- 200 NTS) til SNV position. Disse 17 par blev testet med RNAsnp at kontrollere, om SNP i LD med (forstyrrende) SNV er en struktur-stabiliserende haplotype [60]. Af disse 17 par, fem blev forudsagt at forårsage væsentlige strukturelle ændringer, som kunne være mulige struktur-stabiliserende haplotyper; mens de øvrige 12 par har vist væsentlige strukturelle ændringer (se File S3.xls).

Effekt af SNVs på microRNA målområderne

Screening alle menneskelige modne miRNA mod alle identificerede SNVs med flankerende sekvens udbytter 2 × 59.810.180 mulige kombinationer. Den indledende Targetscan trin er en konservativ filter og reducerer sæt af SNV-miRNA par til 0,2% af dette. Vi derefter anvende Miranda som andet target forudsigelse metode efterfulgt af et sæt filtre. Fordelingen af ​​

lr

værdier i

ændre

sæt er vist i fig S3, eneste tilfælde med relative ændringer er større end de beskrevne afskåret anses (se materialer og metoder). Figur 2 viser de forskellige trin med individuelle tællinger af formodede interaktion steder på hvert trin. Det giver os 490 SNVs i 447 gener forudsagt at påvirke 707 interaktioner med 344 miRNA (se Fil S4.xlsx). Efter krydset med kendte cancer-associerede gener (sidste trin i støbeskeen, figur 1), finder vi 124 SNVs og 148 miRNA at være involveret i 186 interaktioner, der adskiller sig med mutationen. Disse SNVs der inducerer formodede miRTS ændringer kan yderligere inddeles i dem, der styrker interaktionen med mutanten (80) eller vildtype (52) variant.

Tabel 3 angiver alle gener, der indeholder mere end én miRTS forudsiges at være ændret mellem vildtype og SNV. Dette omfatter eksempler, hvor det samme SNV Ændrer målområdet til forskellige modne miRNA fra samme familie, men også eksempler, hvor forskellige SNVs inden for genet forårsager en gevinst eller tab af en miRTS. Ligeledes er alle miRNA med mere end to ændrede målsteder præsenteret i tabel 4. Det viser medlemmer af MIR-29 familien som tidligere er blevet rapporteret at virke som tumorsuppressorer samt oncogener (se [61] for en gennemgang).

af de 148 miRNA (ansvarlig for 186 formodede interaktioner) i vores endelige kandidat sæt, 89 er

lungekræft-associerede miRNA

(i 117 interaktioner) (angivet i File S4.xlsx). Tabel 5 viser alle 14 formodede målområder i vores endelige kandidat sæt, der omfatter

NSCLC-associerede miRNA

. Især listen omfatter fire miRNA med mere end én forudsagt mål ændret. For miR-184 en målsted er skabt, mens en anden er svækket ved indføring af mutationen. Desuden er MIR-30a, d, og e forudsiges at målrette 3’UTR af

SUZ12

gen. Men de forudsagte interaktioner kan forventes at være funktionel i vild-typen og tabt i mutanten grund SNV-inducerede ændringer i frøet region. SUZ12 er tidligere blevet vist at være rettet direkte af MIR-200b og inhibering af dette miRNA øger dannelsen af ​​kræft stamceller (CSCS) [62], som bidrager til tumor aggressivitet. Tabet af miR-30 regulering af (en af) de tre tilstødende SNVs i frø af målområdet kunne have en lignende effekt i NSCLC.

Desuden er der for 48 SNVs fandtes de forudsagte miRTSs at være placeret inde i lokale region, hvor en betydelig sekundær strukturel ændring blev forudsagt af RNAsnp. Af disse blev 15 SNVs placeret i cancer-associerede gener (se tabel 6). Baseret på de tidligere undersøgelser [63], [64], vi spekulere, at SNV-inducerede miRTS ændrer sammen med de sekundære strukturelle ændringer i og omkring miRTS kan potentielt påvirke bindingen af ​​forudsagt miRNA.

Be the first to comment

Leave a Reply