Abstrakt
Nylige undersøgelser, der anvender high-throughput sekventering teknologier har identificeret flere gentagne muterede gener og veje i flere kræft genomer. Men transkriptionelle konsekvenser fra disse genomiske ændringer i kræft genomet fortsat uklare. I denne undersøgelse, vi udførte integrerede og komparative analyser af hele genomer og transcriptomes af 22 hepatitis B virus (HBV) relaterede hepatocellulært karcinom (HCCs) og deres matchede kontroller. Sammenligning af hele genomet sekvens (WGS) og RNA-Seq afslørede mange beviser, at forskellige typer af genomiske mutationer udløste forskellige transkriptionelle ændringer. Ikke kun splejse-site-mutationer, men også tavse mutationer i kodende regioner, dybe intron mutationer og strukturelle ændringer forårsaget splejsning aberration. HBV integrationer genereret forskellige mønstre af virus-menneskelig fusion udskrifter afhængigt berørte gen, såsom
TERT
,
CDK15
,
FN1
og
MLL4
. Strukturelle variationer kunne køre over-ekspression af gener, såsom Wnt ligander, med /uden at skabe genfusioner. Ved at tage hensyn til genomiske mutationer forårsager transkriptionelle afvigelser, kan vi forbedre følsomheden af skadelige mutation opdagelse i kendte cancer driver gener (
TP53, AXIN1, ARID2, RPS6KA3
), og identificerede tilbagevendende forstyrrelser i formodet cancer driver gener såsom
HNF4A
,
CPS1
,
TSC1
og
THRAP3
i HCCs. Disse resultater viser, genomiske ændringer i kræft genomet har forskellige transkriptom effekter og integreret analyse af WGS og RNA-Seq kan lette fortolkningen af et stort antal af genomiske forandringer påvist i kræft genom
Henvisning:. Shiraishi Y, Fujimoto A, Furuta M, Tanaka H, Chiba Ki, Boroevich KA et al. (2014) Integreret Analyse af Whole Genome og Transkriptomet sekventering afslører Diverse transkriptom Afvigelser Drevet af somatiske genomiske Ændringer i Lever Kræft. PLoS ONE 9 (12): e114263. doi: 10,1371 /journal.pone.0114263
Redaktør: Chad Creighton, Baylor College of Medicine, USA
Modtaget: 28. maj 2014; Accepteret: 5. november 2014 Udgivet: December 19, 2014
Copyright: © 2014 Shiraishi et al. Dette er en åben adgang artiklen distribueres under betingelserne i Creative Commons Attribution License, som tillader ubegrænset brug, distribution og reproduktion i ethvert medie, forudsat den oprindelige forfatter og kilde krediteres
Data Tilgængelighed:. Det forfattere bekræfter, at alle data, der ligger til grund resultaterne er fuldt tilgængelige uden restriktioner. Somatisk mutation data blev deponeret til ICGC database (https://dcc.icgc.org/), som er frit tilgængelig. Sequence rå datafiler WGS og RNA-Seq er blevet deponeret i den europæiske Genome-Phenome Arkiv under tiltrædelsen kode EGAD00001001035, og deres adgang styres af ICGC DACO
Finansiering:. Finansiering af dette arbejde kom fra Riken præsidentens Fond 2011, Princess Takamatsu Cancer Research Fund, Takeda Science Foundation, Grand-i Støtte til videnskabelig forskning om innovative områder (Integrative Systems Forståelse af kræft for Avancerede Diagnose, Terapi og forebyggelse), og Grant-in-Aid for Unge Forskere ( B) 24700272. de finansieringskilder havde ingen rolle i studie design, indsamling og analyse af data, beslutning om at offentliggøre, eller forberedelse af manuskriptet
konkurrerende interesser:.. forfatterne har erklæret, at der ikke findes konkurrerende interesser
Introduktion
Hvert år mere end en halv million mennesker verden over er diagnosticeret med hepatocellulært carcinom (HCC), den femte og syvende mest almindelige kræftform hos mænd og kvinder henholdsvis [1]. I de fleste tilfælde HCCs udvikles efter hepatitis eller skrumpelever forårsaget af hepatitis B virus (HBV) infektion, hepatitis C-virus-infektion, alkoholisme eller metaboliske sygdomme, hvoraf HBV er den mest afgørende faktor, især i Sydøstasien og syd for Sahara Afrika [1]. Selv om der er påvist forskellige genetiske vekslen i HCCs, såsom mutationer af
TP53
CTNNB1
koder β-catenin [2], yderligere detaljeret karakterisering af leverkræft genom er nødvendig for identifikation af biomarkører for personaliseret medicin og mere effektiv terapeutisk lægemiddeludvikling.
Nylige fremskridt i high-throughput sekventering teknologi giver os mulighed for omfattende påvisning af somatiske mutationer i kræft genomer [3] og high-throughput sekventering af HCC genomer har afsløret flere roman kræft driver gener såsom kromatin regulatorer [4], [5] og tilbagevendende virus integrationer på
TERT
MLL4
loci [4], [6] – [8]. Aktuelle genomiske studier fokuserer primært på mutationer i kodende regioner, og andre typer af mutationer, såsom base-substitutioner eller indels i ikke-kodende områder, og strukturelle variationer (SVS) er normalt ignoreret, da deres indvirkning på udviklingen af kræft er vanskeligt at vurdere og fortolke indtil nu. En metode til evaluering af deleteriousness af disse mutationer er at kontrollere de transkriptionelle konsekvenser af disse genomiske forandringer. Til dette formål, bredere forståelse af forholdet mellem genomiske mutationer og transkriptionelle afvigelser i kræft genomet er nødvendige. Flere eksempler på splejsning afvigelser [9], [10] og gen-fusioner [11] forårsaget af genomiske mutationer er kendt, og undersøgelser med anvendelse af de seneste high-throughput sekventering data identificerede cancer-specifikke transkriptionelle afvigelser i flere kræfttyper [12], [13 ]. Men der er stadig få undersøgelser, der systematisk sammenligne genomiske mutationer og transkriptionelle afvigelser fra hele genomet sekventering (WGS) og transkriptom sekvensering (RNA-Seq) data. Som sådan, vi stadig har lidt viden om landskabet af kræft transkriptom og dens relationer med somatiske mutationer.
Tidligere vi sekventeret og analyseret WGS af 27 forskellige typer af leverkræft [4], men effekten af stor del af diverse somatiske mutationer, herunder ikke-kodende mutationer og SV’er, var næppe til at fortolke kun ved hjælp af WGS data. Derfor i denne undersøgelse har vi tilføjet flere WGS og deres tilsvarende RNA-Seq data, helt fra 22 HBV-relateret HCC prøver, for at bestemme de genetiske ændringer sammen med deres transskriptionelle konsekvens. og vi udførte sammenlignende og integrerede analyser af deres WGS og RNA-Seq data (se fig. 1A til oversigten af undersøgelsen). Først identificerede vi en række somatiske genomiske begivenheder, herunder punktmutationer, korte indels, SV’er og HBV integrationer fra WGS-data. Så efter systematisk karakteriserer kræft-specifikke transkriptom afvigelser, såsom forskellige typer af splejsning ændringer (exon springer, splejse-site glider, pseudo-exon indeslutninger og intron-tilbageholdelser, se fig. 1B), gen fusioner, herunder dem, der involverer HBV-sekvenser over -expression begivenheder og nukleotidændringer på RNA-niveau, undersøgte vi forholdet mellem detekterede genomiske og transkriptomisk ændringer. Endelig giver en profil af genomiske mutationer og transkriptionelle afvigelser, vi diskuterer fordelene ved integreret analyse af WGS og WTS til følsom påvisning af kræft driver gener.
(A) Først vi opdaget forskellige typer af genomisk og transkriptom ændringer fra RNA-Seq data for 22 HCCs. De karakteriserede ændringer detekteres af hver analyse blev sammenlignet for at afsløre virkningen af somatiske genomiske ændringer på transkriptomisk aberrationer. (B) De fire typer af splejsning aberrationer defineret i denne undersøgelse. Grønne linjer og pile viser normal transskription mens røde linjer og pile viser afvigende transskriptioner.
Resultater
somatiske begivenheder opdaget af WGS
Vi udvundet DNA fra 22 frosne HBV relaterede HCC væv og deres matchede normale lymfocytter, og sekventeret hele deres genomer ved massiv parallel sekventering. Klinisk og patologisk information er vist i tabel S1 i S1 Fil. Gennemsnitlige sekventering dybder af kræft og kontrol (lymfocytter) genomer var 36,8 × og 29.9x henholdsvis efter fjernelsen af PCR gentagelser (Tabel S2 i S1 File). I alt blev der opdaget 209,055 (3,597-19,063) somatiske udskiftninger (tabel S4 i S1 File). Blandt dem, til 1.096 missense, 32 nonsens og 35 splejsnings-site mutationer i protein-kodende regioner, blev identificeret, hvor splejsnings-site mutationer blev defineret være de påvirker splejsningsacceptor og donorsteder placeret ved den første og sidste to baser af en intron sekvens (essentielle splejsnings-sites). Af de 5.725 indels identificeret i de hele genomer, 105 var placeret i protein-kodende regioner og seks berørte væsentlige splejsning-sites. De afledte driver gener i rækkefølge statistisk signifikans for fornyet var
TP53
,
ARID2
,
BRD7
,
HNF4A
RPS6KA3
(
P
-værdi 0,001, tabel S5 i S1 File). Desuden blev 2.254 SV’er (15-577 per tumor) opdaget, 1168 hvoraf påvirkede kommenterede protein-kodende gener. Desuden blev 86 (0-12 pr tumor) HBV integrationer identificeret med 2 og 5 tilbagevendende integrationer på
TERT
MLL4
loci, henholdsvis, hvilket stemmer overens med tidligere undersøgelser [4] [6], [7], [8].
Splejsning afvigelser relateret med genomiske mutationer
Totale RNA’er ekstraheret fra de frosne 22 HCCs og deres tilstødende ikke-kræft levervæv var underlagt RNA-Seq, og dens resumé er vist i tabel S3 i S1 File.
først undersøgte vi status udskrifter omkring væsentlige splejse-site-mutationer ved manuelt at kontrollere justeringer af sekvens læser. Efter at have udelukket udskrifter uden udtryk, vi observerede enkelte eller flere splejsning afvigelser for 19 ud af de resterende 24 essentielle splejse-site-mutationer (3 splice-site glider, 6 exon springer, og 13 intron tilbageholdelser, figur S1 i S2 Filer, Table S6 i S1 File), hvilket indikerer, at de somatiske mutationer ved væsentlige splejsning-sites viste stærke effekter på splejsning afvigelser som forventet. Berørte gener inkluderet gentagne muterede gener fra WGS-analyse (
TP53, ARID2, HNF4A
og
RPS6KA3
) samt
AXIN1
.
For at få en omfattende liste over kræft-specifikke splejsning afvigelser, systematisk opdaget vi fire typer splejsning afvigelser (splejse-site slip, exon springe, pseudo-exon inklusion og intron fastholdelse, fig. 1B) ved hjælp af internt udviklede algoritmer (se Materialer og metoder ). Samlet set blev 292 splejsning aberrationer begivenheder (26 splejse-site glider, 41 exon springer, 77 pseudo-exon indeslutninger og 148 intron tilbageholdelser) registreres (tabel S7 i S1 File). Da vi udførte ikke-retningsbestemt RNA-Seq, diskriminere mellem intron fastholdelse og kræft-specifikke antisense transskription var svært, og dermed resultaterne af intron tilbageholdelser bør nøje fortolkes. Denne liste omfattede aberration begivenheder, der svarer til de 10 essentielle undersøgte ovennævnte splejsning-sites. PCR og Sanger-sekventering valideret 154 stærkt cancerspecifikke splejsningsbegivenheder ud af 239 detekteres. For 72 begivenheder, vi bekræftede mål splejsning afvigelser for både kræft og ikke-kræft levervæv.
Ud over væsentlige splejse-site mutationer, vi identificeret forskellige typer af mutationer og korte indels der synes at være de direkte årsager af de observerede splejse afvigelser, gennem at ændre redigere afstande på splejsning donor eller acceptor motiver. Tre mutationer nær exon-intron junctions ( 10 bp), men ikke i den afgørende splejse-site forårsagede splejsning afvigelser (figur 2A, B, og C.). Tre mutationer i kodende regioner, som sandsynligvis genererede hidtil ukendte splejsealleler donor motiver, forårsaget splejsnings-site glider (fig. 2D, E og F). En mutation påvirker
LAMB2
gen var synonymt. To pseudo-exon integration begivenhed, der påvirker
THRAP3
og
TSC1
syntes at være udløst af somatiske mutationer dybt inde introner proksimalt til den nye splejsning samlingspunktet (fig. 2G, og H). Desuden syv exon springer, hvis berørte gener omfattede flere tumorsuppressorgener såsom
IQGAP2
,
ST7
og
TP53
, havde lange sletninger mellem krydset punkter (Fig. 2I, J og K). Desuden otte intron tilbageholdelser havde omlejringer i de tilsvarende introner, fx
RB1
(fig. 2 I). De viser, at forskellige typer af splejsning afvigelser ofte er drevet af ikke kun vigtige splejse-site-mutationer, men også mutationer i kodende regioner, herunder synonyme stille mutationer, dybe intron mutationer og SV’er. På den anden side, havde en stor del af splejsning aberrationer (239/292 = 81,8%) ikke har proksimale mutationer (inden for 1 kb) eller SVS (ca. 500 kb). Nogle af disse er sandsynligvis syntes at være forårsaget af epigenetiske ændringer [14], eller udtryksmæssige ændringer i anti-sense udskrifter som nævnt ovenfor.
exoniske og intronsekvenser er udpeget af store og små bogstaver, henholdsvis. Røde sekvenser er somatiske mutationer i HCCs. Blå og grønne numre på siden af sekvenser er rediger afstande fra splejsning donor motiv (AG | GTRAGT, [38]) og splejsningsacceptor motiv (YYYYNCAG | G), hhv. De fleste somatiske mutationer ændret redigeringen afstand til splejsning donor motiver, så den tilsvarende ændring kan forbedres.
Fusion udskrifter relateret med genomiske SV’er
For at detektere genfusioner med fremavlet udskrifter og /eller virale sekvenser, såsom HBV, anvendte vi Genomon-fusion (se Materialer og fremgangsmåder). Vi har registreret 245 kandidater af menneske-menneskelige fusion udskrifter og 192 genfusioner efter fjernelse overflødige splejsning varianter (figur S2 i S2 File og tabel S8 i S1-fil), 66 som involverede udskrifter uden gen annotation (UCSC kendte gener, RefSeq, Ensemble) , og 21 af disse var un-splejsede fusion udskrifter deler de breakpoints med deres tilsvarende genomiske SV’er (Figur S3 i S2 File). RT-PCR, efterfulgt af Sanger-sekventering valideret 113 (71,9%) af 157 fusionstranskripter.
Gennem sammenligning med WGS data blev fundet 83 genfusioner, der skal støttes af somatiske SV’er på de tilsvarende genomiske placeringer (figur S4 i S2 fil). Mens nogle af genfusioner uden observeret tilsvarende SV’er kan tilskrives enten falsk positive for genfusioner i RNA-Seq analyse eller falske negativer for SV’er i WGS analyse, forhold for ekspressionsvektorer værdier af fusionstranskripter at der foreligger mindre sub-kloner med upåviselig tilhørende SV’er (Figur S5 i S2 File). Vi har detekteret også 147 genfusioner i ikke-tumor levervæv (tabel S9 i S1-fil), hvoraf mange involverede gener med ekstremt høje udtryk værdier i leveren væv, såsom
ALB
,
HP
og
TF
, hvilket antyder, at fundne fusion udskrifter kan også stamme fra SV’er nærede inden mindre sub-klonal leverceller (Figur S5 i S2 File).
Blandt dem,
NBEAP1 Hotel (
BCL-8
) fusion udskrifter blev gentagne opdaget og valideret i to HCCs, med overekspression specifikke for begge præparater (fig. 3 og figur S6 i S2 File). Omlejringer involverer
BCL-8
locus med overekspression blev rapporteret at forekomme i omkring 4% af diffust storcellet-celle lymfom [15]. Mange fusion udskrifter påvirker kromatin modifikation pathway gener (
CHD4
,
CTCF
,
KDM4C
HDAC4
) blev opdaget, og fusion udskrifter med kendt tumor suppressor gener (
TSC1
og
SUFU
), en komponent i den afgørende NF-KB-modulator (
IKBKB
), og et centralt meditator af WNT signalvejen (
TCF7L1
) blev også godkendt [16]. Selv om der ikke specifikke overekspression resulterede fra disse genfusioner, spekulere vi flere af dem har et tab af funktion natur selvom tabet af fysiologisk vigtige domæner (Figur S7 i S2-fil).
Blå og røde bjælker viser FKPMs for HCCs og den tilsvarende ikke-kræft leveren henholdsvis som beregnes ved RNA-Seq data. Røde cirkler angiver prøver med HBV integrationer på loci af de overudtrykte gener. Grønne cirkler angiver dem med gen-fusioner og /eller SV’er der kan køre gen overekspression.
HBV integration og dens virkninger på transskription
Samlet set blev der påvist 33 HBV-menneskelige fusioner , herunder dem, der påvirker
TERT Hotel (2 prøver) og
MLL4 Hotel (5 prøver), og WGS kunne finde associerede HBV integration sites for 23 af disse 33 fusioner (tabel S10 i S1 fil). HBV integrationer med tilhørende genfusioner tendens til at have breakpoints koncentreret omkring det geometriske sted for HBX gener (1770 bp-1830 bp) i den positive retning (fig S8 i S2 fil), som tidligere rapporteret [8].
Interessant , 7 diskrete HBV
-tert
blev påvist fusion udskrifter i én prøve (RK010), som syntes at være afledt af en HBV-integration sted (fig. 4A). 4 ud af de 7 varianter er udledes at være i ramme. RK166 havde HBV integration lige før transskription start-steder af
TERT
, der genererede den fulde
TERT
udskrift direkte forbundet til HBV sekvens (figur S9 i S2 fil). Begge prøver udviste en markant overekspression af
TERT
sammenlignet med andre prøver (fig. 3). En HBV
-CDK15
gen fusion påvist i RK050 havde også flere fusion udskrifter herunder en i-frame fusion, som forårsagede
CDK15
overekspression (figur S10 i S2 File). De breakpoints af splejsede HBV-menneskelige fusion udskrifter var koncentreret på HBV-genomet koordinat 458bp. Vi kalder denne position HBV fusion splejsning hotspot.
(A) Syv
blev påvist HBV-TERT
fusion udskrifter i RK010. En transskript var en un-splejset transkript med samme breakpoint som den genomiske integration breakpoint. De andre eksisterede i splejsede former og GT-AG splejsning motiver blev observeret ved breakpoints af alle, men en. Udover HBV fusion splejsning hotspot (458 bp), blev 3 fusion udskrifter splejset ved koordinat 1634 bp koordinater HBV-sekvenser. En fusion transcript omfattede en nyligt genererede 87 bp pseudo-exon-sekvens samt subsekvens exon sekvenser. (B) HBV integrationer i
MLL4
loci og deres deraf følgende fusion udskrifter i fem prøver. Grønne trekanter på genomet sekvens viser HBV integrationssteder. De fleste fusion udskrifter delte breakpoints med dem af genomisk HBV integration koordinater for begge parter, og dermed, de synes at eksistere i un-splejsede former. De fusion udskrifter for RK141 og RK159 blev valideret til at blive sammenkædet (figur S11). (C)
HBV-fn1
fusion udskrifter for 7 tilstødende ikke-kræft leverprøver. Næsten alle fusion udskrifter havde breakpoint ved HBV fusion splejsning hotspot. De andre fusion udskrifter som havde breakpoints på intron regioner synes at være un-splejsede udskrifter omkring integration sites.
På den anden side, genfusioner involverer
MLL4
viste forskellige mønstre. Mens de fleste observerede genfusion indeholdt HBV på 5′-enden, vi har registreret to typer af HBV
MLL4
genfusioner: dem med HBV om 5′-siden og dem med HBV om 3′-siden (fig. 4B). PCR med efterfølgende Sanger sekventering valideret, at disse var dele af sammenkædede splejset fusion udskrifter af
MLL4-
HBV
-MLL4
i mindst to prøver (figur S11 i S2 File). blev opnået Ingen tegn på splejsning for disse fusion udskrifter bortset fra en i RK141. Selv om en smule øget ekspression af
MLL4
blev observeret i HCC prøver, disse ud-af-frame HBV
-MLL4
fusion udskrifter tyder på, at HBV integrationer på
MLL4
loci kan føre til tab af funktion.
i ikke-kræft levervæv blev 161 HBV-menneskelige fusion udskrifter detekteret (figur S12 i S2 File og tabel S11 i S1 File). Især blev HBV
fn1
genfusioner gentagne observeret i 7 ikke-kræft levervæv, og de fleste af dem havde multiple splejsningsvarianter herunder fusion i ramme transkripter med HBV fusion splejsning hotspot som i HBV
TERT
fusion (fig. 4C).
over-udtryk forårsaget af somatiske SV’er
Der er adskillige dokumenterede eksempler på kromosomale SV’er fører til ektopisk udtryk for downstream onkogener med og uden dannelsen af genfusioner [11]. Her undersøgte vi forholdet mellem somatiske SV’er og over-ekspression af gener støder op til breakpoints. Gennem iterativ anvendelse af Grubbs-Smirnov test, vi identificeret 3.735 overekspression begivenheder i 3017 gener i 22 HBV-relaterede HCCs. Listen over overekspression hændelser omfattede
TERT
CDK15
overekspression drevet af HBV integration. Proksimale SV’er og HBV integrationer (inden gen regioner eller 500 kb up-stream fra transcription start-sites) kan være forbundet med 63 og 5 overekspression arrangementer, henholdsvis (tabel S12 i S1 File). Af disse breakpoints, forekom 44 begivenheder inden for de promotorområder, tyder mekanismer overekspression bortset genfusioner er almindelige fænomener. Selv om det er vanskeligt at bekræfte hver observeret overekspression begivenhed er virkelig en konsekvens af de identificerede SV’er, statistisk signifikans ved permutation test (
P
-værdi 0,0001, Figur S13 i S2 File) angiver mange over- udtrykker begivenheder kan være drevet af somatiske SV’er.
Interessant, over-udtryk begivenheder Wnt ligander blev gentagne gange observeret i to HCCs. Over-ekspressionen af
WNT1
WNT10B
(fig. 3) i RK107 havde associeret SV’er. Selvom et gen fusion involverer
WNT10B
blev observeret, dette ikke synes at være den direkte årsag til overekspression fordi
WNT10B
var den opstrøms side af fusion udskrifter (Figur S14 i S2 fil) . For
Wnt3a
overekspression i RK010 (fig. 3), vi har registreret fusion udskrifter involverer
Wnt3a
og et par støtte læst par for dem i WGS-data, hvilket tyder på komplekse rearrangementer omkring
Wnt3a
locus kan drive sin over-udtryk. Endvidere overekspression af
kunne detekteres c-KIT
med tilhørende SV i RK092 (fig. 3). Ovennævnte resultater viser, at SV’er kan spille en vigtig rolle i overekspression af onkogener og molekylære målgener.
Supplerende detektering af somatiske mutationer og kræft-specifikke RNA-redigering begivenheder
Vi undersøgte kræft -specifikke SNVs (enkelt nukleotid variant) og korte indels i RNA-Seq data ved hjælp af EBCall algoritme [17], og opdaget 6.024 kandidater på RNA-niveauer, herunder 1.205 ikke-synonyme eller splejse-site mutationer. Blandt dem, WGS analyse integreret med RNA-Seq data (se Materialer og metoder) angivne beviser på 1,912 somatiske mutationer (545 ikke-synonyme eller splejsnings-sites). Der er en vis grad korrelation mellem allelfrekvenserne af somatiske mutationer sig at være yderst sikker i WGS og RNA-Seq (korrelation effektivitet = 0,466,
P- Drømmeholdet værdi = 2,2 × 10
-16 af Pearsons produkt-moment korrelation, figur S15 i S2 File), men mængden af korrelation er ikke meget stærk. Dette kan skyldes ændringer i post-transkriptionelle processer såsom ikke-sense medicineret henfald eller mRNA stabilisering anlagt af somatiske mutationer. Af disse blev 417 (112 ikke-synonyme eller splice-sites) ikke indkaldt som somatiske mutationer i indledende WGS analyse uden hensyntagen RNA-Seq data, herunder flere kendte driver gener såsom
CTNNB1
og
TSC2
. Mange af de somatiske mutationer påvises ved denne integrativ analyse blev bekræftet af Sanger sekventering af kræft DNA’er (74/83 = 89,1%), og nogle af de ubekræftede mutationer kan være under detektionsgrænsen ifølge Sanger-sekventering grund af deres lave klonal andel. Derfor er nogle af de falsk negative somatiske mutationer heraf følgende fra den lave sekventering dækning i WGS analyse kan reddes af komplementært RNA-Seq analyse.
Endelig uden tegn på at støtte variant indlæser hverken tumor eller normal WGS data, vi identificeret 464 cancer RNA-specifikke begivenheder, der er kandidater til RNA-redigering [18]. Selv om det er vanskeligt at bekræfte ægtheden af hver redigering begivenhed, mutationen profil var rigelige i A: T G: C-mønstre og forekom i 3’UTR-regioner, hvilket viser, at mange af dem vil sandsynligvis være forårsaget af RNA-redigering ved ADARs (adenosin deaminaser) på post-transskription fase [18] (fig. 5A). Antallet af kandidat-RNA-redigering begivenheder varierede meget blandt prøverne. Vi fandt en signifikant sammenhæng (
P
-værdi = 2,38 × 10
-7 ved Wilcoxon rank sum test) mellem antallet af A: T G: C begivenheder og
ADAR
ekspressionsniveauerne (fig. 5B), hvilket indebærer eksistensen af nye kræft undertyper bestemt af mængden af somatiske RNA-redigering.
(a) antallet af kræft-specifikke RNA mutationsbegivenheder (RNA redigering kandidater) og deres substitutionsmønstre for hver prøve. (B) Scatter plot mellem antallet af A: T G: C-RNA-redigering begivenheder og
ADAR
udtryk værdi (FKPM) beregnet ved hele transkriptom sekvens data. Der er en signifikant sammenhæng (
P
-værdi = 2,38 × 10
-7 ved Wilcoxon rank sum test) mellem antallet af A: T G: C begivenheder og
ADAR
ekspressionsniveauerne.
Landskab af genomiske og transkriptom forstyrrelser i HBV-relaterede HCCs
i betragtning af, at mange transkriptom afvigelser skyldes genomiske forandringer, påvisning af transkriptom ændringer, såsom splejsning aberrationer og fusion udskrifter, rejser høj sandsynlighed for eksistensen af proksimale genomiske forandringer. Fra dette aspekt ved komplementær anvendelse af RNA-Seq til WGS analyse, vi yderligere reddet 64 kombinationer af genomiske mutationer og associerede transskriptionelle aberrationer (se Materialer og fremgangsmåder). I alt blev der opdaget 252 genomiske mutationer forårsager transkriptionelle afvigelser (GMTAs).
Gennem denne integreret analyse af WGS og RNA-Seq, vi kunne opnå fuldstændige profiler af genomiske og transkriptom ændringer såsom punktmutationer, indels, strukturel variationer, splejsnings- aberrationer og genfusioner for hver berørt gen. Her et kritisk problem er at skelne kræft chauffører fra blot passager begivenheder ved hjælp af disse profiler. Faktisk selvom tilbagevendende SV’er ( = 3 HCCs) blev set i 12 gener (
C10orf11
,
CIT
,
CLTC
,
CNTNAP2
,
DSCAML1
,
eys
,
FHIT
,
Store |,
LRP1B
,
MACROD2
,
MAGI3
,
TTC28
), mange af dem er placeret på eller meget proksimalt for fælles skrøbelige regioner [19], og faktisk blev ikke fundet at have nogen indflydelse på transkription (figur S16A i S2 fil) , hvilket indebærer fleste af dem er passager SV’er, som fandt sted i ustabile genomiske regioner. For at fjerne passager begivenheder, vi kun betragtet SV’er fremgår af associerede transskriptionelle afvigelser, hvilket også er nyttigt til at fjerne falske positive opdagelser i WGS-analyse. På den anden side, tilbagevendende genfusioner ( = 3 HCCs) blev identificeret i 6 gener (
ALB, CES1, FGA, SEPP1, SERPINA1
og
TF
). WGS-analyse ikke opdaget nogen SV forbundet med disse fusioner (Figur S16B i S2 File), hvilket indebærer, at disse fusioner synes at komme fra mindre sub-klonede celler eller artefakter og kan ikke være drivkræfterne bag klonal ekspansion af kræftceller. Disse observationer understøtter også betydningen af kombinationer af transkriptionelle afvigelser og tilhørende genomiske mutationer.
I denne WGS analyse fandt vi, at GMTAs blev koncentreret om markant muterede gener (tre i
TP53
, to i
HNF4A
RPS6KA3
, en i
ARID2
), med angivelse af deres konsekvenser i kræft patogenese (fig. 6). Blandt de ovennævnte otte GMTAs var fire SV’er og kunne ikke påvises ved eneste undersøgelse af kodende regioner, hvilket antyder, at kombinationen af WGS og RNA-Seq analyse er effektiv til at detektere kandidater driver gener. Således
HNF4A
vil sandsynligvis være en ny driver gen for leverkræft, samt
ARID2
[4] og
RPS6KA3
[20].
HNF4A
spiller en afgørende rolle i reguleringen af flere metaboliske veje i leveren samt hepatocyt differentiering og nedregulering af
HNF4A
har vist sig at være forbundet med HCC [21] , [22]. Desuden centrale gener i WNT signalvejen (
APC, AXIN1, CTNNB1, TCF7L1, TCF7L2
og Wnt ligander) blev ofte muteret (11 mutationer) i ni HCCs, hvoraf seks er ramt deres transkriptionelle konsekvenser som GMTAs.
listen over gener blev ekstraheret ved (1) signifikant muterede gener i WGS-analyse, (2) med ikke mindre end 3 mutationer (punktmutationer eller indels i kodende regioner, eller GMTAs), (3) ikke har nogen mindre end 2 GMTAs og er registreret i kræft-gen folketælling [17]. (4) er involveret i WNT signalvej, (5)
TERT
eller
MLL4
.
Diskussioner
Gennem sammenlignende og integrativ analyse af WGS og RNA-Seq, opnåede vi en række beviser for, at genomiske mutationer, herunder ikke-kodende mutationer, SV’er og virus integrationer, kan forårsage forskellige transkriptom afvigelser, såsom splejsning ændringer, gen fusioner og over-udtryk. På trods af mange beviser, der synonymt tavse mutationer i kodende regioner og dybe intron mutationer føre alvorlige sygdomme ved at forstyrre transskription [23] – [25], de er ofte ignoreret i løbende kræft genomsekvensering undersøgelser, og det samme gælder for SV’er. Derfor udfører RNA-Seq kombineret med WGS er vigtigt at fortolke konsekvenserne af somatiske ændringer også i ikke-kodende regioner og SV’er i cancerpatienter genomer. Hertil kommer, ved hjælp af WGS og RNA-Seq komplementære, vi reddet ikke blot en række yderligere somatiske mutationer, men også splejsning afvigelser forårsaget af genomiske mutationer, der blev snævert glip kriterierne for at blive kaldt ved en enkelt analyse.
i leverkræft genom blev HBV integrationer ofte observeret som en af SV’er og i denne undersøgelse observerede vi, at HBV integrationer forårsaget diverse transcrptic ændringer såsom virus-menneske fusioner. Interessant, vi også observeret tilbagevendende HBV
fn1
fusion begivenheder i ikke-cancer levervæv. Selv om tidligere undersøgelser anførte også, at HBV integrationer i
FN1
loci kunne være specifikke for tilstødende ikke-kræft levervæv på genomet plan [6], [7], har de ikke opdaget resulterende fusion udskrifter. Hyppigheden af HBV
FN1
fusion i nærværende undersøgelse (31,8% = 7/22) var meget højere end de tidligere undersøgelser (5,6% (= 5/88) [6] og 10,0% (= 4/40) [7]). Dette synes især at være, fordi HBV integrationer i
FN1
locus ofte næret i mindre sub-klonede befolkninger i ikke-kræft leverceller, som ofte gået glip af den lave dybdegående genom sekventering. Men RNA-Seq analyse giver mulighed for mere følsomme forudsigelse af sub-klonal HBV integration begivenheder, når de genererer en tilstrækkelig stor mængde af afvigende udskrifter. Paradoksalt nok, det faktum, at HBV integrationer i
FN1
loci ikke forekommer i tumorprøver indebærer, at
FN1
er ikke blot udsat for tilfældige HBV integrationer; HBV
fn1
fusion udskrifter kan spille vigtige roller i lever fibrose eller cirrose eller kan fremme kræft udvikling af celler nærmest til dem med HBV
fn1
fusioner.
I
Leave a Reply
Du skal være logget ind for at skrive en kommentar.