Abstrakt
Retrovirus har været grundlæggende i kræftforskning siden begyndelsen undersøgelser identificerede proto-onkogener som mål for insertionel mutagenese. Integration af murine gamma-retrovirus i værtsgenomet favoriserer initiativtagere og forstærkere og indebærer interaktion af viral integrase med host BET /bromodomain faktorer. Vi rapporterer, at denne integration mønster er konserveret i felin leukæmivirus (FeLV), en gamma-retrovirus, der inficerer mange humane celletyper. Analyse af FeLV insertionssteder i MCF-7 brystcarcinom cellelinie afslørede stærk slagside i retning af aktive kromatin varemærker uden tegn på signifikant post-integration udvælgelse vækst. De mest fremtrædende FeLV integration mål havde lidt overlap med de mest rigeligt udtrykt udskrifter, men var stærkt beriget for kommenterede cancer gener. En meta-analyse baseret på flere gamma-retrovirus integration profilering (GRIP) studier i humane celler (CD34 +, K562, HepG2) afslørede en lignende kræft gen skævhed, men også bemærkelsesværdigt celle-typen specificitet, med prominente undtagelser, herunder en universel integration hotspot på lange ikke-kodende RNA
MALAT1
. Sammenligning af GRIP mål med databaser super-forstærkere fra de samme cellelinjer viste, at disse har kun begrænset overlapning og at GRIP giver enestående indblik i de opstrøms førere af cellevækst. Disse observationer belyse onkogene styrken af gamma-retrovirus og støtte bredere anvendelse af GRIP at identificere de gener og vækst regulerende kredsløb, der driver forskellige cancertyper
Henvisning:. Gilroy KL, Terry A, Naseer A, de Ridder J, Allahyar A, Wang W, et al. (2016) Gamma-Retrovirus Integration Marks Cell typespecifikke Cancer Gener: A Novel Profilering værktøj i Cancer Genomics. PLoS ONE 11 (4): e0154070. doi: 10,1371 /journal.pone.0154070
Redaktør: Mary Bryk, Texas A M University, UNITED STATES
Modtaget: Februar 15, 2016 Accepteret: April 10, 2016; Udgivet: 20. april, 2016
Copyright: © 2016 Gilroy et al. Dette er en åben adgang artiklen distribueres under betingelserne i Creative Commons Attribution License, som tillader ubegrænset brug, distribution og reproduktion i ethvert medie, forudsat den oprindelige forfatter og kilde krediteres
Data Tilgængelighed:. Alle relevante data er inden for papir og dens støtte Information filer, eller er blevet stillet til rådighed tidligere via publicerede manuskripter
Finansiering:. KLG, aT, AN, AK, ERC og JCN blev støttet af et fælles program fra Cancer Research UK og Bloodwise (tilskud numre A11951 (CRUK) og 13046 (Bloodwise) webadresser https://www.cancerresearchuk.org/og https://bloodwise.org.uk/). JDR blev finansieret af en VENI tilskud (639.021.233) fra NWO (Holland Organisation for Videnskabelig Forskning, https://www.nwo.nl/). AM blev finansieret af canadiske Institutes for Health Research (MOP 97.798, https://www.cihr-irsc.gc.ca/~~number=plural). GK-SW blev finansieret af Alberta innoverer Teknologi Futures (AITF, https://www.albertatechfutures.ca/) og til at innovere Centre of Research Excellence (Icore). De finansieringskilder havde ingen rolle i studie design, indsamling og analyse af data, beslutning om at offentliggøre, eller forberedelse af manuskriptet
Konkurrerende interesser:.. Forfatterne har erklæret, at der ikke findes konkurrerende interesser
Introduktion
evne retrovira til at dirigere stabil integration i sig selv er mutagent og kan forstyrre værtscellegener på den provirale insertionssted eller selv ved en væsentlig afstand [1,2]. Mens denne funktion er kommet for at blive betragtet primært som en uønsket komplikation for brug af retrovirusvektorer i genterapi [3,4], har det længe været et værdifuldt aktiv i kræftforskning, som integration lokaliteter af retrovirus i naturligt forekommende eller eksperimentelt inducerede kræftformer fra fugle, mus og katte har givet en rig høst af kræft driver gener og familier, herunder
Myc
,
Myb
,
Pim
,
Runx
,
Bmi1
,
Gfi1
Notch
[1]. Færdiggørelsen af musen genom sekvens og fremkomsten af high throughput kloning og sekventering af insertionssteder udvidet omfanget af disse undersøgelser massivt, afslører mange nye potentielle målgener [5-7]. Det blev antaget i tidlige undersøgelser, at retroviral integration er effektivt tilfældig, og at kræft-specifikke fælles integration sites (CISS) opstod blot fra klonal ekspansion efter sjældne indrykninger på følsomme steder, der faldt sammen i selvstændige tumorer ved en tilfældighed. I modsætning hertil er det blevet klart i de seneste år, at retrovirus har betydelige integration præferencer, der afspejler deres karakteristiske biologiske egenskaber og former for host kolonisering.
forkærlighed for lentivirus HIV at integrere i aktivt transskriberede gener er et centralt element af dens patogenese, hvor det er i transit mellem latent infektion og cytopatisk replikation. For HIV, denne proces indebærer interaktion mellem det virale integrase protein og LEDGF, en transkriptionel co-aktivator, der bindsler integrationen komplekse til kromatin og letter integration [8,9]. I kontrast, gamma-retrovirusreplikation er generelt ikke-cytopatisk og persistent inficerede værter kan vise høje niveauer af viræmi, med tumorer induceret af insertionsmutagenese en forholdsvis almindelig resultat af infektion [10,11]. Den ikke-tilfældighed af murine leukæmi virus (MLV) integration blev først værdsat fra tidlige undersøgelser, der fremhævet bias i retning af DNasel hypersensitive steder og transskriptionelle start- sites [12]. Grundlaget for denne specificitet blev for nylig belyst med demonstrationen at MLV integrase interagerer med BET /bromodomain proteiner (Brd2, 3 og 4), som til gengæld binder til acetyleret histon H3K27ac, mærkning nogle af de mest aktive områder af kromatin [13-15 ]. Vigtigheden af denne interaktion understreges af den betydelige reduktion i titer og /eller tab af TSS målretning af MLV dyrket i tilstedeværelsen af BET-hæmmere JQ1 og I-BET
in vitro
[13-15]. Dette skaber en yderligere forbindelse med kræftforskning som BET-hæmmere i øjeblikket er ved at blive undersøgt i kliniske forsøg til behandling af flere kræftformer [16].
Det fulde omfang af afgang fra tilfældige af MLV integration er blevet klart kun med fremkomsten af skala metoder store at fange og sekvens integration sites i polyklonalt inficerede cellepopulationer
in vitro
forud for enhver væsentlig udvælgelse vækst. studier af MLV vektor integration i humane CD34 celler eller MLV pseudotype infektion af menneskelige kræftceller Storstilede har afsløret en bemærkelsesværdig selektiv proces, hvor mere end halvdelen af de integrationer målrette mindre end 2% af det menneskelige genom [17,18]. Desuden forekommer de foretrukne genomiske steder på aktive kromatin mærker og omfatter stærke forstærkere samt initiativtagere.
I denne undersøgelse vi udforskes integration præferencer anden gamma-retrovirus, felin leukæmi virus (FeLV). Vi anvendte FeLV-B, en fælles naturligt forekommende variant af FeLV der er i stand til at inficere praktisk talt alle dyrkede humane celler uden indlysende cytopatologi [19] gennem interaktion med den bredt udtrykt phosphat transportør PIT1 [20]. Vi analyserede oprindeligt integrationer i MCF-7 human brystcancer cellelinje, som er permissiv for spredning, høj titer FeLV-B-replikation, og er blandt de bedst karakteriserede cancercellelinier med hensyn til funktionel genomik. FeLV-B vises en lignende præference for transcription start sites og aktiv kromatin mærker til MLV, i overensstemmelse med bevarelse af den C-terminale løkke af integrase som binder til BET /Brd [21]. Imidlertid blev FeLV integration specificitet ikke primært rettet til de mest rigeligt udtrykt gener, men var stærkt skæv retning brystkræft driver gener. Dette fund inspireret en meta-analyse af gamma-retrovirus præference integration fra flere undersøgelser, som afslørede en høj grad af celle-typen specificitet, mens kræft gener blev begunstiget i alle tilfælde, også i normale celler. Disse resultater tyder på, at gamma retroviral integration profilering (GRIP), vil være et værdifuldt værktøj til identifikation af slægt-specifikke kræft driver gener i en lang række humane kræfttyper.
Resultater
FeLV integration i humane brystcancerceller målretter transcription start sites og aktive kromatin mærker
Kloning af FeLV-B integrationssteder i inficerede MCF-7 brystcancerceller ved linker-medieret PCR og kortlægning til det humane genom gav 20.634 autentiske virus- vært forbindelsesfragmenter, svarende til 8.052 unikke insertioner (figur 1A, S1 datasæt). Det forholdsvis lave antal kopier pr unikke indsættelse foreslog, at nogen væsentlig klonselektion havde fundet sted i løbet af den korte periode med vækst
in vitro
, og dette spørgsmål blev undersøgt yderligere ved analyse af proviralt orientering bias. Mens integrationsprocessen selv er tilfældig med hensyn til orientering, tilbøjeligheden af gamma-retrovira at aktivere værtsgener efter enhancer insertion, en proces, som er stærkt påvirket af orientering, fører til fremkomsten af en dominerende kloner med udtalt skævhed på centrale integration hot-spots der kan påvises statistisk ved en “heads-haler analyse [22]. Vi anvendte denne test til FeLV /MCF-7 datasæt. Af de 100 gener oftest målrettede, 8 viste tegn på orientering bias (p-værdier fra 0,011 til 0,049 af Fishers eksakte test), men ingen af disse observationer overlevede Bonferroni eller Benjamini-Hockberg korrektion for multiple test (i alt 8 sager p-værdi med Bonferroni korrektion var en, og p-værdi med Benjamini-Hockberg korrektion var 0,612). Desuden er ingen af de nærliggende gener blev kommenteret cancer drivere, og ingen viste den klassiske ‘opstrøms og baglæns’ clustering der hyppigst observeret med denne form for onkogen aktivering [1]. Derudover, insertioner i de 100 mest målrettede gener viste ingen tegn på forøget kopital i forhold til datasættet som helhed, med et gennemsnit på 2,7 og 2,6 kopier /insertion (p = 0,44). Disse observationer antyder, at der er sket minimal klonselektion efter integration, og at enhver observerede ikke-tilfældig fordeling i genomet skyldes hovedsagelig at indføringsstedet præference. Gruppering af FeLV indrykninger omkring transskription starter sites (TSSs) var tydeligt fra datasættet, med en dobbelt top på +/- 1,5 kb og et trug direkte på TSS skelnes fra det mønster, rapporteret for [17] MLV (figur 1B). Positionen af indrykninger inden det nærmeste genet blev bestemt og er vist i fig 1C. De fleste af de insertioner ligger inde i genet, med det næste største gruppe opstrøms for genet, i overensstemmelse med deres målretning af enhancerelementer
A:. Experimental arbejdsgang. B: Placering af insertioner i MCF-7-celler med hensyn til TSS, der viser en dobbelt top med trug på TSS. C:. Pie diagram, der viser placeringen af indrykninger i MCF-7 celler i forhold til den nærmeste gen
For at bestemme, om specifikke epigenetiske mærker også blev ramt af virussen, er data fra den KODE konsortium analyseret. Chip-seq datasæt for alle tilgængelige histon mærker i MCF-7 celler blev behandlet og toppe kommenteret som beskrevet i Materialer og Metoder. Ledige histon varemærker var H3K27ac, H3K9me3, H3K36me3, H3K27me3 og H3K4me3. Overlappet af MCF-7 indrykninger med histon mærker blev bestemt og er opsummeret i figur 2. For det første markører for aktiv kromatin blev anset, disse er H3K27ac (forstærker mærke), H3K4me3 (aktiv promotor mark) og H3K36me3 (markør for forlængelse). Som opsummeret i figur 2A, en stor del af MCF-7 indrykninger overlapper disse histon mærker (41,8%); den største overlapning med enten H3K4me3 alene (1119 insertioner, 15,7%) eller med både H3K4me3 og H3K27ac (1508 insertioner, 21%). Når man overvejer undertrykkende mærker H3K9me3 og H3K27me3, der var meget lidt overlap med MCF-7 indrykninger (kun 0,97% i alt, Fig 2B). I betragtning af betydningen af parvise overlapning af MCF-7-insertioner med hver af de fem histon varemærker, ingen var statistisk signifikant med undtagelse af H3K27ac, som var stærkt signifikant med ap værdi 4.96E-69 (p-værdier for alle andre parvise overlapninger var 1). Efter at have undersøgt de globale forbindelser mellem histon mark annotation og MCF-7 indsættelse, blev forholdet til histon tilhørende de væsentligste indsættelse klynger undersøgt. A ‘nærmeste gen «analyse blev udført som beskrevet i Materialer og Metoder, tildele hver indsættelse til et gen og vurdere betydningen af indsættelsen på det gen. Tilsvarende blev histon mærker kommenteret og betydningen score (p-scores) opnået under anvendelse af Galaxy /Cistrome suite som beskrevet i Materialer og Metoder. De øverste 500 gen hits for hver histon mærke (identificeret ved p-score) blev indsamlet og sammenlignet til toppen retroviral integration mål og overlapper vurderes. Sandsynligheden for en sådan overlapning forekommer tilfældigt blev vurderet ved anvendelse af Monte-Carlo simulering som beskrevet i Materialer og Metoder. Data er opsummeret i figur 2C og tabel 1. De tre aktive kromatin varemærker viser væsentlig overlapning, når de væsentligste gener klynger betragtes, med p-værdier af 1.67E-8, 0,00236 og 0,0014 for H3K27ac, H3K4me3 og H3K36me3 hhv. Den undertrykkende kromatin markerer H3K9me3 og H3K27me3 viser ingen signifikant sammenhæng med MCF-7 indrykninger (p = 1 og p = 0,97 henholdsvis). Samlet set sammenligning med alle tilgængelige histon modifikationer viser konsekvent, at indsættelser er målrettet til aktive kromatin mærker og er fraværende fra undertrykkende mærker
A:. Global sammenslutning af indrykninger med aktive histon mærker, der viser antallet af krydsende funktioner. B: Global association med repressive histon mærker. C: Statistisk sammenslutning af de mest markant beriget nærmeste gener for indsættelser og histon-mærker. Transformerede p-værdier er vist. Den stiplede linie repræsenterer p = 0,05. D: Eksempler genklynger målrettet med FeLV i MCF-7-celler, som vist i UCSC Genome Browser. Insertioner er vist i lilla øverst efterfulgt af Skema af genstruktur, og endelig H3K27ac chip-seq signal densitet.
Antallet af overlappende gener fra toppen 500 er noteret ligesom p værdier for betydningen af overlap. Bemærk, at p-værdi for H3K27ac repræsenterer en 1 i 60×10
6 chance for foreningen forekommer tilfældigt, men den sande p-værdi vil være lavere, da dette niveau af overlap ikke blev observeret i 60×10
6 simuleringer.
FeLV integration fokuserer på cancer driver gener i MCF-7 brystcancerceller Salg
Tidligere undersøgelser i stor målestok har fokuseret på murin gamma-retrovirus og vektorintegration i normale og maligne celler, og det blev bemærket anekdotisk at mange vektor indrykninger i normale CD34 celler var på “farlige” websteder med hensyn til risikoen for malignitet, herunder LMO2 locus, som har præsenteret som en hyppig mål af vektor integration i genterapi associeret leukæmier [3,4]. Indledende inspektion af de store klynger af FeLV indsætning i MCF-7-celler viste en bemærkelsesværdig koncentration på gener med rapporteret overekspression eller amplifikation i brystcancer eller med et tab af funktion knockdown fænotype i MCF-7-celler. Eksempel gen klynger vist i fig 2D omfatter tre HOX gen klynger, herunder den lange ikke-kodende RNA
hotair
, sammen med chromobox
CBX2
og den lange ikke-kodende RNA
MALAT1
. I de fleste tilfælde indrykninger faldt sammen primært med toppe af H3K27 acetylering, og i mindre grad med H3K4 trimethylation og H3K36 trimethylation mærker, i overensstemmelse med ovenstående data viser forening med aktive kromatin mærker (fuld histon anmærkning for disse gener er vist i S1 Fig) .
Disse observationer tilskyndet os til at foretage en mere systematisk analyse af de foretrukne insertionssteder. Nærmeste genanalyse identificeret 6926 gener. De øverste 100 gener blev bestemt ved første valg for statistisk signifikans (p 0,05 hjælp Fishers eksakte test), og derefter ranking ved kendelse af antallet af indrykninger. De øverste 100 MCF-7 integration mål ved disse kriterier omfatter 773 indrykninger (6,7% af de samlede indrykninger), og er vist i S1 tabel. Disse blev krydstjekket mod Kræft Gene Census [23], en stringent, regelmæssigt opdateret database af kræft gener baseret på stærke beviser for førerens gen status (https://cancer.sanger.ac.uk/census/).
11 af de 100 MCF-7 integration mål viste sig at være kræft driver gener (se fig 3A og S2 tabel). Dette er en særdeles signifikant berigelse over baggrundsniveauet for cancer driver gener i genomet som helhed, hvilket er 2,2% (p = 2.01E-09). For at undersøge veje målrettet med FeLV integration, blev de 100 målgener forhørt af QIAGEN Ingenuity Pathway Analysis (IPA) softwarepakke (IPA, QIAGEN Redwood City, www.qiagen.com/Ingenuity). Vi fandt, at det øverste biologiske proces er defineret for dette gen sæt var “kræft” (p-værdi rækkevidde 1.95E-2-4.6E-6, median p = 0,00789), hvilket giver yderligere bevis på selektivitet for kræft gen programmer (figur 3B). Have etableret præferentielle målretning af kræft driver gener, blev celletypespecificiteten af målgener undersøgt. IPA ‘kræft’ annotation for top MCF-7 hits blev undersøgt yderligere ved at se på kræft delprocesser. Slående, tre af de øverste fem kræft delprocesser var relateret til brystkræft, viser en stærk væv specifik kræft gen signatur i de øverste integration mål (fig 3C)
A:. Andel af top 100 indsættelse gen klynger der er cancerceller driver gener sammenlignet med genomet som helhed. B: IPA top processer grupperinger viser rækken af transformerede p-værdier, med median angivet med gråt kors. C: Top 5 ‘kræft’ undertyper identificeret af IPA med transformeret p-værdi er vist. Punkterede linie repræsenterer p = 0,05. D:. Procentdel af de 100 indsættelse gen klynger med kendt brystkræft anmærkning, som bestemt ved systematisk litteraturgennemgang i forhold til en tilfældig sæt af 100 gener
For at verificere berigede brystkræftgen annotation i MCF -7 top integration sites blev en skærm af peer-reviewed videnskabelige litteratur foretaget for de 100 MCF-7 målgener i forhold til 100 gener udvalgt tilfældigt. For at minimere bias, i hvert tilfælde blev anvendt den samme søgning sigt ( gen navn + “brystkræft”) og de samme kriterier for kendte brystkræft annotation (direkte association af genet med brystkræft med efterfølgende kontrol af bl.a. knockdown eller ekspressionsundersøgelser). 29 af de 100 MCF-7 integration mål havde kendt brystkræft anmærkning, sammenlignet med 5 af de tilfældige 100 gener, en forskel, der var stærkt signifikant (p = 3.35E-28, Fig 3D). Tilsammen indikerer disse resultater, at integration fortrinsvis retter sig mod en celletype-specifikt gen sæt, der også er relevant for kræft fænotype.
Gener ved foretrukne insertionssteder af FeLV vise heterogene niveauer af ekspression
Forrige undersøgelser har vist, at gamma-retrovirus integreret i regioner af aktiv genekspression, ofte i regulatoriske regioner, såsom enhancer og promotorregioner. For at bestemme om FeLV målretter de mest højt udtrykte gener, blev de bedste MCF-7 integrationsmålsætningerne sammenlignet med de mest højt udtrykte gener i MCF-7 celler under anvendelse af en tidligere publiceret microarray datasæt [24]. MCF-7 gener blev rangordnet efter intensitet og placeringen af de 100 GRIP målgener bemærket (Fig 4A). Denne viste ingen tydelig skævhed af FeLV integration for de mest højt udtrykte gener. For at analysere dette forhold statistisk, stigende stikprøvestørrelser blev brugt til at undersøge, hvordan forholdet varierede når kun overvejer de øverste hits eller et bredere gen valg. Niveauet af overlap på hver prøve størrelse blev sammenlignet med det forudsiges at ske ved chance af Monte-Carlo simulering, og p-værdier beregnet (se materialer og metoder for detaljer)
A:. Rangorden plot viser intensiteten af alle microarray prober for MCF-7. Vist i rød er de 100 bedste genklynger målrettede med FeLV indsættelse. B: Transformeret p-værdier for betydningen af sammenhængen mellem de øverste indsættelse target gener og de højest udtrykte gener for forskellige stikprøvestørrelser. Den stiplede linie repræsenterer p = 0,05 signifikansniveauet. C: Tabel viser p-værdier repræsenteret i B for de forskellige stikprøvestørrelser
De øverste 150 retrovirale målgener viste ingen større overlap med de øverste 150 højt udtrykte gener end forventet ved en tilfældighed i MCF-7. celler (p-værdier for de øverste 50, 100 og 150 gener var en, 0,22 og 0,43 (fig 4B og 4C)). Den lange ikke-kodende RNA
MALAT1
var den eneste genetiske element, der overlappede de mest højt udtrykte gener og de foretrukne retrovirale mål i denne analyse. Med det forbehold at transkriptionshastigheder og steady state-RNA-niveauer ikke er sammenfaldende, tyder disse resultater på, at de øverste 150 retrovirale mål integration bliver udvalgt af en mere subtil proces end affinitet for de mest aktive regioner af værten kromatin. I modsætning hertil at udvide analysen til et større antal foretrukne mål ( 200) registreres stigende overlap med de højest udtrykte gener, hvilket tyder på en bimodal udvælgelsesproces
præference Gamma-retroviral integration:. En meta-analyse
Efter at have vist, at FeLV selektivt rettet mod kræft driver gener i en human brystcancer cellelinje, vi anvendte samme tilgang til offentliggjorte datasæt “-valgte” gamma retrovirus integration sites i humane celler til at etablere den generelle betydning af disse observationer. Til denne meta-analyse brugte vi udgivet indsættelse af data fra to humane cancer cellelinjer, K562 og HepG2 [18] og normale CD34 + celler [17]. Mens disse undersøgelser blev udført med murine gRVs og infektion af humane celler blev opnået ved pseudotypebestemmelse af infektiøs MLV-virus med VSV-G kuvert [18] eller amfotrop vektor levering [17] i stedet for naturlig infektion, en histon kode præference meget lig vores undersøgelsen blev bemærket, hvilket tyder på, at den bevarede integrase funktionen er den afgørende faktor for specificitet.
Oplysninger om de datasæt, der anvendes i meta-analysen er sammenfattet i fig 5A. De offentliggjorte sæt er væsentligt større end vores MCF7 sæt og for at opnå et tilsvarende antal foretrukne indsættelse websted gener vi fastsætte en højere grænse betydning før ranking generne efter antal indrykninger som tidligere. For tre MLV datasæt der var igen en meget vigtig berigelse for kræft driver gener. For CD34 + celler, 15% af de øverste målgener mærket som kræft drivere (beriget i forhold til den samlede genom baseline, p = 2.69E-18), for K562 var nummer 11% (p = 2E-9) og for HepG2 6% . (p = 0,0096)
A: Oversigt over de anvendte data, herunder størrelsen af datasæt. B: Heatmap viser den globale sammenslutning af GRV insertionssteder med histon modifikation for alle cellelinjer. Blå repræsenterer stillede mærker, mens rød repræsenterer stilles ringere mærker. En asterisk angiver signifikansniveau, med * bliver p 0,05, ** p 0,01 og *** p 0,001. C: Berigelse af kræft driver gener med raffinement af top hits for alle cellelinjer. Den stiplede linie repræsenterer procentdelen af kræft driver gener i genomet (2,2%) D: Placering af insertioner i forhold til transskriptionsstartstedet for alle cellelinier. Anslået antal samlede indrykninger er vist nedenfor hver diagram.
De epigenetiske mærker er mål for virus i hver cellulære sammenhæng blev undersøgt som beskrevet ovenfor ved hjælp af chip-seq data fra KODE (for K562 og HepG2-celler) eller human Epigenetik køreplan (for CD34 celler). De samme histon ændringer blev betragtet som for MCF-7 celler, disse er H3K27ac, H3K4me3, H3K36me3, H3K9me3 og H3K27me3. I overensstemmelse med de tidligere offentliggjorte undersøgelser, var der en generel berigelse for virale indsættelser på aktive kromatin mærker (H3K27ac, H3K4me3 og H3K36me3), mens undertrykkende mærker (H3K9me3 og H3K27me3) blev stilles ringere af virus [17,18]. Den eneste undtagelse fra dette mønster var K562s som viste en berigelse af indrykninger på H3K27me3 mærket, selv om dette ikke var statistisk signifikant. Resultaterne er opsummeret i figur 5B.
Fig 5C viser en klar tendens med stigende berigelse for kræft driver gener mod de meget målrettede gener i alle fire cellelinjer. Dette mønster er mindst klart for HepG2 datasæt, selv om der er grund til at tro, at de øverste hits kan have været skjult af mætning i denne enorme datasæt (3 x 10
6), på grund af scoring af reelt uafhængige indrykninger på den store hotpots som dubletter. Beviser til støtte for denne fortolkning er leveret af inspektion af fordelingen af indrykninger omkring transkriptionelle start- sites. Når disse normaliseres ved tophøjde, HepG2 viser en meget større basalt niveau af ikke-TSS insertioner, i overensstemmelse med den mætning hypotese (Fig 5D).
Fig 6A viser overlapningen af generne i top 100 for hver af de testede cellelinier. Mens der er nogle fælles målgener deles af mere end én celletype, hvad der er mest slående er, at de fleste af de øverste hits er unikke for denne bestemte celletype med relativt lille overlap. Udvidelse datasættene at omfatte de top 500 gener mindsker ikke dette generelt eksklusive mønster efter celletype, selv om dette mere afslappet cut-off afslørede en lille delmængde af seks ‘universelt’ målrettede elementer:
MALAT1
,
MIR7851
.
1
,
RCC1
,
VMP1
,
ZC3H4
og
ZMYND8
(fig 6B).
A: Venn diagram, der viser graden af overlap mellem de 100 gen mål i hver testet cellelinje. B:. Som (A), men overvejer overlap af de 500 gener i hver celle linie
Gamma-retroviral integration profilering er et supplement til super-forstærker profilering
Den seneste opdagelse, at GRV integration medieres ved binding til BET afslørede en overbevisende link til kræft, som BET binding til acetylerede histoner er en af de afgørende træk ved ‘super-forstærkere “, et begreb opfundet til at beskrive store klynger af forstærkere, der viser tætte binding af master-regulatorer og spille en rolle i vævsspecifik celleidentitet [25]. Desuden hæmmere af BET binding kan forstyrre væksten af kræftceller [16], og dette fænomen er blevet tilskrevet den akutte følsomhed over for BET afbrydelse af super-forstærkere på onkogener såsom MYC og BCL2 [26,27].
for at undersøge parallel mellem GRIP og super-forstærkere defineret af biokemiske metoder, vi sammenlignede nærmeste gener identificeret ved begge metoder. Lister over super-forstærker forbundet gener blev opnået fra dbSUPER databasen [28] for MCF7, K562, HepG2 og CD34 primære celler (RO01480, RO01536 og RO01549). For MCF-7 celler blev kun 98 gener registreret i super-forstærker liste, og af disse otte var cancer driver gener, som defineret af de seneste Cancer Gene Census data, sammenlignet med 11 af de 100 GRIP mål (Fig 7A) . Lignende observationer blev bemærket for de andre datasæt, og kun K562 sæt afslørede en stærkere berigelse for kræft driver gener i super-enhancer forbundne gener over toppen GRIP mål (23% vs. 11%, p = 0,004). Vanskeligheden ved at definere en præcis cut-off mellem super-enhancere og konventionelle forstærkere [29] er illustreret ved den store variation i antallet af super-enhancere for en given celletype, med de tre primære CD34 + dbSUPER firmaer har antal superenhancers spænder fra 326 til 733.
A: Procentdel af de 100 gener identificeret for GRIP og superenhancers der er kræft driver gener for alle cellelinjer. B:. Overlapning mellem de 100 gener for GRIP og superenhancers i hver cellelinje
På trods af de tilsvarende tal for kræft driver gener identificeret ved hjælp af de to metoder, de identificerede gener var for det meste forskellige, og kun 2 /11 cancer driver gener identificeret ved GRIP blev også noteret i databasen super-forstærker for MCF-7 celler (S2 tabel). Ser man på de bredere gen-apparater, der var også forholdsvis lille overlap mellem gener identificeret i top 100 GRIP og super-forstærker mål (Fig 7B).
Pathway analyse afslører forskellige opstrøms regulatorer af retrovirale mål og super-forstærker tilknyttede gener
IPA softwarepakke indeholder et modul til at vurdere de sandsynlige opstrøms transkriptionelle regulatorer af enhver indvindes gen sæt, bidrager til at belyse biologiske aktiviteter i det cellulære system. For at opnå en omfattende og statistisk robust analyse, vi analyserede de 500 GRIP target gener for hver celletype (tabel 2). De stærkt forudsagte opstrøms drivere til MCF-7 GRIP datasæt inkluderet hovedsageligt kræft drivere (myc KMT2A) og cancer forbundet gener (ATF4). Især disse gener var selv meget målrettet med retroviral indsættelse, hvilket afspejler deres transkriptionelt aktiv status og adgang til integration. Denne analyse tyder på, at disse gener er involveret i at orkestrere udtryk for GRIP mål sæt og dermed kan repræsentere de kritiske førere af kræft-programmet. Lignende observationer blev noteret for de andre cancer cellelinjer og til normale CD34 + celler, selv i sidstnævnte tilfælde to af de stærkest forudsagte opstrøms drivere var cytokiner (CSF, IL15), som ikke er blevet rettet af retroviral integration og var tilsyneladende ikke transkriptionelt aktiv i målcellerne.
Denne analyse blev også udført for super-forstærker-associerede gen-apparater, idet de 500 gener, som bestemt ved den “rang” på dbSUPER database indrejse, eller hele indstillet, hvis der var færre end 500 gener. Selvom de super-forstærker-associerede gen sæt var i nogle tilfælde mindre (range 98-742 gener), som fremkommer de forudsagde opstrøms regulatorer med lignende statistiske scoringer. Igen disse opstrøms regulatorer afslørede relativt lidt overlap mellem GRIP og super-enhancer regulerede gener, illustrerer de forskellige perspektiver på underliggende vækst programmer afsløret af disse tilgange. En yderligere forskel er, at retroviral integration var signifikant mere tilbøjelige til at målrette GRIP opstrøms regulatorer sammenlignet med den super-forstærker sæt (p = 0,005, Fishers eksakte test).
Diskussion
Denne undersøgelse viser at gamma-retrovirus integration i humane celler er skæv i retning kræft driver gener i en stærkt celletypespecifik måde. Mens gamma-retrovirus er ofte blevet brugt som kræft gen opdagelse værktøjer på grund af deres insertionel mutagent potentiale i deres naturlige værter, denne tilgang krævede besværlig opgave at indsamle flere end-stage tumorer fra dyremodeller og sammenlignende genomisk analyser for at bekræfte relevansen af resultater til human cancer [5-7,11,30].
Leave a Reply
Du skal være logget ind for at skrive en kommentar.