Abstrakt
Cancer Genome Atlas (TCGA) projekter har avancerede vores forståelse af føreren mutationer, genetiske baggrunde, og de vigtigste veje aktiveret tværs kræftformer. Analyse af TCGA datasæt har mest fokuseret på somatiske mutationer og omplantning, med mindre vægt på gen-amplificeringer. Her beskriver vi en bioinformatik screening strategi til at identificere formodede kræft driver gener forstærkede tværs TCGA datasæt. Vi udførte GISTIC2 analyse af TCGA datasæt spænder 14 cancer undertyper og identificeret 461 gener, der blev forstærket i to eller flere datasæt. Listen blev indsnævret til 73 cancer-associerede gener med potentielle “druggable” egenskaber. Størstedelen af gener blev lokaliseret til 14 amplikoner spredt over hele genomet. For at identificere potentielle kræft driver gener, analyserede vi gen kopi nummer og mRNA udtryk data fra individuelle patientprøver og identificeret 40 formodede kræft driver gener forbundet med diverse onkogene processer. Onkogen aktivitet blev yderligere valideret af siRNA /shRNA knockdown og ved at referere de Project Achilles datasæt. De forstærkede gener repræsenterede en række af gen familier, herunder epigenetiske regulatorer, cellecyklus-associerede gener, DNA skader respons /reparation gener, metaboliske regulatorer, og gener forbundet med Wnt, Notch, Hedgehog, JAK /STAT, NF-KB og MAPK signalveje. Blandt de 40 formodede driver gener var kendt driver gener, såsom
EGFR
,
ERBB2
PIK3CA
. Wild-typen
KRAS
blev forstærket i flere kræfttyper, og
KRAS
-amplified kræftceller var mest følsomme over for
KRAS
shRNA, tyder på, at
KRAS
forstærkning var en uafhængig onkogen begivenhed. En række af MAP kinase adaptorer blev co-amplificeret med deres receptortyrosinkinaser, såsom FGFR adapter
FRS2
og EGFR familie adapter
GRB7
. Det ubiquitin-lignende ligase
DCUN1D1
og histon methyltransferase
NSD3
blev også identificeret som nye formodede kræft driver gener. Vi diskuterer patient skræddersy konsekvenser for eksisterende kræft lægemiddelvirkninger og vi yderligere at drøfte potentielle nye muligheder for lægemiddeludvikling indsats
Henvisning:. Chen Y, McGee J, Chen X, Doman TN, Gong X, Zhang Y, et al. (2014) Identifikation af Druggable Cancer drivere Gener Amplified tværs TCGA datasæt. PLoS ONE 9 (5): e98293. doi: 10,1371 /journal.pone.0098293
Redaktør: Masaru Katoh, National Cancer Center, Japan
Modtaget: Marts 6, 2014 Accepteret: April 30, 2014; Udgivet: May 29, 2014
Copyright: © 2014 Chen et al. Dette er en åben adgang artiklen distribueres under betingelserne i Creative Commons Attribution License, som tillader ubegrænset brug, distribution og reproduktion i ethvert medie, forudsat den oprindelige forfatter og kilde krediteres
Finansiering:. Denne undersøgelse blev finansieret af Eli Lilly and Company. Den bidragyder ydet støtte i form af lønninger til alle forfattere, men havde ikke nogen ekstra rolle i studie design, indsamling og analyse data, beslutning om at offentliggøre, eller forberedelse af manuskriptet. De specifikke roller disse forfattere er formuleret i afsnittet forfatter bidrag
Konkurrerende interesser:. Denne undersøgelse var fuldt finansieret af Eli Lilly and Company, arbejdsgiver for alle forfattere. Der er ingen patenter, produkter i udvikling eller markedsførte produkter til at erklære. Dette ændrer ikke forfatternes tilslutning til alle PLoS ONE politikker om datadeling og materialer, som beskrevet online i vejledningen for forfattere.
Introduktion
De seneste fremskridt inden for DNA-sekventering teknologi har gjort det muligt sekventering af hele kræft genomer og identifikation af almindeligt muterede, forstærkede, og slettede gener på tværs af kræftformer. Den Cancer Genome Atlas (TCGA) indsats blev oprettet for at sekventere og analysere flere tusinde individuelle kræftformer, hvilket giver et øjebliksbillede til sygdomsspecifikke genetiske baggrunde og kræft chauffører [1] – [6]. Integreret analyse af TCGA datasæt identificeret 127 betydeligt muterede cancer-associerede gener, der repræsenterer forskellige biologiske veje og cellulære processer [6]. Det gennemsnitlige antal af førerens mutationer pr tumorprøve var to år til seks, hvilket antyder, at et lille antal af muterede driver gener kunne inducere carcinogenese [6]. I brystkræft, at kun tre gener (
GATA3
,
PIK3CA
, og
TP53
) blev fundet muteres på 10% forekomst på tværs af alle patientens tumorer. Yderligere analyse afslørede pathway-specifikke genetiske driver mutationer i brystkræft undertyper, såsom
BRCA1 /2
ombygninger og
PIK3CA
ændringer i basal-lignende og luminale brystkræft henholdsvis [4]. I kolorektale cancere, blev fireogtyve gener almindeligvis muterede og de fleste af de gener kortlagt til den Wnt, TGF-b, PI3K, p53 og RAS signalveje [3]. I lungekræft, blev elleve gener almindeligt muteret, herunder
TP53
, oxidative stress respons gener og skællede differentiering gener [1]. Disse undersøgelser har kastet lys ind i de store genetiske årsager til kræft undertyper og har også identificeret potentielt druggable veje knyttet til disse undertyper. De fremskridt vil fremskynde udviklingen af lægemidler ved at tilbyde nye patient skræddersy strategier for pathway-specifikke hæmmere. Imidlertid har de TCGA undersøgelser hovedsagelig fokuseret på mutationer og sjældne translokationer, med mindre opmærksomhed placeret på genamplifikationer i cancere. Da genamplifikation er en vigtig mekanisme i carcinogenese, vi søgte at udvinde de TCGA datasæt til at identificere nye targets og drivere forstærkes tværs kræftformer.
Gene forstærkning i cancerceller giver et middel til overekspression af kræft-fremme driver gener , såsom
EGFR
ERBB2
på kromosomerne 7 og 17, henholdsvis. Genamplifikation forekommer somatisk i et begrænset område af kræft genomet gennem forskellige mekanismer, såsom brud-Fusion-broer cyklusser [7]. Disse forstærkede områder, kendt som amplikoner, kan spænde kilobaser til et tocifret antal megabaser og kan omfatte flere onkogene gener samt passager gener i de forstærkede områder [8]. Længden af amplikoner kan variere betydeligt baseret på den genomiske locus og cancer type. For eksempel, enkelt gen forstærkning af
KIT
på kromosom 4 kan forekomme i testikeltumorer [9], endnu større amplikoner indeholder
KIT
,
PDGFRA
, og
KDR
amplificeres i glioblastom [10]. Fordi amplikoner indeholder ofte mange gener, herunder passager gener ikke er relateret til onkogenese, er det ofte vanskeligt at identificere kræft driver gen (er) med ansvar for forstærkningen. Strategier for at identificere kræft gener driver en amplicon omfatter kortlægge minimale region forstærkning (MRA) på tværs af mange tumorprøver, identificere positiv korrelation mellem antal kopier og mRNA ekspression af gener, og eksperimentel validering med siRNA /shRNA knockdown i celler. Sådanne analyser har til dato identificerede opformerede gener med en dokumenteret rolle i carcinogenese [7]. Imidlertid har de fleste analyser til dato påberåbte små prøver størrelser, der resulterer i store MRA og potentielle falske positive gener. De TCGA datasæt tilbyder en enestående samling af tumorprøver med store stikprøvestørrelser at identificere forstærkede kræft driver gener i forskellige typer kræft.
Her beskriver vi en bioinformatik screening strategi til at identificere potentielt druggable kræft driver gener forstærkede tværs TCGA datasæt. Vi brugte GISTIC2 analyse af TCGA datasæt (cBio portal) og identificeret 461 gener, der blev statistisk forstærket i to eller flere TCGA datasæt omfatter 14 kræftformer. Gener med formodede eller verificerede roller i kræft blev identificeret ved hjælp af Cancer Genes cBio database. Vi tildelt en druggability score for hvert gen ved at integrere data fra fire eksterne druggability indekser. Fra de 461 gener identificerede vi 73 potentielt druggable opformerede gener med kendt eller formodet rolle i carcinogenese. Vi derefter brugt korrelationsanalyse med kopi nummer og mRNA-ekspression data fra flere tusinde TCGA patientprøver for at identificere potentielle kræft driver gener på listen. Dette resulterede i identifikationen af 40 formodede kræft driver gener forbundet med diverse onkogene processer, herunder epigenetiske regulatorer, cellecyklus-associerede gener, DNA skader respons /reparation gener, metaboliske regulatorer, og gener forbundet med Wnt, Notch, Hedgehog, JAK /STAT, NF-KB og MAPK signalveje. Den formodede cancer driver aktivitet blev yderligere valideret ved at åbne shRNA hårnål aktivitet i cancer cellelinjer ved hjælp af Project Achilles databasen [11]. Yderligere validering blev udført på en delmængde af de gener ved anvendelse af siRNA /shRNA knockdown i cancer cellelinjer, der indeholder genet amplifikation af interesse. Blandt de 40 formodede driver gener var kendt driver gener, såsom
EGFR
ERBB2
, samt nye mål, såsom
DCUN1D1
NSD3
.
KRAS
, en fremtrædende kræft driver med kendte aktiverende mutation i kræft [12], viste sig at blive forstærket i en delmængde af æggestokkene, gastrisk, lunge-, og livmoder kræft. Vi diskuterer konsekvenserne for lægemiddelforskning indsats, og vi identificerer nye patient skræddersy strategier for eksisterende terapeutiske mål.
Materialer og metoder
Bioinformatik analyse
TCGA datasæt fra 14 cancer undertyper var analyseres for genamplifikation ved hjælp af GISTIC2 algoritme i cBio portal (https://www.cbioportal.org). De 14 kræft undertyper omfatter BLCA – Blære urothelial Carcinoma, BRCA – Breast invasiv karcinom, CRC – Kolorektal Cancer (COAD og LÆS undersøgelser kombineres sammen), GBM – glioblastoma multiforme, HNSC – hoved og hals pladecellekræft, KIRC – Kidney renal klar celle karcinom, LGG – Brain Lavere Grade gliom, LUAD – Lung adenocarcinom, LUSC – Lung pladecellekræft, OV – æggestokkene serøs cystadenocarcinoma, Prad – Prostate adenocarcinom, SKCM – hud Kutan melanom, STAD – mave adenocarcinom, og UCEC – Uterin Corpus endometrioide carcinoma . Gener, der blev forstærket i to eller flere TCGA studier blev poolet sammen for at lave en liste over 461 gener. Niveau 3 SNP6 og RNAseq version 2 data blev hentet fra TCGA hjemmeside, og niveau 3 SNP6 data blev yderligere kortlagt til gen-niveau ved hjælp af R pakke CNTools. Pearson korrelationskoefficienter for genkopitallet (SNP6) versus genekspression (RNASeq) blev beregnet for gener af interesse ved hjælp af funktionen cor () i R. dataanalyse kode i R og Gawk kan leveres efter anmodning. Hvert gen blev tildelt en druggability score baseret på data fra de eksterne databaser Ensembl, InterPro-Blast, BioLT-Drugbank og Qiagen Druggability listen. For hver database, blev et gen givet en 0-4 druggability score, hvor 0 er undruggable og 4 er en etableret drug target. Et gen med et “1” druggability score i nogen af de fire databaser blev betragtet som “potentielt druggable” og inkluderet i den endelige gen listen. Genet Listen blev også uploades til Cancer Gener database (cBio portal) og gener forbundet med onkogenese blev medtaget i den endelige gen listen.
Projekt Achilles
Projektet Achilles database består af shRNA udtømning scores fra en samlet genomisk bibliotek testet på tværs af en panel af kræft cellelinjer [11]. Vi udviklede en metode til at score gen afhængighed i hver cellelinje ved at vægte hver hårnål i henhold til graden af sammenhæng med andre hårnåle designet mod det samme gen, på en måde svarende til den, der er beskrevet af Shao et. al [13]. Vi ræsonnerede, at hvis tumorcellelinjer varieret i deres afhængighed af en bestemt driver gen, bør derefter hårnåle effektivt rettet mod at gen giver tilsvarende shRNA udtynding scores i de afhængige linjer. Vi beregnede parvise korrelationer af nedbrydningen scores på tværs af panelet for alle hårnåle fra gruppen af shRNA konstruktioner designet til at målrette et bestemt gen. Så hver shRNA blev vægtet med antallet af andre shRNAs fra det gen sæt, var stærkt korreleret til det (Spearman korrelationskoefficient er større end 0,35 med en p-værdi 0,01). Et gen-niveau sammensat score (shRNA score) blev derefter opnået ved vægtet summation af de shRNA nedbrydningen scores. Disse gen-afhængighed profiler blev anvendt til at beregne sandsynligheden forholdet scorer for sammenslutningen af gen-mutation eller kopi nummer med shRNA følsomhed ved at sammenligne genmutation model til en “nul-model” (uden nogen genmutation).
Celler
Celler blev opnået fra American Type Culture Collection (ATCC) og blev dyrket i Dulbeccos modificerede Eagles medium (DMEM) medium suppleret med 10% føtalt bovint serum. Forstærket og ikke-amplificerede cellelinier blev udvalgt til hver kræft amplificeret gen af interesse. For hver kræft forstærket gen, de cellelinjer benyttes til valideringsundersøgelser og deres tilsvarende gen kopi numre er som følger: (1)
NSD3
: H1581 (7 eksemplarer), H1703 (6 eksemplarer), SW48 (5 eksemplarer ), SW837 (ikke-forstærkede); (2)
DCUN1D1
: Kyse (6 eksemplarer), T47D (4 eksemplarer), SW48 (ikke-forstærket), HCT15 (ikke-forstærket). Kopier talværdier blev opnået fra offentliggjorte CCLE datasæt [14].
Gene knockdown
For gen knockdown gener, vi brugte shRNA lentiviral transduktion partikler købt fra Sigma (Mission, SHCLNV).
DCUN1D1
shRNA konstruktioner var TRCN0000133666, TRCN0000134440, TRCN0000134715, TRCN0000136858, og TRCN0000137482. For
NSD3
Knockdown undersøgelser, brugte vi On-Targetplus SMARTpool siRNA rettet mod human Nsd3 (Thermo Scientific). Celler blev inficeret med lentivirale shRNA partikler ved infektionsmultiplicitet (MOI) i området fra 5-10 i nærvær af 10 ug /ml polybren. siRNA /shRNA blev udført ifølge etablerede protokoller [15].
cellebaserede analyser
Antistoffer anvendt til Western blot-analyse indbefatter kanin-anti-DCUN1D1 (Sigma, HPA035911), kanin-anti- WHSC1L1 (Proteintech, 11.345-1-AP). Western blot blev udført ifølge traditionelle protokoller. Celleproliferation og apoptose blev udført med cellen Titer Glo og Caspase Glo assays (Promega) ifølge producentens instruktioner. Cell cyklus analyse blev udført med propidiumiodidfarvning af cancer cellelinjer ved hjælp af konventionelle protokoller [15].
Resultater
Identifikation af gen-opformeringer i TCGA datasæt
TCGA datasæt omfattende 14 cancertyper blev analyseret med GISTIC2 algoritme (cBio portal) for at identificere genamplifikationer i patienternes tumorprøver. Gener blev bedømt for statistisk sandsynlighed for amplifikation, og de gener, som viser amplifikation i to eller flere datasæt blev identificeret (figur 1). I alt 461 gener blev identificeret som potentielt opformerede gener (Tabel S1). I nogle tilfælde flere gener (fx
CD274
og
NDUFC2
) blev opformeret i to eller flere datasæt, der stammer fra en enkelt cancer undertype (figur 1, tabel S1). Genet liste blev yderligere indsnævret ved at identificere den delmængde af gener med etablerede eller formodede roller i onkogenese samt gener, der var potentielt druggable. Først genet listen var krydsrefereret med Cancer Genes database (cBio portal), som viste, at mindre end 25% af de 461 gener blev forbundet med onkogenese. Derefter blev generne tildelt en druggability score baseret på druggability indeks fra fire eksterne databaser (Ensembl, InterPro-Blast, BioLT-Drugbank og Qiagen Druggability liste). For hver database, blev et gen givet en 0-4 druggability score, hvor 0 er undruggable og 4 er en etableret drug target. Et gen med et “1” druggability score i nogen af de fire databaser blev betragtet som “potentielt druggable” og inkluderet i den endelige gen listen. Fra analysen, blev i alt 73 potentielt druggable cancer forstærkede gener identificeret på tværs af TCGA datasæt (Figur 1).
TCGA datasæt blev udvundet for genamplifikation (GISTIC2 analyse cBio portal) og 461 gen amplifikationer blev identificeret . Listen blev indsnævret til 73 gener cancer-relaterede gener, der var potentielt “druggable” baseret på eksterne druggability databaser. Fra de 73 gener blev 40 formodede cancer driver gener identificeret på basis af kopiantal versus mRNA-ekspression analyse af TCGA data.
73 cancer amplificerede gener blev placeret på tværs af genomet og størstedelen af generne klynge i sygdom loci (figur 2). Af de 73 gener, 57 gener grupperet i 14 loci i hele genomet, og de resterende 18 gener var fokale amplifikationer. I en klynge, generne tendens til at blive amplificeret i tilsvarende typer cancer. For eksempel, et kromosom 20q klynge bestående fire gener (
PTK6
,
SRM
,
RTEL1
, og
PRPF6
) blev alle forstærket i livmoderen /endometrie kræft og lunge adenokarcinomer. En kromosom 1q klynge indeholdt 12 gener, såsom
SETDB1
,
BCL9
,
PIAS3
, og
MCL1
, og 11 af de 12 gener var amplificeret i lung pladeceller cancere og blære kræft (figur 2). En velundersøgte klynge på kromosom 4q indeholder
PDGFRA
,
KIT
, og
KDR
blev forstærket i gliom og melanomer [10]. På grund af den stringens anvendes i Gistic2 analyse, vi sandsynligvis undervurderet cancertyper, hvori et gen-amplifikation fandt sted. Derfor er det sandsynligt, at de 73 cancer gener vi identificeret blev opformeret i andre typer kræft ikke er repræsenteret her (figur 2).
Fra den første liste over 461 gener forstærkede i en eller flere TCGA datasæt, 73 forstærkede gener var identificeret med potentielt “druggable” egenskaber som etablerede /formodede roller i onkogenese. Gener /amplikoner er arrangeret af kromosomal placering, med deres genomiske placering markeret som vist (Mb = megabase). Farvede felter angiver kræftformer med TCGA betegnelser, som følger: BLCA – Blære urothelial Carcinoma, BRCA – Breast invasiv karcinom, CRC – Kolorektal Cancer (COAD og LÆS studier kombineret sammen), GBM – glioblastoma multiforme, HNSC – hoved og hals pladecellekræft , KIRC – Kidney renal klar celle karcinom, LGG – Brain Lavere Grade gliom, LUAD – Lung adenocarcinom, LUSC – Lung pladecellekræft, OV – æggestokkene serøs cystadenocarcinoma, Prad – Prostate adenocarcinom, SKCM – hud Kutan melanom, STAD – mave adenocarcinom, UCEC – Uterin Corpus endometrioide Carcinoma
Blandt de 73 cancer forstærket gener var en række mål etablerede narkotika, såsom
EGFR
,
ERBB2
og
KIT
(figur 2).
ERBB2
på kromosom 17 blev forstærket i 5 cancertyper og blev co-forstærket med MAP kinase adapter
GRB7
PPP1R1B
.
EGFR
på kromosom 7 blev forstærket som et enkelt gen i 7 kræfttyper, validering betydningen af dette stof mål i kræft [16]. Listen omfattede også en række mål i øjeblikket i klinisk udvikling på tværs af branchen, såsom
CDK6
,
PIK3CA
,
PIK3C2B
og
NOTCH2
.
CDK6
på kromosom 7q blev forstærket som et enkelt gen i lunge skællede kræft og glioblastom, mens
PIK3CA
boede på et kromosom 3q klynge med 6 andre gener og blev forstærket i flere typer kræft (figur 2) [17]. Adskillige tidligere validerede cancer forstærkede gener, såsom
FAK
/
pTk2-
blev ikke identificeret i analysen, dels som følge af høj stringens, der blev anvendt på bioinformatik analyse for at reducere falske positive hits [18].
Identifikation af amplificerede cancer gener med formodet cancer føreraktiviteten
da nogle af generne identificeret som cancer amplificerede gener kan være passager gener i amplikonnerne, vi yderligere analyseret genet sæt at identificere formodede cancer driver gener. Dette blev gjort ved at beregne Pearson korrelationskoefficienten mellem kopital og mRNA-ekspression værdi fra TCGA patient tumordata. Korrelationskoefficienter blev beregnet for hver af de 14 cancertyper og den gennemsnitlige korrelationer på tværs af alle kræftformer blev beregnet (figur 3-4). Analysen afslørede en bred vifte af kopiantal versus mRNA-ekspression korrelationer for generne. Formodede cancer driver gener forventes at vise højt kopiantal versus mRNA udtryk korrelation. Validerede kræft drivkræfter, som
ERRBB2
,
EGFR
, og
KRAS
demonstrerede højt kopiantal versus mRNA udtryk korrelation i de tilsvarende kræfttyper, de regulerer (
ERBB2
r = 0,9 i brystkræft,
EGFR
r = 0,8 i lunge adenocarcinom,
KRAS
r = 0,9 i kræft i æggestokkene) (figur 3-4).
Pearson korrelationskoefficienter blev beregnet ved at analysere gen kopi nummer og mRNA-ekspression fra individuelle patient-afledte prøver i TCGA datasæt. Vist er korrelationskoefficienterne for hver TCGA kræft undertype og den gennemsnitlige korrelation på tværs af alle typer kræft (rød betegner høj korrelation, blå angiver lav korrelation). Forkortelser af TCGA datasæt er angivet i figur 1.
Pearson korrelationskoefficienter blev beregnet ved at analysere gen kopi nummer og mRNA-ekspression fra individuelle patient-afledte prøver i TCGA datasæt. Vist er korrelationskoefficienterne for hver TCGA kræft undertype og den gennemsnitlige korrelation på tværs af alle typer kræft (rød betegner høj korrelation, blå angiver lav korrelation). Forkortelser af TCGA datasæt er angivet i figur 1.
Det eksemplar nummer versus udtryk analyse viste de potentielle driver gener, der blev forstærket i gen-klynger. For eksempel kromosomet 1q klynge med 12 opformerede gener indeholdt 4 gener med kopital vs. udtryk korrelation er større end 0,5 (
SETDB1
,
Arnt
,
APH1A
, og
CHD1L
), hvilket tyder på, at disse kan være føreren gener i amplikon (figur 3). Blandt de 12 gener,
SETDB1
viste den højeste samlede korrelation, i overensstemmelse med de seneste rapporter,
SETDB1
er en kræft forstærket gen med demonstreret driver aktivitet [19], [20]. De andre tre gener kan også spille potentielt betydningsfulde roller i carcinogenese –
APH1A
er en gamma sekretasekomplekset underenhed i Notch vej,
Arnt
er en underenhed i HIF1 kompleks, og
CHD1L
er en DNA helicase i DNA beskadigelse respons pathway [21]. Fire gener i amplikon viste kopi nummer versus udtryk korrelation mindre end 0,3 (
PDE4DIP
,
S100A11
,
S100A9
, og
S100A8
) (figur 3). Den kromosom 3 klynge med 7 gener indeholdt 2 gener med kopi nummer versus udtryk korrelation større end 0,5 (
DCUN1D1
PRKCI
) og 4 gener med kopi nummer versus udtryk mindre end 0,3 (
tert
,
SKIL
,
GNB4
, og
SOX2
).
PRKCI
er en serin /threonin-kinase i NF-KB-vejen og tidligere væv microarray data valideres dette gen som en potentiel hidtil ukendt cancer driver genet [22].
DCUN1D1
er en E3 ubiquitinligase kompleks underenhed med potentiel cancer driver aktivitet, som vi yderligere valideret med shRNA knockdown (nedenfor). Mens
PIK3CA
vises en overordnet korrelationskoefficient 0,4, det viste høj korrelation i brystcancer (r = 0,9), hoved og hals skællede cancer (r = 0,8), og uterus /endometriecancere (r = 0,7) ( Figur 3).
kromosom 11q klynge indeholdt 5 gener, herunder
CCND1
, en veletableret cellecyklus regulator og onkogen driver. Mens
CCND1
viste højt kopiantal versus ekspressionsvektorer korrelationer i leverkræft (r = 1,0), blærecancer (r = 0,8), lunge squamous cancer (r = 0,7), hoved og hals caner (r = 0,7) og brystcancer (r = 0,7), korrelationerne var lavere i andre typer cancer, hvilket antyder, at
CCND1
amplifikation er en sygdomsspecifik onkogen driver (figur 3). To andre gener i amplikon,
FADD
, og
PPFIA1
, vises større samlet korrelation på tværs cancertyper, implicerer disse gener som potentielle roman kræft drivere til yderligere undersøgelse.
FADD
, en apoptotisk effektormolekyle, er tidligere identificeret som en ny kræft driver gen i et panel af 167 larynx /svælg kræft, berettiger yderligere undersøgelser i sin mekanisme onkogenese [23]. Det er vigtigt at bemærke, at korrelationen af mRNA-ekspression for at kopiere nummer er ikke afgørende i princippet et gen til at være en cancer driver gen. Derfor gener med lav mRNA-ekspression versus kopital korrelation er ikke nødvendigvis passager gener. For eksempel kromosomet 1q klynge indeholdt
MCL1
, et gen med en cancer driver signatur baseret på Project Achilles (data ikke vist), men med en gennemsnitlig mRNA-ekspression versus kopiantal korrelation på 0,31.
at identificere de forstærkede cancer gener med højeste samlede kræft driver aktivitet, vi rangeret generne i rækkefølge efter højeste antal kopier versus mRNA udtryk korrelation på tværs af alle typer kræft. Vi identificerede 40 gener med overordnet r større end 0,3 (tabel 1). Den r = 0,3 cutoff blev brugt, fordi flere gener viste høj r i et lille antal kræftformer. For eksempel,
FGFR3
vises r 0,7 i fire kræftformer (blærekræft, glioblastom, lunge skællede, og melanom), men r 0,5 i andre kræftformer. Tilsvarende
CDK6
demonstrerede r 0,7 i kun 4 kræftformer (glioblastom, hoved- og halscancer, lunge adenocarcinom, og lunge skællede kræft), mens
IGF1R
havde r 0,7 i kun én cancer ( brystkræft) (Figur 3-4). Blandt de 40 gener med højeste kræft driver aktivitet, de øverste to mest klassificeret gener var
NSD3
/
WHSC1L1
og
SETDB1
, to vigtige histon methyltransferaser (tabel 1) . Mens
SETDB1
blev for nylig etableret som en bona fide forstærket kræft driver i melanom og lungekræft [19], [20], den rolle,
NSD3
/
WHSC1L1
har ikke blevet godt karakteriseret og så vi yderligere valideret dets onkogene rolle in vitro (nedenfor). To andre kromatin regulatorer, den kromatin læser Brd4 og histonacetyltransferase
YEATS4
, blev også højt rangeret som formodede kræft driver gener. Andre gen familier, der var repræsenteret på listen omfatter Notch pathway gener (
NOTCH2
,
APH1A
), metaboliske regulatoriske gener (
NDUFC2
,
PRKAB2
), pindsvineoverføringsvejen gener (
DCUN1D1
), Wnt pathway gener (
BCL9
), NF-KB pathway gener (
ERC1
,
PRKCI
,
IKBKB
), JAK /STAT pathway gener (
PIAS3
), MAPK signalering effektorer (
KRAS
,
FRS2
,
GRB7
), receptortyrosinkinaser (
FGFR3
,
EGFR
,
ERBB2
,
IGF1R
), DNA skader respons /reparation gener (
RAD51AP1
,
RTEL1
,
ERCC5
,
RAD52
,
CHD1L
), p53-associerede gener (
MDM2
,
MDM4
,
GTPBP4
), og cellecyklus regulerende gener (
CCNE1
,
TPX2
,
CCND3
,
CDK6
) (tabel 1).
kopi nummerserier af kræft forstærkede gener blev analyseret i individuelle TCGA patient tumorer at bestemme omfanget af gen forstærkning (fig. S1, S2) . Nogle gener viste højt forstærkning svarende til 10-20 genkopier, mens andre gener viste lave niveau 3-8 kopital amplifikationer. Den kromosom 1q amplicon, som indeholdt
PRKAB2
,
APH1A
,
Arnt
, og
SETDB1
viste lavt niveau forstærkning (3-10 kopier) , mens kromosom 12q amplicon, som indeholdt
MDM2
,
YEATS4
, og
FRS2
viste højt amplifikation (10-20 kopier) (fig. S1, S2 ). Andre gener med højt niveau amplifikationer omfatter
PRKAB2
(6-10 eksemplarer i ovariecancer),
MDM4
(10-30 kopier i glioblastom),
MDM2
(10- 15 eksemplarer i lunge adenocarcinom),
PIK3CA
(5-20 eksemplarer i lunge skællede kræft),
DCUN1D1
(5-15 eksemplarer i lunge skællede kræft),
FADD
og
PPFIA1
(hver med 5-10 eksemplarer i hoved og halskræft),
NDUFC2
(5-15 eksemplarer i ovariecancer), og
RAP1B
(5- 15 kopier i lunge adenocarcinom). MAP-kinase associerede gener viste også højt forstærkning, med receptortyrosinkinaser
ERBB2
,
IGF1R
, og
EGFR
alle stærkt forstærket, som forventet. De MAP kinase adapter proteiner
FRS2
og
GRB7
blev også meget forstærket (10-20 kopier i lungeadenokarcinom og brystkræft, henholdsvis). Cellecyklus regulatorer, såsom
CCNE1
(10-20 kopier i ovariecancer), blev også stærkt forstærket, som forventet. Foruden kopiere nummerserier, blev hyppigheden af genamplifikation i patientens tumorer beregnet ved hjælp kopiantal 4 som et cutoff til amplifikation (fig. S4). Et betydeligt antal gener blev forstærket i mere end 30 procent af kræftpatienter, herunder
DCUN1D1 Hotel (43% af lunge planocellulære kræft),
FADD
og
PPFIA1
(~ 30% af hoved og hals kræft), og
PRKCI Hotel (36% af lunge planocellulære kræft) (fig. S4). Mens forstærkning var den primære genomiske forandring for disse gener, en række gener, også foretaget somatiske mutationer, såsom
PIK3CA
,
KRAS
NOTCH2
. I disse tilfælde, de amplificeringer og mutationer var stort set udelukker hinanden (fig. S4).
MAPK pathway forstærkede gener
De 73 cancer forstærkede gener blev yderligere analyseret af shRNA validering at kontrollere kræft driver aktivitet . Projekt Achilles er en store forsøg til katalog genetiske svagheder i cancercellelinier ved anvendelse af en genom-dækkende shRNA bibliotek for at identificere gener, som påvirker cancercelleoverlevelse /proliferation [11]. Vi minerede Achilles databasen for at afgøre, hvilke af de 73 cancer forstærkede gener kan spille en rolle i cancer celle overlevelse /spredning. Den Achilles Biblioteket består af flere shRNA hårnåle og vi beregnet en sammensat shRNA score baseret på virkningerne af flere lentivirale shRNA hårnåle på inficerede kræftceller. Gener demonstrerer en lav shRNA score i inficerede cellelinjer formodes at være vigtige for kræftcellen overlevelse og kan repræsentere formodede kræft drivere. De shRNA score er kun gældende, når flere shRNA hårnåle konsekvent demonstrere kræftcellen hæmning (betegnet “large korrelation”). Den Achilles databasen blev forespurgt med de 73 gener og disse gener med “stor korrelation” shRNA aktivitet blev identificeret, og deres shRNA scoringer blev beregnet på tværs af flere hundrede cancer cellelinjer (fig. S3). Adskillige gener haft negative shRNA scores over det meste af de kræftcellelinjer og var formentlig afgørende for kræftcellen overlevelse /spredning. Disse gen omfattede
KRAS
,
PRKAB2
,
GRB7
,
BRD4
,
PRPF6
,
BCL9
,
PPFIA1
og
NOTCH2
. Andre gener viste negativ shRNA scorer i en delmængde af kræft cellelinjer, såsom
CCND1
,
NDUFC2
,
YEATS4
,
GTPBP4
, og
CHD1L
(fig. S3).
Leave a Reply
Du skal være logget ind for at skrive en kommentar.