PLoS ONE: systematisk identifikation af kombinatoriske drivere og mål i Cancer Cell Lines

Abstrakt

Der er et presserende behov for at fremkalde og validere yderst effektive mål for kombinatorisk indgriben fra storstilede igangværende molekylære karakterisering indsats af tumorer. Vi etablerede en i silico bioinformatiske platform i koncert med en high throughput screening platform evaluere 37 nye målrettede agenter i 669 ekstensivt karakteriserede kræft cellelinjer afspejler den genomiske og vævstype mangfoldighed af menneskelige kræftformer, til systematisk at identificere kombinatoriske biomarkører for respons og co-handlingsrettede mål i kræft. Genomisk biomarkører opdaget i en 141 cellelinje træningssæt blev valideret i en uafhængig 359 cellelinje test sæt. Vi identificerede co-forekommende og gensidigt udelukkende genomiske begivenheder, der repræsenterer potentielle chauffører og kombinatoriske mål i kræft. Vi demonstrerer flere samarbejdende genomiske begivenheder, der forudsiger følsomhed overfor lægemiddel indgriben uafhængig af tumor afstamning. Koblingen af ​​skalerbare i silico og biologiske high throughput kræft cellelinje platforme til identifikation af co-events i kræft leverer rationelle kombinatoriske mål for syntetiske dødelige tilgange med et stort potentiale for at foregribe fremkomsten af ​​resistens.

Henvisning: Tabchy A, Eltonsy N, Housman DE, Mills GB (2013) systematisk identifikation af kombinatoriske drivere og mål i kræftceller. PLoS ONE 8 (4): e60339. doi: 10,1371 /journal.pone.0060339

Redaktør: Mark Isalan, Center for Genomic forordning, Spanien

Modtaget: 25 oktober, 2012; Accepteret: 25 februar 2013; Udgivet: April 5, 2013 |

Copyright: © 2013 Tabchy et al. Dette er en åben adgang artiklen distribueres under betingelserne i Creative Commons Attribution License, som tillader ubegrænset brug, distribution og reproduktion i ethvert medie, forudsat den oprindelige forfatter og kilde krediteres

Finansiering:. Dette arbejde blev støttet af National Institutes of Health (NIH) U54 CA112970 til GBM (https://www.nih.gov/), en Komen Promise tilskud (KG08109903) til GBM og Komen Proteomics Discovery tilskud (FAS0703849) til aT og GBM (http : //ww5.komen.org/), et program af underholdning Industry Foundation SU2C-AACR-DT0209 01 tilskud til GBM (https://www.standup2cancer.org/), og støtte fra GSK til GBM (http: //www.gsk.com/). De finansieringskilder havde ingen rolle i studie design, indsamling og analyse af data, beslutning om at offentliggøre, eller forberedelse af manuskriptet

Konkurrerende interesser:. GBM modtaget sponsoreret forskning fra GSK til at bestemme molekylære markører forudsige respons på PI3K pathway hæmmere. GBM har støtte fra Exelixis, Celgene, Wyeth og Astra Zeneca at bestemme respons på lægemidler, der ikke er involveret i denne undersøgelse. GBM er på onkologi Advisory Board af Astra Zeneca. Dette ændrer ikke forfatternes tilslutning til alle PLoS ONE politikker om datadeling og materialer. De andre forfattere erklærer ingen konkurrerende interesser.

Introduktion

En stor spirende udfordring i kølvandet på tsunamien af ​​data genereret af bestræbelser på at karakterisere tumorer på det molekylære niveau (f.eks The Cancer Genome Atlas [ ,,,0],TCGA] (https://www.cancergenome.nih.gov) og International Cancer Genome Consortium [ICGC] (https://www.icgc.org)) er, hvordan man udnytte data og omsætte den til forbedrede kliniske resultater, som identificere det molekylære grundlag af cancer hos individuelle patienter og efterfølgende anvendelse af disse molekylære læsioner som mål for effektiv intervention. Samtidig er reduktionen i sekventering omkostninger fører til

demokratisering

af molekylær test allerede resulterer i mange patienter, der har deres tumorer indtastet på molekylært niveau. Tumoren karakterisering indsats ikke længere er hastighedsbegrænsende; snarere hvordan man skal fortolke og “handle” på de data, er nu den vigtigste begrænsende faktor. Disse udfordringer skal overvindes, før nye teknologiske fremskridt i tumor karakterisering kan levere maksimale kliniske effekt. Et vigtigt skridt i processen er at identificere biomarkører, der ville forudsige respons på behandling og parsing af handlingsrettede kørsel molekylære afvigelser fra støj. Disse udfordringer kan løses ved at gennemføre algoritmer, der hjælper analysere data, sideløbende med oprettelse storstilede humaniseret modelsystemer for high throughput target opdagelse og validering, som også vil informere en fremskyndet udvikling af lægemidler og kliniske forsøg proces. Robuste prædiktive biomarkører for kombinatorisk molekylær medicin er et presserende behov for at ændre det kliniske forsøg landskabet fra den aktuelle lave terapeutiske virkning i store kliniske forsøg og umarkerede befolkninger, høj effekt små kliniske forsøg beriget til målgrupper. Denne fremgangsmåde har potentialet til at gøre de kliniske forsøg mindre, hurtigere og billigere, og samtidig øge fordelene for de enkelte patienter.

langt enkelt biomarkører drevne interventioner har således haft begrænset succes i klinikken. Indledende succeser med målrettede lægemidler i “onkogen-afhængige” tumorer [1] – [4] (f.eks Imatinib i CML, BRAF inhibitorer i melanom) er blevet hærdet af realiseringen af ​​en række begrænsninger: (1) udvikling af resistens som følge af kræft heterogenitet, med præ-eksisterende kloner demonstrerer variation i det molekylære mål fører til klinisk resistens (klonselektion); (2) indledende modstand af tumorer grund af en samtidig mutation i en modstand pathway; og (3) resistens som følge af homeostatiske tilbagekoblingssløjfer at genindføre baseline steady state forstyrres af målrettede foranstaltninger [2] – [6]. Således fremgår det, at enkelte biomarkører og /eller indgreb kan have begrænset potentiale for succes i klinikken. På samme måde, som vi håndtere livstruende bakterielle eller virale infektioner (f.eks Tuberkulose, human immundefekt virus) med flere samtidige antibiotika [7] – [9], vellykket terapi for cancer, som har alle de alsidighed og robusthed eukaryote repertoire af svar til sin rådighed, vil sandsynligvis kræve flere samtidige målrettede interventioner for at foregribe fremkomsten af ​​resistens. Her foreslår vi en ramme for rationel identifikation af de flere drivere, der samarbejder for at producere cancerfænotypen, og kunne derefter anvendes som effektive mål til kombineret terapeutisk indgriben.

cancercellelinier nøje rekapitulere kendt tumorassocieret genetiske abnormaliteter leverer modeller for human sygdom. For eksempel brystcancer-afledte cellelinier vist sig at trofast rekapitulere de genomiske træk ved primære tumorer, med HER2-genamplifikation korrelerer med trastuzumab følsomhed både in vitro og hos patienter [10], hvilket viser, at klinisk observerede genotype-respons sammenhænge er konserveret i cancercellelinie modeller. Her udfører vi en systematisk søgning efter genomiske co-hændelser, der er valgt under kræft initiering eller progression, og hvis målrettede sammen kunne markant forbedre patienternes resultater. Vi demonstrerer en i silico platform til identifikation af co-forekommende cancer chauffører og biomarkører for respons, og dens anvendelse som proof of concept i et stærkt præget 669 cellelinje sæt behandlet med 37 nye målrettede agenter. Predictive biomarkører identificeret i en 141 cellelinje træningssæt blev valideret i en uafhængig 359 cellelinje test sæt. Vi foreslår, at en pipeline består af en robust i silico bioinformatik platform koblet til en high throughput kræft cellelinje platform for funktionel genomisk opdagelse og validering kunne fungere som en bro mellem karakterisering indsats ligesom TCGA /ICGC den ene ende og de klinik /kliniske forsøg på den anden.

Metoder Resumé

Drug svar gIC50 data for i alt 37 målrettede forbindelser testet på 669 cellelinjer, der repræsenterer den genomiske mangfoldighed af menneskelige typer cancer, specielt 23 forbindelser testet på 310 celle linier (GSK set), og 14 testede forbindelser på 500 cellelinjer (McDermott set) blev opnået fra offentlige databaser (fig. 1) [11] – [13]. Drug respons-kurver blev genereret og vendepunkter var matematisk opgøres på grundlag af høj orden polynomiel kurve modeller og defineret følsomme vs resistente cellelinier for hvert lægemiddel (fig. S1 i File S1). Cellelinjer blev primært SNP genotype matches til Sanger Institute Cancer Genome cellelinje database til at linke narkotika følsomhed data på cellelinjer til genomiske karakterisering data fra Sanger [14], herunder mutationen status fra fuld kodende exoner sekventering af 64 almindeligt muterede cancer gener (herunder antal kopier), og kopier nummer data fra Affymetrix SNP Array 6.0 på 419 gener [14]. Et genomisk begivenhed blev defineret som enten en mutation og /eller en kopiantal aberration i et bestemt gen. Forventede og observerede co-begivenhed frekvens blev genereret i de følsomme og resistente cellelinjer og genomiske co-funktioner, der var i uligevægt fanget gennem flere lag statistisk og biologisk betydning test og cross validering dermed producerer meget betydelige co-udvalgt og gensidigt eksklusive arrangementer, herunder genomiske og slægt funktioner i cellelinjen befolkning og for hvert lægemiddel (fig. 2). De genomiske biomarkører opdaget i en 141 cellelinje uddannelse sæt blev uafhængigt valideret i en uafhængig ikke-overlappende test sæt 359 cellelinjer screenet den 14. af forbindelserne.

GSK sæt er 310 cellelinjer, genomisk information til rådighed på 294. McDermott sæt er 500 cellelinjer, genomisk information til rådighed på 366. de 141 cellelinier fælles for GSK og McDermott blev brugt som et træningssæt, genomisk information tilgængelig på 139.

Plot af forskel mellem de frekvenser (

Observed – Predicted)

for alle potentielle dobbelte genomiske begivenheder i 294-cellelinjer. Baseret på 262 forskellige gener berørte, var der i alt 34,191 potentielle genomiske begivenheder, der involverer to gener. Negative forskelle er længst fra nul (venstre hale) er gensidigt eksklusive arrangementer, positive forskelle er længst fra nul (højre hale) er co-udvalgte begivenheder. De væsentlige begivenheder fra venstre og højre haler findes i tabel 3 og tabel S5 i File S3

Metoder

Etik Statement:. N /A.

Cell linje Growth Inhibition Analyser

Data fra 23 testet på op til 310 cellelinier GSK-forbindelser (interval 187-273 cellelinjer screenet per lægemiddel, betyder = 228 cellelinjer pr lægemiddel) blev downloadet fra indtægter fra Greshock og kolleger, og Kim og kolleger (GSK sæt) [11], [13], og data fra 14 testet på op til 500 cellelinier yderligere forbindelser (interval 244-500, betyder = 460 cellelinjer) blev downloadet fra midler, som McDermott og kolleger (McDermott sæt) [12] (fig. 1). Både GSK og McDermott sæt cellelinjer repræsenterer forskelligartede spektrum af tumortyper i human cancer, med 23 og 21 kræft slægter henholdsvis epitel, mesenkymale og bloddannende oprindelse. For GSK sæt, Wooster og kolleger opnået i alt 311 unikke kræft cellelinjer fra flere leverandører (American Type Culture Collection, Developmental Therapeutics Program, National Cancer Institute, tysk Resource Center for Biologisk materiale, og europæisk Collection Animal Cell Cultures), derefter vokset til standard dyrkningsmedier anbefalet af sælgeren; cellelinjer hvor bekræftet af SNP fingeraftryk på Affymetrix 500 K ‘SNP Chip’ som tidligere [11] beskrevet. For McDermott sæt blev menneskelige kræftceller fås fra American Type Culture Collection (ATCC), Deutsche Sammlung von Mikroorganismen und Zellkulturen GmbH (DSMZ), den japanske Indsamling af Research Bioressourcer (JHSF), eller den europæiske samling af cellekulturer (ECACC) og dyrket i overensstemmelse med standardprotokoller som beskrevet tidligere [12]. Cellelinie vækstinhibering assays blev udført som tidligere beskrevet [11], [12]. Kort fortalt, for GSK sæt, midtpunktet af væksten vindue (den gIC50) falder halvvejs mellem antallet af celler på tidspunktet for forbindelse tilsætning (T = 0) og væksten af ​​kontrolceller behandlet med DMSO ved 72 timer. Den gIC50 værdi (lægemiddelkoncentration, nmol /L) er et metrisk til måling af hæmning af proliferation i kræftceller. Ligeledes i McDermott sættet,

cellelevedygtigheden

af hver cellelinje til en given koncentration af forbindelse blev beregnet som den del af levedygtige celler med ubehandlede celler til stede efter 72 timers behandling (ratio). Vi vil henvise til gIC50 (GSK sæt) og cellernes levedygtighed (McDermott sæt) som Growth Inhibition (GI) værdier. I begge sæt, jo lavere GI-værdi på mere følsom cellelinie til et bestemt lægemiddel.

Drug respons kurver og Bestemmelse af Resistent vs Følsomme cellelinier

Vi systematisk identificeret følsomme vs resistent celle linjer for hvert lægemiddel. Følsomhed og modstand er ikke iboende egenskaber cellelinierne, men er defineret i forhold til et specifikt lægemiddel. For hvert lægemiddel, rang vi bestilte og plottet GI værdier for cellelinie befolkning. Den GSK sæt omfattede 310 cellelinjer. Den McDermott sæt omfattede 500 cellelinjer testet på 14 forbindelser: de 141 cellelinjer, der var fælles for de McDermott og GSK sæt blev brugt som et træningssæt; De resterende ikke-overlappende 359 cellelinjer (500-141 = 359) blev anvendt som en prøveopstilling for at validere vores resultater på de 14 sammensatte data fra McDermott (fig. 1). Baseret på bestemmelsen af ​​den første “vendepunktet”, der svarer til det område, hvor grafen afviger brat ind i lejligheden centrale område af kurven (fig. S1 i File S1), blev cellelinien population opdelt i to grupper, den tidlige del af kurven definerede de følsomme linjer med lav GI-værdier (før vendepunkt), og den flade del af kurven og videre definerede resistente linjer med højere GI-værdier (efter vendepunktet). Dette sikrer, at cellelinjer, der er defineret som følsomme har lav GI værdier og en anden følsomhed derefter resten af ​​de testede for at narkotika cellelinier. Den centrale flade del af kurven indeholder cellelinier med lignende GI-værdier, det svarer til den maksimale frekvens område på en normal fordelingskurve, når frekvensen er afsat mod GI-værdier. Denne fremgangsmåde sikrer også en effektiv opsamling af små delmængder af outlier cellelinjer med afmærkede reaktioner på grund af lav frekvens narkotikarelaterede sensibiliserende genotyper. Kurven lægemiddelrespons blev modelleret matematisk som en høj orden polynomium kurven; den første “vendepunktet” blev bestemt grafisk som den første forekomst af den største ændring i hældningen (hældningen er den første afledte) af lægemidlet responskurve, dvs. den første forekomst af den største absolutte værdi for den anden afledede af kurven ( første ekstremum). Bøjning punkter blev bestemt uafhængigt for hver forbindelse i GSK sæt, og i uddannelses- og test sæt til forbindelser i McDermott sættet hhv. I GSK sæt, median gIC50 værdien ved vendepunktet var 659 nM, med en række på 16 til 3955 nM. I McDermott sæt, vi bruges som et cutoff vendepunktet eller en GI værdi på 0,78, alt efter hvad der gav den største følsomhed (mindre GI-værdi): for træningssættet, median cutoff var 0,69, med en række på 0,51 til 0,78; til testen sæt, medianen cutoff var 0,74, med en rækkevidde på 0,50 til 0,78.

SNP-baserede fingeraftryk bruges som Robust Adresse for cellelinje krydsreferencer

For at udføre genotype- respons sammenhænge, ​​vi er knyttet genomisk information (mutationer og kopi nummer afvigelser) på cellelinjer fra en særskilt samling til deres respons profiler (GI). For at undgå potentielle problemer med navngivning af cellelinjer og forurening, brugte vi den unikke SNP fingeraftryk af hver cellelinje (GSK sæt) for krydsreferencer og matchende cellelinjer tværs databaser. Genotype analyse af GSK 310 cellelinje sæt blev udført af SNP fingeraftryk på Affymetrix 500 K ‘SNP Chip’ som tidligere [11] beskrevet. Kort fortalt blev SNP fingeraftryk af cellelinierne i forhold til hinanden og til SNP fingeraftryk genereres af Wellcome Trust Sanger Institute Cancer Genome cellelinje Project som tidligere beskrevet, med cellelinjer, der har 80% identitet betragtes som en genetisk match. Der var 283/310 genetisk forskellige cellelinier i GSK sættet. Celle levedygtighed assays for 25 ud af de 37 forbindelser blev begrænset til de genetisk forskellige cellelinier. I alt 256/310 cellelinier viste sig at have en genotype match i Sanger-databasen. Af de genotype kampe, 233/256 også modsvares af navn, og for dem, der ikke passer med navn (n = 23), havde genotypen association mellem de navne, tidligere registreret (https://www.sanger.ac.uk /genetics/CGP/Genotyping/synlinestable.shtml). For de resterende 54 cellelinier (310-256), blev 38 modsvares af navn til Sanger-databasen, og 16 forblev uovertruffen (tabel S1 i File S3). Cellelinie navne blev manuelt revideret. blev taget yderligere skridt til at sikre sammenhæng mellem cellelinje navne og ingen overlapning i tilfælde var syntaks eller tegnsætning forskelle opstod mellem navne eller aliaser. For McDermott sæt tælle 500 cellelinjer, blev de 141 cellelinjer, der var fælles for de McDermott og GSK sæt som modsvares af navn, der anvendes som et træningssæt, og de resterende ikke-overlappende 359 cellelinjer blev anvendt som en test sæt. Cellelinier i testen sæt, hvor en genotype association til en cellelinje i træningssættet tidligere er blevet registreret, blev fjernet fra testen sæt; Derudover blev cellelinjer inden den test, der hvor en genotype forening tidligere er blevet registreret (interne dubletter) fjernes med en repræsentant for cellelinie tilbage. Således 348 distinkte cellelinier forblev i testsættet. I alt 216/348 cellelinier blev matchet til Sanger-databasen og 132 forblev umatchede (tabel S2 i File S3). De genomiske karakteristika for de tilsvarende cellelinjer i Sanger Cancer Genome Project blev downloadet (https://www.sanger.ac.uk/genetics/CGP/CellLines/) til GSK og McDermott sætter henholdsvis; en kurateret database over de genomiske begivenheder i hver cellelinje blev kompileret (tabel S3 i File S3 for GSK sæt og træningssæt, n = 310-16 = 294; Tabel S4 i File S3 til testen sæt, n = 216) baseret på sekventering data til basepar-opløsning af den fulde kodende exoner af 64 almindeligt muterede cancer gener, og genom-dækkende analyse af kopi nummer gevinst og tab ved hjælp af Affymetrix SNP 6.0 mikroarrays og PICNIC algoritme til at forudsige kopital segmenter på 419 gener (herunder de 64 gener ovenfor), downloadet fra Sanger Cancer Genome Project, katalog af somatiske mutationer i Cancer (COSMIC V51 release) [14]. Et genomisk begivenhed blev defineret som enten en mutation (kodende sekvens variant), og /eller et kopiantal aberration [en homozygot deletion (total kopiantal = 0) eller en forstærkning (total kopiantal = 8)] i et bestemt gen . Udtrykkene genomisk begivenhed og mutation i flæng i teksten til at repræsentere en afvigelse på et specifikt genomisk sted.

Identifikation Genomisk Co-begivenheder Relevans

Hvis genomiske hændelser (dvs. mutationer, kopiantal aberrationer) er tilfældigt fordelt i populationen af ​​cellelinier, og to begivenheder co-forekomme i en cellelinje uafhængigt af hinanden og på grund af tilfældige faktorer alene, og deres samtidig forekomst ikke sætte cellen ved en selektiv fordel eller ulempe, så den forudsagte co-mutation sats i befolkningen er følgende:

Observeret co-mutationsrater blev sammenlignet med forudsagte co-mutationsrater; Co-mutationer, der opstår

mere eller mindre end

forudsagt tilfældigt blev bestemt ved et signifikansniveau på P = 0.05 af Pearson Chi-square test. Disse afvigelser fra tilfældighed skyldes sandsynligvis selektive pres. Konkret at identificere co-hændelser, der var forbundet med narkotika respons, sammenlignede vi forventes at observerede frekvenser for hvert lægemiddel i følsomme og resistente subpopulationer henholdsvis (Chi-square test). Når relevante co-mutationer blev bestemt i følsomme og resistente underpopulationer, der ud over Chi-square test for statistisk signifikans, et forhold mellem observerede frekvenser i følsomme vs resistente linjer (S /R) blev beregnet med en større end 1,5 gange ændring [ ,,,0],,667-1,5] bliver brugt som et andet udvælgelseskriterium. Disse tilgange blev anvendt på uddannelse og test sætter hhv.

Dataanalyse og Clustering

Cluster software blev brugt til at justere GI data før hierarkisk klyngedannelse. For hver af de 37 forbindelser, GI-værdier blev første median centreret normaliseres derefter; dette giver en skaleret væksthæmning score, der er en potens-uafhængig middel til at sammenligne respons profiler på tværs forbindelser. Dataene blev derefter hierarkisk klynger hjælp Pearsons korrelation som en metrik baseret på den gennemsnitlige afstand mellem noder. Træstrukturvindue blev anvendt til visualisering af de resulterende klynger. Den Cluster og Treeview software er tilgængelige fra Eisen laboratoriet (https://rana.lbl.gov/EisenSoftware.htm) [15].

Statistisk analyse

Pearsons Chi-square test ( for co-events) og Fishers eksakte test (for enkeltstående begivenheder) blev anvendt til at tildele tosidede P-værdier på 95% konfidensinterval at beskrive sammenhænge mellem genmutationer /kopi nummer aberrationer og narkotika følsomhed. Til bestemmelse af statistisk signifikante enkelt genomiske begivenheder, med kun et par tests kører, dette undgås behovet for at korrigere for flere sammenligninger. (. Tabel S5 i File S3 og figur 2) Når løbet af to co-events blev bestemt i de 310 cellelinier blev en Benjamini-Hochberg multiple test korrektion tærskel med falsk opdagelse sats (FDR) på 5% anvendes; mere end 92% af resultater forblev signifikant efter korrektionen. Selvom for teoretiske grunde, vi anvender den strengeste korrektion multipel testning, den meget konservative Bonferroni korrektion, til den samlede ufiltrerede rum af alle observerede 6871 dobbelt co-arrangementer, med 6871 test køre, 65% af resultater forblev signifikant efter korrektion blev anvendt. Endnu vigtigere, blev vores biomarkør forudsigelser for enlige og co-events uafhængigt valideret i en uafhængig ikke-overlappende test sæt 359 cellelinjer testet på 14 forbindelser, som omfatter McDermott indstillet.

Resultater

Unsupervised gruppering af Drug respons i cellelinier rekapitulerer Pathway Specifikke lægemiddelvirkninger og drivere

Vi først bestemmes, hvis ukontrollerede gruppering af følsomheden af ​​310 menneskelige kræftceller til 37 målrettede lægemidler kunne rekapitulere kendte narkotika virkningsmekanismer og også den molekylære grundlag af reaktionen i stærkt karakteriseret cellelinier. Dette visualiseres i fig. 3 for et samlet overblik over cellelinje-drug respons (og fig. S2 i File S1). Fig. S3, S4 i File S1 visualisere clustering billeder til GSK (23 stoffer) og McDermott sæt (14 drugs) separat; den uafhængige analyse reducerer støjen indført ved analyse af 37 forbindelser og sammenlægning af to uafhængige datasæt med forskellige tilgange således at give en strammere gruppering af funktionelle mål klasser. Faktisk lægemidler samlet i en klynge på den lodrette akse efter deres primære kendte molekylære mål. For eksempel kan et sæt af strukturelt afvigende IGF1R målrettede lægemidler grupperet i tæt nærhed i fig. 3 og fig. S3 i File S1, med en korrelationskoefficient på 0,78 for IGF1R subcluster afbildet. Hierarkisk klyngedannelse sammenfattet også drug mål inden for veje, og dermed definere pathway specifikke interventioner, der effektivt kan modulere afvigende onkogene veje. Det var tydeligt i den stramme gruppering af lægemidler, der er målrettet PI3K /AKT /mTOR pathway, i fig. 3 og fig. S3 i File S1, som GSK2126458 [PI3K], GSK690693 [AKT], Temsirolimus [mTOR], TGX-221 [PI3K-beta], IC87114 [PI3K-delta], GSK2119563A [PI3K-alpha], GSK2080806A [PI3K], BEZ -235 [panPI3K og mTOR], og GSK1059615 [PI3K], grupperet sammen med en korrelationskoefficient på 0,72 for PI3K /AKT /mTOR pathway subcluster. I fig. 3 og fig. S4 i File S1, EGFR og HER2 målrettede lægemidler, Erlotinib [EGFR], CL387 [EGFR], HKI272 [EGFR, HER2], og Lapatinib [ErbB1 /2], grupperet sammen med en korrelationskoefficient på 0,66 for EGFR subcluster. Mitotiske inhibitorer, Paclitaxel [tubulin], GSK461364 [PLK1], GSK661637 [Pan-PLK], GSK923295 [CENPE], og GSK1070916 [AURKB] også grupperet tæt som vist i fig. 3 og fig. S3 i File S1. I denne analyse har afstamning af oprindelsen af ​​cellerne ikke signifikant indflydelse på organiseringen af ​​klynger, hvilket tyder på, at ikke-slægt afhængige begivenheder bidrager til respons på forskellige narkotika klasser. De molekylære læsioner, der ligger til grund for svar på specifikke lægemidler i disse subclusters er yderligere udforsket nedenfor.

Hver række repræsenterer en separat celle linje, og hver kolonne repræsenterer en testet separat forbindelse. Stigende følsomhed af en cellelinje er angivet med stigende intensitet af den grønne signal, og stigende resistens af en cellelinje er angivet med stigende intensitet af det røde signal; sorte firkanter angiver følsomhed tæt på medianen tværs cellelinier. Cellelinier ikke screenet med en bestemt forbindelse er angivet med gråt. Dataene fra fig. 3 er opdelt i to mindre komplekse tal (Fig.S3 og S4 i File S1) for at mindske støj og giver en bedre visning af funktionelle relationer og aktiveret onkogene pathway subclusters.

Single Genomisk Events adskilt Sensitive fra resistente Lines

Vi ønskede at identificere den molekylære basis for forskellen i afhængighed af narkotika intervention. Vi korreleret bagvedliggende molekylære forskelle i cellelinier med forskelle i lægemiddelrespons. At identificere, hvilke molekylære læsioner blev forbundet med følsomhed eller resistens mod et specifikt lægemiddel, blev frekvensen af ​​en genomisk begivenhed sammenlignet i følsomme vs resistente linjer og et forhold mellem (frekvens i følsomme /frekvens i resistent), S /R, blev beregnet for enhver gen aberration stede i mere end 12% af de følsomme eller resistente linjer. Helst gen frekvens, der blev ændret på mere end 1,5 gange i følsomme vs resistente linjer blev anset for at være forbundet med følsomhed over for lægemidlet (S /R 1.5) eller resistens over for lægemidlet (S /R 0,67), hhv. Dette identificerede genomiske begivenheder forbundet med følsomhed eller resistens over for specifikke lægemidler indgriben; de statistisk signifikante hændelser findes i tabel S6 i File S3.

Som et eksempel, linjer, der var følsomme over for MEK-inhibitor GSK1120212 var 2,93 gange, 2,35, 1,92 og 1,67 gange større sandsynlighed for at huse et BRAF, KRAS, APC mutation eller CDKN2A (P14) mutation, henholdsvis (P = 0,0009, P = 0,0021, P = 0,0243, P = 0,0105), mens resistente linjer var 2,57 mere tilbøjelige til at harbor en hændelse i RB1 (P = 0,0024) (tabel 1). BRAF og RAS læsioner er kendt for at øge MEK aktivitet i tumorer [3], [16], derfor indgreb, der hæmmer MEK aktivitet vil reducere /normalisere nedstrøms signalering gennem konstitutivt aktiveret MEK-ERK-kinase kaskade og dermed forventes disse links. Imidlertid blev sammenslutningen af ​​følsomhed med APC eller CDKN2A mutationer forventes ikke og foreslå yderligere biomarkører for reaktion på MEK hæmning.

Linjer følsomme til AKT-inhibitor GSK690693 forventeligt nærede mutationer i PI3K pathway, herunder PIK3CA , PTEN, ERBB2, og også FBXW7, TET2, og BRCA2 ændringer (P = 0,0140, P = 0,0197, P = 0,0053, P = 0,0273, P = 0,0346, P = 0,0208, henholdsvis) igen antyder uventede genomiske biomarkører for respons på AKT inhibitorer, der kan øge antallet af patienter, der kan drage fordel; der var ingen enkelt begivenheder signifikant forbundet med resistens (tabel S6 i File S3).

PIK3CA afvigelser tillægges resistens over for BRAF-hæmmer AZ628 (P = 0,042) en observation, som blev bekræftet i testen sæt (P = 0,05 ), sandsynligvis gennem bypass aktivering af den parallelle PI3K pathway, den gentog resultater fra eksperimentelle indgreb [17], [18]. På den anden side, BRAF, nationale tilsynsmyndigheder, som forventet [3], [16], og MLTT3 og MET afvigelser tillægges følsomhed til AZ628 i træningssættet (P = 0,003, P = 0,036, P = 0,034, P = 0,003); dette blev bekræftet i testen sæt til BRAF og de nationale tilsynsmyndigheder (P = 2,4 × 10

-10, P = 0,001) (Tabel 2).

Selv om der var en stærk sammenslutning af enkelt genetisk afvigelser med respons på terapeutiske midler denne forening var ikke absolut med en række cellelinjer, der indeholder nogen specifik begivenhed bliver scoret som enten følsomme eller resistente. Således skal der være yderligere begivenheder, der samarbejder med mutationsstatus at bestemme følsomheden og modstandsdygtighed over for målrettede lægemidler. Andre end de sammenslutninger nævnt ovenfor og aberrationer i PTEN og ERBB2 potentielt bidrage til gruppering af EGFR familie inhibitorer og afvigelser i PTEN og CDKN2A blive associeret med lægemidler målrettet mod PI3K og IGF1R veje, var der ingen klare aberrationer køre størstedelen af ​​lægemiddelrespons klynger (fig. 3). Igen tyder på, at ekstra co-events skal bidrage til narkotika følsomhed og modstand. De potentielle co-events udforskes nedenfor.

Molekylær Co-forekommende begivenheder Reveal Drivere og Co-handlingsrettede mål i Cancer

For at identificere potentielle samarbejder begivenheder, vi først identificeret genomiske begivenheder, co-indtruffet ud over hvad der forventes, hvis de var uafhængige og foreningen skyldes tilfældigheder faktorer alene. Dette definerer co-begivenheder, der var sandsynligvis under selektivt tryk under tumor initiering eller progression (eller under tilpasning til kultur), og dermed har en høj sandsynlighed for at være førere af kræft fænotype. Molekylære læsioner, hvis samtidig forekomst fører til en proliferativ eller overlevelse fordel ud over, hvad der er observeret for separate enkelt hændelser vil blive co-valgt, og frekvensen af ​​co-event vil stige i befolkningen (fig. 4). Baseret på den database af genomiske begivenheder i cellelinjer, blev rummet af observerede to co-events (fx mut1-Mut2) genereret for de 294 cellelinier for hvilke genomisk information var tilgængelig (GSK sæt). Der var 6871 observeret tydelige dobbelt co-begivenheder i de 294 cellelinjer og 12958 total forekomster. Der var 95415 distinkte triple co-begivenheder (fx mut1-Mut2-Mut3) i de 294 cellelinjer og 110872 alt hændelser. Vi sammenlignede forudsagt at observerede co-event frekvenser i 294 cellelinjer, hvor et tilstrækkeligt antal co-events var parate til at give statistisk analyse. (Figur 2;. Tabel S5 i File S3)

Illustreret her er en sekventiel multiple hit model af kræft initiering og progression, underliggende co-udvælgelse og gensidig eksklusivitet af genetiske begivenheder i kræft. A, B, C er gener inde i en celles kerne.

Be the first to comment

Leave a Reply