PLoS ONE: Drug Repositionering for Cancer Therapy Baseret på de store Drug-induceret Transcriptional Signatures

Abstrakt

En

i silico

kemiske genomics tilgang er udviklet til at forudsige narkotika repositionering (DR) kandidater tre typer af kræft: glioblastom, lungekræft, og brystkræft. Den er baseret på en nylig storstilet datasæt på ~ 20.000 lægemiddelinducerede udtryk profiler på flere cancer-cellelinjer, som giver i) en global indvirkning af transkriptionel forstyrrelse af både kendte mål og ukendte off-mål, og ii) rig information om lægemidlets tilstand-of-action. Først lægemiddelinduceret ekspressionsprofil vist mere effektiv end andre oplysninger, såsom lægemidlet struktur eller kendt mål, ved hjælp af flere HTS datasæt saglig benchmark. Især blev nytten af ​​vores metode håndfast demonstreret i at identificere nye DR kandidater. For det andet, vi forudsagde 14 high-scoring DR kandidater udelukkende baseret på udtryk signaturer. Otte af de fjorten lægemidler udviste signifikant anti-proliferativ aktivitet mod glioblastom;

jeg

.

e

., Ivermectin, trifluridin, astemizol, amlodipin, maprotilin, apomorphin, mometason, og nortriptylin. Vores DR score stærkt korreleret med den af ​​cellebaserede eksperimentelle resultater; de øverste syv DR kandidater var positive, hvilket svarer til en ca. 20-fold berigelse sammenlignet med konventionelle HTS. Trods forskellige oprindelige betegnelser og kendte punkter, de forstyrrede veje for aktive DR kandidater viser fem forskellige mønstre, der danner tætte klynger sammen med et eller flere kendte cancerlægemidler, foreslå mekanismer af anti-proliferative aktivitet fælles transkriptom-niveau.

Henvisning: Lee H, Kang S, Kim W (2016) Drug Repositionering for Cancer Therapy Baseret på de store Drug-induceret Transcriptional signaturer. PLoS ONE 11 (3): e0150460. doi: 10,1371 /journal.pone.0150460

Redaktør: Enrique Hernandez-Lemus, National Institute of Genomic Medicine, MEXICO

Modtaget: November 10, 2015; Accepteret: 15 Februar 2016; Udgivet: 8 Marts 2016

Copyright: © 2016 Lee et al. Dette er en åben adgang artiklen distribueres under betingelserne i Creative Commons Attribution License, som tillader ubegrænset brug, distribution og reproduktion i ethvert medie, forudsat den oprindelige forfatter og kilde krediteres

Data Tilgængelighed:. Alle relevante data er inden for papir og dens støtte Information filer

Finansiering:. WK blev støttet af National Research Foundation (NRF) tilskud (NRF-2014R1A2A2A01007166) og Teknologi Program Innovation (10.050.154) finansieret af Ministeriet for Handel, industri Energi Korea

Konkurrerende interesser:. Forfatterne har erklæret, at der ikke findes konkurrerende interesser

Introduktion

Drug repositionering (DR) henviser til identifikation af nye indikationer for eksisterende. narkotika [1], og betragtes som en effektiv vej til lægemiddeludvikling, fordi det reducerer omkostningerne og omgår sikkerhedsproblemer. Imidlertid opdage hidtil ukendte indikationer med DR er meget udfordrende, selv med veletablerede high-throughput screening (HTS) på grund af de mange kombinationer af begge analyser og narkotika [2]. På grund af disse begrænsninger har mest omplacerede lægemidler blevet serendipitously udviklet.

I silico

DR betragtes som en alternativ og effektiv vej til at etablere nye forbindelser mellem sygdomme og eksisterende lægemidler [3,4]. Fremskridt i systemer farmakologiske tilgange og væksten i lægemiddel-target information har øget succes

i silico

DR [5,6]. En bred vifte af datasæt er blevet udnyttet, såsom sæt relateret til kemiske struktur [7,8], lægemiddel-target forhold [9], og fænotypisk oplysninger, herunder narkotika bivirkninger [10-14]. For eksempel, Cheng

et al

. identificeret simvastatin og ketoconazol som potente anti-proliferative midler i brystkræft ved at analysere en lægemiddel-target-netværk [15]. Især har store kemiske genomics data, såsom Connectivity Kort eller CMAP [16], forudsat rig information om tilstandene-af-handling af lægemidler, der afspejles i de transkriptom reaktioner på grund af kemisk forstyrrelse. Imidlertid blev de relative værker af forskellige datasæt ikke strengt evalueret, fordi forbindelsen sæt CMAP ikke var stor nok til integrativ statistisk analyse.

Den seneste version af CMAP består af genekspression profiler af fem cellelinier behandlet med ~ 1.300 forbindelser, hvorfra mange

i silico

DR metoder blev udviklet ved hjælp af dette datasæt enten alene eller i kombination med andre oplysninger [17-25]. Den negative korrelation af genekspression med en sygdom førte til identifikation af topiramat til behandling af inflammatorisk tarmsygdom (IBD) og cimetidin til behandling af lunge adenocarcinom [19,20]. Iskar

et al

. yderligere afsløret virkemåder for flere lægemidler ved hjælp af narkotika-induceret udtryk moduler bevaret mellem mennesker og rotter. For nylig blev en lignende, men meget udvidet version af et kemisk genomics datasæt offentligt frigivet af NIH LINCS program (Library of Integrated Network-baserede Cellular signaturer). Dette datasæt består af genekspression signaturer og proteinbinding, cellulære fænotypiske og phosphoproteomic profiler som følge af kemiske eller genetisk forstyrrelse. Konkret er det produceret genekspressionsprofilerne af ~ 1.000 skelsættende gener (L1000) i svar til 20.000 kemiske forstyrrelser på tværs af mange cellelinjer. Derudover har de udledte transkriptom niveau udtryk profiler af ~ 20.000 gener beregningsmæssigt bruger de 1.000 skelsættende gener [26].

I denne undersøgelse har vi vedtaget en integrativ tilgang til

i silico

DR hjælp af ekspressionssignatur (E) afledt af den nylige store, kemiske genomforskning datasæt (LINCS) såvel som kemiske struktur (S) og target signaturer (T). Dernæst vi anvendt vores metode til at udlede DR kandidat anti-cancer medicin for glioblastom, lungecancer, og brystkræft. Vi fokuserede på muligheden for at identificere hidtil ukendte DR kandidater, der ikke strukturelt beslægtede med kendte anti-cancerlægemidler fordi strukturelle analoger kan udledes let af andre strukturbaserede metoder [27,28]. Den LINCS datasæt dækker et tilstrækkeligt stort antal forbindelser, der tillod uvildig evaluering af den prædiktive magt hver signatur. Vi forudset dengang nye DR kandidater til glioblastom. De høje-lave kandidat lægemidler blev eksperimentelt valideret med kræft cellelinjer og patient-afledte primære celler. Den LINCS datasæt også muligt for os at fortolke virkemåde af de validerede DR kandidater.

Materialer og metoder

Kendt stof sæt og sammensatte-target information

Den kendte stof sæt (KD sæt eller

guldstandarden

) blev ekstraheret fra flere offentlige databaser af DrugBank [29], CTD [30], pubchem [7], og Kegg DRUG [31] for glioblastom, lungecancer, og bryst kræft. Desuden har vi manuelt kurateret aktive forbindelser og narkotika fra PubMed ved at søge abstracts, der udtrykkeligt er beskrevet anti-cancer aktiviteter for disse tre typer af kræft (S1 tabel). En typisk forespørgsel omfattede flere vilkår, såsom ‘apoptose’, ‘spredning’, ‘cellevækst’, ‘cytotoksicitet “,” anti-cancer’, ‘cytotoksicitet “og” øget overlevelse “efter behandling. Oplysningerne Forbindelsen-mål blev indsamlet fra 10 offentlige datakilder: DrugBank [32], Kegg [31], MATADOR [33], TTD [34], KiDB [35], BindingDB [36], ChEMBL [37], WOMBAT [ ,,,0],38], CTD [30], og DCDB [39]. Vi inkluderede kun sammensatte målgruppen interaktioner understøttes af rettet beviser, såsom sammensatte-target bindende, aktivering, hæmning, og reaktion på en rimelig høj affinitet (

e

.

g

., Ki 10 nM). Gennem hele analysen blev forbindelser og proteinholdige mål kortlagt til NCBI pubchem Compound Identifikatorer (CID) og Entrez Gene ID som standard identifikatorer henholdsvis.

Expression signaturer til de pågældende sygdomme

Udtrykket profiler til de pågældende sygdomme blev hentet fra enten TCGA data portalen (https://tcga-data.nci.nih.gov) eller NCBI GEO [40], der omfattede både normale og sygdomstilstande. De glioblastom datasæt på 200 patienter blev opnået fra TCGA der blev delt i fire kanoniske undertyper-klassisk, mesenkymale, proneural, og neurale. Fire forskellige udtryk underskrifter blev udtrukket til de tilsvarende undertyper. For lunge- og brystkræft, blev der opnået 11 og 16 microarray datasæt, hhv. De 11 lungekræft datasæt bestod af GDS1761, GDS1312, GDS2771, GSE5364, GSE7670, GSE10072, GSE10799, GSE1987, GSE2088, GSE1037, og GSE11969. De 16 brystkræft datasæt bestod af GDS817, GDS820, GDS823, GDS1761, GDS1925, GDS2250, GDS2617, GDS2618, GDS2635, GDS2739, GSE5364, GSE10780, GSE15852, GSE16443, GSE17072, og GSE20266. Alle microarray datasæt blev bearbejdet og normaliseret ved hjælp af SAM-pakken [41]. DEGS blev udvundet som udtryk signaturer ved hjælp af FDR. 0,05 som en cutoff

Expression underskrifter fra LINCS datasæt

LINCS datasæt indeholdt et omfattende katalog af gen-udtryk profiler genereret af Library of Integrated Network-baserede Cellular signaturer (LINCS) projekt fra 59 humane cancerceller som reaktion på ~ 20.000 kemiske forstyrrelser. Den LINCS team har produceret udtrykket profiler af 1.000 skelsættende gener ved hjælp af en high-throughput Luminex-baseret assay [42]. De hele transkriptomisk profiler for ~ 20.000 gener blev udledt fra de målte ekspressionsniveauer værdier af de 1.000 skelsættende gener. Udtrykket signaturer for de forbindelser blev hentet fra LINCS projektsiden (www.lincsproject.org), der bestod af de 100 mest op- og ned-regulerede gener som reaktion på hver forbindelse.

Cell Levedygtighed Assay

de forbindelser, der anvendes til celleviabilitetstest blev købt fra Sigma-Aldrich og Enzo Life Science. Både glioblastoma-cellelinier (A172, T98G, U251, og U87) og primære celler (GBL celler) blev dyrket i DMEM høj glucose celledyrkningsmedium (HyClone; SH30243.01) suppleret med 10% føtalt bovint serum, 1% penicillin /streptomycin løsning, og 30 pg /ml Plasmocure (InvivoGen, ant-pc) reagens for at forhindre forurening med mycoplasma.

for at måle den cytotoksiske aktivitet af lægemiddelkandidater, blev den metaboliske aktivitet af de levedygtige celler målt ved hjælp af WST reagens (EZ-Cytox, Dogen) i plader med 96 brønde. Antallet af podede celler var tilpasset efter vækstraten for hver celletype (100-500 celler /brønd). Fireogtyve timer efter podning blev cellerne behandlet med lægemidler ved en koncentration på 10 uM og yderligere dyrket i 72 timer ved 37 ° C. En tiendedel af mediet volumen WST-reagens blev tilsat til cellerne, og absorbansen blev målt ved 450 nm efter 2 timer under anvendelse af en SpectraMax 190 mikropladelæser (Molecular Devices). Forsøgene blev gentaget fem gange.

Pathway berigelse analyse

Kegg veje blev hentet fra MSigDB database (https://www.broadinstitute.org/gsea/msigdb), som består af 186 gensæt repræsenterer forskellige biologiske processer. Da mange sygdomsrelaterede veje er overflødige med andre signalveje (f.eks

KO05200

:

Veje i kræft

omfatter

KO04310

:

Wnt

,

KO04210

:

Apoptose

,

KO04115

:

p53 signalering

, etc.), vi udelukkede sådanne 28 veje, og de resterende 158 veje blev brugt. Betydningen af ​​berigelse blev beregnet under anvendelse af hypergeometric test. Den LINCS datasæt indeholder flere signaturer for samme lægemiddel fra forskellige celler og betingelser, hvor det harmoniske gennemsnit af de tilsvarende p-værdier blev taget som sin repræsentant p-værdi. Den justerede q-værdi blev derefter beregnet ved anvendelse af Benjamini-Hochberg metoden. Afstandene mellem lægemidler blev beregnet som cosinus afstand-log p-værdi.

Resultater

Dataindsamling og forarbejdning

Først vi samlet en liste over kendte lægemidler ( KD sæt) som benchmark for de tre typer kræft (glioblastom, lungecancer, og brystkræft) fra fire offentlige databaser samt ved manuelt at kuratering 243 publikationer (S1 tabel). Vi overvejede kun de forbindelser, der udtrykkeligt er anført som værende aktive over målet sygdomsfri

e

.

g

., Narkotika X inducerer apoptose, hæmmer proliferation, eller viser cytotoksisk aktivitet. KD sæt bestod af 132, 216 og 256 forbindelser til behandling af glioblastom, lungecancer og brystcancer, henholdsvis (figur A i S1 File). Desuden har vi indsamlet en omfattende liste over 1.155 forbindelser (kræft narkotika sæt eller CD sæt), der blev rapporteret for at vise den anti-proliferative aktivitet mod enhver anden form for kræft, herunder alle de stoffer i KD sæt.

Næste den strukturelle signatur blev ekstraheret som 1.024 bits FP2 kemiske fingeraftryk implementeret i Open Babel [43] for forbindelser (S

CPD) eller kendte lægemidler (S

KD). Oplysningerne målet blev indsamlet fra 10 offentlige databaser omfatter 342,311 sammensatte målgruppen samspil mellem 205,570 unikke forbindelser (figur A i S1 fil). De sæt af gener associeret med hver forbindelse eller lægemiddel blev derefter genereres og tjente som mål-signaturer (T

CPD, T

KD). Udtrykket signatur (E

CPD, E

KD) blev hentet fra LINCS og bestod af de differentielt udtrykte gener (degs) ved kemisk forstyrrelse [26]. Flere underskrifter for et enkelt stof var almindelige, fordi udtryk underskrifter blev genereret i forskellige cellelinjer af forskellig oprindelse. Derudover LINCS datasæt indeholdt en betydelig brøkdel af redundante sammensatte id’er og nogle generiske sammensatte navne, 2D strukturer og /eller stereoisomerer af de samme molekylære formler var ikke skelnes mellem forskellige datakilder. Derfor blev underskrevet af disse lignende forbindelser flettes sammen efter at konvertere dem til den kanoniske SMILES format, selvom stereoisomerer kan udvise forskellige farmakologiske virkninger og nogle blev oprindeligt tildelt forskellige sammensatte id’er ved LINCS. Vi bemærker, at ID-kortlægning af en stereoisomer var meget sjældent mellem to forskellige stereoisomerer, men blev gjort mest med generisk navn eller SMILES uden 3D-information. Den resulterende antal unikke forbindelser blev reduceret til 8860. Vi definerede en

kerne

af 2.250 forbindelser, for hvilke alle tre typer af signaturer (S, T og E) var til rådighed. Skæringspunktet af kernen sæt og cd-sæt var 304 lægemidler (figur A i S1 fil). Ligeledes har vi også genereret sygdomsekspression signaturer (E

DIS) for glioblastom (4 sæt), lungecancer (11 sæt), og brystcancer (16 sæt) fra TCGA [44] eller offentlige microarray datasæt fra GEO. Den detaljerede procedure er beskrevet i Materialer og metoder sektion.

Oversigt over analysen

Vi udviklet en serie af klassificører at forudsige DR lægemiddelkandidater til behandling af glioblastom, lungecancer, og bryst kræft. Vores fremgangsmåde anvendes tre typer af signaturer, som er afledt fra kemiske struktur (S), lægemiddel-target relation (T), og genekspression data (E). DR kandidater blev forudsagt på grundlag af ligheden af ​​disse underskrifter mellem forbindelserne og sygdom (eller dets kendte lægemidler). Forudsigelsen præstation blev grundigt inspiceret i en saglig måde ved hjælp af i) en konventionel cross-validering ordning, der anvender kendte lægemidler (KD sæt) som benchmark, ii) 29 anti-cancer HTS datasæt for 11,000-41,000 forbindelser, og iii) analyser . baseret på glioblastom cancer cellelinjer og patient-afledte primære celler

den her beskrevne arbejde bestod af tre faser: 1) bygning forening signaturer, 2) konstruere en række klassificører, og 3) evaluering forudsigelse ydeevne. Formålet med det første trin var at associere forbindelser og et mål sygdom (eller dets kendte anticancerlægemidler) baseret på ligheden mellem de tre typer underskrifter (Fig 1A). I alt blev der etableret syv forskellige typer af associationer, der var uafhængige af hinanden. Først blev en forbindelse, forudsagt som DR kandidat baseret på dens strukturelle lighed med de kendte lægemidler (S

CPD-S

KD). Udtrykket (E) og mål (T) underskrifter væsentlige er en liste af gener, der kunne forbindes med enhver metode til sæt berigelse genanalyse. Derfor kunne vi generere yderligere seks typer af associationer mellem forbindelser (T

CPD, E

CPD) og sygdom (T

KD, E

KD, E

DIS). Vi brugte

Tanimoto koefficient

som et mål for signatur lighed, fordi alle signaturer kan repræsenteres som en binær vektor af 0’er og 1 S-

jeg

.

e

., Den nærvær eller fravær af gener eller strukturelle fingeraftryk. Fordi flere signaturer er tilladt for en enkelt forbindelse og sygdom, vi beregnede gennemsnittet af de Tanimoto koefficientværdierne for en given forbindelse-sygdom par.

(A) Den strukturelle (S), mål (T), og udtryk (E) underskrifter for hver forbindelse (cirkler til venstre) og sygdom (firkanter til højre) blev sammenlignet. Foreningerne er angivet med stiplede linjer i tre kategorier (S: gul, T: grøn, E: rød) afhængigt af typen af ​​sammensatte signatur. (B) I alt blev syv forskellige klassificører bygget på grundlag af lighed mellem forbindelsen og målet signatur eller deres kombinationer (S, T, E, ST, SE, TE, og STE). De DR scoringer blev beregnet ved hjælp af en række klassificører baseret på en logistisk regression med den kendte lægemiddel sæt (KD sæt), der anvendes som benchmark. (C) Forestillingen blev evalueret ved hjælp af tre uafhængige datasæt: I) den gennemsnitlige AUC på 100 runder af validering 3 gange kors, II) sammenligning med de 29 sæt NCI-60 DTP human tumorcellelinje HTS data, og III) eksperimentel validering af antiproliferative aktiviteter, der anvender cancercellelinier og primære celler. Et forløb-niveau fortolkning af lægemidlet virkemåde blev udført for aktive DR kandidater til glioblastom (IV).

Det andet trin omfattede konstruktionen af ​​en række klassifikatorer at forudsige DR kandidater (Fig 1B ). For at sammenligne effektiviteten af ​​hver signatur blev syv klassificører konstrueret ved hjælp af en logistisk regression. De resulterende klassifikatorer brugt en enkelt (S, T, E), en kombination af de to (ST, SE, TE), eller alle tre typer (STE) af forbindelse signaturer. Endelig blev forudsigelse præstation grundigt inspiceret i en saglig måde ved hjælp af i) en konventionel cross-validering ordning, der udnytter kendte lægemidler som

guldstandarden

, ii) 29 storstilet HTS datasæt for anti-proliferative aktivitet og iii) assays, der anvender både etablerede glioblastomcellelinier og patient-afledte glioblastoma primære celler. Vi yderligere fortolket de potentielle virkemåder af lægemidler ved hjælp af sti berigelse analyse efterfulgt af sammenligninger med andre kræftmidler.

Ydelse evaluering ved hjælp af den kendte stof (KD) datasæt

For at sikre uvildig evaluering vi begrænset vores analyse til kernen sæt af 2.250 forbindelser således at forskellige klassificører kan sammenlignes ved hjælp præcis den samme benchmark. Kernen sæt omfattede 79, 100, og 132 kendte anti-cancer medicin (KD sæt) som benchmarks for glioblastom, lungecancer og brystcancer, hhv. Den negative sæt (1.946 forbindelser) fremstilledes ved at udelukke cd’en sæt fra det centrale sæt.

Som nævnt i det foregående afsnit, vi bygget syv forskellige klassificører baseret på en enkelt underskrift (S-, T-, og E-klassificeringen) eller en kombination af flere signaturer (ST-, SE-, TE-, og STE-klassificeringen). Deres relative ydelser blev evalueret under anvendelse af 100 runder af tre-fold krydsvalidering ordninger. De klassificører var baseret på en logistisk regression, der automatisk vejer komponenten funktioner til at give en samlet forudsigelse score-

DR score

-scaled fra nul til én. De målrettede klassificører (T) klarer sig bedre end de andre klassifikatorer (S, E) i at identificere kendte lægemidler (KD core sæt) i alle tre typer af kræft (fig 2). Denne tendens blev konsekvent observeret i kombination med andre signaturer (ST, TE SE). Vi ræsonnerede, at målene for kendte lægemidler (KD) tendens til at være bedre karakteriserede end andre forbindelser, og målrettede klassificører kan derfor favorisere kendte lægemidler. Derfor vi yderligere evalueret klassificører på en mere saglig måde i de følgende afsnit.

klassificører ved hjælp af en enkelt type signatur (S, T og E) og deres kombinationer (ST, SE, TE, og STE) blev evalueret baseret på AUC for ROC-kurven for glioblastom, lungecancer og brystcancer. De AUC-værdier blev beregnet ved at tage gennemsnittet 100 runder af 3 gange validering kors.

Evaluering i sammenligning med offentlige anti-cancer HTS

For at undgå potentiel bias, vi indsamlede snesevis af store -skala anti-cancer HTS analyser fra pubchem [45]. De bestod af otte, tretten, og otte HTS assays for GBM, lungecancer og brystcancer-cellelinier (tabel A i S1 fil). Disse analyser alle brugte forskellige cellelinjer og var rimeligt adskiller sig fra hinanden med hensyn til både analyseret og ramte compounds-

e

.

g

., Blev der kun observeret en 20% hit overlap mellem to assays for GBM (AID57, AID59) (Figur B i S1 File). Igen, begrænsede vi vores vurdering af de analyserede forbindelser, der også tilhørte det centrale sæt. At fokusere på evnen til at forudsige nye DR kandidater blev kendte lægemidler (KD) udelukket fra hit-forbindelser. De resterende hits af hver analyse blev inddelt i to kategorier: i) anti-cancer hits, der hørte til cd-sæt eller havde to eller flere strukturelle analoger i CD sæt med en Tanimoto koefficient 0,7, og ii) nye hits, der ikke indgik i den tidligere sæt. Derfor er de anti-cancer hits repræsenterede dem, der kunne let forudsagt baseret på strukturel lighed og de nye hits, som var de vanskelige sager og er i fokus i denne undersøgelse.

Interessant, udførelsen af ​​hver signatur var i modsætning til resultatet af den foregående evaluering baseret på KD sættet. Udtrykket-baserede klassifikator (E) bedst forudsagde anti-cancer hits i alle tre cancere (Fig 3A). Derimod target-baserede klassifikator (T) udføres værste. Denne tendens var mere indlysende i forudsigelsen af ​​hidtil ukendte hits (Fig 3B). De klassificører baseret på strukturen (S) eller target signatur (T) var væsentligt ude af stand til at forudsige nye hits (median AUC = 0,41 ~ 0,62), hvorimod udtrykket signatur (E) udføres rimeligt godt (median AUC = 0,73 ~ 0,79, Fig 3B ). Denne tendens blev konsekvent observeret i kombination med andre signaturer (SE TE ST). Især den eneste signatur (E) konsekvent klarede sig bedre alene end i kombination med andre signaturer (SE, TE) for alle tre kræftformer. Samlet set udtrykket signatur (E) var mere informativ end struktur (S) eller mål (T) underskrifter blandt HTS datasæt for de tre forskellige kræftformer. Dataene foreslog også, at tidligere evalueringer af enhver

i silico

DR kunne være forudindtaget, hvis kendte lægemidler blev brugt som den eneste benchmark sæt, især hvis metoden var meget afhængig af target oplysninger. Især med fokus på det centrale sæt bevarer kun et lille sæt af forbindelser til evaluering, men denne fremgangsmåde forblev tilstrækkeligt til upartiske statistiske forsøg med det samme sæt af forbindelser (tabel A i S1 File). Evalueringen resultater for alle forbindelserne i HTS datasættet viste væsentlige den samme tendens (figur C i S1 File).

De syv klassificører (S, T, E, ST, SE, TE, og STE) var vurderet ud fra AUC af ROC-kurven for glioblastom, lungecancer og brystcancer. Kun forbindelser i kernen sæt blev evalueret. AUC-værdierne blev beregnet ved at tage gennemsnittet 100 runder af 3-fold krydsvalidering. (A) Typiske eksempler på evaluering af ydeevne ved hjælp af HTS datasæt til glioblastom (AID45), lungekræft (AID5), og brystkræft (AID97). AUC blev uafhængigt beregnet ved hjælp af to forskellige sæt af hit-forbindelser som benchmark (eller positive) -i) hit med kendt anti-cancer aktivitet (røde linjer) og ii) de nye hits (grønne linjer). Fordelingen af ​​AUC hjælp (B) forbindelserne med kendte anti-cancer aktivitet som et benchmark, og (C) romanen hits som benchmark.

Eksperimentel validering af DR lægemiddelkandidater for glioblastom

glioblastoma multiforme (GBM) er den mest almindelige og aggressiv form for kræft i hjernen, der viser en meget dårlig prognose trods samtidig eller sekventiel kemo-strålebehandling [46]. Temozolomid (TMZ) er en første-line kemoterapeutisk middel til behandling af GBM. Som et alkyleringsmiddel, overfører TMZ methylgrupper til purinbaserne af DNA, hvilket forårsager enkelt- og dobbelt-strengede DNA-brud og efterfølgende apoptotisk celledød. De fleste undersøgelser rapporteret, at kemoterapi tillagt en begrænset samlet overlevelse til gavn for GBM patienter. Den mediane tid til tilbagefald var kun 6,9 måned efter standardbehandling [47]. Derfor er behovet for mere effektive lægemidler er klar og udækket.

Her har vi listet DR kandidater til GBM og eksperimentelt afprøvet deres anti-tumor aktiviteter udelukkende baseret på udtrykket signatur. Først blev de 8.860 forbindelser bestilt af DR score,

jeg

.

e

. percentilen rang af forudsigelserne af samme klassifikator (E) som beskrevet i det foregående afsnit. Dernæst vi anvendes flere filtre: a) FDA-godkendt; b) DR score 0,9; og c) oplysning til at passere hjerne-blod-barrieren (BBB) ​​enten af ​​litteratur eller

i silico

forudsigelse på https://www.cbligand.org/BBB. Et højt scorer kandidat (ivermectin, DR score = 0,98) blev også inkluderet trods bliver angivet ikke at passere BBB. De endelige 14 DR kandidater blev udvalgt, og deres anti-tumor aktiviteter blev testet under anvendelse fire GBM cellelinjer og otte patient-afledte primære celler. Vores DR scorer korrelerede godt med de anti-tumor aktiviteter blandt de testede både anti-proliferative aktivitet og den del af signifikant vækstinhibering (Fig 4A og 4B) cellelinier. Otte af de 14 kandidater var væsentlige hits i tre eller flere GBM celler ved 10 uM. Især viste de øverste syv kandidater stærke anti-tumor aktivitet, svarende til et ca. 20 gange hit berigelse fra ~ 5% hit rate af konventionel high-throughput screening.

(A) DR scores, (B) den brøkdel af væsentligt hæmmede celler sammenfatter resultaterne af (C), (C) anti-proliferative aktiviteter (% vækst hæmning) for de fire glioblastom cellelinier (fire cellelinier af TG98, A172, U251MG, og U87MG) og otte patient -afledte primære celler (den GBLs) 10 uM, (D) i silico forudsigelse scorer for BBB transport baseret på https://www.cbligand.org/BBB. Den røde stjerne angiver eksperimentel støtte til at føre BBB ifølge litteraturen. Samlet, anti-proliferative aktiviteter på tværs glioblastom celler stærkt korreleret med placeringerne ved DR score. De fleste DR kandidater blev vist at være i stand til at passere BBB.

Vi observerede litteraturen til rapporter om anti-cancer aktivitet af de otte aktive DR kandidater, som opsummeret i tabel 1. Vi fandt, at fire lægemidler (ivermectin, astemizol, nortriptylin, og apomorphin) blev tidligere rapporteret at vise antitumoraktivitet i hjernekræft. Tre lægemidler (trifluridin, amlodipin, og maprotilin) ​​demonstrerede anti-tumor aktivitet i andre kræftformer, men ikke i glioblastom. Mometasone er et corticosteroid og betragtes som en ny behandling til kræft fordi den ikke er blevet rapporteret at vise antitumoraktivitet i enhver form for cancer. Kortikosteroider er blevet anvendt til at reducere peritumoral ødem og kemoterapi-associeret bivirkninger, såsom smerte, kvalme og opkastning [48]. Alle aktive DR kandidater undtagen ivermectin har vist sig at være i stand til at passere BBB i enten litteratur rapporter eller via

i silico

forudsigelse.

Fortolkning af narkotika virkemåder for den aktive DR kandidater

Drug-induceret transkriptom profiler afspejler direkte og indirekte ændringer i cellulær fysiologi i omik skalere og giver rig information om den farmakologiske mekanisme af narkotika. For at fortolke deres virkemåder, vi udførte pathway berigelse analyse af op- og ned-regulerede gener ved hjælp Kegg veje. Kollektivt, blev 32 og 17 veje betydeligt beriget i op- og nedreguleret gener, henholdsvis ved en cut-off q-værdi 0,1 (figur 5). Samlet set antyder dataene plausible mekanismer antitumoraktiviteter, der deles mellem DR kandidater. Opreguleret veje inkluderet apoptose, aminosyre og lipid stofskiftet, og tumor-undertrykkende P53 /MAPK /WNT signalering, som foreslog, at aktiviteterne i anti-proliferative processer blev forøget. Omvendt celleproliferative veje, såsom cellecyklus, DNA-replikation, DNA-reparation, og ribosom samling blev nedreguleret.

p-værdier og deres justerede Q-værdier blev beregnet ved hypergeometric test og Benjamini-Hochberg metoden, henholdsvis.

Fire lægemidler (amlodipin, astemizol, maprotilin, og nortriptylin) stærkt øget lipid metabolisme (steroid, terpenoide, og fedtsyrer). Følgelig amlodipin, en calciumkanalblokker, er tidligere blevet rapporteret at inducere steroidgenese [66]. Amlodipin og maprotilin moderat opreguleret apoptoseveje der kan være forbundet med pKD1 overekspression og caspase-3 aktivering, henholdsvis [67,68]. Især apomorphin syntes at virke via en særskilt mekanisme: gener associeret med mitochondrial energimetabolisme var stærkt nedreguleret uden mærkbare ændringer i apoptose, metabolisme eller DNA-reparation. Disse mitokondrie metaboliske gener omfattede gener, der koder ATP syntase (ATP5O, ATP5D), cytochrom oxidaser (COX8A, COX7) og NADH dehydrogenaser (NADUFS8, NADUFB2). Mitokondriel dysfunktion er blevet godt etableret for at modulere apoptose og tumorigenese [69]. De to andre DR kandidater (nortriptylin og maprotilin) ​​faldt også mitokondrie energiomsætning. Nedregulering af cellecyklus gener var almindeligt observeret blandt alle otte DR kandidater. Fem lægemidler faldt betydeligt ekspressionen af ​​DNA reparation gener. Samlet set disse aktive DR kandidater alle signifikant forstyrres flere tumorigen eller tumor undertrykkende veje, som kan lede kræftceller mod anti-proliferativ resultat.

Vi udførte også en klynge analyse af de otte DR kandidater sammen med de 69 kræftmedicin inkluderet i LINCS datasæt ved hjælp af berigelse mønster af samme 32 op- og 17 nedreguleres pathways (fig 6). Disse cancerlægemidler ofte opregulere P53, MAPK, apoptose og immun signalering. Mange kræft narkotika samt vores DR kandidater nedregulerer celle cycle-, DNA reparations- og p53 signalveje. Syv af de DR kandidater otte viser en meget lignende berigelse mønster med andre kræftmidler (klynge I-V i figur 6). Fire DR kandidater (amlodipin, astemizol, nortriptylin, og maprotilin) ​​og otte cancer medicin tilhører to relaterede klynger (I og II).

Be the first to comment

Leave a Reply