PLoS ONE: Forudsigelse af Cancer Drugs ved Kemisk-kemiske påvirkninger

Abstrakt

Kræft, som er en førende dødsårsag på verdensplan, lægger en stor byrde på sundhedssystemet. I denne undersøgelse blev en ordre-prognosemodel bygget til at forudsige en række kræft narkotika indikationer baseret på kemisk-kemiske påvirkninger. Ifølge tillid snesevis af deres samspil, blev ordren fra den mest sandsynlige kræft til den mindst én opnået for hver forespørgsel lægemiddel. Den 1

st orden forudsigelse nøjagtighed af uddannelsen datasættet var 55,93%, vurderet ved overdrejningsalarm test, mens det var 55,56% og 59,09% på en validering test datasæt og en uafhængig test datasæt, hhv. Den foreslåede metode udkonkurrerede en populær metode baseret på molekylære deskriptorer. Desuden blev det bekræftet, at visse lægemidler var effektive til ‘forkerte’ forudsagte indikationer, hvilket indikerer, at nogle ‘forkerte’ drug indikationer var faktisk korrekte indikationer. Opmuntret af de lovende resultater, kan metoden blive et nyttigt redskab til forudsigelsen af ​​narkotika indikationer

Henvisning:. Lu J, Huang G, Li H-P, Feng K-Y, Chen L, Zheng M-Y, et al. (2014) Forudsigelse af Cancer Drugs ved Kemisk-kemiske påvirkninger. PLoS ONE 9 (2): e87791. doi: 10,1371 /journal.pone.0087791

Redaktør: Lukasz Kurgan, University of Alberta, Canada

Modtaget: Oktober 4, 2013; Accepteret: December 31, 2013; Publiceret: 3 feb 2014

Copyright: © 2014 Lu et al. Dette er en åben adgang artiklen distribueres under betingelserne i Creative Commons Attribution License, som tillader ubegrænset brug, distribution og reproduktion i ethvert medie, forudsat den oprindelige forfatter og kilde krediteres

Finansiering:. Denne undersøgelse blev finansieret af National Basic Research Program Kina (2011CB510101, 2011CB510102), National Science Foundation of China (61.202.021, 31.371.335, 61.373.028), Innovation Program for Shanghai Municipal Education Kommissionen (12ZZ087, 12YZ120), tildeling af “The First -class Discipline af universiteter i Shanghai “, Shanghai Educational Development Foundation (12CG55), den Videnskabelige Fund Research Hunan Provincial Videnskab og Teknologi Institut (2011FJ3197), Hunan National Science Foundation (Grand: 11JJ5001), og den Videnskabelige Research Fund af Hunan Provincial Education Department (Grant: 11C1125). De finansieringskilder havde ingen rolle i studie design, indsamling og analyse af data, beslutning om at offentliggøre, eller forberedelse af manuskriptet

Konkurrerende interesser:.. Forfatterne har erklæret, at der ikke findes konkurrerende interesser

Introduktion

Kræft er den hyppigste dødsårsag i både udviklede lande og udviklingslande [1]. Alene i 2008 var der 12,7 millioner nye kræfttilfælde og 7,6 million kræftdødsfald i verden [1]. I mellemtiden, mængden af ​​nyligt godkendte lægemidler formindsket løbende på trods af en stigning i R (2) dem, der deler lignende strukturer eller aktiviteter og (3) de med litteratur foreninger, såsom binding det samme mål [9]. I denne undersøgelse har vi forsøgt at opbygge en forudsigelse model af lægemiddel-indikation ved at kvantificere kemisk-kemisk vekselvirkning af hvert par interaktive forbindelser. Kort fortalt narkotika og deres tilsvarende indikationer (

dvs.

, 8 former for kræft) blev udvundet fra Kegg (Kyoto Encyclopedia of Genes og genomer, https://www.genome.jp/kegg/) [11], en velkendt database beskæftiger sig med genomer, enzymatiske veje og biologiske kemikalier, og Drugbank [12], en anden database med detaljerede oplysninger om narkotika og deres mål oplysninger. Derefter blev den score på hver indikation af forespørgslen forbindelse opnået fra tillid snesevis af interaktioner mellem forespørgslen forbindelse og dens interaktive forbindelser ved hjælp af tegn på de interaktive forbindelser. Og ordren fra den mest sandsynlige indikation til mindst blev opnået for hvert lægemiddel. Endelig blev forudsigelsen kvaliteten af ​​modellen evalueret ved overdrejningsalarm test og nogle andre parametre.

Foruden at opbygge et effektivt forudsigelsesmodel, et andet formål med vores undersøgelse er at undersøge lægemidlets repositionering evne vores model. Drug repositionering,

dvs..

Finde nye anvendelser af eksisterende lægemidler, er en alternativ strategi for lægemiddeludvikling, fordi det har potentiale til at fremskynde processen med narkotika godkendelser. Adskillige lægemidler, såsom thalidomid, sildenafil, bupropion og fluoxetin, med succes er blevet omplaceret til nye indikationer [13], [14]. Eksperimentelle metoder til lægemiddel repositionering anvender sædvanligvis højkapacitetsscreening (HTS) for at teste bibliotekerne af lægemidler mod biologiske mål af interesse. For nylig, flere

i silico

modeller blev udviklet for at løse problemer med narkotika repositionering. Iorio

et al.

Forudsagt og valideret nye lægemiddelkandidater virkemåder og narkotika repositionering fra transkriptionelle respons [15]. Butte gruppe rapporterede to vellykkede eksempler på narkotika repositionering baseret på genekspression data fra sygdomme og lægemidler [16], [17]. Cheng

et al.

Fusioneret lægemiddel-baserede lighed inferens (DBSI), target-baserede lighed inferens (TBSI) og netværksbaseret følgeslutning (NBI) metoder til lægemiddel-target forening og narkotika repositionering [18]. I vores undersøgelse ifølge den antagelse, at interaktive lægemidler er mere tilbøjelige til at målrette den samme indikation, undersøgte vi den repositionering mulighed for nogle “forkerte” forudsagte lægemidler ved at hente referencer, og forsøgte at foreslå alternative betegnelser for nogle lægemidler.

Materialer og metoder

Materialer

oplysningerne på 98 lægemidler, der kan behandle kræft blev hentet fra Kegg sYGDOM i Kegg [11]. Disse stoffer kan behandle de følgende 10 former for kræft:

Kræft i nervesystemet

Kræft i fordøjelsessystemet

Kræft af hæmatopoietiske og lymfoide væv

kræft i bryst og kvindelige kønsorganer

kræft i blødt væv og knogler

Hudkræft

kræft i urinvejene og de mandlige kønsorganer

kræft i endokrine organer

hoved og hals kræft

kræft i lungerne og lungehinden

Da nogle lægemidler har ingen oplysninger om kemisk-kemiske vekselvirkninger, vi kasseret disse lægemidler, hvilket resulterer i 68 lægemidler. Efter dette, fandt vi, at ‘Hudkræft’ og ‘hoved og hals kræft’ kun indeholdt 3 og 4 narkotika, hhv. Det er ikke tilstrækkeligt at etablere en effektiv forudsigelse model med kun et par prøver, således disse to former for kræft blev opgivet. Som følge heraf blev 68 lægemidler opnået, omfattende benchmark datasæt S. Disse 68 stoffer blev klassificeret i 8 kategorier på en måde, lægemidler, der kan behandle en slags cancere omfattede én kategori. Koderne af de 68 lægemidler og deres indikationer kan findes i tabel S1. Antallet af lægemidler i hver kategori er opført i kolonne 5 i tabel 1. For nemheds skyld, vi brugte tags til at repræsentere hver slags kræft. Se venligst kolonne 1 og 2 i tabel 1 for den tilsvarende af tags og cancere. Det bemærkes af tabel 1, at summen af ​​det antal lægemidler i hver kategori er meget større end de forskellige stoffer i S, hvilket indikerer, at nogle stoffer tilhøre mere end én kategori,

dvs

visse lægemidler kan behandle mere end en slags cancere. I detaljer, kan 50 narkotika behandle kun én slags cancere, mens 18 lægemidler kan behandle mindst to former for kræft. Der henvises til figur 1 for en afbildning af antallet af lægemidler mod antallet af cancere de kan behandle. Det er således en multi-label klassifikation problem, som har behov for at tildele hvert lægemiddel til de førnævnte 8 kategorier i faldende rækkefølge. Klassificeringen kun give en kandidat kræft, en forespørgsel lægemiddel kan behandle er ikke et optimalt valg. Svarende til den situation, når der beskæftiger sig med proteiner og forbindelser med flere tilskrivninger [7], [19], den foreslåede metode også nødt til at give en række kandidat kræftformer, der spænder fra det mest sandsynlige kræft til den mindst sandsynlige én.

for bedre at vurdere den foreslåede metode blev benchmark datasæt S opdelt i en uddannelse datasæt S

st og en validering test datasæt S

te,

dvs.

S = S

tr∪S

te og S

tr∩S

te = Ø, hvor lægemidler, der kun kan behandle nøjagtig én slags kræft og halvdelen af ​​lægemidler, der kan behandle mindst to former for kræft Består S

tr, mens S

te indeholdt resten narkotika i S. antal lægemidler i hver kategori for S

st og S

te er opført i kolonne 3 og 4 i tabel 1, henholdsvis.

Desuden at teste generalisering af den foreslåede metode, vi udvindes 59 narkotika forbindelser fra Drugbank [12], som ikke er i benchmark datasæt

S

. Efter at have udelukket stofblandinger uden information af kemisk-kemiske vekselvirkninger, blev 44 stoffer opnået omfattende uafhængige test datasæt S

ITE. Antallet af stoffer i hver kategori af S

ite er opført i kolonne 6 i tabel 1, og de detaljerede oplysninger om disse narkotika forbindelser, herunder deres koder og angivelser kan findes i tabel S2.

Kemisk-kemiske interaktioner

i de senere år er oplysningerne for kemisk-kemiske vekselvirkninger trænge ind i forudsigelsen af ​​forskellige tilskrivninger af forbindelser [7], [8], [20]. Den grundlæggende idé er, at interaktive forbindelser er mere tilbøjelige til at dele fælles funktioner end ikke-interaktive dem. Sammenlignet med de oplysninger, baseret på kemisk struktur, den indeholder andre væsentlige egenskaber af forbindelser, såsom forbindelser aktiviteter, reaktioner, og så videre.

Oplysningerne af interaktive forbindelser blev hentet fra SØM (chemical_chemical.links.detailed. v3.1.tsv.gz) [9]. I det opnåede fil, hver interaktion består af to forbindelser og fem slags scoringer titlen »Lighed ‘,’ Experimental ‘,’ Database ‘,’ Textmining” og “Combined_score«. I detaljer, er de første fire slags scoringer beregnes ud fra de sammensatte strukturer, aktiviteter, reaktioner og co-forekomst i litteratur, henholdsvis mens den sidste form for score ‘Combined_score «integrerer de førnævnte fire scoringer. Det er således anvendt i denne undersøgelse at angive interaktivitet to forbindelser,

dvs..

To forbindelser er interaktive forbindelser hvis og kun hvis den »combined_score« af samspillet mellem dem er større end nul. Faktisk værdien af ​​’combined_score «viser også styrken af ​​interaktion,

dvs..

Sandsynligheden for samspillet af begivenheder. Således er det betegnes som score tillid i denne undersøgelse. For nemheds skyld, betegner vi tillid score på samspillet mellem

c

1 og

c

2 ved. Især hvis

c

1 og

c

2 er ikke-interaktive forbindelser, er sat til nul.

112 drug forbindelser blev undersøgt i denne undersøgelse som beskrevet i afsnit “Materialer” og 1.393 kemisk-kemiske vekselvirkninger, hvis tillid scoringer var større end nul blev opnået. Blandt de interaktioner, som score er større end nul, 50 af dem tilhørte etiketten ‘lighed’, 4 tilhørte Et forsøg, 114 tilhørte »database«, og 1352 tilhørte “Textmining«. Det er nødvendigt at påpege, at nogle lægemiddelinteraktioner havde to eller mere end to slags scoringer. For så vidt angår mængden af ​​kemisk-kemiske vekselvirkninger angår, tag ‘Textmining “bidraget mest til opførelsen af ​​forudsigelse, der er beskrevet i afsnit” Metoden baseret på kemisk-kemiske påvirkninger “.

Prediction Method

metoden baseret på kemisk-kemiske interaktioner.

Systemer biologi er blevet anvendt i udstrakt grad i forudsigelser af egenskaberne af proteiner og forbindelser, og anses for at være mere effektiv end nogle konventionelle metoder [7], [20], [21], [22]. I denne undersøgelse, vi forsøger at klassificere kræftlægemidler i de førnævnte 8 kategorier baseret på kemiske interaktioner.

Antag at der er

n

narkotika i træningssættet, siger. Kræft, der kan behandle er gengivet som følger: (1), hvor T er den transponerede operatør og

(2) For en forespørgsel lægemiddel, som kræft kan behandle kan bestemmes ved dens interaktive forbindelser i. Til at vurdere sandsynligheden, der kan behandle kræft, vi beregnet en score som følger: (3)

Større score på indikerer at det er mere sandsynligt forespørgslen lægemiddel kan behandle kræft. Og foreslår, at sandsynligheden for, at forespørgslen stof kan behandle kræft er nul, fordi der ikke er interaktive forbindelser i, der kan behandle kræft.

Som nævnt i afsnit “Materialer”, at forudsige, hvilke kræftformer et lægemiddel kan behandle en multi-label klassificering problem. En pålidelig klassifikatør bør give ikke kun den mest sandsynlige kræft, men også en række kandidat kræftformer, der spænder fra det mest sandsynlige ene til den mindst sandsynlige én. Ifølge resultaterne af Eq. 3, er det let at arrangere kandidatlandene kræft ved hjælp af faldende af de tilsvarende scoringer. For eksempel, hvis resultaterne af Eq. 3 er: (4)

betyder det, at der er tre kandidat kræft, hvor den mest sandsynlige kræft det kan behandle er efterfulgt af og. Desuden kaldes en

st ordre forudsigelse, og er den 2

nd orden forudsigelse, og så videre.

metoden baseret på Molekylær Deskriptorer

For at sammenligne vores metode med andre metoder, var den metode baseret på molekylære deskriptorer konstrueret som følger. Strukturen optimering af hvert lægemiddel forbindelse blev udført ved anvendelse af AM1 semi-empiriske metode implementeret i AMPAC 8.16 [23]. 454 deskriptorer herunder forfatningsmæssige, topologiske, geometriske, elektrostatiske og kvante-kemiske deskriptorer blev beregnet ved Codessa 2.7.2 [24]. For at indkode hvert lægemiddel sammensatte effektivt blev deskriptorer med manglende værdier kasseres, hvilket resulterer i 355 deskriptorer,

dvs

hvert lægemiddel sammensatte

d

kan være repræsenteret ved en 355-D (dimension) vektor, som kan formuleres som følger: (5), hvor T er den transponerede operatør. Derfor er forholdet mellem to lægemidler

d

1 og

d

2 kan beregnes ved følgende formel: (6) hvor er dot produkt af, og mens og er den modul og henholdsvis

Svarende til metoden baseret på kemisk-kemiske vekselvirkninger, den score, en forespørgsel lægemiddel kan behandle kræft kan beregnes ved følgende formel: (7).

resten proceduren er den samme som for den metode baseret på kemisk-kemiske vekselvirkninger, som også giver en række kandidat kræftformer, der kan behandle, lige fra den mest sandsynlige ene til den mindst én.

Validering og evaluering

overdrejningsalarm test er en af ​​de mest populære metoder til evaluering af ydeevne klassificører. Under testen er hver prøve udpeget én efter én, og forudsagt af klassificeringen trænet af resten prøver i datasættet. Afprøvningen er åben og derved undgå vilkårlige problem [7]. Derfor er den opnået ved overdrejningsalarm test resultat er altid unik for et givet datasæt. I lyset af dette, har mange forskere vedtog det at evaluere nøjagtighed af deres klassificører i de senere år [25], [26], [27], [28], [29].

Som beskrevet i afsnit “Forudsigelse metode”, metoderne i denne undersøgelse kan tilvejebringe en serie af kandidat cancere for en given forespørgsel lægemiddel.

j

th orden forudsigelse nøjagtighed beregnes ved følgende formel [7], [8] 🙁 8) hvor

N

er det samlede antal af narkotika i datasættet, og er den antal lægemidler sådanne, at deres

j

th forudsigelser er de sande kræftformer, som de kan behandle. Det er indlysende, måler kvaliteten af ​​

j

th orden forudsigelse. Hvis de sande kræftformer, der en forespørgsel lægemiddel kan behandle er placeret i lav orden, er det anset som et optimalt forudsagt resultat. Således høj med lav ordrenummer

j

og lav med høj ordrenummer

j

indikerer en god præstation af klassificeringen. . Er den vigtigste indikator for udførelsen af ​​klassificeringen

For at evaluere de metoder, mere grundigt, vi beregnet forudsigelse nøjagtighed på kræft for

jeg

th orden forudsigelse som følger: (9 ) hvor

N

j

er antallet af lægemidler, der kan behandle kræft i datasættet, og er antallet af lægemidler, således at dets

jeg

th orden forudsigelse er korrekt forudsagt at behandle . kræft

Desuden en anden måling blev taget, som blev vedtaget i nogle tidligere undersøgelser [6], [7], [8] og kan beregnes på følgende måde: (10), hvor

m

repræsenterer den første

m

forudsigelser, der tages i betragtning, er antallet af de korrekte forudsigelser af

i-

th lægemiddelforbindelse blandt de første

m

forudsigelser ,

n

jeg

er antallet af kræfttilfælde, at

i-

th lægemiddelforbindelse kan behandle. Det er let at udlede, at betyder den del af alle sande kræftformer, at prøverne i datasættet kan behandle omfattet af de første

m

forudsigelser af hver prøve i det. Det kan ses af figur 1, at forskellige lægemiddelforbindelser kan have forskellige antal af cancere de kan behandle. I lyset af dette, parameteren

m

i lign. 10 tager normalt værdien af ​​den mindste, men ikke mindre end det gennemsnitlige antal kræfttilfælde som narkotika forbindelser i datasættet kan behandle. Det kan beregnes ved

(11) Generelt tyder højere bedre ydeevne af metoden.

Resultater og diskussion

Som beskrevet i afsnit “Materialer”, benchmark datasæt S blev opdelt i en uddannelse datasæt S

st og en validering test datasæt S

te, som indeholdt 59 og 9 narkotika, hhv. Desuden blev en uafhængig test datasæt S

ite indeholder 44 stoffer konstrueret til at teste generalisering af metoden. Den forudsagte metode indført i afsnit “Metoden baseret på kemisk-kemiske vekselvirkninger” blev brugt til at lave forudsigelse. De detaljerede forudsagte resultater er angivet som følger.

Ydelse af metoden baseret på Kemisk-kemiske interaktioner på Training Dataset

Som for de 59 stoffer i uddannelsen datasættet S

st, forudsigeren blev udført og evalueret af overdrejningsalarm test. Opført i kolonne 2 i tabel 2 er de 8 forudsigelse nøjagtighed beregnet af ligning. 8, hvorfra vi kan se, at 1

st ordre forudsigelse nøjagtighed var 55,93%, mens 2

nd ordre forudsigelse nøjagtighed var 22,73%. Det er også observeret fra kolonne 2 i tabel 2, at forudsigelse nøjagtighed generelt fulgt en faldende tendens med stigningen af ​​ordrenummer, hvilket indikerer, at den foreslåede metode arrangeret kandidatlandene kræft i uddannelsen datasæt ganske godt. I detaljer, for hver ordre forudsigelse, vi beregnede nøjagtighed hver slags kræft ifølge Eq. 9, er optaget i række 2-9 i tabel 3. Det kan ses, at det meste af 0,00% nøjagtighed forekom, når forudsigelsen ordre var høj, hvilket indikerer, at for hver slags cancer, blev det bedre forudsiges med lavere orden antal forudsigelserne. Det gennemsnitlige antal kræfttilfælde som narkotika i S

tr kan behandle var 1,31 (77/59), beregnet af ligning. 11. Det betyder, at den gennemsnitlige succesrate ville være kun 16,38%, hvis dem gør forudsigelse af tilfældige gæt,

dvs

tilfældigt tildele en kræft indikation til hver prøve, som er meget lavere end 1

st ordre forudsigelse nøjagtighed, der opnås ved vores metode. Fordi det gennemsnitlige antal af cancere et lægemiddel kan behandle er 1,31, de første 2 ordens forudsigelser af hver prøve i S

tr blev taget til at beregne andelen af ​​sande cancere, at prøver i S

tr kan behandle omfattet af disse forudsigelser ifølge Eq. 10, opnåelse af et forhold på 61,04%.

Ydelse af metoden baseret på Kemisk-kemiske interaktioner på Validering Test Dataset

Som for de 9 stoffer i valideringen test datasæt S

te, blev deres kandidat kræft forudsagt af beskrevet i afsnit “metoden baseret på kemisk-kemiske vekselvirkninger” baseret på de oplysninger om narkotika i S

tr metode. 8 forudsigelse nøjagtigheder beregnet ved ligning. 8 blev opført i kolonne 3 i tabel 2. Det kan ses, at 1

st ordre forudsigelse nøjagtighed var 55,56%, mens 2

nd ordre var 66,67%. Det er også observeret fra tabel 2, at forudsigelse nøjagtighed af dette datasæt var generelt højere end for uddannelse datasæt, på grund af det faktum, at lægemidler i S

te kan behandle to eller flere end to former for kræft, mens de fleste lægemidler i S

kan tr kun behandle én slags kræft. Ligeledes vi beregnet de nøjagtigheder for hver type kræft for 1

st, 2

nd, …, 8

th orden forudsigelse af Eq. 9. Række 10-17 af tabel 3 er angivet dem. Det gennemsnitlige antal kræfttilfælde, at narkotika i S

te kan behandle var 3,78 (34/9), hvilket indikerer, at hvis dem gør forudsigelse af tilfældige gæt ville den gennemsnitlige succesrate være 47,22%, hvilket er betydeligt lavere end 1

st og 2

nd bestil nøjagtigheder er anført i kolonne 3 i tabel 2. Dette antyder, at udførelsen af ​​metoden på valideringen test datasæt er temmelig god. Da det gennemsnitlige antal af cancere, at lægemidler i S

te kan behandle var 3,78, de første 4 ordens forudsigelser af hver prøve i S

te blev overvejet. Ifølge Eq. 10, blev 61,76% af sande kræftformer korrekt forudsagt af de første 4 ordens forudsigelser.

Ydelse af metoden baseret på Kemisk-kemiske interaktioner på den uafhængige Test Datasæt

kandidat kræft i 44 narkotika i den uafhængige test datasæt S

iTE blev også forudsagt af vores prædiktor baseret på oplysninger om narkotika i S

tr. 8 forudsigelse nøjagtighed blev opnået og opført i kolonne 4 i tabel 2, hvorfra vi kan se, at 1

st ordre forudsigelse nøjagtighed var 59,09%, mens 2

nd ordre forudsigelse nøjagtighed var 29,55%. For bedre at vurdere den metode, forudsigelsen nøjagtigheder på hver slags kræft for de 8 ordens forudsigelser blev beregnet ved ligning. 9 og anført i række 18-25 i tabel 3. Det gennemsnitlige antal kræfttilfælde, at narkotika i S

ITE kan behandle var 1,32 (58/44), hvilket tyder på, at hvis dem gør forudsigelse af tilfældige gæt, ville den gennemsnitlige succesrate være 16,5%, hvilket er meget lavere end 1

st ordre forudsigelse nøjagtighed, der opnås ved vores metode. Fordi det gennemsnitlige antal drug indikationer var 1,32, den første 2 ordre forudsigelse af hver prøve i S

ite blev overvejet. Ifølge Eq. 10, blev 67,24% af sande kræftformer korrekt forudsagt af de første 2 ordens forudsigelser.

Sammenligning med andre metoder

For at angive effektiviteten af ​​vores metode til forudsigelse af narkotika kræftindikationer, nogle andre metoder blev bygget til at gøre sammenligning.

Den metode baseret på molekylære deskriptorer beskrevet i afsnit “metoden er baseret på molekylære deskriptorer” blev udført på S

st med sin præstation evalueret af overdrejningsalarm test. De 8 forudsigelse nøjagtigheder beregnet af ligning. 8 blev opført i kolonne 2 i tabel 4, hvorfra vi kan se, at 1

st ordre forudsigelse nøjagtighed var 41,38%. Det er meget lavere end 1

st orden forudsigelse nøjagtighed på 55,93% opnået ved metode baseret på kemisk-kemiske påvirkninger. Også for narkotika i S

te og S

ITE, deres kræftindikationer blev forudsagt af molekylære deskriptorer på S

tr. De forudsigelse nøjagtighed blev opført i kolonne 3 og 4 i tabel 4. I detaljer, den 1

st ordre forudsigelse nøjagtighed på S

te og S

ite var 55,56% og 44,19%, henholdsvis. Sammenlignet med forudsigelse nøjagtighed på 55,56% på S

te og 59,09% på S

ite bruger kemiske vekselvirkninger, de optrådte på samme niveau på S

te, og kemiske interaktioner er meget bedre end kemiske deskriptorer på S

iTE. Derudover har vi overvejet de første to-order, 4-order og 2-ordens forudsigelser om S

tr, S

te og S

ITE på grund af det gennemsnitlige antal kræfttilfælde, at narkotika i disse datasæt kan behandle. Andelen af ​​sande kræftformer, der prøver i S

st, S

te, og S

ITE kan behandle omfattet af disse forudsigelser var 51,39%, 58,82% og 49,12%, henholdsvis, som alle var lavere end den tilsvarende andele af 61,04%, 61,76% og 67,24%, henholdsvis, fremstillet ved metode baseret på kemisk-kemiske påvirkninger. Derfor er metoden baseret på kemiske vekselvirkninger var overlegen i forhold til metoden baseret på molekylære deskriptorer.

Som det blev beskrevet i de ovennævnte tre sektioner, udførelsen af ​​vores metode var meget bedre end de tilfældige gæt , som tilfældigt tildelt en cancer indikation på en forespørgsel lægemiddel. Her blev en anden tilfældig gætte metode anvendt til at evaluere vores metode fra et andet aspekt. For enhver forespørgsel stof

d

q

, vi tilfældigt udvalgt et lægemiddel stof i træningssættet, siger

d

, og tildelte sande kræftformer,

d

kan behandle til

d

q

,

dvs

de forudsagte kræft i

d

q

var samme som de sande kræftformer, der

d

kan behandle. Da der ikke er nogen orden oplysninger i de forudsagte kandidat kræftformer for hver prøve, de foranstaltninger, som Section “Validering og evaluering” kan ikke evaluere resultaterne af denne metode. Således Recall og Precision [30], [31] var ansat til at evaluere sine resultater, som kan beregnes ved (12). Hvor er antallet af korrekte forudsagte kræftformer for

jeg

th stof sammensatte, repræsenterer antallet af kræft, som

jeg

th lægemiddelforbindelse kan behandle, repræsenterer antallet af forudsagte kræftformer for

jeg

th stof sammensatte, og

N

er samlede antal undersøgte prøver.

den tilfældige gæt beskrevet i ovenstående afsnit blev udført på S

st med sin præstation evalueret af overdrejningsalarm test. Precision og Recall var 15,29% og 16,88%, henholdsvis. For de forudsagte resultater på S

tr ved kemisk-kemiske vekselvirkninger, blev det 1

st orden forudsigelse af hver prøve plukket, indhentning præcision 55.93% og tilbagekaldelse af 42.86%, som var meget højere end den tilfældige gæt metode .

Det er let at se, at vores metode afhænger dybt på tillid snesevis af kemiske-kemiske påvirkninger. For at teste betydningen af ​​disse scoringer, udvekslede vi tilfældigt den tillid snesevis af nogle interaktioner. Baseret på de tilfældige permutationer blev dataene evalueret af overdrejningsalarm test på uddannelse datasæt S

tr. Den 1

st ordre forudsigelse nøjagtighed var 23,73%, mens de øvrige forudsigelse nøjagtighed på 2

nd, 3

rd, …, 8

th orden forudsigelse var 18,64%, 11,86%, 18,64%, 20.34%, 15,25%, 13,56%, 8,47%, hhv. Det observeres, at 1

st ordre forudsigelse nøjagtighed, der opnås ved tilfældig permutation var meget lavere end den 55.93% opnået ved kemiske vekselvirkninger. Desuden blev de 8 forudsigelse nøjagtighed ikke fulgt en faldende tendens med stigningen af ​​ordrenummer, hvilket indikerer, at kandidatlandene kræftformer ikke blev arrangeret godt. Dette implicerer, at tillid score er meget vigtigt at de forudsigelser.

Diskussion

26 1

st ordre forudsigelser var ‘forkerte’ i uddannelsen datasæt, der er, de forudsagte kræft indikationer på disse lægemidler blev ikke registreret i Kegg. Disse 26 lægemidler og deres 1

st ordre forudsigelser var tilgængelige i tabel S3. Men rapporteret nogle referencer, at 23 af disse 26 stoffer var faktisk effektiv til deres “forkerte” indikationer, og det var det samme med 3 af de 4 stoffer i valideringen test datasæt (se tabel S3 for de detaljerede 4 lægemidler og deres 1

st ordre forudsigelse), og 13 af de 18 stoffer i den uafhængige test datasæt (se tabel S3 for detaljerede 18 lægemidler og deres 1

st ordre forudsigelse). Således håber vi, at vores forudsigelse model kan give nogle oplysninger om narkotika repositionering. I de følgende afsnit, vi citerede nogle henvisninger til at støtte vores forudsagte resultater.

Tyve-tre Forkerte Forventede Par af narkotika og Indikation i Training Datasæt

Cisplatin-Kræft af hæmatopoietiske og lymfoide væv.

Cisplatin (Kegg ID: D00275), “penicillin af cancer narkotika”, er almindeligt ordineret til mange cancerceller behandlinger, såsom testikel-, ovarie-, blære-, lunge-, mavekræft, og lymfom [32], [33 ], [34]. Prasad

et al.

Undersøgte virkningen af ​​cisplatin på Daltons lymfom, og konkluderede, at cisplatin kan inducere komplet regression af ascites Dalton lymfom i mus [35].

Ifosfamid-Kræft af hæmatopoietisk og lymfevæv.

Ifosfamid (D00343) kan anvendes til behandling af kønsceller testikelkræft, livmoderhalskræft, småcellet lungekræft, non-Hodgkins lymfom, og så videre [36]. Ekstranodal naturlige dræberceller /T-celle lymfom, nasal type (ENKL) er Epstein-Barr virus-associeret lymfoide maligne sygdomme, og patienter med stadie IV, recidiverende eller refraktær ENKL har dystre prognoser. Yamaguchi

et al.

Udforsket en ny regime SMILE, herunder steroid dexamethason, methotrexat, ifosfamid, L-asparaginase, og etoposid, og konkluderede, at SMILE var effektiv til denne form for sygdom [37], [38] .

lomustin-kræft af hæmatopoietiske og lymfoide væv.

lomustin (D00363) er en komponent af kombinationen kemoterapi til behandling af primære og metastatiske hjernetumorer, og også som en sekundær terapi for refraktær eller recidiverende Hodgkins sygdom [39]. Desuden rapporterede tidligere undersøgelser, at lomustine kan komme i betragtning til behandling af hunde lymfom hos hunde [40], [41], [42], [43], selv om det inducerede fælles, men ikke livstruende toksicitet [44].

Mitotan-kræft i urinvejene og de mandlige kønsorganer.

Mitotan (D00420) er den første linje lægemiddel til metastatisk binyrebark karcinom [45], [46], [47], og også anvendes til adjuverende terapi efter fjernelse af primær tumor [48]. Dog kan mitotanbehandling fremkalde nogle bivirkninger, såsom binyrebarkinsufficiens og mandlig hypogonadisme [49].

procarbazin-Kræft af hæmatopoietiske og lymfoide væv.

Procarbazin (D00478) anvendes til behandling af humane leukæmier [50].

Be the first to comment

Leave a Reply