PLoS ONE: Sequence og Struktur underskrifter Cancer Mutation Hotspots i Protein Kinases

Abstrakt

Proteinkinaser er de mest almindelige proteindomæner impliceret i kræft, hvor somatisk erhvervede mutationer vides at være funktionelt knyttet til en række forskellige cancere. Resekventering studier af protein kinase kodende regioner har understreget betydningen af ​​sekvens og struktur determinanter for kræftfremkaldende kinase mutationer i forståelsen af ​​mutationen-afhængige aktiveringen. Vi har udviklet en integreret bioinformatik ressource, som konsoliderede og kortlagt alle de foreliggende oplysninger om genetiske modifikationer i proteinkinasegenerne med sekvens, struktur og funktionelle data. Integrationen af ​​diverse datatyper forudsat en bekvem ramme for kinome-dækkende undersøgelse af sekvens-baserede og struktur-baserede underskrifter kræft mutationer. Databasen-drevne analyse har afsløret en differentieret berigelse af SNPs kategorier i funktionelle områder af kinase domæne, der viser, at et betydeligt antal kræft mutationer kan falde på strukturelt tilsvarende stillinger (mutationsmønstre hotspots) inden den katalytiske kerne. Vi har også fundet, at strukturelt konserverede mutationsmønstre hotspots kan deles af flere kinase gener og er ofte beriget af kræft driver mutationer med høj onkogen aktivitet. Strukturel modellering og energisk analyse af de mutationsmønstre hotspots har foreslået en fælles molekylær mekanisme for kinase aktivering med kræft mutationer, og har lov til at forene de eksperimentelle data. Ifølge en foreslået mekanisme, kan strukturel effekt af kinase-mutationer med en høj onkogent potentiale manifestere i en signifikant destabilisering af autoinhibited kinase form, og som sandsynligvis vil drive tumorgenese på et vist niveau. Struktur-baserede funktionelle annotation og forudsigelse af cancer mutation virkninger i proteinkinaser kan lette forståelsen af ​​mutationen-afhængig aktivering proces og underretter eksperimentelle undersøgelser, molekylær patologi tumorigenese

Henvisning:. Dixit A, Yi L, Gowthaman R, Torkamani A, Schork NJ, Verkhivker GM (2009) Sequence og struktur underskrifter Cancer Mutation Hotspots i proteinkinaser. PLoS ONE 4 (10): e7485. doi: 10,1371 /journal.pone.0007485

Redaktør: Kumar Selvarajoo, Keio Universitet, Japan

Modtaget: 16. juli 2009; Accepteret: September 25, 2009; Udgivet: 16 Oktober 2009

Copyright: © 2009 Dixit et al. Dette er en åben adgang artiklen distribueres under betingelserne i Creative Commons Attribution License, som tillader ubegrænset brug, distribution og reproduktion i ethvert medie, forudsat den oprindelige forfatter og kilde krediteres

Finansiering:. Dette arbejde blev støttet af The University of Kansas opstart finansiering. De finansieringskilder havde ingen rolle i studie design, indsamling og analyse af data, beslutning om at offentliggøre, eller forberedelse af manuskriptet

Konkurrerende interesser:.. Forfatterne har erklæret, at der ikke findes konkurrerende interesser

Introduktion

Et centralt mål for kræft forskning indebærer opdagelsen og funktionel karakterisering af de muterede gener, der driver tumorigenese [1]. The Human Genome Project har givet forskere med hidtil usete indsigt i struktur og organisation af gener. Storstilet resekventering og polymorfi karakterisering undersøgelser har efterfølgende fokuseret på identifikation og katalogisering af naturligt forekommende gen og sekvensvariation [2] – [5]. Den Cancer Genome Atlas og relaterede DNA sekventering initiativer har specifikt undersøgt de genetiske determinanter for kræft [6]. Disse undersøgelser har fastslået, at kun en brøkdel af genetiske ændringer, der bidrager til tumorigenese kan være arvet, mens somatisk erhvervede mutationer kan bidrage afgørende under udviklingen af ​​en normal celle til en kræftcelle. Proteinkinaser spiller en kritisk rolle i cellesignalering og har vist sig som de mest almindelige proteindomæner, der er impliceret i cancer [7] – [11]. Selvom kinase katalytiske domæne er stærkt bevaret, har protein kinase krystalstrukturer afslørede betydelige strukturelle forskelle mellem nært beslægtede aktive og meget specifikke inaktive former af kinaser [12] – [17]. Evolutionære konservering og konformationel plasticitet af kinasen katalytiske domæne muliggøre en dynamisk ligevægt mellem aktiv og inaktiv kinase former, som kan lette regulering af den katalytiske aktivitet [15] – [17]. Der er mere end 500 proteinkinaser kodet i det humane genom og mange medlemmer af denne familie er fremtrædende terapeutiske mål for bekæmpelse af sygdomme forårsaget af abnormiteter i signaltransduktionsveje, især forskellige former for cancer [18] – [22].

den komplette Kortlægningen af ​​det menneskelige genom og high-throughput generation af genomiske data har åbnet muligheder for en systematisk tilgang til at forstå den komplekse biologi kræft og klinisk målretning af aktiverede onkogener. Store tumor sekventering studier har identificeret en rig kilde til naturligt forekommende mutationer i proteinkinasegenerne med mange være enkle single nucleotide (SNP’er) [23] – [32]. En undergruppe af disse SNP’er kan opstå i de kodende regioner (cSNPs) og føre til den samme polypeptidsekvens (synonyme SNP’er, sSNPs) eller medfører en ændring i den kodede aminosyresekvens (ikke-synonyme kodende SNP, nsSNPs). Resekventering studier af kinasen kodende regioner i tumorer har klassificeret tumorassocierede somatiske mutationer afslører, at kun et lille antal kinase mutationer kan bidrage til tumordannelse (kendt som cancer driver mutationer), mens flertallet kunne være neutrale mutationelle biprodukter af somatiske celler replikation ( kendt som passager mutationer) [23] – [28]. Mens proteinkinaser har en fremtrædende rolle i tumorigenese, almindeligt muterede protein kinaser i kræft syntes at være undtagelsen fra reglen, og de fleste af kinase driver mutationer forventes at blive fordelt på mange proteinkinasegenerne [27]. Kræft mutationer i proteinkinaser kunne ofte eksemplificere fænomenet onkogen afhængighed hvorved trods periodisering af talrige genetiske ændringer over modning af en tumor, kan kræftceller forblive afhængige af særlige onkogene veje og kan blive afhængige af den fortsatte aktivitet af specifikke aktiverede onkogener [33], [34]. De dominerende onkogener, der bibringer den onkogen afhængighed effekt omfatter ABL, EGFR, VEGFR, BRAF, FLT3, RET, og MET-kinase gener [34].

Den nylige opdagelse af lungekræft mutationer i EGFR kinasedomænet [35 ] – [37] og deres differentiel følsomhed over for EGFR-hæmmere har foreslået, at genetiske ændringer kan være forbundet med strukturelle ændringer, rendering tumorer følsomme overfor selektive inhibitorer. Strukturelle bestemmelser af EGFR [38] – [41] og ABL kræft mutanter [42], [43] har foreslået, at molekylære mekanismer i kinase aktivering af kræft mutationer og aktivitet underskrifter af kræft narkotika kan være forbundet med dynamikken i funktionelle overgange mellem inaktive og aktive kinase former. Biofysisk modellering af protein kinase struktur og dynamik har afsløret væsentlige mekanistiske træk kinase aktivering ved atomar opløsning. Molekylær dynamik (MD) simuleringer af store konformationelle overgange er blevet udført i mange terapeutisk vigtige proteinkinaser, herunder HCK kinase [44], adenylatkinase [45], Src-kinase [46] – [51], cyclin-afhængig kinase 5 (CDK5) [52], ABL-kinase [53], KIT-kinase [54] EGFR, RET og MET-kinase-domæner [55] – [57]. Disse undersøgelser har antydet, at kræft mutationer kan have en subtil, men alligevel dybt vigtigt funktionelle påvirker ikke kun på lokale konformationsændringer på mutations site, men også på allosterisk regulering og kooperative interaktioner i signal transduktion netværk [58], [59]. I henhold til den foreslåede mekanisme af kinase aktivering, kan strukturel effekt af kræft mutationer manifestere i at flytte dynamisk ligevægt mellem inaktive og aktive kinase former mod et konstitutivt aktiv kinase, hvorved skadelige konsekvenser for kinase regulering.

Kræft biologiske undersøgelser af proteinkinasegenerne har integreret genetiske, strukturelle og funktionelle tilgange til at karakterisere underliggende molekylære underskrifter kræft mutationer. High-throughput DNA-sekvensanalyse og funktionel vurdering af kandidat kræft mutationer i tyrosinkinase-gener er identificeret punktmutationer i de konserverede hotspots fra aktiveringssløjfen i leukæmi-associeret tyrosinkinaser [60] – [63]. En høj-throughput platform er blevet anvendt til at forespørge hele FLT3 kodende sekvens i AML-patienter og eksperimentelt teste de funktionelle konsekvenser af hver kandidat tumorigen allel [63]. Disse undersøgelser har vist, at sjældne driver varianter ofte kunne forekomme ved frekvenser ikke kan skelnes fra personbiler mutationer. Som et resultat, kan funktionel analyse af kandidat mutationer identificeret i genom-dækkende skærme være i sidste ende nødvendig for at bestemme, hvilke mutationer bidrager til celletransformation. Computational tilgange, når det kombineres med strukturelle og funktionelle studier, har også lettet identifikation og forudsigelse af kandidat cancer gener og individuelle alleler, der bidrager til tumorigenese [64] – [67]

Bioinformatik værktøjer blev for nylig udviklet til at skelne mellem. fører og passager nsSNPs [68], [69]. Selvom ganske stærke, kan generelle forudsigelse metoder mislykkes at opnå den følsomhed og specificitet opnås ved forudsigelsesmodeller skræddersyet til de enkelte protein familier. Vi har udviklet kinase målrettet maskine learning modeller, der fokuserede på nsSNPs i proteinkinaser ved at udnytte kendte sekvens-baserede og struktur-baserede protein kinase funktioner til at identificere mønstre i rester og sekvensmotiver huser funktionelt relevante varianter [70] – [72]. Den udviklede support-vektor maskine (SVM) metoden er blevet vist at skelne mellem sygdomsassocierede nsSNPs og neutrale nsSNPs med -80% nøjagtighed [70]. Disse resultater har foreslået, at den prædiktive effekt af machine learning modeller vurdere funktionelt vigtige mutationer kan øges betydeligt ved at vælge informativ attributter karakteristisk for et specifikt protein familie. Endvidere har vi fundet, at kinase regioner, der huser et stort antal kræft mutationer i flere proteinkinaser kan indeholde en høj andel af de forudsagte driver mutationer, mens kinase subdomæner blottet for kræft mutationer var mere tilbøjelige til at indeholde passager mutationer [71], [72 ]. Disse resultater tyder på, at biologiske egenskaber og funktionelle konsekvenser adskiller cancer driver mutationer fra personbiler mutationer i proteinkinaser kan afvige fra dem separere sygdom-associeret fra neutrale nsSNPs tværs af hele genomet.

Den voksende genetiske, molekylære og funktionel information om protein kinaser gener, kombineret med deres fremtrædende rolle som terapeutiske mål for kræft indgriben har produceret en hidtil uset eksplosion af diverse data. En stor mængde information om genetiske modifikationer i protein kinase familier er blevet akkumuleret i forskellige kilder, herunder PupaSNP [73], dbSNP database [74], Mendelian Inheritance in Man (OMIM) fra National Center for Biotechnology Information (NCBI) [75 ], [76], KinMutBase [77], [78], BTKbase [79], human genmutation database (HGMD) [80], [81], katalog af somatiske mutationer i Cancer database (COSMIC) [82], Protein kinase Resource (PKR) [83], og Mutationer af kinaser i Cancer (MoKCa) [84]. Mens de nuværende databaser og informationsportaler har oparbejdet en stor mængde information om kinase SNPs, er der et stigende behov for integration og omfattende kortlægning af diverse data kategorier på proteinkinasegenerne inden for en central ressource.

I dette arbejde, introducerer vi Composite kinase Mutation Database (CKMD), en enkelt repository og integreret bioinformatik ressource, konsolideret og utvetydigt kortlagt alle de foreliggende oplysninger om genetiske variationer i proteinkinasegenerne med sekvens, strukturelle og funktionelle data. CKMD og webbaseret ressource er frit tilgængelige på https://verklab.bioinformatics.ku.edu/database/. Funktionaliteten og evner CKMD portal kan tillade robust funktionel annotation af protein kinase gener og aktivere kinome hele forudsigelse og struktur-funktionel analyse af kræft mutationer. Databasen-drevne analyse af sekvens og struktur-baserede underskrifter fra kinase SNPs har afklaret fremtrædende aspekter af sekvens bevarelse mønstre og strukturelle profiler af kræftfremkaldende mutationer, herunder fremkomsten af ​​strukturelt bevarede tumorigene hotspots på tværs af flere proteinkinaser. Desuden strukturel modellering og energisk analyse af kinase kræft mutationer, som udgør den største mutations hotspot, har givet en nyttig indsigt i en fælles mekanisme for kinase aktivering.

Resultater

Sekvens-Structure Klassificering og Mapping af kinase SNP’er

integrationen og kortlægning af forskellige datatyper i CKMD forudsat en bekvem ramme for kinome hele analyse af sekvens-baserede og struktur-baserede underskrifter kræft mutationer. Genetiske variationer i proteinkinasegenerne er bredt fordelt på både fylogenetisk og strukturel plads, og kun en delmængde af alle SNP’er kan direkte mappes til kinase katalytiske domæne. Vi begyndte ved at analysere fordelingen af ​​forskellige SNPs kategorier, kan kortlægges på de 12 funktionelle subdomæner (SDS) af kinasen katalytiske kerne [7] (Figur 1). Strukturelle kortlægning af sSNPs resulterede i en ensartet dækning af kinase subdomæner, der kun viser en svag præference for SD II, som har nogen klar funktionel rolle i kinase regulering (figur 2A). I modsætning hertil fordelingen af ​​nsSNPs fremhævede præferentiel bias mod specifikke funktionelle regioner. Faktisk funktionelt vigtige P-loop (SD I), hængselregion (SD V), katalytisk sløjfe (SD VIB), og især aktivering loop (SD VII) sammen med den nedstrøms P + 1 loop region (SD VIII) tendens til at være mere tætbefolkede (figur 2B). P + 1 segment forbinder subdomæner i den C-terminale lap med ATP og substrat bindende regioner i den N-terminale lap. Desuden er P + 1 loop direkte forbundet til F-helix, der fungerer som et centralt skelet ved samling af aktiv kinase form [85] -. [87]

kinase katalytiske domæne blev opdelt i 12 subdomæner (SD) ved hjælp af ABL-kinase krystalstruktur (PDB entry 1IEP) som reference for at definere de restkoncentrationer intervaller som følger: SD i: 242-261 (P-loop-regionen); SD2: 262-278; SD3: 279-291 (aC-helix); SD4: 292-309; SD5: 310-335 (hængsel region); SD6A: 336-356; SD6B357-374 (katalytisk sløjfe); SD7: 375-393 (aktivering sløjfe); SD8: 394-416 (P + l loop); SD9: 417-438; SD10: 439-461; SD11: 462-480; SD12: 481-498. Tilpasningen af ​​funktionelle underdomæner for proteinkinasegenerne blev udført under anvendelse struktur-informeret multipel sekvensalignment.

Fordelingen af ​​kinase sSNPs er vist i panel (A) og fordelingen af ​​sSNPs er præsenteret i panel ( B)

kinase katalytiske domæne huser et betydeligt antal nsSNPs falder i tre hovedkategorier:. fælles og sandsynligvis neutrale nsSNPs, arvede sygdomsfremkaldende nsSNPs og kræftfremkaldende (somatiske) nsSNPs. Vi analyserede evolutionære bevarelse mønstre blandt disse tre forskellige kategorier af kinase nsSNPs (figur 3). Et mål for bevarelse blev afledt af den absolutte værdi af substitutionsstillingen-specifikke evolutionære konservering score, betegnet “subPSEC”, som blev opnået ved at rette et givet protein mod et bibliotek af Hidden Markov Models (HMM), som repræsenterer distinkte proteinfamilier [88] , [89]. Den score blev defineret som – | ln (P

aij /P

bij) |, hvor P

aij er sandsynligheden for at observere aminosyre A i position i i HMM j. Ifølge PANTHER hjemmeside [89], ville en score på -3 svarer til anslået 50% sandsynlighed for, at SNP kan være en sygdom, der forårsager variant. De SNPs bevarelse profiler til kinase gener kan beskrives som den absolutte værdi af subPSEC score, hvor højere score, jo større grad af evolutionær bevarelse. Fordelingen af ​​fælles nsSNPs blev forudindtaget mod et lavere bevarelse, som ville forventes for neutrale varianter med ringe eller ingen funktionel betydning. Cancerassocierede nsSNPs syntes at falde i positioner med en højere grad af bevarelse end almindelige nsSNPs, men kunne som konserveret som sygdomsfremkaldende nsSNPs (figur 3A). Denne analyse viste, at enten cancerassocierede nsSNPs ikke nødvendigvis kan falde ind evolutionære højt konserverede positioner, eller fordelingen kan være skæv mod en nedre bevarelse niveau ved kræft varianter af nogen funktionel konsekvens (personbiler mutationer). Ved hjælp af en nyudviklet SVM-baserede metode kan forudsige funktionelt vigtige kræft mutationer [70], [71], vi sammenlignet de evolutionære bevarelse fordelinger af kræft driver mutationer og passager mutationer ved forskellige niveauer af bevaring (figur 3B). Selvom de forudsagte kræft driver mutationer faldt på positionerne udviser lidt højere bevaring niveau, i forhold til de passager mutationer, forskellen var temmelig beskedne. Derfor fremgik det, at kræft mutationer i proteinkinaser ikke kan vise stærke bevarelse sekvens signaler og dermed, funktionelle betydning kinase genetiske varianter kan ikke være direkte relateret til deres evolutionære bevarelse.

(A) Sandsynligheden fordeling af fælles nsSNPs (vist i blå søjler), sygdomsfremkaldende SNPs (vist i røde søjler) og kræftfremkaldende nsSNPs (vist i grønne søjler) som en funktion af evolutionær bevarelse niveau. (B) Sandsynligheden fordeling af kræft driver mutationer (vist i blå søjler) og passager nsSNPs (vist i røde søjler) som en funktion af evolutionær bevarelse niveau. For begge paneler (A) og (B), en højere score svarer til en højere grad af bevaring.

Vi analyserede også molekylære determinanter for genetiske variationer i proteinkinaser udnytte CKMD ressource for en omfattende strukturel kortlægning af nsSNPs onto kinase-katalytisk kerne. Databasen-drevne analyse afslørede en differentiel berigelse af SNPs kategorier i funktionelle regioner af kinasedomænet (figur 4, 5). Fælles nsSNPs tendens til at være tilfældigt fordelt indenfor det katalytiske kerne, kun sparsomt udfyldelse funktionelle segmenter af den katalytiske kerne, såsom de katalytiske eller aktivering loops, hvorimod disse nsSNPs mere tæt besætte evolutionære unconserved regioner i den C-terminale hale (figur 4A). De sygdomsfremkaldende nsSNPs primært kortlagt til de er involveret i regulering og substrat regioner bindende, såsom APE-loop og P + 1 region, samt den katalytiske sløjfe (figur 4B). Cancerassocierede nsSNPs generelt målrettet regioner er direkte involveret i den katalytiske aktivitet, der hovedsagelig lokaliseret i P-loop, aktivering loop og katalytisk sløjfe (fig 4C). Fordelingen af ​​kinase nsSNPs tværs funktionelle kinase subdomæner forstærkede opfattelsen af, at de kinase regioner, er beriget (eller blottet) af SNPs kunne være markant forskellige på tværs af de tre mutation typer, med en minimal overlapning. Faktisk viser fordelingen en klar præference for kræftfremkaldende nsSNPs at akkumulere det meste i aktivering loop-regionen (SDVII) samt befolker P-loop (SD I) (figur 5A). Et betydeligt antal af sygdom-associerede nsSNPs var ikke direkte involveret i ATP-binding, men snarere begravet i den katalytiske kerne. Interessant, P + 1 loop og de rester, der forankre denne lomme til F-helix var nogle af de mest beriget med sygdomsassocierede mutationer, men ikke kræftfremkaldende mutationer. Disse resultater bekræfter med tidligere resultater indikerer, at sygdom-associerede mutationer primært kunne påvirke kinase regioner involveret i funktionel regulering, allosteriske interaktioner og substrat binding [72].

Strukturel kortlægning er vist for fælles nsSNPs (A), sygdom -causing nsSNPs (B) og kræftfremkaldende nsSNPs (C). I alle paneler den grønne farve repræsenterer regioner med et SNP frekvens svarer til, hvad man kunne forvente ved tilfældig chance, blåfarvning repræsenterer regioner, som er statistisk blottet for SNP’er, og rød farve viser områder, der er statistisk beriget med SNPs. Berigelse af SNP’er i disse regioner blev beregnet som beskrevet i materialer og fremgangsmåder. For klarhedens skyld blev SNP’er tæthed kortlagt på en repræsentativ kinase krystalstruktur (EGFR, pdb post 1M14) ved at projicere sekvens kinase alignment multipel på protein struktur.

(A) Fordelingen af ​​fælles nsSNPs (vist i blå søjler), sygdomsfremkaldende nsSNPs (vist i røde bjælker) og kræftfremkaldende nsSNPs (vist i grønne søjler) i de funktionelle subdomæner af kinase katalytiske kerne. Den forventede sandsynlighed for en SNP forekommer i en kinase underdomæne region blev beregnet for hver SNP typen som beskrevet i de materialer og fremgangsmåder. (B) Positionen-specifikke fordeling af fælles nsSNPs (vist i blå søjler), sygdomsfremkaldende nsSNPs (vist i røde bjælker), og cancer-associerede nsSNPs (vist i grønne søjler) på tværs af forskellige kategorier af strukturelt bevarede mutationsmønstre hotspots som bestemt med antallet af SNPs pr strukturelt identisk position.

Funktionelle forskelle på tværs af forskellige mutation typer kunne afspejles også i den position-specifikke fordeling af nsSNPs på mutationsmønstre hotspots bestemt af antallet af strukturelt tilsvarende proteinkinase positioner (figur 5B). Fordelingen af ​​fælles nsSNPs, der har lidt eller ingen funktionel indflydelse og kunne være tilfældigt fordelt i hele den katalytiske kerne, var domineret af svagt bevarede positioner muteret i en enkelt eller to proteinkinaser. I modsætning hertil sygdomsfremkaldende nsSNPs tendens til at blive koncentreret ved strukturelt tilsvarende stillinger med en signifikant overskud af mutationer, der forekommer ved positionerne muteret i fire eller flere forskellige proteinkinaser. Stillingen-specifikke fordeling af kræft nsSNPs blev forskudt mod et højere antal nsSNPs pr position, sandsynligvis på grund af valget af tumorigene mutationsmønstre hotspots deles på tværs af flere proteinkinaser (figur 5B).

Strukturelle Bioinformatik Analyse af kinase Mutationsanalyse Hotspots

Kinome hele analyse af sekvens og struktur-baserede underskrifter fra kræft mutationer, afslørede, at et betydeligt antal kræft mutationer kan falde på strukturelt tilsvarende stillinger inden for den katalytiske kerne. Disse strukturelt konserverede mutationer tendens til at klynge i specifikke mutationsmønstre hotspots, som kan deles af flere kinase gener. Cancer mutation hotspots i proteinkinaser er stort set befinde sig dér P-loop, hængselregion, og aktivering sløjfe (figur 6A, tabel S1). Af særlig interesse er et spektrum af EGFR, ABL, MET, FLT3 og KIT kræft mutationer, som svarer til det samme strukturelt konserverede position i aktiveringen loop, som syntes at være muteret i mindst 8 forskellige kinaser (figur 6A, tabel S1). Dette websted svarer til de kendte driver mutationer BRAF-V600, FLT3-D835, KIT-D816, PDGFRA-D842, MET-D1228, EGFR-L861, ABL-L387, og ErbB2-L869. På trods af en sekvens-specifik bevaring mønster, mange mutationer ved denne strukturelt bevaret position almindeligt forekommende aktiverende mutationer, herunder D1228H /N /V i MET [90], [91], D835E /F /H /N /V /Y i FLT3 [92], [93], D816E /F /H /N /i /V /Y i KIT [94], [95] og V600D /E /G /K /L /M /R i BRAF [96]. I nogle tilfælde kan disse mutationer have stor betydning for målrettede hæmmere ved at føre til lægemiddelresistens effekter i KIT [97], BRAF [98], EGFR [99], ABL [100], og MET [101]. En anden funktionelt vigtig mutations hotspot svarer til det konserverede gate-keeper kinase position og inkluderer ABL-T315I, EGFR-T790M, KIT-T670E, og PDGFRα-T674I-varianter (figur 6A, tabel S1). Nogle af de strukturelt tilsvarende stillinger kan bevares på tværs af kinome, som aspartat og glycinrester fra DFG-motivet (svarende til referencepositionerne EGFR-D855 og EGFR-G857), samt en konserveret glycin i hængselsregionen (som svarer til EGFR-G796 referenceposition). Der er eksempler på kræft mutationer viser en undergruppe niveau af bevarelse, herunder EGFR-L858 position, som har en bevaret leucin i EGFR og ABL kinaser, eller en bevaret aspartat delt i FLT3, KIT, MET, PDGFRα.

(A) Strukturel lokalisering af de konserverede mutations hotspots illustreres ved anvendelse af krystalstrukturen af ​​det aktive EGFR-kinase (PDB entry 2J6M). Den store størrelse rød bold svarer til strukturelle stilling i L861, og betegner lokalisering af de største mutational hotspot deles i 8 forskellige kinaser. De mellemstore gule bolde svarer til strukturelle positioner T790, D855, og G857-rester (respektive mutationsmønstre hotspots deles af 6 forskellige kinaser). Den mindre grøn bold svarer til G796 position (5 strukturelt konserverede kinase mutationer); de cyan bolde svarer til L718 og G721 positioner (hver position betegner rester med 4 kræft mutationer); og den mindste blå bold svarer til L858 position (3 strukturelt konserverede kinase mutationer). Cancer mutation hotspots i proteinkinaser er stort set befinde sig dér P-loop, hængselregion, og aktivering sløjfe. Se også tabel S1 for en omfattende annotation af strukturelt bevarede mutationsændringer hotspots. (B) Konstruktion lokalisering af kræft driver mutationer med den høje onkogent potentiale illustreres ved anvendelse af krystalstrukturen af ​​det aktive EGFR-kinase (PDB entry 2J6M). De dominerende onkogene mutationer er BRAF-V600E, KIT-D816V, og PDGFRA-D842V som alle svarer til den samme strukturelt bevaret mutations hotspot. Strukturelle annotation af kræft driver mutationer er anbragt efter deres onkogent potentiale som bestemt ved frekvensen af ​​observere respektive somatiske mutationer i proteinkinaserne gener. Jo højere onkogent potentiale af kræft drevet, jo større bolden betegner strukturelle stilling i den respektive mutation.

Mens de fleste af kræft driver mutationer vil sandsynligvis være temmelig sjældne, er det påfaldende, at en betydeligt antal funktionelt vigtige cancer-mutanter falder på strukturelt konserverede positioner i kinase katalytiske kerne. Desuden har vi observeret, at strukturelt konserverede hotspots for kræft driver mutationer ofte bærer mutationer med en høj onkogen aktivitet (figur 6B). En kvantitativ karakterisering af “onkogenicitet” kunne beskrives på en række forskellige måder, herunder transformation celle potentiale, substratanvendelse, og katalytiske effektivitet. Sådanne data findes typisk kun for et begrænset antal gener og mutationer og er ikke egnede til genom-dækkende analyse. Vi brugte en bekvem definition af et onkogent potentiale, der kan tilbydes ved hjælp af frekvens profiler af somatiske mutationer i proteinet kinaser gener opnået fra COSMIC repository [82]. Denne analyse viste, at en ret lille antal somatiske kinase mutationer med kendte onkogent potentiale kunne opstå med en høj frekvens i de mutationelle prøver (Tabel S2). Påfaldende er disse funktionelt vigtige mutationer falder i større strukturelt konserverede positioner i kinase katalytiske domæne. Faktisk meget onkogene mutationer BRAF-V600E, KIT-D816V, og PDGFRA-D842V tilhører den største mutations hotspot (figur 6B). Den funktionelle betydning onkogene kinase mutationer fra mutationsmønstre hotspots såsom ABL-T315I, EGFR-L858R, og RET-M918T, er også almindeligt anerkendt. For eksempel strukturelt konserverede RET-M918T og MET-M1250T cancer drivere er beliggende i substratbinding C-lap af kinase kerne (figur 6B) og er kendt for at være forbundet med onkogen aktivering ved at vise den højeste transformerende potentiale blandt kendte RET [ ,,,0],102] – [106] og mødte mutationer [107] – [110]. Den præsenterede analyse viser, at strukturelt bevarede hotspots i kinase katalytiske domæne kan være statistisk beriget med mutationer med en høj sandsynlighed for at være kræft drivere. Vi hævder, at den præferentielle strukturelle lokalisering af onkogene mutationer i aktivering loop og underlaget bindende C-lap af kinase domæne kan bestemmes ved deres strategiske placering kritisk for kinase autohæmning, regulering og allosteriske interaktioner i signal transduktion netværk.

Strukturelle og energiske signaturer af kinase Mutationsanalyse Hotspots

Strukturel modellering og energisk analyse af kræft mutation effekter kan give yderligere indsigt i molekylære mekanismer i kinase aktivering. Vi ansat homologi modellering og MD simuleringer at analysere, om strukturelt bevaret kræft drivere, der er målrettet den samme tumorigen hotspot i kinase katalytiske domæne kan også dele en fælles aktivering mekanisme. Molekylær modellering fokuseret på en kvantitativ sammenligning af MET-D1228V, MET-D1228H [90], [91], FLT3-D835V, FLT3-D835E [92], [93], og KIT-D816V, KIT-D816H [94], [95] mutanter. Substitutioner af D835 i FLT3 og D816 i KIT resultat i konstitutiv aktivering af receptoren, er denne rest blevet foreslået at spille en vigtig regulerende rolle. Krystalstrukturerne af FLT3 [111], KIT [112] og Met kinaser [113], [114] har foreslået, at kræft mutationer kan destabilisere autoinhibited vildtype (WT) -form. Det er vigtigt at bemærke, at strukturel modellering undersøgelser blev udført for at vurdere omfanget af lokale forstyrrelser, der kunne induceres af kræft mutationer på autoinhibited kinase struktur. Da der ikke i høj opløsning krystalstrukturer af kinase kræft mutanter og karakteren af ​​store konformationsændringer forårsaget af aktiverende mutationer, vi fokuseret på at forstå lokale funktionelle effekter af kræft mutationer stedet for at forsøge at gøre beregningsmæssige forudsigelser af mutant strukturer.

Homologimodellering og MD simuleringer af almindeligt forekommende aktiverende mutationer i denne mutations hotspot afslørede en betydelig lokal reorganisering af autoinhibited kinase kropsbygning. Dette afspejles i de lokale strukturelle variationer nær stedet for mutation (root mean square afvigelser, RMSD = 3 Å-4 Å) (tabel S3). Størstedelen af ​​kræft mutationer resulterede i moderate globale ændringer, men betydelige lokale strukturændringer nær mutational stedet og i aktiveringssløjfen.

Be the first to comment

Leave a Reply