PLoS ONE: Den Cancer Exome Dannet med alternativ mRNA splejsning udvander Predicted HLA klasse I epitop Density

Abstrakt

Flere undersøgelser har vist, at kræft aktivt regulere alternativ splejsning. Ændrede splejsning mekanismer i kræft føre til kræft-specifikke udskrifter forskellige fra puljen af ​​udskrifter forekommer kun i sundt væv. Samtidig, er ændret præsentation af HLA klasse I epitoper hyppigt observeret i forskellige typer af cancer. Nedregulering af gener relateret til HLA klasse I antigen behandling er blevet observeret i flere kræfttyper, hvilket fører til færre HLA klasse I antigener på celleoverfladen. Her bruger vi et peptidindhold bred analyse af forudsagte alternative splejsning former, baseret på en offentligt tilgængelig database, for at vise, at peptider overrepræsenteret i kræft splejsningsvarianter omfatter betydeligt færre forudsagt HLA klasse I epitoper sammenlignet med peptider fra normale udskrifter. Peptider overrepræsenteret i cancerpatienter transkripter er i tilfælde af de tre mest almindelige HLA klasse I supertype repræsentanter konsekvent fundet at indeholde færre forudsagte epitoper sammenlignet med normalt væv. Vi observerede en væsentlig forskel i aminosyresammensætningen mellem proteinsekvenser er forbundet med normal versus kræftvæv, som transkripter fundet i cancer er beriget med hydrofile aminosyrer. Denne variation bidrager til den observerede signifikant lavere sandsynlighed for kræft-specifikke peptider der forudsiges epitoper sammenlignet med peptider findes i normalt væv

Henvisning:. Stranzl T, Larsen MV, Lund O, Nielsen M, Brunak S (2012 ) Den Cancer Exome Dannet med alternativ mRNA splejsning udvander Predicted HLA klasse I epitop Density. PLoS ONE 7 (9): e38670. doi: 10,1371 /journal.pone.0038670

Redaktør: Kjetil Tasken, Universitetet i Oslo, Norge

Modtaget: December 28, 2011; Accepteret: 9 maj 2012; Udgivet: 25 september, 2012 |

Dette er en åben-adgang artiklen, fri for alle ophavsrettigheder, og kan frit gengives, distribueres, overføres, ændres, bygget på, eller på anden måde bruges af alle til ethvert lovligt formål. Værket gøres tilgængeligt under Creative Commons CC0 public domain dedikation

Finansiering:. Dette arbejde blev støttet af en bevilling fra Dansk Forskningsrådet for Teknologi og Produktion (Projekt “Disease Gene Finding, somatiske mutationer, og Vaccine design “principal finansiering modtager, Søren Brunak) og blev støttet af National Institutes of Health (kontrakt HHSN26620040006C). De finansieringskilder havde ingen rolle i studie design, indsamling og analyse af data, beslutning om at offentliggøre, eller forberedelse af manuskriptet

Konkurrerende interesser:.. Forfatterne har erklæret, at der ikke findes konkurrerende interesser

Introduktion

kræftspecifikke splejsningsvarianter, er særdeles interessante, da de kan være involveret i patogenesen og kan yderligere potentielt anvendes som biomarkører og generere nye targets for cancer [1], [2]. Det humane immunsystem er i stand til at reagere på nogle af disse cancer specifikke antigener, som først vist ved en melanom-specifikt antigen, MAGE-1, i stand til at stimulere humane T-celler [3], [4]. Mere generelt er personer med høj eller middel cytotoksisk aktivitet af perifer-blod lymfocytter yderligere forbundet med en betydeligt lavere risiko for kræft, hvilket tyder på en rolle for naturlige immunologiske vært forsvarsmekanismer i kræft [5].

Alternativ splejsning kan ændre strukturen af ​​mRNA ved optagelse eller springer af exons, og det kan ændre den funktion, stabilitet eller bindende egenskaber af kodede proteiner og dermed bidrage til humane sygdomme såsom kræft [6]. I et studie, der undersøgte alternativ splejsning begivenheder i ovarie- og brystvæv ramt af tumorer blev det konstateret, at omkring halvdelen af ​​alle splejsningsbegivenheder i disse væv ændres i tumorer, mange af dem på grund af exon skipping [7]. Lignende tendenser er blevet observeret i andre typer af cancere, f.eks, i coloncancer og testikel tumor [8], [9], samt i gastrisk cancer, hvor gener, som viser differentiel ekspression mellem cancercellelinier og tilsvarende normale væv blev fundet [ ,,,0],10]. Ud over cancer er involveret i dysregulating pathways og dermed bidrage til ændringer i alternativ splejsning og genekspression kontrolleres af disse proteiner [11], human leukocyt antigen (HLA) klasse I antigen forarbejdning komponenter og HLA-ekspression er også blevet vist at blive nedreguleret i forbindelse med kræft [12], [13]. En undersøgelse undersøger ændringer af HLA klasse I-ekspression i 12 ovariecancerpatienter rapporterede lave niveauer af HLA klasse I antigener i tumorceller fra alle patienter. En patient-afledt tumor cellelinje viste en fuldstændig haplotype tab, herunder HLA-A2 locus [14].

Disse observationer fortolkes som mekanismer vedtaget af tumorer at undslippe immunovervågning og undgå tumorcelle genkendelse og destruktion [15], [16]. Det er blevet foreslået, at eliminering af voksende tumorer af immunsystemet kan føre til udvælgelsen af ​​tumor varianter, der er effektive til at undgå immunsystemet anerkendelse [17]. Der synes således at være akkumulerende beviser for kræft er koblet til alternativ splejsning samt til en effektivitet i unddragelse fra immunsystemet ved nedregulering og ændring HLA-ekspression. De fleste af de undersøgelser vedrørende cancer-specifik alternativ splejsning til ændret immunsystem overvågning er imidlertid af begrænset størrelse og i de fleste tilfælde anekdotiske. Her ønskede vi at undersøge, i en storstilet undersøgelse, hvis den alternative kræft exome allerede på det trin mRNA splejsning indeholder en bias i forhold til normale udskrifter i sættet af mulige HLA klasse I epitoper.

Resultater

Udskrifter overrepræsenteret i kræft indeholder færre forudsagte epitoper begrænset af de tre mest almindelige HLA klasse i supertyper

Formålet med denne undersøgelse var at undersøge, ved hjælp af en storstilet datasæt, hvis peptidomes specifikke for kræft versus normalt væv har forskellige egenskaber relateret til ændret grad af immunsystemet overvågning. For at gøre dette, vi konstrueret to sæt peptider, en over-repræsenteret ved kræftvæv og en over-repræsenteret ved normalt væv. Globalt permuterede versioner af disse sæt blev fremstillet som beskrevet i Materialer og Metoder. Den globale permutation ødelægger strukturelle karakteristika inden for de HLA-bindende 9-mer, kun opretholde globale kompositoriske egenskaber. Til sammenligning, konstrueret vi lokalt permuteret normale og cancer sæt ved permutating hvert peptid separat, således at beskytte det lokale aminosyresammensætning af hvert peptid. For at undersøge immunrelaterede egenskaber, potentielle epitoper dækker alle 12 HLA klasse I supertyper blev forudsagt under anvendelse NetMHCpan. For hver supertype, vi beregnet de procentdele af forudsagte epitoper for seks peptid datasæt: normal, normal globalt og normal lokalt permuteret, kræft og kræft globalt og kræft lokalt permuteret

Det er velkendt, at nogle HLA klasse. jeg supertype repræsentanter er mere almindelige end andre. Det forventes derfor, at der for de mindre hyppige HLA-alleler, er resultaterne mere tilbøjelige til at omfatte støj. Kilden til vores datasæt, ASTD databasen, er i vid udstrækning stammer fra EST data uden HLA specifikke oplysninger. EST-data er hovedsagelig baseret på kaukasiske europæere [18]; Derfor kan vi roligt antage, at de mere almindelige HLA-typer i den europæiske befolkning er også mere almindelige i vores datasæt. HLA allelfrekvenserne blev opnået fra dbMHC databasen [19]. Omtrentlige antal forventede fænotype pr supertype i den europæiske befolkning er givet i tabel 1.

De tre mest almindelige supertype repræsentanter i den europæiske befolkning er HLA-A * 02:01, HLA-A * 01 :01 og HLA-A * 03:01. For disse tre Supertype repræsentanter, de udskrifter, der er forbundet med normal væv har en signifikant højere procentdel af forudsagte epitoper end udskrifter overrepræsenteret i kræft. Figur 1 viser de observerede tal, i procenter af forudsagte epitoper pr 9-mer, for de forskellige datasæt for disse tre mest almindelige supertype repræsentanter. Alle observerede forskelle mellem normale og cancer væv vist i figur 1 er signifikant (p 0,006, 2-sample test for ligestilling af proportioner).

Data er vist for de tre mest almindelige HLA-I alleler i Europa befolkning. Hver søjle viser procentdelen af ​​forudsagte epitoper pr 9-mer i den respektive sæt. Hvert sæt består af peptider, der enten over-repræsenteret i normal eller kræftvæv. Globalt permuteret eller lokalt permuteret udgave af peptidet sæt blev konstrueret som beskrevet i Materialer og Metoder. Alle observerede forskelle mellem kræft og normale væv er signifikant (p 0,006, 2-sample test for ligestilling af proportioner).

For de fleste HLA klasse I supertyper, kræft udskrifter indeholder færre forudsagte epitoper

Desuden er andelen af ​​forudsagte epitoper for permuterede og ikke-permuterede sekvenser for alle 12 Supertype repræsentanter er vist i tabel 2. Her observerede vi en lignende tendens i forhold til vores observation for de tre mest almindelige supertyper i den europæiske befolkning . For ikke-permuteret sekvenser, syv ud af de tolv supertype repræsentanter (HLA-A * 01:01, HLA-A * 02:01, HLA-A * 03:01, HLA-A * 24:02, HLA-A * 26:01, HLA-B * 15:01 og HLA-B * 58:01) havde en signifikant lavere brøkdel af forudsagte epitoper i sekvenser er tildelt kræft patologi. En statistisk signifikant forskel, hvor cancer-associerede peptider indeholdt mere forudsagte epitoper blev, på den anden side, kun observeret for én supertype repræsentant, nemlig HLA-B * 27:05.

Ved analyse permuteret sekvenser blev der observeret lignende resultater. Kun én supertype repræsentant (HLA-B * 40:01, lokalt permuteret) havde signifikant mere forudsagte epitoper i de permuteret cancer sekvenser end i de permuteret normale sekvenser. På den anden side, permuterede, normale sekvenser havde konsekvent for både lokale og globale permuterede sæt mere forudsagte epitoper i syv supertype repræsentanter (HLA-A * 01:01, HLA-A * 02:01, HLA-A * 03:01 , HLA-A * 24:02, HLA-A * 26:01, HLA-B * 15:01, HLA-B * 58:01). For disse syv Supertype repræsentanter, at forskellen mellem normale og cancer datasæt er væsentlig i den permuteret såvel ikke-permuteret datasæt. Den observation, at cancer transkripter indeholde færre forudsagte epitoper for de fleste HLA klasse I supertype repræsentanter, er stabil, når forskellige tærskler for forudsigelsen af ​​potentielle epitoper anvendes (data ikke vist). Salg

HLA motiv og aminosyresammensætning-bias

Den relative forskel i forudsagt epitop tæthed mellem normal og kræft er, for vores tidligere definerede mest almindelige HLA-alleler, relativt stabilt. Også den forskel i epitop massefylde er størst, når man sammenligner ikke-permuteret til globalt permuterede peptidsæt. For HLA-A * 02:01, observeres en mærkbar nedgang af forudsagte epitoper, når man sammenligner normale og cancer ikke-permuteret peptider til normale og cancer permuterede peptider. Som det fremgår af tabel 2 og figur 1, er forskellen i procent af epitoper er den største, når man sammenligner de ikke-permuteret sekvenser til det globalt permuterede sekvenser (normale: 0,83 vs 0,73, cancer: 0,77 vs. 0,69). For HLA-A * 01:01, procentdelen af ​​epitoper i ikke-permuteret versus permuterede sekvenser synes at være relativ stabil (normal: 0,82 vs 0,80, kræft: 0,77 vs 0,76), hvorimod permuteret HLA-A * 03:01 sekvenser har mere forudsagt epitoper end de tilsvarende ikke-permuteret sekvenser (normal: 0,94 vs 1,01, kræft: 0,91 vs 0,96). For disse tre Supertype repræsentanter, procentdelen af ​​forudsagte epitoper i lokalt permuterede peptider altid falder mellem de respektive procentsatser for ikke-permuterede og globalt permuterede sekvenser. Lokalt permuterede peptider bevarer kun lokal aminosyresammensætning, og globalt permuterede peptider har deres lokale strukturelle egenskaber ødelagt og bevare eneste globale aminosyresammensætning. Disse observationer indikerer, at både globale og lokale strukturelle aminosyre-egenskaber er faktorer, der definerer de observerede forskelle i epitop-densiteter mellem normal og cancer samlede peptidindhold.

En analyse af relativ aminosyresammensætning blev udført for alle overrepræsenteret 9-mer forbundet med normal og cancer. Vi fandt, at hydrofile rester er mere almindelige i polypeptider fra cancerpatienter transkripter end fra de normale polypeptider. Relationerne N /C-forhold sammenlignet med hydrofile omfanget af aminosyrer ved Hopp-Woods, hydrofobicitet skala af Wimley-White samt den gennemsnitlige rangordning af aminosyrer i henhold til hyppigheden af ​​deres forekomst i 38 publicerede hydrofobicitet skalaer vises i figur 2. i figur 2 rester er mere almindelige i kræft, hvis N /C er mindre end 1. Hydrofile rester er markeret sort.

N /C-forhold i forhold til Hopp-Woods hydrofilicitet skala (A) , Wimley-White hydrofobicitet skala (B) og til gennemsnittet rangordning af aminosyrer baseret på 38 hydrofobicitet skalaer (C). N /C-forhold er forholdet mellem observerede frekvenser af de respektive aminosyrer i polypeptider af overrepræsenterede transkripter fra normale og cancer væv. Hvis N /C-værdi 1, aminosyren er mere almindelig i normalt væv; Hvis N /C-værdi 1, aminosyren er mere almindelig hos cancer. Grønne søjler refererer til mere hydrofobe aminosyrer, hvorimod sorte bjælker refererer til flere hydrofile aminosyrer. Alle N /C-forhold større eller mindre end en er væsentlige. (P 0,001 beregnet ved hjælp af Wilson score [45] og Bonferroni korrigeret)

Hopp-Woods og Wimley-hvide skæl korrelerer stærkt med N /C-forhold med et Spearman rank korrelationskoefficient på -0,72 og 0,78 hhv. Den gennemsnitlige placering aminosyre skala er korreleret med en korrelationskoefficient på -0,65. Alle tre korrelationskoefficienter er signifikant (P-værdi 0,003, nøjagtig permutation test). Ingen korrelation blev fundet for andre aminosyre egenskaber som masse, overfladeareal eller volumen (data ikke vist).

Det er slående at konstatere, at alle stærke hydrofile aminosyrer (KPRQ, Hopp-Woods skala) er beriget med sekvenser associeret med cancer. En lignende observation er lavet til Wimley-White skala: Vi identificerede syv aminosyrer betydeligt mere almindelige i kræft (APERKDQ). Seks af disse (alle undtagen A) er inden for de syv mest hydrofile aminosyrer baseret på Wimley-White skala. En omvendt tendens er fundet for hydrofobe aminosyrer. De øverste væsentlige aminosyrer klassificeret af både Hopp-Woods og Wimley-Scott som hydrofobe (WFICM) er alle mere almindelige i sekvenser, der er forbundet med udskrifter fra normalt væv.

Baseret på disse resultater, kunne man foreslå en forklaring på forskellen i epitop tæthed mellem den normale og cancer samlede peptidindhold. De bindende motiver for de 3 hyppigste supertype repræsentanter er vist i figur 3. Ud af de fire mest foretrukne aminosyrer ved HLA-A * 02:01 ankerpositioner, er tre aminosyrer (VMI) beriget med normale transkripter, mens kun on (L) er så almindeligt i normale som i cancer. Dette fører til den konklusion, at i det mindste en del af de observerede forskelle i procentdelen af ​​forudsagte epitoper i normale versus cancer transkripter skyldes aminosyresammensætning. Samme tendens findes for HLA-A * 01:01. De to hyppigst forekommende aminosyrer i motivet (YT) er også mere ofte findes i normalt væv, hvorimod S er neutral, og den næste almindelige aminosyre, D, er mere almindelig hos cancer. Den hyppigste aminosyre for HLA-A * 03:01 (K) er lidt mere almindelig i kræft, mens den anden næste hyppige (Y) er, på grund af en stærkere præference til at passe peptider fra normale væv, flytte bias mod aminosyrer mere almindelige i splejsningsvarianter associeret med normalt væv. For alle tre motiver, vi yderligere beregnede gennemsnitlige vægtede afvigelser, baseret på N /C-forhold og aminosyre frekvenser (se materialer og metoder). De vægtede bias blev beregnet for begge de respektive 5 hyppigste aminosyrer pr motiv samt alle 20 aminosyrer. For alle tre motiver observerede vi en overordnet præference for aminosyrer, som findes i vores normale væv sæt.

De tre mest almindelige HLA-typer i den europæiske befolkning. Højden af ​​en søjle af breve er lig med informationsindholdet i denne position, hvorimod højden af ​​hvert bogstav i en kolonne er proportional med frekvensen af ​​den tilsvarende aminosyre i denne position [44].

diskussion

Alternativ splejsning af mRNA-transkripter er en vigtig mekanisme til generering genomisk kompleksitet og har vist sig at variere mellem kræft og de tilsvarende normale væv [1], [8], [9]. Desuden kræftformer i nogle tilfælde nedregulerer HLA klasse I antigen-forarbejdning komponenter og HLA klasse I-ekspression for at undgå afsløring af immunsystemet. Disse observationer førte os til at undersøge, om udskrifter fundet i kræft væv deler karakteristika, der ville reducere immunforsvaret anerkendelse. Her har vi gennemført en storstilet analyse sigter mod at identificere immunsystem relaterede aftryk, der kan differentiere kræft fra normale udskrifter. Baseret på ASTD database, en database med forudsagte splejsede former, vi identificeret to peptid datasæt; en forbindelse med udskrifter overrepræsenteret i kræft og en tilknyttet udskrifter overrepræsenteret i normalt væv. Brug state-of-the-art immunoinformatics forudsigelsesværktøjer, vi næste analyseret de to datasæt for forskelle med hensyn til sandsynligheden for at blive præsenteret på fremherskende HLA klasse I molekyler, og dermed potentielle til aktivering af immunsystemet.

vi fandt, at peptider, som på grund af alternativ splejsning er udtrykt i cancer væv, indeholder færre forudsagte epitoper begrænset af de tre mest almindelige HLA klasse i-alleler end peptider er udtrykt i normalt væv. Brug globalt permuteret datasæt vi konsekvent, for de tre mest almindelige HLA klasse I alleler, fandt, at den observerede tab i epitop tæthed i kræft peptidindhold også opretholdes for de permuteret datasæt. Dette indikerer kraftigt, at forskelle i aminosyresammensætningen mellem peptider fra alternativt splejset normale og cancer-transkripter er den drivende kraft i den reducerede forudsagte epitop densitet.

Årsagen til den observerede ændring i hyppigheden af ​​specifikke aminosyrer i proteiner associeret med cancer i sammenligning med normalt væv er ukendt, men fænomenet er tidligere blevet observeret i studier formål at kortlægge biomarkører for trin påvisning af kræft tidligt: ​​i en nylig undersøgelse blev fundet niveauerne af alanin, isoleucin, leucin og valanine forhøjes i bugspytkirtler af rotter med bugspytkirtelkræft sammenlignet med prøver fra rotter med kronisk pancreatitis og raske rotter [20]. I en anden undersøgelse blev fundet niveauerne af N-methylalanin og lysin øges betydeligt i plasmaet fra patienter med pancreascancer, mens der ikke blev niveauet af glutamin og phenylalanin være nedsat [21]. Disse undersøgelser identificerede forskelle i aminosyresammensætning i en enkelt cancer typen baseret på blodplasma og vævsprøver. Vi i modsætning hertil analysere overrepræsenteret cancerpeptider generelt. Som kan forventes, konklusionerne vedrørende aminosyre koncentration rapporteret i denne undersøgelse ikke er samtidig med de undersøgelser enkelte kræftform.

En mulig forklaring på, hvorfor vi observeret færre forudsagte epitoper i peptider, som på grund af alternativ splejsning er udtrykt i cancer, kunne være, at værtens immunsystem begrænser cancer exome. I det tilfælde, pres fra immunsystemet disfavors cancerceller, der præsenterer nye epitoper på celleoverfladen. En alternativ forklaring – hvilket ikke udelukker tidligere forklaring – tager som udgangspunkt den observerede ændring i aminosyresekvens frekvens, især stigningen i hydrofile aminosyrer i cancerpatienter proteiner

Det er tidligere blevet vist, at missense mutationer i. den BRCA domænet af højrisiko-bryst og æggestokkene kræftpatienter ofte målrette stærkt hydrofobe aminosyrer [22]. Endvidere er det blevet foreslået, at stabiliseringen af ​​en proteinstruktur er at en stor del på grund af den hydrofobe virkning [23]. Følgelig stigningen i hydrofile aminosyrer har en destabiliserende virkning på proteinstruktur, hvilket er i overensstemmelse med de i proteinet tab af funktion, der er korreleret med cancer progression. Dette er eksemplificeret ved en undersøgelse om nedarvede missense mutationer af tumorsuppressorgen,

BRCA-1

, som kan prædisponere til bryst- eller ovariecancer [24]. I denne undersøgelse blev det konstateret, at mutationerne overvejende målrette konserverede hydrofobe aminosyrer, der er ansvarlige for foldning og stabilitet. Da især den mest almindelige HLA klasse I allel, A * 02:01, foretrækker hydrofobe aminosyrer på anker positioner, vil en forøgelse af hydrofile aminosyrer uundgåeligt føre til færre forudsagte epitoper. Reduktionen i epitop densitet i peptider associeret med cancer kan derfor være en iboende egenskab af proteiner, som er destabiliseret af et fald af hydrofobe aminosyrer som en del af progression til cancer. Vi er dog ikke bekendt med undersøgelser, der viser en generel stigning af hydrofobe aminosyrer i hele forskellige former for kræft.

En skævhed af færre potentielle epitoper på grund af kræft er tidligere vist ved Wiedenfeld et al [25]. Peptider forårsaget af missense mutationer af p53 viste sig at have en nedsat tilpasning til HLA-A * 02:01 motiv. Alle forudsagte varianter af peptiderne var enten fra patienter med andre alleler eller allelen blev tabt under tumorigenese. Den faldt pasform til HLA motivet på grund af mutationer i sammenhæng med vores undersøgelse undersøger forskelle i epitop tæthed på grund af alternativ splejsning. Så vidt vi ved, er dette den første undersøgelse indikerer, at alternativt splejsede cancer transkripter tendens til at udtrykke færre potentielle epitoper end alternativt splejsede transkripter fundet i normalt væv. Den identificerede forskel i aminosyresammensætning mod hydrofile aminosyrer subsidiært splejset kræft exome er en mulig forklaring på bias i potentielle HLA klasse I epitoper. Den præference for hydrofile aminosyrer på det trin alternativ mRNA splejsning kunne støtte udviklingen af ​​kræft ved at give det mulighed for at unddrage værtens immunsystem. I dette tilfælde ved at føre til færre potentielle HLA klasse I epitoper præsenteret på celleoverfladen.

Materialer og metoder

Data udtræk fra ASTD databasen

Alternative Splejsning og Transcript mangfoldighed database (ASTD) giver adgang til en samling af alternative splice begivenheder og udskrifter af gener fra mennesker, mus og rotter [26]. Formålet med databasen er at analysere de mekanismer alternativ splejsning på et genom-plan. Det integrerer en beregningsmæssige rørledning til påvisning og karakterisering af isoform splejsemønstre samt alternative introns og exons. Databasen indeholder forudsagte transkripter, der genereres ved at kortlægge udtrykt sekvens tags (EST’er) for at genomsekvenser. Vores undersøgelse er baseret på ASTD-version v1.1 build 9 (tilgængelige på ftp://ftp.ebi.ac.uk/pub/databases/astd/). Databasen dækker 14.194 humane gener og lister 50,581 unikke udskrifter ikke er omfattet af Ensembl gener. Baseret på beslægtede beviser fra cDNA-biblioteker, mange af disse transkripter er kodet med patologi information. Informationen patologi er givet som Evoc ontologier, hvilket er et kontrolleret ordforråd til forenende genekspression data [27]. Som et alternativ til ASTD database, ville vi have ønsket at bruge RNA sekvens data, men kunne ikke identificere nogen brugbar database, der giver genom-bred dækning af potentielle udskrifter, sammen med patologi oplysninger.

To datasæt var genereret baseret på kommenteret patologi oplysninger. Alle udskrifter mærket med oplysningerne udtrykkes i normale væv blev tildelt delmængde N. Denne delmængde bestod af 30,739 udskrifter afledt af 11.980 gener. En anden delmængde, C, med udskrifter relateret til kræft, bestod af 27,967 udskrifter afledt af 10,730 gener

kræft delmængde består af alle udskrifter tagget med EVOC udtryk relateret til kræft.; der bliver en undergruppe af tumor i Evoc ontology hierarki (tabel 3). Adskillige EVOC vilkår kan associeres til den samme udskrift.

For vores analyse, vi var interesserede i udskrifter entydigt forbundet til normalt væv eller til en eller flere af de kræft EVOC vilkår. To nye delmængder, der består af udskrifter kun forbundet til enten normal eller kræft EVOC vilkår blev skabt. Ud af 30,739 udskrifter forbundet til det normale, blev 16.566 entydigt forbundet med normalt væv, på grund af ASTD database, og ikke med kræft (unikt N sæt). Den delmængde af udskrifter entydigt forbundet med kræft (unikke C sæt) består af 13,794 udskrifter (se tabel 4). Udskrifter er omfattet af hvert datasæt er unikke for enten normale væv eller kræft som defineret af ASTD databasen. Den ASTD Databasen giver ikke patologi oplysninger om alle udskrifter eller lister alle potentielle vævstyper eller patologier. Derfor henviser vi til vores sæt udskrifter entydigt forbundet til enten normal eller kræft som overrepræsenteret i enten normal eller kræftvæv.

Oversættelse til proteiner

Alle udskrifter tildelt enten normal eller kræft patologi blev oversat til deres respektive protein sekvens ved hjælp af Virtual Ribosome [28]. Den længste ORF blandt alle tre læserammer blev valgt som den translaterede proteinsekvens. Proteinsekvensen og tilsvarende transkript blev kasseret, hvis ingen ORF blev fundet, eller hvis den resulterende proteinsekvens var kortere end 9 aminosyrer. Tærsklen på 9 aminosyrer blev valgt som vi efterfølgende anvender epitop forudsigelse den 9.-Meric peptider, selv om vi er klar over, at proteiner denne lille måske ikke være funktionel. Anvendelse dette filter resulterede i en normal sæt af 16,490 udskrifter og en kræft sæt af 13,721 udskrifter.

Generation af unikke 9-mer

Alle proteiner tildelt enten normale eller kræft patologi stater blev inddelt i overlappende 9-Meric peptidsekvenser. Peptidsekvenser, der blev fundet i begge grupper blev fjernet, hvilket fører til skabelsen af ​​to sæt af unikke 9-mer peptider. Der er 1,856,231 unikke 9-merer i den normale gruppe (N-peptidindhold) og 1,684,028 unikke 9-merer i cancer-gruppen (C-peptidindhold). Bemærk, at normale og cancer sæt ikke består af komplette proteiner; de kun består af unikke 9-Meric peptider ikke findes i det andet sæt. Permuteret sæt både den unikke N og unikke C sæt blev skabt. For hvert sæt, man lokalt permuteret og en globalt permuteret sat 9-Meric peptider blev genereret. De lokale permuteret sæt blev konstrueret ved at permutere hver 9-mer, og dermed holde den aminosyresammensætningen inden for hver 9-mer fast. De globale permuteret sæt blev foretaget af tilfældigt bygge nye 9-mer ud af alle aminosyrer i hvert sæt. Dette bevarer den overordnede aminosyresammensætning inden de unikke N og C-sæt, lokale egenskaber inden for hver 9-mer er dog ødelagt.

Forudsigelse af potentiel HLA klasse I epitoper

Den forudsigelse metode NetMHCpan-2.4 [29], [30] blev anvendt til at forudsige potentielle epitoper for 12 HLA klasse i supertyper [31]. Den NetMHCpan-2.4 metode blev uddannet på en eksperimentelt validerede datasæt på mere end 100.000 kvantitativ peptid – HLA klasse I interaktioner dækker mere end 100 HLA-molekyler og er blevet vurderet som den bedste pan-specifik metode til HLA-peptid binding i en stor benchmark undersøgelse [32]. En generel accepteret tærskelværdi for binding er en rang score på 1% [33], [34] (bindingsstyrke falder inden for top 1% i forhold til et stort sæt af tilfældige naturlige peptider), som også er den tærskel, der anvendes i hele denne undersøgelse .

De procentdele af potentielle epitoper pr 9-mer for alle 6 sæt (normal 9-mer, normal globalt permuterede 9-mer, normal lokalt permuterede 9-mer, kræft 9-mer, kræft globalt permuteret 9- merer og kræft lokalt permuteret 9-merer) blev beregnet. P-værdier for forskel i procent af forudsagte epitoper mellem normal og kræft 9-mer til ikke-permuteret og permuterede delmængder blev beregnet ved en 2-stikprøve-test for ligestilling af proportioner og justeret for multipel testning (Bonferroni korrektion).

aminosyre skalaer

aminosyre overflod for normalt væv i forhold til kræft væv blev bestemt på grundlag af alle unikke 9-mer i de to datasæt. De relative frekvenser for alle aminosyrer i både normale og cancer sæt blev beregnet. Observeret forhold af frekvenser (N /C) af aminosyrer blandt normale og cancer væv var korreleret med Hopp-Woods hydrofilicitet [35] og Wimley-White hydrofobicitet skala [36] værdier. Forholdet blev yderligere korreleret med en gennemsnitlig rangordning skala pr aminosyre som er offentliggjort af Simpso]. Ifølge Simpson [37], er skalaen baseret på den gennemsnitlige rangordning af aminosyrer i henhold til hyppigheden af ​​deres forekomst i hver sekvens rang for 38 offentliggjorte hydrofobicitet skalaer [38]. Andre undersøgte skalaer er gennemsnitlige mængde af begravede rester [39], [40], van der Waals volumen [41] og samlede tilgængelige overfladeareal [42].

Bootstrapping blev anvendt til at teste, om en aminosyre ejendom skala er korreleret med beriget udtryk for rester i enten unikke normale eller kræft 9-mer. For hver skala blev Spearman rank korrelationskoefficient beregnet og betydningen af ​​sammenhængen blev anslået bruger nøjagtig permutation test.

HLA motiv skævhed

HLA bindende motiver blev genereret fra NetMHCpan-2.4 træningsdata . Position specifikke vægt-matricer blev beregnet ved hjælp af sekvens vægtning og korrektion for lavt antal [43]. Sekvensforskelle logoer blev visualiseret som beskrevet af Schneider og Stephens [44], hvor hvert bogstav betegner den forholdsmæssige frekvensen af ​​den tilsvarende aminosyre i denne position. Baseret på aminosyre frekvenser og observerede forhold mellem frekvenser (N /C) af aminosyrer blandt normale og cancer væv, vi beregnet for HLA-A * A02:01, HLA-A * A01:01 og HLA-A * A03: 01 motifs deres respektive generelle bias mod enten vores definerede normale eller cancer peptidsættet. Dette blev gjort for alle 20 aminosyrer, og for de 5 hyppigste aminosyre-hændelser per motiv. Per position, tendensen til at passe fortrinsvis til enten den normale eller canceren peptidindhold blev beregnet ved summering af de respektive aminosyre-frekvenser multipliceret med de tilhørende N /C-værdier for alle 20 aminosyrer.

Be the first to comment

Leave a Reply