PLoS ONE: Identifikation af klinisk relevante Protein Mål i prostatakræft med 2D-DIGE Koblet massespektrometri og Systembiologi Network Platform

Abstrakt

Prostatakræft (PCA) er den mest almindelige form for kræft fundet hos mænd og blandt de førende årsager til kræft dødsfald i den vestlige verden. I den foreliggende undersøgelse sammenlignede vi de individuelle protein ekspressionsmønstre fra histologisk karakteriseret PCa og det omkringliggende godartet væv opnået ved manuel mikro dissektion under anvendelse meget følsomme todimensional differential gelelektroforese (2D-DIGE) koblet med massespektrometri. Proteom data viste 118 proteinpletter der skal udtrykkes forskelligt i cancer (n = 24) sammenlignet med godartet (n = 21) prostatavæv. Disse pletter blev analyseret ved MALDI-TOF-MS /MS og 79 forskellige proteiner blev identificeret. Brug af principalkomponentanalyse vi kunne tydeligt adskilt tumor og normalt væv og to forskellige tumor grupper baseret på proteinet ekspressionsmønsteret. Ved at bruge en systembiologi tilgang, kunne vi kortlægge mange af disse proteiner både i større veje er involveret i PCa progression samt i en gruppe af potentielle diagnostiske og /eller prognostiske markører. På grund af kompleksiteten af ​​den meget sammenkoblede korteste vej netværk, de funktionelle sub-netværk afsløret nogle af de potentielle kandidat biomarkør proteiner til yderligere validering. Ved at bruge en systembiologi tilgang, vores undersøgelse afslørede nye proteiner og molekylære netværk med ændret udtryk i PSA. Yderligere funktionel validering af de enkelte proteiner er i gang og kan give ny indsigt i PCa progression potentielt fører til udformningen af ​​nye diagnostiske og terapeutiske strategier

Henvisning:. Ummanni R, Mundt F, Pospisil H, venz S, Scharf C , Barett C, et al. (2011) Identifikation af klinisk relevant Protein Mål i prostatakræft med 2D-DIGE Koblet massespektrometri og Systembiologi Network Platform. PLoS ONE 6 (2): e16833. doi: 10,1371 /journal.pone.0016833

Redaktør: Ming Tat Ling, Queensland University of Technology, Australien

Modtaget: 30 august, 2010; Accepteret: 16 Januar 2011; Udgivet: 11 februar 2011

Copyright: © 2011 Ummanni et al. Dette er en åben adgang artiklen distribueres under betingelserne i Creative Commons Attribution License, som tillader ubegrænset brug, distribution og reproduktion i ethvert medie, forudsat den oprindelige forfatter og kilde krediteres

Finansiering:. Dette arbejde blev støttet af det tyske ministerium for Uddannelse og Forskning inden for rammerne af programmet for Medicinsk Genome Research (Tilskud: 01GS0890, 01GS0892, 01GS0189). De finansieringskilder havde ingen rolle i studie design, indsamling og analyse af data, beslutning om at offentliggøre, eller forberedelse af manuskriptet

Konkurrerende interesser:.. Forfatterne har erklæret, at der ikke findes konkurrerende interesser

Introduktion

Prostatakræft (PCA) er i øjeblikket den førende kræft blandt mænd i de vestlige lande [1]. Obduktion undersøgelser har afsløret, at ca. 30% af mænd over en alder af 50 år, og 80% af mænd i 70’erne har mikroskopisk tegn på prostatakræft [2], [3]. I år 2007 i USA, en anslået 218,890 nye tilfælde diagnosticeres og 27,050 mænd døde af PCa [4]. Den (tidligt) opdagelse sats og dermed forekomsten af ​​PCa er steget dramatisk som følge af indførelsen af ​​PSA-screening. Ikke desto mindre, bestemmelse af serum PSA udviser nogle store begrænsninger, som forhøjede niveauer tæt korrelerer med både hyperplasi og cancer.

To-dimensional gelelektroforese (2DE), et kraftfuldt værktøj, der anvendes til protein separation og udtryk profilering er en af de centrale teknologier i proteomics [5], [6]. Proteinekspression analyse af patientdata materialer er informative førte til de identificerende kræft specifikke markører til diagnosticering, terapeutiske mål og er grundlaget for at afsløre forskellige cellulære begivenheder i forbindelse med kræft progression [7]. Til dato har flere forskergrupper allerede udførte protein og genekspression profilering undersøgelser af kirurgiske og biopsi PCA prøver [8] – [12], men det meste af det potentiale rapporterede markører er ikke i klinisk ansøgning om endelig diagnose af PSA. Men tidligere undersøgelser fokuseret på interindividuelle sammenligninger af proteomisk analyse af radikale prostatektomi fra kræftpatienter til dem af ikke kræftpatienter med konventionel 2DE. Den intra-individuelle analyse af tumor og godartede vævsprøver (støder op til tumor) fra de samme kræftpatienter kan reducere teknisk variabilitet og dermed give et middel til at øge specificiteten af ​​resultaterne og øge chancerne for at identificere specifikke sygdom-associeret protein forandringer.

i den foreliggende undersøgelse undersøgte vi sammenlignende proteom af prostatacancer og dens tilstødende histologisk godartet væv fra cancerpatienter med endelig patologisk karakterisering i vores 2-D forskellen i-gelelektroforese (DIGE) system til protein 2-D-elektroforese [13 ] og MALDI-TOF-MS /MS til identifikation protein. De differentielt udtrykte proteiner blev analyseret af MetaCore ™ (Gene GO) og opfindsomhed Pathway Analysis programmet (Opfindsomt Systems). De store knudepunkter af væsentlige sub-netværk blev valideret af real-time PCR-analyse. Systembiologi netværksanalyse kan give den potentielle rolle af proteiner i forskellige lovgivningsmæssige veje, der styrer PCa progression og forudsige nye biomarkører, som yderligere kan valideres ved hjælp af Western blotting og immunhistokemiske (IHC) nærmer.

Materialer og metoder

kliniske prøver og etiske retningslinjer

Vævsprøver og patientdata blev opnået med informeret skriftligt samtykke. Undersøgelsen blev godkendt af den etiske komité i Universitetshospital Hamburg Eppendorf og udføres i overensstemmelse med erklæringen fra Helsinki. For proteinekspression analyse hele prostata blev opsamlet efter radikal prostatektomi fra patienter med forhøjede PSA-værdier og præoperativ patologisk undersøgelse på Martini Klinikker, Hamborg, Tyskland. Patienterne fik ingen præoperative terapi. 24 patienter blev udvalgt, og det tilsvarende klinisk og patologisk data tilvejebringes i tabel 1. serum PSA niveauer af disse patienter blev bestemt, og alle patienter havde et interval mellem 3,9 og 30,4 ng /ml (gennemsnitlig PSA værdi = 10,93 ng /ml) og en Gleason score mellem 3 + 3 og 4 + 5 [14], [15].

Efter radikal prostatektomi prøver blev frosset i flydende nitrogen indtil brug. Tumor og godartede områder blev markeret på sektionerne. Vi ansat manuel mikro dissektion metode til at opnå patologisk karakteriserede materialer til vores proteomics tilgang. De tilsvarende områder på de resterende blokke blev skåret ud med skarp kniv, indlejret i Tissue-tek® og opbevaret ved -80 ° C indtil brug.

Protein isolation og mærkning med CyDyes

Væv var skyllet med fysiologisk saltvand (0,9% NaCl) mærkning farvestof og blod for at fjerne resterende monteringsmuligheder materialer,. De skivede væv var direkte homogeniseret i DIGE lysepuffer (30 mM Tris, 2 M thiourea, 7 M urinstof, 4% CHAPS; ca. 0,5 ml /200 mg væv). Den resulterende homogenat blev ryddet for at fjerne alle rester ved centrifugering ved 12.000 i 15 min ved 4 ° C blev proteinet supernatanten opsamlet og dets proteinkoncentration blev bestemt ved en modificeret Bradford assay [16]. Kvaliteten af ​​prøverne for DIGE blev evalueret ved mini 2DE (7 cm IPG strimler, pH 4-7). De proteinlysater blev mærket med cy Farvestoffer ifølge producentens protokol for minimal mærkning (CyDye DIGE Fluor minimal farvestoffer, GE Healthcare). For at minimere dye-specifikke artefakter mærkning blev Cy3 og Cy5-mærkning mønstre byttes blandt den samme gruppe af prøver. En intern standard pool med lige store mængder af hver proteinprøve (25 ug) blev anvendt til at reducere inter-gel variation. De samlede interne standarder blev mærket med Cy2. 50 ug protein af hver prøve blev mærket med 400

s

mol af tilsvarende farvestof på is i mørke i 30 min. Reaktionen blev standset /standset med 10 mM L-lysin i 10 minutter under de samme betingelser.

DIGE-To-dimensional gelelektroforese (DIGE-2-DE)

Den første dimension isoelektrisk fokusering blev udført ved anvendelse af 24 cm immobiliseret pH-gradient tørre strimler (IPG) med en lineær pH ​​4-7 gradient. Til analytiske geler, et par Cy3 og Cy5 mærkede prøver (hver 50 ug protein) og 50 ug Cy2 mærkede interne standard blev samlet og fyldt op til 150 pi med 2 x prøvebuffer (7 M urinstof, 2 M thiourinstof, 4 % CHAPS, 2% DTT) suppleret med 2% (vol /vol) IPG buffer pH 4-7). For rehydrering fortyndes prøverne med 2 × rehydrering buffer (8 M urinstof, 4% CHAPS, 13 mM DTT) suppleret med 1% (v /v) IPG buffer pH 4-7 og få korn af bromphenolblåt) til slutvolumen på 450 pi. IPG strimler (24 cm, pH 4-7, GE Healthcare) blev passivt rehydreret natten ved 20 ° C i IPGPhor kassetter. For præparative geler, blev 750 ug umærket protein puljet fra lige store mængder af prøver anvendes. Proteiner blev separeret ved den PROTEAN IEF-systemet (Bio-Rad) under anvendelse af en programmeret spænding gradient ved 20 ° C med en nuværende grænse på 50 uA pr strimmel i mørke under følgende betingelser: 4 timer ved 250 V, 8000 V lineær gradient til 15000 V timer, hurtig 8000 V til 75000 V timer, for i alt 90 KVH. Efter IEF blev IPG strimler ækvilibreret i puffer 1 (50 mM Tris-HCI pH 8,8, 8 M urinstof, 30% glycerol, 2% SDS og 0,5% DTT) og puffer 2 indeholdende 4,5% iodacetamid stedet for DTT i hvert tilfælde for 15 minutter.

Anden dimension blev udført i PROTEAN® Plus dodeca ™ Cell-system. De ækvilibrerede strimler blev påført på toppen af ​​12,5% SDS-PAGE geler og forseglet med 1% agarose tilberedt i SDS-Tris-glycinbuffer med spor af bromphenolblåt som en tracking farvestof til overvågning elektroforese. Polyacrylamidgeler (12,5%) blev støbt i lave fluorescens glasplader. Elektroforese blev udført med konstant spænding (80V) ved 20 ° C, indtil farvefronten nåede bunden af ​​gelen. Den komplette apparat er beskyttet mod lys. Efter elektroforese blev analytiske gel kassetter vaskes med Hedeselskabet

2O og aftørres med støvfri silkepapir. Den Cy2 (intern standard), Cy3 og Cy5 mærkede proteiner i hver gel blev visualiseret ved anvendelse af en Typhoon 9400 ™ laserscanner (GE Healthcare) ved 100 mikron tæthed ved hjælp af forskellige excitations- og emissionsbølgelængder direkte fra geler mellem glasplader. Optimale excitation /emission bølgelængder til fluorescensdetektion er 488/520 nm for Cy2, 532/580 nm for Cy3, og 633/680 nm for Cy5. Præparative geler blev farvet med Roti®-Blå, en kolloid Coomassie Brilliant Blue G250 pletten. Kort fortalt blev gelerne fikseret i 40% methanol, 15% eddikesyre i mindst 4 timer og derefter nedsænket i kolloid farvningsopløsning natten over. At fjerne baggrundsfarvning geler blev vasket i 20% methanol.

Billedanalyse

Delta 2D differential analyse software version 4.0 (Decodon GmbH, Tyskland) blev anvendt i denne undersøgelse. Til individuel gel analyse blev opdaget pletter, kvantificeres og normaliseret efter forholdet volumen af ​​tilsvarende pletter detekteret i Cy2 billedet af den poolede-prøve intern standard ved hjælp af den interne standard modul. Alle normaliserede spot mængder fra gelerne blev kollektivt analyseret som to selvstændige grupper “Tumor” og “Benign”, som gør det muligt matchning af flere gel billeder fra forskellige patienter til at levere statistiske data i gennemsnit overflod for hvert protein stedet hos Dige geler indgår i analysen . Tre geler fra godartet gruppe blev udelukket fra analysen på grund af problemet i DIGE mærkning. Studerendes

t

-test blev udført for at vurdere den statistiske signifikans af differentielt udtrykte proteiner. Baseret på gennemsnit spot volumen ratio, er pletter, hvis relative udtryk skiftes mindst 1,5 gange (stigning eller fald) mellem godartede og tumorer ved 95% konfidensniveau (t-test; p 0,05), blev anset for at være signifikant. Til efterfølgende massespektrometrianalyse betydelig spot koordinater blev overført til Coomassiefarvet præparativ gel til spot plukning.

Massespektrometri

Udarbejdelse af peptidblandinger for MALDI-TOF-MS /MS.

Protein identifikation blev udført som beskrevet for nylig [11]. Kort fortalt blev proteiner udskåret fra Kolloid Coomassie Brilliant Blue farvet 2-DE-geler under anvendelse af en plet cutter. Fordøjelse med trypsin og efterfølgende spotting af peptid-løsninger onto MALDI-mål blev udført automatisk i Ettan Spot Handling Workstation. Gelstykker blev vasket 50 mM ammoniumbicarbonat /50% (v /v) methanol og med 75% (v /v) ACN. Efter tørring trypsin opløsning indeholdende 20 ng /pl trypsin i 20 mM ammoniumbicarbonat blev tilsat og inkuberet ved 37 ° C i 120 min. For peptid ekstraktion blev gelstykker dækket med 50% (v /v) ACN /0,1% (w /v) TFA og inkuberet i 30 min ved 37 ° C. Peptidet indeholdende supernatant blev overført til en ny mikro plade og ekstraktionen blev gentaget. Supernatanterne blev samlet og tørret fuldstændigt ved 40 ° C i 220 min. Peptider blev opløst i 0,5% (vægt /volumen) TFA /50% (v /v) ACN og plettet på MALDI-målet. Derefter, matrix-opløsning (50% (v /v) ACN /0,5% (w /v) TFA) mættet med CHCA blev tilsat og blandet med prøveopløsningen ved at suge blandingen fem gange. Forud for målingen i MALDI-TOF instrument blev prøverne lov til at tørre på målet 10 til 15 min.

MALDI-TOF-MS.

MALDI-TOF måling af plettede peptidopløsninger blev udført på en 4800 MALDI TOF /TOF ™ Analyzer. Spektrene blev registreret i reflektor tilstand i en masse går fra 800 til 4000 Da med en intern one-point-kalibrering på autolytiske fragment af trypsin (mono-isotopisk (M + H)

+ m /z ved 2211,104, signal /støj ≥10). Derudover MALDI-TOF-MS /MS-analyse blev udført for de 5 stærkeste toppe af TOF-spektret efter subtraktion af toppe svarende til baggrund eller trypsin fragmenter. Den interne kalibrering blev udført automatisk som one-point-kalibrering, hvis mono-isotopisk arginin (M + H)

+ m /z ved 175,119 eller lysin (M + H)

+ m /z ved 147,107 nået en signal-støjforholdet (S /N) på mindst 5. Efter kalibrering en kombineret databasesøgning af MS og MS /MS-målinger blev udført ved anvendelse af GPS Explorer software v3.6 (Applied Biosystems, Foster City, USA). Peak lister blev sammenlignet med SwissProt rel.49 begrænset til menneskelige taksonomi eller IPI menneskelig v3.12 database ved hjælp af Mascot søgemaskinen 1.9 (Matrix Science Ltd, London, UK). Peptidblandinger der gav mindst to gange om mowse score på mindst 56 for SwissProt eller mindst 59 for IPI database resultater blev betragtet som positive identifikationer.

Bioinformatik analyse af proteom data

Den betydelige differentielt udtrykte proteiner og deres respektive biologiske funktioner eller relationer blev bestemt under anvendelse af Kegg database (https://www.genome.jp/kegg/) og Entrez protein database (https://www.ncbi.nlm.nih.gov/sites /Entrez? db = protein) fra NCBI. Protein-netværk til analyse korteste veje mellem de identificerede proteiner blev bygget af MetaCore ™ (Gene GO) software og Opfindsomhed Pathways Analysis (IPA) program (Opfindsomt Systems) til at identificere molekylære partnere involveret i særlige sygdom. En mester globalt netværk af alle differentielt udtrykte proteiner (input objekter) blev oprettet i henhold til offentliggjorte litteratur-baserede anmærkninger, og derefter de yderligere sub netværk blev bygget fra master-netværket til at fokusere på aktiverede eksperimenter og /eller veje. Større hubs blev identificeret på grundlag af de forbindelser og kanter med i netværket. Proteinet ekspression data blev analyseret ved hierarkisk klyngedannelse og partition analyse med R-sprog for at finde potentielle markører, som kan klassificere alle prøver som tumor og benigne med høj sikkerhed. Den ukontrollerede klyngedannelse blev udført ved hjælp af euklidiske afstand foranstaltning og byområdet metoden “gennemsnit” af log transformerede værdier for alle væsentlige differentielt udtrykte proteiner af 45 prøver indeholdt i analysen sæt.

Lukk et al. viste, at hele genomet differentiel ekspression mellem tumorer og kontrolvæv kan karakteriseres ved anvendelse principal komponent analyse (PCA) ved hjælp af en malignitet parameter, som karakteriserer sammenhængende differentiel ekspression patters som er forbundet med tumordannelse. For at analysere virkningen af ​​samregulering af protein-ekspression på biomarkører identifikation, er uden opsyn PCA været anvendt på protein udtryk data (normaliseret på logaritmisk skala), både fra tumor og normale vævsprøver. Den PCA blev udført i Matlab [The MathWorks Inc, Version 14]. De resulterende vigtigste komponenter i PCA vægtes hjælp af de enkelt protein udtryk, hvor vægtene, automatisk identificeres, således at den primære variation af proteinekspression i datasættet kan forklares ved de første principale komponenter.

for at undgå falske resultater fra outliers, blev en totrins fremgangsmåde anvendes, hvor PCA i et første skridt blev anvendt på de oprindelige data. Påvisningen outlier blev påført på udtrykkene for hovedkomponenterne. I det andet trin blev PCA udføres uden de outliers. De resulterende ekspressionsvektorer værdier for de stabiliserede hovedkomponenter, hvor der anvendes til yderligere analyse. For at analysere forholdet af oplysninger med hensyn til differential ekspression som er repræsenteret ved de første tre hovedkomponenter og det tilbageværende rum for hvert protein udtrykket værdier for alle væv, kvantificeret ved vektoren x

i, hvor opdelt i to komponenter: hvor x

s, jeg er den del af x

jeg som er repræsenteret ved de første tre vigtigste komponenter i PCA (S3) og x

r, jeg kvantificerer de resterende protein udtryk i komplementære rum CS3, som ikke kan være repræsenteret ved de første tre hovedkomponenter i PCA. For at kontrollere fordelingen af ​​forskellen udtryk mellem de to komponenter, for de oprindelige data givet af x

jeg, de PCA-baserede komponenter x

s, i, og de resterende komponenter x

r, ia to Print automatisk t-test for differentiel ekspression mellem normale og tumorprøver er blevet udført.

RNA isolation og målinger af gen-udskrifter af interesser ved kvantitativ real time PCR

kvantitativ real time PCR til analyse af transkriptionelle niveauer af proteiner af interesse blev udført under anvendelse SYBR Green som tidligere beskrevet. Kort fortalt RNA blev isoleret fra de samme biopsier anvendes til proteomanalyse hjælp TRIzol® reagens (Invitrogen, Karlsruhe, Tyskland) ifølge producentens protokol. CDNA’et blev fremstillet ved revers transkription af 1 pg totalt RNA ved anvendelse af oligo dTprimer (15mer) og M-MLV revers transkriptase (Fermentas Life Sciences GmbH, Tyskland). Quanti tect primere for gener af interesse GAPDH (housekeeping-gen) blev købt direkte fra Qiagen, Tyskland. Primersæt blev vist at frembringe en enkelt amplikon af den ønskede størrelse bedømt ved RT-PCR efterfulgt af agarosegelelektroforese. Kvantitativ real time PCR blev udført i termisk cykliseringsapparat (Stratagene, Tyskland) under anvendelse Dynamo Flash SYBR Green qPCR kit (Finnzymes, Finland). PCR’er for målet og husholdning gener blev udført i tre eksemplarer og betyde relative ekspressionsniveauer blev rapporteret. Betingelser for real time PCR reaktion var som følger: 1 cyklus på 94 ° C i 3 minutter og 40 cyklusser ved 94 ° C i 20 s, 60 ° C i 30 s og 68 ° C i 30 s. Ved afslutningen af ​​PCR blev prøver underkastet et smeltepunkt analyse for at bekræfte specificiteten af ​​amplikonet. For at opnå statistisk signifikans data opnået blev analyseret ved uparret student

t

-test udført og p-værdi 0,05 blev betragtet som signifikant

Western blotting

Protein ekstrakter blev adskilt af. 12% SDS-PAGE og overført elektroforetisk på PVDF-membran. Blokering blev udført i 1 × Rotiblock opløsning (Roth Chemicals) efterfulgt af inkubering af membranen med primært antistof natten over ved 4 ° C. Overskydende antistoffer blev fjernet ved vask med NaCl-Tris-Tween 20. Inkubation med sekundært antistof konjugeret til peberrodsperoxidase [anti- (muse IgG) eller anti- (kanin-IgG), fortyndet 1:5000 i 1 × Rotiblock] blev udført i 1 timer ved stuetemperatur. Efter tre vaske blev reaktionen udviklet ved tilsætning af LumiGLO substrat (Thermo). Det udsendte lys blev fanget på røntgenfilm (GE Healthcare).

Resultater

2D-DIGE Analyse og massespektrometri

I denne undersøgelse var vi i stand til at etablere en standard procedure for manuel mikro dissektion af radikal prostatektomi prøver at opnå patologisk evalueret tumor og godartede væv til proteomanalyse. Desuden analyserede vi proteom af prostata fra 24 kræftpatienter og deres tilsvarende godartet væv i 21 tilfælde (tabel 1) af 2D-DIGE med pI intervallet 4,0-7,0 og molekylvægtsområde mellem 10 kDa og 120 kDa. Under disse betingelser var klart påvist i alt 1324 pletter og efterfølgende analyseret ved hjælp Delta2D software til differentiel proteinekspression. 118 pladser blev ændret betydeligt i deres overflod blandt alle de prøver, der indgår i analysen sæt og blev udvalgt til yderligere identifikation. De gennemsnitlige mængderne af pletter blev kvantificeret og dem med relative ændringer i overflod større end 1,5 gange mellem godartede og tumor (op eller ned) på 95% konfidensniveau (

s

0,05) blev betragtet som signifikante. Interessante pletter blev udskåret fra præparative geler til protein identifikation (ID) ved tryptisk i-gel fordøjelse og MALDI-TOF MS /MS-analyse. Efter en Mascot database søgning ved hjælp af de erhvervede MS-data 96 pletter af 79 proteiner blev identificeret som udtrykkes forskelligt i kræft sammenlignet med godartet væv. Pletterne med protein-id er afbildet i figur 1. Individuelle proteiner blev afspejlet af flere pletter sandsynligvis på grund af posttranslationel modifikation, der fører til forskydninger i 2-DE. De identificerede proteiner blev grupperet i forskellige klasser baseret på funktionel information tilgængelig. De fleste af de identificerede proteiner blev enten cytoskeletale proteiner, enzymer af formidlende stofskifte, signaltransduktion, varmechokproteiner, tumor-relaterede proteiner, oxidative stressrelaterede proteiner eller proteiner med ukendt funktion (figur 2B). Detaljer af proteinet identifikationer, protein score, sekvensdækning, teoretisk pI værdi og molekylvægt samt gennemsnitlige relative ændring er vist i tabel S1.

Proteiner blev adskilt ved IEF over pI intervallet 4-7, efterfulgt med 12,5% SDS-PAGE og overlejret af Delta2D. Efter ekstraktion fra væv, blev proteiner mærket med Cy3 og Cy5. En intern standard består af lige mange proteiner fra alle prøver (benigne og PCA-grupper) blev mærket med Cy2 og indgår i alle geler. De grønne pletter indikerer nedreguleret proteiner, mens den røde pletter indikerer opreguleret proteiner i PCa forhold til det tilsvarende godartet væv. De identificerede proteiner, der viste ændrede udtryk betydeligt i PCA er angivet med pile og mærket med respectives protein-id’er.

(A) Unsupervised klyngedannelse (euklidisk afstand foranstaltning og den “gennemsnitlige” agglomerering metode) blev udføres ved hjælp af log transformeret udtryk protein værdier af 45 prøver. Prøverne vises horisontalt, proteinerne lodret. De dendrogrammer repræsenterer afstandene mellem klyngerne. I den øvre farvestang, er tumorprøverne markeret med rødt, er de normale væv er vist i grøn. (B) Biologiske processer reguleres af de alle væsentlige differentielt udtrykte proteiner vurderet af Gene ontologi søgning og sammenfattet i henhold til deres funktioner.

Hierarkisk klyngedannelse og partition analyse af prøver

Figur 2A viser clustering resultat. Højere udtryk er farvet røde, de lavere grønt. Prøverne er vist i kolonner og rækker angiver proteiner. De dendrogrammer repræsenterer afstandene mellem klyngerne. Tumor og godartede prøver ikke danner to særskilte separate klynger. Imidlertid hierarkisk klyngedannelse afslørede en gruppe af meget lignende tumorprøver (10 prøver) danner en klynge. Disse prøver blev betragtet som en tumor undergruppe i yderligere analyse. Partition analyse af udtrykket værdier resulterede i den konstatering, at en enkelt protein, kan pPA2 klassificere prøver med signifikans (Fisher test med p-værdi 6.682e-09). Tumoren undergruppe blev korrekt klassificeret, en (ud af 14) af de resterende tumorer blev kategoriseret som godartet og tre (ud af 21) af de godartede prøver blev kategoriseret som tumorer (data ikke vist). Partition analyseresultater har også vist mange proteiner kan klassificere alle prøver korrekt (data ikke vist). I et forsøg på at tildele en PSA specifikt protein signatur blev ingen direkte sammenhæng mellem PSA og differentielt udtrykte proteiner observeret (data ikke vist). Tilsammen mere end ét protein kan skelne alle prøver, som de blev tildelt i grupperne.

Principal komponent analyse (PCA)

En 3-dimensionel scatterplot af de første tre vigtigste komponenter i vævsprøver viser en god adskillelse mellem tumorer og normalt væv (figur 3A). Desuden figur 3B afbilder logaritmiske p-værdier af de originale data X

i for hver protein på x-aksen, og komponenterne x

s, i og x

r i på y- aksen, viser, at næsten alle differentielle ekspression kan afspejles ved PCA-baserede komponent (røde stjerner).

(A) Scatterplot af de første tre vigtigste komponenter i PCA fra protein udtryk data. De blå stjerner repræsenterer de normale væv, mens de røde stjerner viser tumorer. (B) Fordeling af information med hensyn til differential udtryk mellem tumor og normalt væv. Hver cross repræsenterer et protein. P-værdierne i tosidet t-test er repræsenteret ved x-aksen, mens fremspringene (rød: projektion på S3, blå: projektion på komplementære rum) er repræsenteret ved værdierne på y-aksen. Tilsyneladende for alle proteiner med signifikant forskellig ekspression i de oprindelige data (log10 (p) -2) forskellen udtryk for den resterende del (blå stjerner) er ikke signifikant (log10 (p) -1), mens p -værdier i PSA-baserede komponenter (røde stjerner) svarer til de oprindelige p-værdier (x-akse). (C-D) Median nøjagtighed og odds ratio for prædiktiv tumor /normal klassificering. De blå kurver viser stigningen i model kvalitet ved øget stikprøve bruges til biomarkør model. De røde stjerner viser de kvaliteter af logit model baseret på de første tre hovedkomponenter. (E) Udgangen af ​​regressionsmodellen (y-aksen) angiver, at der findes to tumor klasser adskiller betydeligt alt efter deres separabilitet. Normalt væv (blå og grønne kasser) ved hjælp af protein-ekspression.

Tilsyneladende forskellen proteinekspression mellem tumorer og normale væv ikke kan henføres til en enkelt protein, men ser ud til at afhænge af de samlede protein ekspressionsmønstre, som er repræsenteret af kun tre komponenter af PCA i overensstemmelse med de resultater, der er beskrevet af Lukk et al. [17]. Derfor alle (generiske, ikke-redundante) kombinationer af mindst tre proteiner, der kan måles med stor nøjagtighed skal være tilstrækkelig til at bevise biomarkører med lignende prædiktiv ydeevne, hvis proteinerne viser et væsentligt bidrag til de første tre hovedkomponenter i PSA. Det respektive protein sæt kan vælges efter eksperimentelle kriterier, ikke-redundans og betydningen af ​​korrelation til de respektive PCA komponenter. På grund af konstruktionen af ​​de vigtigste komponenter i PCA som vægtede hjælp af udtrykkene for næsten alle proteiner, kan hovedkomponenterne fylde rollen som en “iboende støjfilter”. Derfor er det hensigtsmæssigt at udtrykke hver hovedkomponent med den gennemsnitlige udtryk for en (lille) gruppe af proteiner, for at drage fordel af den iboende støj undertrykkelse af gennemsnit så godt. Figurerne 3C-D viser virkningen af ​​udjævning. Ekspressionen af ​​enhver hovedkomponent er repræsenteret ved den gennemsnitlige ekspression af 1-25 proteiner, som er blevet tilfældigt udvalgt fra sættet af 38 proteiner med højeste korrelation til enhver hovedkomponent. Tilsyneladende nøjagtigheden og odds ratio afhænger prøvens størrelse af proteinerne anvendes til repræsentation af de væsentligste komponenter. Medianen af ​​model egenskaber også i samme størrelse af de kvaliteter af markører, som er baseret på et biologisk rationale, hvilket indikerer, at den differentielle ekspression kan være domineret af stor skala, stærkt co-reguleret protein ekspression skifter skyldes tumordannelse.

for at kontrollere den forventede prædiktiv præstation, er blevet identificeret en logit-model ved hjælp af kun de første tre hovedkomponenter i PCA. I cross-validering (leave-én ud) nøjagtigheden af ​​forudsigelsen af ​​tumor og normalt væv i testen-set var 86%. Tre (af 21) normale væv og 3 (af 24) tumorvæv er blevet kategoriseret. Modellen viser, at tumorerne kan opdeles i to grupper afviger signifikant med hensyn til deres udskillelse fra normalt væv (figur 3E og tabel 2). Statistiske tests viste ingen direkte relation af tumor grupper til annoterede tumor karakteriseringer (Gleason score, PSA markør etc.). Derfor enten påvirkningsfaktorer bortset fra protein-ekspression kan bidrage til prostata tumor egenskaber, eller meget komplekse, ikke-monoton samarbejdsprocesser mellem proteiner har en indvirkning på tumor status, som ikke er omfattet af de vigtigste komponenter i PCA, der anvendes i logit regressionsmodel. Funktionel klassificering af de 26 identificerede proteiner differentielt udtrykt mellem begge tumor-grupper er opsummeret i figur 4A-C. I alt 70% af proteinerne fra dette datasæt blev klassificeret til metaboliske processer og over 60% var klassificeret til katalytiske eller bindende funktioner.

(A) De biologiske processer, (B) molekylære funktioner og (C ) cellulære rum, der reguleres af de differentielt udtrykte proteiner mellem de to tumor grupper vurderet af Gene ontologi søgning.

netværk analyse af identificerede proteiner i kræft vs godartede prøver

Pathways og netværk, der er involveret proteiner fra 2-D Dige eksperimenter differentielt udtrykte i PCa blev analyseret ved hjælp MetaCore ™, webbaseret integrativ software. Netværket arkitektur repræsenterer forbindelser mellem de individuelle proteiner (knudepunkter).

I denne analyse hubs (centrale proteiner) af protein-netværk foreslås at være de centrale regulatoriske proteiner involveret i flercellede processer. Den indbyggede korteste netværk (figur 5A) viser, at c-Myc, p53, androgenreceptor, 14-3-3-epsilon, vimentin, PSA og østrogen receptor 1 som netknudepunkter.

Be the first to comment

Leave a Reply