Abstrakt
Interstitiel lungesygdom begivenheder (ILD) er blevet rapporteret i japansk ikke-småcellet lungekræft (NSCLC) patienter, der fik EGFR tyrosinkinaseinhibitorer. Vi undersøgte proteom biomarkører for mekanistiske indsigt og forbedret forudsigelse af ILD. Blodplasma blev indsamlet fra 43 gefitinib behandlet NSCLC patienter, der udvikler akut ILD (bekræftet ved blindet diagnostisk revision) og 123 tilfældigt udvalgte kontroller i en indlejret case-kontrol undersøgelse inden for en farmakoepidemiologisk kohortestudie i Japan. Vi genererede ~ 7 millioner tandem massespektrometri (MS /MS) målinger med omfattende kvalitetskontrol og validering, der producerer en af de største proteomisk lungekræft datasæt til dato, indarbejde grundig undersøgelse design, fænotype definition, og evaluering af prøve behandling. Efter justering, skalering, og måling batch justering, vi identificeret 41 peptid toppe, der repræsenterer 29 proteiner bedst forudsige ILD. Multivariate peptid, protein, og sti modellering opnåede ILD forudsigelse kan sammenlignes med tidligere identificerede kliniske variabler; kombinere de to forudsat en vis forbedring. Den akutte fase respons pathway var stærkt repræsenteret (17 af 29 proteiner, p = 1,0 × 10
-25), hvilket tyder på en central rolle med potentiel anvendelighed som en markør for øget risiko for akutte ILD begivenheder. Validering af Western blotting viste korrelation for identificerede proteiner, der bekræfter, at robuste resultater kan genereres fra en MS /MS-platform gennemførelse af en streng kvalitetskontrol
Henvisning:. Nyberg F, Ogiwara A, Harbron CG, Kawakami T, Nagasaka K , Takami S, et al. (2011) proteomiske Biomarkører for akut Interstitiel lungesygdom i Gefitinib-Behandlede japanske lungekræftpatienter. PLoS ONE 6 (7): e22062. doi: 10,1371 /journal.pone.0022062
Redaktør: Scott A. Coonrod, Cornell University, USA
Modtaget: Marts 28, 2011; Accepteret: 14 Juni 2011; Udgivet: 20 Jul 2011
Copyright: © 2011 Nyberg et al. Dette er en åben adgang artiklen distribueres under betingelserne i Creative Commons Attribution License, som tillader ubegrænset brug, distribution og reproduktion i ethvert medie, forudsat den oprindelige forfatter og kilde krediteres
Finansiering:. Denne undersøgelse blev finansieret af AstraZeneca og udføres i samarbejde med forskere fra den akademiske verden, AstraZeneca og Medicinsk Proteoscope Company. Alle samarbejdende parter deltog i undersøgelsen design, indsamling og analyse af data, beslutning om at offentliggøre, og forberedelse af manuskriptet
Konkurrerende interesser:. FN, CGH, ISP, MCS og IGC er medarbejdere i AstraZeneca og egne aktier i virksomheden. AO, TK, K. Nagasaka, ST, KW, HKT, MO, Y. Kyono, TD, Y. Komatsu, MK, SA, og TN er /var medarbejdere i Medicinsk Proteoscope Co Ltd TH er ansat i Chiesi Farmaceutici. TH og GMV er tidligere medarbejdere i AstraZeneca. MF har modtaget honorarer fra AstraZeneca. K. Nakata, YO, SK, og HK har erklæret, at nogen interessekonflikter eksisterer.
Introduktion
Interstitiel lungesygdom (ILD) påvirker pulmonal parenkym eller alveolære region [1]. Når forbundet med medicinsk behandling, kan den forelægge stejlt som akut diffus alveolær skade (DAD), undertiden med dødelig udgang [2]. Patienterne har ofte alvorlige åndenød og bryst radiologi viser ‘jorden glas’ udseende. Ingen specifik behandling er tilgængelig, men støttende behandling omfatter ilt, kortikosteroider, eller assisteret ventilation. Akutte ILD begivenheder kan udvikle
de novo
, men et eksisterende kronisk ILD tilstand øger risikoen betydeligt [3], som observeret i de seneste undersøgelser af patienter med idiopatisk lungefibrose (IPF), den mest almindelige kroniske form [4 ].
ILD, især IPF, er en kendt comorbiditet hos patienter med ikke-småcellet lungecancer (NSCLC) [5]. Akutte ILD hændelser er blevet rapporteret med mange lungekræft behandlinger ved hastigheder på op til -10% [6] – [11]. ILD er anerkendt som mere almindelige i Japan end andre steder, både i befolkningen og blandt patienter med NSCLC [5], [6], [12], [13], selv om det er uklart, hvorfor.
EGFR tyrosin kinase hæmmere (TKI’er) er en etableret behandling for fremskreden NSCLC. I modsætning til meget kemoterapi, er de typisk veltolereret og uden cytotoksiske bivirkninger. Den EGFR TKI gefitinib (IRESSA) blev godkendt i 2002 i Japan til behandling af fremskreden NSCLC. Selv blev observeret nogle ILD-type hændelser i kliniske forsøg og medfølende klinisk brug, først efter godkendelse gjorde et stigende antal spontane rapporter for ILD vises i Japan som stoffet blev mere bredt tilgængelig.
På det tidspunkt, bedre forståelse af ILD var et presserende behov: baseline forekomst på forskellige behandlinger, risikofaktorer, og den potentielle sammenslutning af gefitinib med ILD risiko. En uafhængig akademisk hold sammen med AstraZeneca forskere derfor designet og gennemført en kohorte og nested case-kontrol farmakoepidemiologisk studie af ILD i japanske NSCLC patienter behandlet med enten gefitinib eller kemoterapi, med kliniske resultater rapporteret tidligere [3]. Som en sonderende sub-studie komponent, patienter, der fik gefitinib (begge efterfølgende ILD sager og patienter kontrol) blev udtaget til plasma proteomics, med to hovedformål: 1) at identificere proteomiske prædiktorer for ILD der måske i sidste ende blive udviklet i et skræddersyet medicin diagnostisk til identificere patienter med øget risiko for ILD; 2) at øge forståelsen af de mekanismer, der ligger til grund for udviklingen af akutte ILD begivenheder.
Ved hjælp af en multipel biomarkør tilgang såsom proteomics (den samtidige undersøgelse af store dele af det menneskelige proteom at give en samlet oversigt over differentieret udtryk for proteiner i blod eller væv), i stedet for blot en almindelig enkelt biomarkør, potentielt øger forudsigelseskraft både gennem øget robusthed stammer fra flere målinger og mulighed for at kombinere oplysninger fra flere biologiske processer. For at understøtte høj kvalitet generation af sådanne oplysninger, vi kombineret på en ny måde flere vigtige studieelementer: robust studiedesign, veldefinerede fænotypiske definitioner, procedurer omhyggelig prøvetagning stabil avancerede væskekromatografi (LC) -tandem massespektrometri (MS /MS) -baseret peptid separation og påvisningsmetoder, statistisk analyse inkorporerer proteomisk og kliniske oplysninger, stringente metoder til database protein annotation af detekterede peptid toppe, og biologisk tolkning ved hjælp litteratur minedrift software, plus omfattende kvalitetskontrol og validering, rapporteres nedenfor.
Resultater
Karakteristik af undersøgelsespopulationen
den ikke-randomiserede kohorte omfattede 3.166 japanske patienter med fremskreden /tilbagevendende NSCLC, som blev fulgt i 12 uger efter start gefitinib (n = 1.872 behandlingsperioder ) eller kemoterapi (n = 2.551). Fra gefitinib-behandlede sub-kohorte, 103 formodede ILD sager (79 senere bekræftet og 24 afvist af Case Review Board [CRB]), samt 252 kontroller, blev registreret i case-kontrol undersøgelse. Proteomics prøver til denne sub-studie var til rådighed fra 43 bekræftede ILD sager, 123 kontrolpersoner, og 15 CRB-afvist oprindeligt diagnosticeret ILD tilfælde (tabel 1). Kliniske kendetegn for de sager og kontroller er beskrevet i tabel S1.
sonderende analyse af LC-MS /MS-data genereret under kvalitet kontrollerede forhold afslører stort parti variation, der skal kontrolleres i efterfølgende statistiske analyser
vurdering af prøve forarbejdning og datagenerering Kvalitet
efter immunoaffinitetschromatografi udtømning, resterende serumalbumin var 8% for alle 181 baseline prøver (tabel S2). Den efterfølgende tryptiske hydrolyse resulterede i et resterende ufordøjet proteindel i området fra 3,0% til 32,3% (gennemsnit 15,3%) (tabel S2). Variationen i disse forarbejdningstrin var uafhængig af sag /kontrol status (data ikke vist).
LC-MS /MS-målinger for de 181 individuelle baseline prøver blev udført i 11 partier, med 19 og 20 prøver fra partier 1 og 3 gentages i partier 10 og 11 (tabel 1), hvilket resulterer i 220 diskrete proteomics målinger. Fire af de 11 partier oprindeligt mislykkedes kriterierne for kvalitetskontrol (variationskoefficienten [CoV] 20% for nogen af de seks kontrol peptider blandt de tre inden-batch kontrolprøver) på den første måling køre, men bestået de kriterier, gentagen måling. En sammenfatning kvalitetskontrol af acceptable batchkørsler er givet i figur 1A.
(A) Reproducerbarhed af 6 kontrol toppe for de 3 standard kvalitet kontrolprøver, afbildet som ‘+’, i hver analyse batch (topintensitet, venstre akse). Variationskoefficienterne (%, højre akse) mellem de 3 kontrolprøver i hver batch er plottet som punkter forbundet med en linje. (B) Reproducerbarhed af peptid intensiteter for 39 prøver med to analyser i forskellige analyser batches. Delvis korrelation, efter fjernelse mellem batch forskelle, plottet mod den gennemsnitlige normaliserede intensitet for hvert peptid. Højere peptider intensitet viser høj reproducerbarhed i deres intensiteter mellem gentagne batches.
Figur 1B viser et plot af partielle korrelationer mellem de dobbelte prøver i partier 1 og 10, 3 og 11, efter at der for enhver batch effekt mod den gennemsnitlige normaliserede intensitet over hele prøvesæt for hvert signal. Peptider med højere gennemsnitlige intensiteter viser højere reproducerbarhed mellem partier som det fremgår af generelt høje partielle korrelationer.
sonderende dataanalyse af MS signalintensiteter.
Vi brugte derefter en principal komponent analyse (PCA) til at udforske data med henblik på at identificere de største kilder til variation. Figur 2A viser et plot af denne analyse, med hver prøve farvet efter batch. Målinger fra samme parti tendens til at klynge sammen, adskilt fra andre partier, hvilket indebærer, at de største forskelle mellem prøver skyldes den portionsvis behandling.
(A) Plot af første to hovedkomponenter fra PCA-analyse af fuld proteom data fra alle 11 analyse batches (nummereret 1-11 i tidssekvens). Hver prøve er repræsenteret ved et enkelt punkt, med den række af punkter inden for hver batch er vist ved en polygon forbinder yderpunkterne i dette parti. (B) Plots af de første to primære komponenter til de gentagne batcher af prøver (1 og 10, 3 og 11). Individuelle prøver er repræsenteret ved en linie, der forbinder de to replikater i forskellige batches. (C) Reproducerbarhed af et eksempel differentielt udtrykte peptid mellem to dobbelte batchkørsler af proteomisk analyse. Intensiteterne af den første og anden kørsler for hver replikeret prøve plottes mod hinanden. Prøver farvet af batch (batch 1 gentages som batch 10 – blå, batch 3, gentages som batch 11 – rød). Giver mulighed for mellem-sekvens forskelle der er en god sammenhæng mellem gentagne kørsler.
Figur 2B viser resultaterne af PCA på parrene af gentagne batcher (1 og 10, 3 og 11), med dobbelte prøver forbundet ved en linje, plottet mod de første to hovedkomponenter. Linjerne er generelt vandret og parallel, hvilket igen antyder, at den største kilde til variabilitet eller de største overordnede forskelle i profilerne mellem prøver (første principale komponent) vedrører inter-batch variation, og at bestilling af prøver på den anden hovedkomponent, dvs. i den næststørste kilde til variabilitet eller overordnede forskelle mellem prøver, er i stærk aftale mellem de gentagne partier. Korrigeret for konsistente forskelle mellem partier, disse resultater bekræfter således, at inter-sample forskelle er reproducerbare med den anvendte metode.
de figur 2B sammenligner resultater sammenfattet i alle målte peptider, Figur 2C viser de gentagne køre resultater for en eksempel peptid. Selv om der er store mellem-batch forskelle inden for hver batch der er høj korrelation mellem de intensiteter for samme emne på replikere kørsler. Af de 41 differentielt udtrykte peptidtoppe benyttes til at identificere proteiner, der er anført i tabel 2, 25 (61%) viser en delvis korrelation efter fjernelse af batch effekt større end 0,8, og alle viser en delvis korrelation på over 0,35.
Ryd forskelle i peptid og protein mønstre mellem ILD sager og kontroller
De efterfølgende analyser havde til formål at identificere peptider og proteiner, der effektivt diskriminerede mellem cases og kontroller, så afviste sager blev nu udelukket. Gentagne prøver i partier 10 og 11 blev udelukket, og i betragtning af de store mellem-batch forskellene i de sonderende analyser, blev kontrollen emne målt i batch 10 også udelukket, hvilket efterlader 43 bekræftede ILD tilfælde og 122 kontroller med én prøve måling hver.
Identifikation af diskriminere peptider og proteiner.
Figur 3 viser resultaterne af den univariate (individuel peptid) analyser under anvendelse kovariansanalyse (ANCOVA), vist som histogrammer af p-værdierne for sammenligning mellem tilfælde og kontroller. Giver mulighed for batch som en analyse kovariat, at fjerne variation mellem batch, øger væsentligt magt analysen identificerer omtrent dobbelt så mange peptider viser statistisk signifikant forskellig ekspression på 5% niveau. Figurerne S1 og S2 udforske og forklare dette forhold nærmere. Yderligere tegner sig for indenfor-batch ordre kun lidt nedsætter antallet af betydende peptider, hvilket tyder på, at en hvilken som helst inden-batch ordre effekt er marginal, og forsøg på at modellere det vil ikke øge magten.
Figuren viser effekten på distribution af p-værdier for differentieret udtryk for herunder analyse behandling information og kliniske variable.
på den anden side, der giver mulighed for vigtige kliniske variabler (WHO performance status [PS], rygning historie, omfang af normal lunge dækning på CT-scanning, og sværhedsgraden af allerede eksisterende ILD) i analysen konsekvent reduceret antallet af peptider detekteres som differentielt udtrykt, hvilket afspejler, at mange af de oplysninger transporteres i de væsentligste peptider er duplikere informationer båret af de kliniske variable ( figur 3). Figur S3 viser et eksempel på dette, hvor højere niveauer af peptidet, højere performance status score og tilfælde status er alle forbundet med hinanden, og meget af den forøgede peptid intensiteten af tilfældene sammenlignet med kontrollerne kan forklares ved deres tilknytning til højere performance status score, så peptid intensitet tilføjer meget mindre information når de betragtes i kombination med denne kliniske variabel.
Baseret på p-værdi, de 100 toppe fra både analyserne med og uden kliniske variable var identificeret. Disse toppe blev efterfølgende begrænset til 41 efter følgende kriterier: 1) normaliseret LC retentionstid mellem 5 og 75 min, og 2) fuld scanning
m /z Drømmeholdet værdi af precursor ion mellem 450 og 1.500. Derefter blev peptid-identifikationer inkluderet i de 41 peptidtoppe udvalgt efter følgende kriterier: 1) et Mascot ion scorer mere end identiteten tærskelværdi givet til det enkelte aminosyresekvens af peptidet; og 2) 3 prøver med den tilsvarende peptid identifikation. Dette resulterede i 45 gyldige peptid identifikationer fra 28 af de 41 toppe, herunder to peptider fra spiked lysozym (Tabel S3). De plasmaafledte 43 peptider repræsenteret 27 forskellige identifikationer med 2 dobbelte identifikationer af nært beslægtede proteiner, for i alt 29 proteiner. Disse er opført i tabel 2, med flere detaljer om deres identifikation givet i tabel S3.
Akut fase respons identificeret som en vigtig vej forventes at blive involveret i akutte ILD begivenheder
Dette sæt af proteiner blev derefter anvendt i den biologiske fortolkning analyser under anvendelse opfindsomhed Pathway Analysis (IPA) system. Den mest markante vej fundet når man lægger proteinerne på Opfindsomhed-kurateret kanoniske veje var den akutte fase respons signalvej, som 17 af de 29 proteiner kan være forbundet (p = 1,0 × 10
-25). Andre veje viser en høj overlapning med listen af proteiner omfattede komplement og koagulationsveje, men p-værdier var mindre markant på grund af det mindre antal proteiner involveret (figur 4).
De væsentligste veje fra en analyse forbinder de identificerede 29 proteiner fra studiet til curated veje i Ingenuity pathway analyse systemet vises, beordrede efter forholdet mellem antallet af protein markører, der kan være forbundet med vejen, og antallet af proteiner i vejen.
Indtastning de 29 proteiner i IPA, 5 netværk blev dannet. Den mest markante netværk indeholder 24 af de 29-proteiner (figur 5). Proteiner føjet til netværket ved værktøjet til at forbinde markørproteinerne omfatter IL1 og NF-KB, hvilket antyder at disse proteiner også kan være involveret i generering af observerede mønster. Ved at kombinere de to netværk med den højeste score tilføjer yderligere IL1-beta, HNF1A, HNF4A, HNF6 (ONECUT1), og CEBPB som centrale komponenter (figur S4).
Højeste scoring netværk genereret i at komme ind de identificerede 29 proteiner til opfindsomhed Pathway Analysis-system, med proteiner identificeret i undersøgelsen skyggefulde grå og forbinder proteiner identificeret ved Ingenuity Pathway Analyse non-skraverede. Mørkeblå former og linjer = proteiner identificeret som prædiktorer i denne undersøgelse og samspillet mellem dem. Grå former og linier = proteiner identificeret ved Ingenuity at generere netværket og interaktioner mellem dem. Lyseblå linjer = interaktioner mellem proteiner identificeret ved Ingenuity at generere af nettet og de proteiner identificeret i undersøgelsen. Figur S4A viser dette tal med interaktion relationer mærket. Proteiner er identificeret i undersøgelsen, og som indgår i netværket: SERPINA1 = alfa-1-antitrypsin; SERPINA3 = alfa-1-antichymotrypsin; SERPINC1 = antithrombin-III; ApoA1 = apolipoprotein A-I; ApoB = apolipoprotein B-100; APOC3 = apolipoprotein C-III; C3 = komplement C3; C4A, C4b = komplement C4-A; supplere C4-B; C9 = komplement komponent C9; GSN = gelsolin; HbA2 = hæmoglobin alpha; HBB, HBD = hæmoglobin beta /delta; HP = haptoglobin; HPR = haptoglobin-beslægtet protein; HRG = histidin-rige glycoprotein; KLKB1 = plasmakallikrein; IGKC = Ig kappa-kæde V-III region Ti; RBP4, RBP = retinol-bindende protein 4; APCS = serum amyloid P-komponent; TF = serotransferrin; TTR = transthyretin. Proteiner identificeret i undersøgelsen og ikke indgår i nettet: ORM1 = alfa-1-syre-glycoprotein 1; A1BG = alfa-1B-glycoprotein; LRG1 = leucin-rige alpha-2-glycoprotein; ARMC2 = bæltedyr repeat-holdigt protein 2; AHSG = alfa-2-HS-glycoprotein; ITIH4 = inter-alpha-trypsininhibitor tung kæde H4.
Validering af MS /MS-data viser god reproducerbarhed og fornuftig aftale med Western blot
Inden for MS /MS-platformen der var stærk overensstemmelse mellem gentagne kørsler med de samme prøver med mulighed for batch effekter, som beskrevet ovenfor (figur 2C).
Validering med en anden metode, tabel 2 viser korrelationen i intensiteter afledt af MS /MS og Western blotting (WB) for et udvalg af 9-proteiner. I betragtning af at WB rettet mod intakt protein, mens den nuværende MS /MS kan registrere peptider afledt af de intakte proteiner, disse 9 proteiner viser ganske høj grad af enighed mellem de teknologier, med 6 af de 9 proteiner udviser en korrelation på over 0,7 . Scatterplots sammenligner MS /MS og WB protein intensiteter er vist i figur S5 og WB billeder i figur S6.
Forudsigelse af ILD hjælp proteiner og kliniske data
Modeling fænotype baseret på flere peptid markører .
Figur 6A viser forudsigelseskraft baseret på leave-one-out krydsvalidering for modeller bygget ved hjælp af en række forskellige antal peptider i kombination. Væsentlige forbedringer på tilfældig forudsigelse blev opnået fra blot et par peptider, og øge antallet af peptider yderligere ikke væsentligt forbedre modellens forudsigelser. Den prædiktive effekt af modellen faldt selv ved brug meget mange peptider.
(A) fra peptider, for forskellige antal peptider inkluderet i proteomisk forudsigelsesmodel, og (B) fra kliniske data, proteomik data, og en kombination af både kliniske og proteomiske data.
for robusthed, blev alternative multivariate modellering tilgange sammenlignet. Brug af tilfældige skove i stedet for partielle mindste kvadraters diskriminant analyse (PLS-DA) og logistisk regression inden for modellering rammer gav omtrent samme forudsigende niveau som vist ved arealet under kurven (detaljer ikke vist).
En undergruppe analyse begrænser sæt af sager til dem med DAD akut ILD mønster (20 af de 43 sager) blev hæmmet af lille prøvestørrelse og var ude af stand til at forbedre den samlede forudsigelseskraft.
Modeling fænotype baseret på flere peptid markører og kliniske data.
Figur 6B sammenligner forudsigelseskraft, baseret på orlov-én-out cross validering, for modeller bygget på kliniske /radiologiske data alene ved hjælp af en logistisk regression, peptid data alene, og en kombination. Begge datatyper alene forudsat lignende forudsigelse. Vis forbedring blev opnået ved at kombinere de to datatyper, men det var langt mindre end additiv. Dette er i overensstemmelse med resultaterne fra analysen af de enkelte peptider, hvilket tyder på, at de diskriminerer peptider til dels bære information også tilgængelig fra de kliniske /radiologiske variable.
Modeling fænotyper baseret på proteiner og kliniske data.
Figur 7 viser p-værdier til at skelne og kontrolpersoner opnået fra proteinerne (dvs. kombineret bestanddel peptid score), alle deres konstituerende peptider, og den kombinerede akutte fase pathway intensitet foranstaltning (dvs. den samlede score af de 16 omfattede konstituerende proteiner) . For de fleste proteiner, den estimerede protein intensitet er større end de fleste af de målte peptid intensiteter forbundet med dette protein, men blot forbedrer på betydningen af den bedste peptid til et par proteiner. Da disse resultater blev opnået inden for samme datasæt, der blev brugt til at identificere og vælge de konstituerende peptider, kan nogle over-fitting være forekommende, og det protein udtryk intensitet integrerer oplysninger fra mange peptider kan være en mere robust foranstaltning at anvende i en bredere sammenhæng . Den kombinerede akutte fase pathway intensitet foranstaltning viser en større respons end nogen af de indgående proteiner. Et lignende billede fås, når vi betragter de supplerende oplysninger, som de peptid, protein og pathway foranstaltninger på toppen af de kendte kliniske variable til at forudsige ILD status (Figur S7).
p-værdier for de proteiner er vist af røde stjerner, er p-værdier for de enkelte peptider vist ved punkter, og fordelingen af disse for hvert protein er vist med en boxplot. I hvert boxplot, de øvre og nedre sider af kassen repræsenterer højere og lavere kvartil værdier (Q3 og Q1), hhv. Den sorte bjælke i hver boks repræsenterer medianværdien. P-værdi for den akutte fase pathway er repræsenteret ved den stiplede linie; boxplots til proteiner i den akutte fase respons pathway er nedtonet. A1AG1 = alfa-1-syre-glycoprotein 1; A1AT = alfa-1-antitrypsin; A1BG = alfa-1B-glycoprotein; A2GL = leucin-rige alpha-2-glycoprotein; AACT = alfa-1-antichymotrypsin; ANT3 = antithrombin-III; ApoA1 = apolipoprotein A-I; ApoB = apolipoprotein B-100; APOC3 = apolipoprotein C-III; ARMC2 = bæltedyr repeat-holdigt protein 2; CO3 = komplement C3; CO4 = supplere C4-A; supplere C4-B; CO9 = komplement komponent C9; FETUA = alpha-2-HS-glycoprotein; GELS = gelsolin; HBA = hæmoglobin alpha; HBB, HBD = hæmoglobin beta /delta; HPT = haptoglobin; HPTR = haptoglobin-beslægtet protein; HRG = histidin-rige glycoprotein; ITIH4 = inter-alpha-trypsininhibitor tung kæde H4; KLKB1 = plasmakallikrein; KV3 = Ig kappa-kæde V-III region Ti; RETBP = retinol-bindende protein 4; SAMP = serumamyloid P-komponent; TrFE = serotransferrin; TTHY = transthyretin.
Figur 8A viser den akutte fase respons pathway intensitet plottet mod en kombineret klinisk variabel score måler sandsynligheden for et emne at være en sag beregnet ud fra en logistisk regression af case-control status mod kliniske variabler WHO PS, rygevaner, omfanget af normal lunge dækning på CT-scanning, og sværhedsgraden af allerede eksisterende ILD. Dette viser både informationskilder bidrage til at forudsige ILD resultat, selv om disse to foranstaltninger er ret stærkt korreleret, så mange af de oplysninger duplikeres. Figur 8B betragter konsekvenserne for at forudsige ILD ved at vise receiver drifts- egenskaber (ROC) kurver for de kliniske variabler, den akutte fase pathway intensitet, og kombinationen af de to informationskilder. Dette viser sammenlignelige niveauer af forudsigelseskraft fra de kliniske variable og akut fase-pathway intensiteter, og nogle potentielle fordel ved at kombinere dem sammen som imidlertid er begrænset, som afspejler deres korrelation.
(A) Plot af den akutte fase svar intensitet imod den kombinerede kliniske variable score måler sandsynligheden for et emne bliver en sag beregnet ud fra en model forudsige case-kontrol-status kun baseret på de kliniske variable WHO PS, rygning historie, omfanget af normal lunge dækning på CT-scanning, og sværhedsgraden af tidligere ILS, med boxplots sammenligne fordelingen af disse foranstaltninger i tilfælde og kontroller. I hvert boxplot, de øvre /højre og nedre /venstre sider af kassen repræsenterer højere og lavere kvartil værdier (Q3 og Q1), hhv. Den sorte bjælke i hver boks repræsenterer medianværdien. (B) Modtager opererer karakteristika kurve af cross-valideret forudsigelser fra kliniske data, den akutte fase respons intensitet og en kombination af de kliniske data og akutfaserespons intensitet.
Diskussion
Vi præsenterer her skyldes en proteomisk analyse anvendes til en storstilet farmakoepidemiologisk undersøgelse og viser, at med stor opmærksomhed for at studere design og eksperimentelle procedurer i hele processen kræves for at generere data af høj kvalitet, er det muligt at udlede værdifuld viden fra både et videnskabelig og en diagnostisk perspektiv. Men der er mange potentielle kilder til variation data og uoverensstemmelser i denne proces. Integriteten af alle trin i processen er afgørende for at skabe nyttige data og fiasko at sikre høj kvalitet i en af dem kan kompromittere gyldigheden og værdien af hele undersøgelsen.
Metodologiske aspekter
Undersøgelse design og prøveforberedelse.
Vi anvendte omhyggelig fænotypebestemmelse med blindet diagnostisk gennemgang for at sikre en nøjagtig ILD diagnose, og indarbejdet foranstaltninger til at sikre, at alle tilfælde af ILD forekommer i kilden kohorten ville blive taget til fange. Kontroller blev udvalgt fra den faktiske befolkning genererer sagerne, sikrer sammenlignelighed mellem tilfælde og kontroller, så kontraster set kan tilskrives tilfælde status. Deltagelse satser var høj ( 90%) og lignende for cases og kontroller [3], hvilket gør selektionsbias usandsynlig. Proteomics prøver blev opnået efter særskilt informeret samtykke fra cirka halvdelen af alle gefitinib-behandlede sager og kontroller. Skridt til at sikre proteom data af høj kvalitet til vores store epidemiologiske undersøgelser omfattede randomisering af de behandlede prøver, omhyggelig kvalitetsvurdering af prøven præparater og optimerede forberedelse protokoller til at sikre stabilitet i alle procedurer for et stort antal prøver. Vi har tidligere beskrevet den generelle strategi, at vi besluttede at bruge i undersøgelsen er baseret på en række eksperimentelle pilot fase runder [14].
Eksperimentelle måling batch effekter.
To-dimensionelle polyacrylamid gel elektroforese er en almindelig konventionel teknologi, der anvendes til proteinanalyse i serum /plasma [15], [16]. I øjeblikket har LC-MS /MS blevet bredt accepteret til høj opløsning proteom-dækkende profilering fra en kompleks peptidblanding [17]. Nylige fremskridt i denne metode, herunder forbedret stabilitet peptid separation og detektion har gjort det muligt at sammenligne ion intensitet mellem LC-MS /MS-profiler [18]. Vores proteomics analysesystem anvendte LC-MS /MS efter immunoaffinitets- udtømning af de mest udbredte konstituerende proteiner i blodplasma, og proteolytisk enzym behandling af forarmet plasmaprøve.
Vi identificerede, at LC-MS /MS måling proces har systematiske målefejl, som man kunne forvente, som vi tog foranstaltninger til at eliminere ved at indføre batch-behandling med kvalitetskontrol, designe rækkefølgen af prøve behandling for at minimere virkningerne af eventuelle systematiske fejl, og derefter fjerne batch effekter i den statistiske analyse. Behandlingen af batch effekter i den statistiske analyse viste sig at forbedre processen detektere diskriminerende toppe, og derfor vi baseret vores endelige proteinidentifikation skridt på denne analyse tilgang
justeringsalgoritmer -. Intern standard-guidede Optimal Profile alignment ( i-OPAL)
for at tillade sammenlignende kvantificering mellem prøver, prøve målinger skal tilpasses -. dvs skal være identificeret korrespondance af ion-signaler. blevet foreslået forskellige metoder til dette, f.eks baseret på stabile isotoper mærkning [19] – [21], at udnytte komparative identifikation [22], [23], eller med direkte sammenligning af de respektive peptid ion signaler [18]. I-OPAL metode hører til den sidste kategori. På trods af den relativt lave nøjagtighed og masse beslutning af
m /z
måling, MS instrument ion-trap Prøvesæt kan en langsigtet stabil måling uden nogen kalibrering operation [24], [25]. Derfor er
m /z
værdier er direkte sammenlignelige i en stor mængde stikprøver uden yderligere transformationer.
Biologiske resultater og konsekvenser
Potentielle biologiske mekanismer bag akutte ILD begivenheder.
i vores IPA mapping til kanoniske biologiske veje, akut fase proteiner kom ud som det stærkeste signal, efterfulgt af komplement og koagulationsveje.
Leave a Reply
Du skal være logget ind for at skrive en kommentar.