Abstrakt
Late diagnose af lungekræft er stadig den vigtigste årsag til høj dødelighed i lungekræft. Lungekræft er en heterogen sygdom, som inducerer et immunrespons på forskellige tumorantigener. Adskillige metoder til søgning autoantistoffer er blevet beskrevet, der er baseret på kendte oprensede antigen paneler. Formålet med vores undersøgelse er at finde tegn på, at dele af antigen-bindende-domæne af antistoffer er delt mellem lungecancerpatienter. Dette blev undersøgt ved en hidtil ukendt fremgangsmåde baseret på sekventering antigenbindende-fragmenter (Fab) af immunglobuliner under anvendelse proteomiske teknikker uden behov for tidligere kendte antigen paneler. Fra serum af 93 deltagere i NELSON forsøget IgG blev isoleret og efterfølgende fordøjet i Fab og Fc. Fab blev oprenset fra det fordøjede blanding ved SDS-PAGE. De Fab indeholder gel-bånd blev skåret ud, tryptisk fordøjet og målt på en nano-LC-Orbitrap-Mass-spektrometri system. Multivariat analyse af massespektrometri data ved lineær kanonisk diskriminant analyse kombineret med trinvis logistisk regression resulterede i en 12-antistof-peptid-model, som var i stand til at skelne lungekræftpatienter fra kontroller i en population høj risiko med en følsomhed på 84% og specificitet 90%. Med vores Fab-rensning kombineret Orbitrap-massespektrometri tilgang, fandt vi peptider fra de variable-dele af antistoffer, som deles blandt lungekræftpatienter
Henvisning:. De Costa D, Broodman I, Calame W, Stingl C, Dekker LJM, Vernhout RM, et al. (2014) Peptider fra Variable Region specifikke antistoffer deles blandt lungekræftpatienter. PLoS ONE 9 (5): e96029. doi: 10,1371 /journal.pone.0096029
Redaktør: Sophia N. Karagiannis, Kings College London, England
Modtaget: Juli 22, 2013; Accepteret: April 3, 2014; Udgivet: 1. maj 2014
Copyright: © 2014 de Costa et al. Dette er en åben adgang artiklen distribueres under betingelserne i Creative Commons Attribution License, som tillader ubegrænset brug, distribution og reproduktion i ethvert medie, forudsat den oprindelige forfatter og kilde krediteres
Finansiering:. Forfatterne tak Roche Diagnostics for deres ubegrænset forskningsbevilling og NWO (Holland Organisation for Videnskabelig forskning) for deres økonomiske støtte (Zenith tilskud 93.511.034). De finansieringskilder havde ingen rolle i studie design, indsamling og analyse af data, beslutning om at offentliggøre, eller forberedelse af manuskriptet
Konkurrerende interesser:. Denne forskning blev delvist understøttet af Roche Diagnostics ved en ubegrænset forskningsbevilling. Roche Diagnostics havde ikke nogen rolle i studie design, indsamling og analyse af data, beslutning om at offentliggøre, eller forberedelse af manuskriptet. Support efter Roche Diagnostics ændrer ikke forfatternes tilslutning til alle PLoS ONE politikker om datadeling og materialer.
Introduktion
Lungekræft er i øjeblikket den mest almindelige kræftform med den højeste dødelighed ( 28%) i verden på grund af diagnosen på et fremskredent stadium. [1], [2] Men med demonstration af en 20% lungekræft dødelighed reduktion af NLST forsøget (National cancer screening Trial) lav dosis CT screening for lunge kræft modtager stigende interesse. [3] NELSON forsøg (hollandsk-belgiske lungekræft screening studie) viste, at efter tre screening runder 3,6% af alle deltagerne i dette studie havde en falsk-positive skærm resultat. [4] Selv stadig ca. 27% af deltagerne blev udsat for invasive procedurer, der afslørede godartede lungesygdomme ved baseline screening (første runde NELSON retssag). [5] En god biomarkør (panel) vil reducere dette antal unødvendige invasive procedurer. Ved udvælgelsen tidspunktet for højrisiko individer til screening sker efter alder og rygning historie. En biomarkør eller biomarkør panel ville være nyttige i at vælge høj risiko enkeltpersoner for CT-screening, da det kan afsløre lungekræft på et tidligere tidspunkt end CT.
Antistoffer kan være interessant som markører for at skelne lungekræftpatienter fra lunge kræft- frie individer. Disse antistoffer produceret af immunrespons, som er rettet mod særlige tumorassocierede antigener (TAA’er) under udviklingen af kræft, sandsynligvis på et tidligt stadium [6] -.. [12] Nyligt Liu et
al
viste, at koncentrationen af cirkulerende IgG autoantistoffer mod ABCC3 transportør var signifikant højere hos kvindelige adenocarcinoma patienter end hos kvindelige kontroller [13].
Humane antistoffer består af fire kæder, to identiske tunge kæder og to identiske lette kæder. Hver lette kæde har et variabelt (V
L) og konstant (C
L) domæne. De tunge kæder har tre forskellige konstante domæner (C
H1, C
H2 og C
H3) og et variabelt domæne (V
H). De første konstante og variable dele danner antigenbindingsstedet fragment (Fab). De resterende to konstante dele af den tunge kæde danner Fc-regionen. Inden Fab seks komplementaritetsbestemmende regioner (CDR1, CDR2 og CDR3) er placeret mellem rammer. Disse CDR’er bestemme antigenspecificitet og danner en overflade komplementær til en form, der er en del af antigenet. CDR’er er hypervariable regioner i antistoffet. [14] antistoffer eller immunoglobuliner, er meget komplekse molekyler med stor variation i deres aminosyresekvens. Den mulige mangfoldighed i immunglobuliner anslås mellem 10
13 og 10
50, og derfor konstateringen af tilsvarende eller endda identiske sekvenser i forskellige individer tilfældigt er i teorien, højst usandsynligt. [14], [15] Dog undersøgelser af forskellige forskningsgrupper har for nylig vist, at på trods af denne teoretiske lille chance for at have identiske antistoffer mellem individer, er det muligt at identificere lignende eller identiske sekvenser [16] – [19]. En undersøgelse udført af os viste, at i PNS (paraneoplastisk neurologisk syndrom) patienter identiske muterede primære aminosyresekvenser af komplementaritetsbestemmende regioner (CDR’er) findes. Disse CDR er specifikke for kendte onconeural antigener, såsom HUD og Yo i PNS patienter, og mest interessant var delt mellem forskellige PNS patienter [20].
Formålet med denne undersøgelse er at finde beviser for, at specifikke antistof peptider deles mellem patienter med lungecancer i modsætning til lunge cancer-fri individer. Som lungekræft er en heterogen sygdom og med variabiliteten af et antistof kan være det en udfordring at detektere identiske tumorrelaterede antistoffer i serum. Vi tester eksperimentelt den hypotese, at specifikke yderst variable regioner af et antistof, herunder komplementaritetsbestemmende regioner (CDR’er) kan deles mellem patienter med lungecancer. Vores eksperimenterende tilgang til at kontrollere denne hypotese er baseret på sekventering antistof peptider ved massespektrometri. Måling af serum ved et massespektrometer kan være for kompleks på grund af den høje variabilitet som nævnt ovenfor. Rensende IgG Fab fra serum vil reducere kompleksiteten af prøven fra en lungekræft patient og vil give mulighed for at fokusere på rene antistof fraktioner.
Materialer og metoder
Etik og juridisk godkendelse
NELSON forsøget blev godkendt af det hollandske sundhedsråd, sundhedsministeren og det lægelige etiske udvalg i alle deltagende centre (klinisk forsøg nummer ISRCTN63545820). Alle deltagere til denne undersøgelse forudsat skriftligt informeret samtykke til brug af deres serumprøver. Donoren af henvisningen prøve anvendes i hele denne undersøgelse forudsat skriftligt samtykke til brug af hans /hendes serum til videnskabelige formål i henhold til de retningslinjer fra Blodbank Sanquin, Rotterdam, Holland.
NELSON Trial
NELSON (hollandsk-belgiske Lung Cancer Screening forsøg) retssag er begyndt rekruttering i 2003 ved at sende spørgeskemaer til 548,489 mænd og kvinder mellem 50-75 år. Deltagerne skulle være nuværende eller tidligere rygere i mindst 25 år, rygning mindst 15 cigaretter om dagen eller rygning i mindst 30 år, ryger mindst 10 cigaretter om dagen. Fra 548,489 mænd og kvinder blev 15.822 deltagere inkluderet i forsøget. Disse deltagere blev randomiseret til en skærm eller kontrol arm. Screeningen arm fik CT screening i år 1,2 og 4. Kontrollen arm fik ingen screening (sædvanlig behandling). Deltagere med en positiv test resultat blev henvist til en pulmonologist. Hvis diagnosen lungekræft blev etableret patienten blev behandlet og gik ud screening. Deltagere med en ubestemt testresultat undergik en opfølgende scanning tre måneder senere. Hvis en negativ test resultat blev opnået den anden runde CT-scanning var planlagt til 12 måneder senere [5], [21].
Undersøgelse Befolkning
For denne undersøgelse valgte vi 44 lungekræft cases og 49 kontroller (Supplerende figur S1) fra NELSON lungekræft screening forsøg. [5], [21] i tilfælde af opdagelsen sæt, NELSON 1, kun tidlig fase (i og II) skællede celle (n = 4) eller adenocarcinomer (n = 21) blev udvalgt. De blev omhyggeligt matches til den kontrol, som alder, køn, rygning status, varighed og antal cigaretter røget per dag, kronisk obstruktiv lungesygdom (KOL) status, asbest og sted for blodprøvetagning (Supplerende tabel S1). Udvælgelseskriterierne for de tilfælde af den NELSON 2 (validering) indstillet (n = 19) var ens, bortset fra at alle ikke-småcellet histologi-og stadier sygdom fik lov (Supplerende tabel S1) for at udfordre resultaterne af opdagelsen fase . På formål de kliniske karakteristika af kontrol patienter er forskellige med NELSON 1 sæt med hensyn til rygning og KOL. Derfor er denne NELSON 2 sæt ikke matchet med sættet NELSON en. Ved hjælp af en validering prøvesæt (NELSON 2) valgt på denne måde, kan bestemmes robusthed af metoden.
Serumprøver blev indsamlet til både NELSON 1 og NELSON 2 opnået fra baseline CT screening (første runde) .
IgG Fab rensning og nanoLC Orbitrap MS Analyser
Før alle procedurer for prøveforberedelse, blev alle prøver blindet og nøglen til afblinding blev stillet til databasen koordinator for NELSON forsøget. IgG Fab rensning og nano-LC Orbitrap MS analyser blev udført i overensstemmelse med den beskrevne før metode. [22] For en mere uddybende beskrivelse henvises til supplerende metoder S1. Kort fortalt blev IgG isoleret fra serum og fordøjet i Fab og Fc (figur 1). Fab del blev isoleret fra det fordøjede blanding ved SDS-PAGE. Fab indeholdende gel bånd blev udskåret og tryptiske fordøjet. Et blankt stykke gel, der ikke var fyldt med protein blev skåret ud og behandlet som de udskårne Fab båndene til baggrund vurdering.
I denne flow-kortlægge de forskellige trin i Fab rensning, Fab måling og analyse af data er illustreret. I gul vises Fab rensning, i blåt den massespektrometri måling i grøn dataanalyse og i pink den statistiske analyse.
LCMS-målinger blev udført på en Ultimate 3000 nano LC-system (Thermo Fisher Videnskabelig /Dionex, Amsterdam, Holland) online koblet til en hybrid lineær ion trap /Orbitrap MS (LTQ Orbitrap XL, Thermo Fisher Scientific, Bremen, Tyskland). 4 pi af det fordøjede Fab blev fyldt på systemet. For yderligere indstillinger og løsninger henvises til supplerende metoder S1 og tidligere offentliggjorte arbejde. [22] Alle prøver blev randomiseret før måling og blev målt i partier af 11 prøver, herunder en reference prøve. En referenceprøve blev anvendt som en kvalitetskontrol for hver måling og analyse trin. En blindprøve blev kørt i starten og slutningen af målingen til at bestemme baggrunden og eksistensen af fremførsel under kromatografi.
Data Analyser
Rå datafiler blev indlæst i softwaren Progenesis ( figur 1) (Version 3.1;. Nonlineair Dynamics Ltd, New Castle, UK) og processer som beskrevet tidligere [22] Desuden har vi udført en Progenesis analyse, hvor i stedet for at opdage funktioner (peptid masse (m /z)) i alle prøver på samme tid ved programmet blev funktionen detektion udføres individuelt per prøve. Features plukket derved blev matchet til Progenesis resultat tabel, der indeholder alle prøver med en masse tolerance på 5 ppm. Det var en fordel, da funktioner opstår ofte med lave intensiteter i én prøve og efterfølgende matches af Progenesis i alle andre prøver. Dette resulterer i fejl relateret til baggrunden, hvis man tager de respektive massespektre i betragtning. Med denne relative lille justering den sikrer, at en funktion detekteres mere præcist hele prøverne. De data, der er erhvervet af denne fremgangsmåde blev filtreret med indstillingerne samme standardindstillinger. [22] En separat data matrix for hvert enkelt tilfælde og kontrol blev genereret bestående af alle funktioner med tilsvarende rå overflod og opholdstid. For at generere en stor data matrix, der omfatter alle sager og kontroller af disse separate data-matricer, vi søgte masser fra de separate datamatricer pr sag eller kontrol i det komplette data matrix genereret fra standard Progenesis analyser. Hver masse skulle opfylde tre kriterier: 1) m /z (± 5 ppm), 2) retentionstid (± 1 min) og 3) identisk ladning. Hvis en masse mødte disse tre kriterier den rå overflod fra den komplette matrix (genereret af en generel procedure [22] anbefalet af producenten) blev anvendt. Hvis en masse ikke opfyldte disse kriterier et nul blev genereret for den rå overflod.
MS /MS-spektre blev udvundet fra rå datafiler og omdannet til Mascot kompatible filer ved hjælp af ekstrakt-msn (en del af Xcalibur version 2.0. 7, Thermo Fisher Scientific Inc.). Mascot (version 2.3.01; Matrix Science Inc., London, UK) blev anvendt til at udføre databasesøgninger mod det humane delmængde NCBInr database (version marts 11
th, 2009; Homo sapiens arter begrænsning; 222,066 sekvenser) af den ekstraherede MS /MS-data (Figur 1). Database (NCBInr) afhængig peptid identifikation og
de novo
sekventering resultater (software PEAKS, Version 5.2, Bioinformatik Solutions Inc., Waterloo, Canada) blev også inkluderet i Progenesis forudsat matrix. For indstillinger, der anvendes til databasesøgning og
de novo
sekventering henviser vi til tidligere offentliggjorte arbejde og metoder S1. [22] For
de novo
sekvenser hidtil ikke kendt fra en database, toppene software identificerer en leucin for isobarisk aminosyrer leucin og isoleucin. Databaseafhængige peptididentifikation resultater eller
de novo
sekventeringsresultaterne blev inkluderet i matrixen baseret på det højeste peptid identitet score (Data S1, Data S2 og Data S3). Alle peptidsekvenser fra de tilfælde og kontroller identificeret af Mascot eller PEAKS blev efterfølgende justeret til databaser, der indeholder V, D, J eller C-region germliniesekvenser afledt IMGT database (IMGT, den internationale Immunogenetics informationssystem http: //www.imgt. org) under anvendelse af BLAST algoritmen (figur 1). [23] Peptider med tilstrækkelig match (bitscore ≥12.5 og alignmentscore ≥70%) til V-region database blev tildelt en position på immunoglobulinmolekyle med varierende CDR længder (data S1, data S2 og data S3).
rådatafiler af referenceprøver af hvert datasæt blev separat indlæst i softwaren Progenesis og fulgt standardprocedurer som nævnt ovenfor. For at bestemme andelen af variation mellem referenceprøven målinger foretaget på forskellige tidspunkter blev median r kvadraters beregnet for hver prøve. Hver prøve blev sammenlignet med alle de andre referenceprøver målt i datasættet og en median r-square blev beregnet for hver prøve. Sammenligningen var baseret på den rå overflod af hver funktion. Dette blev udført separat for de to uafhængige datasæt, Nelson 1 og NELSON 2 (tabel S2a og S2b).
For at bestemme andelen af variation (figur 1) mellem prøverne (tilfælde og kontroller) af de to separate datasæt blev de samme beregninger udført som beskrevet ovenfor for hver prøve tilfælde og kontrol. Denne analyse blev udført separat for de to datasæt (tabel S2C og S2d). Baseret på fordelingen af den mediane R-firkanter af hver prøve, besluttede vi at sætte en cut-off på r-square 0,70. De sager og kontroller, der opnåede en median r-pladsen nedenfor 0,70 blev udelukket fra datasættet og yderligere analyser. Beregninger blev udført ved hjælp af Microsoft Excel 2007.
Statistisk Analyse
To uafhængige datasæt er blevet brugt, NELSON 1 og NELSON 2. Det første skridt i den statistiske analyse bestod af test for normalitet hjælp skævhed og kurtosis fordelingsegenskaber af intensiteten af den rå overflod af funktionerne [24].
Efterfølgende udførtes univariat analyse under anvendelse enten af en uparret t-test (parametrisk) eller en Mann-Whitney U-test ( ikke-parametrisk) til at detektere signifikante forskelle i rå overflod mellem tilfælde og kontroller i sættet NELSON en. [25] grænseværdien signifikans blev sat til 0,05 (to-sidet). Alle identificerede funktioner, der blev fundet signifikant forskellige, blev anvendt til udvælgelse af funktioner til at skelne lungekræftpatienter fra kontroller.
For det andet, vi brugte til multivariat analyse kun de betydeligt identificerede funktioner, der havde ≥2 udløste MS spektre. Vi anvendte en multivariat analyse af funktioner, der opfylder disse kriterier med en (logistisk) trinvis regressionsmodel (y = a
1 × 1 + a
2 × 2 + a
3 × 3 … .a
nx
n + c) i kombination med kanonisk lineær diskriminant analyse (tabel S3a). [26], [27] Dette resulterede i en kombination af funktioner med høj følsomhed og specificitet i NELSON 1 datasæt. Denne kombination af funktioner, blev derefter testet i NELSON to datasæt ved hjælp af samme metode som beskrevet ovenfor. [26], [27] Bemærk, at for at NELSON 2 datasæt var det nødvendigt at optimere koefficienterne i modellen ligningen for (tabel S3b ) for at optimere følsomhed og specificitet i NELSON to datasæt.
for at undgå en tilfældig-fejl effekt i modellering, vi verificeret den statistiske baggrund af kombinationen af funktioner i et permuteret datasæt. evaluering Baggrunden bestod af den samme arbejdsgang som anvendes til model bygning, bortset fra, at i begyndelsen fordeling af sager og kontrol af NELSON 1 blev permuteret (figur S2). Denne permutation blev udført tolv gange, og de opnåede resultater blev testet for signifikans mod modellen resultatet af z-test (ensidet; p 0,05). Da modelbygning var baseret på de data, som fastsat i NELSON 1, hvorefter validering af denne model blev gjort ved hjælp af data i NELSON 2, blev den samme tilgang efter hver enkelt permutation. Også her bemærke, at for NELSON 2 datasæt koefficienterne i modellen ligningen blev optimeret.
Alle analyser af model bygning, validering og baggrund evaluering blev udført ved hjælp af STATA, version 12 (StataCorp, Texas, USA). Hele undersøgelsen, under anvendelse tosidet test (undtagen for én-sidet test for Z-værdier), blev p-værdier på henholdsvis 0,05 eller lavere betragtes som statistisk signifikant. Statistiske analyser af dataene vist i tabel S1 blev genereret ved SPSS (IBM SPSS Statistics 20). Tiden til kræft blev genereret ved at beregne intervallet mellem blodprøvetagning og diagnose for hvert enkelt tilfælde.
Resultater
kliniske karakteristika af den undersøgte population
Der var ingen signifikant forskel i de kliniske karakteristika mellem de tilfælde og kontrol i NELSON 1 sæt (tabel S1). I NELSON 2 sæt, nuværende eller tidligere ryger og KOL status afveg betydeligt mellem cases og kontroller (tabel S1). I 72% og 84% af tilfældene af sættet NELSON 1, og NELSON 2 sæt henholdsvis tidsintervallet mellem blodprøvetagning og lungekræft diagnose var mellem 0-1,5 år. Den mediane follow-up periode efter blodprøvetagning var til kontrol befolkning 1925 dage (interval 1075-2086 dage) og 1861 dage (interval 347-2135) i NELSON 1 sæt og NELSON 2 sæt, hhv. Ingen af kontrollerne udviklede lungekræft i follow-up perioden.
Teknisk Variation
I de massespektrometri målinger af biologiske prøver vi målte en reference prøve på forskellige tidspunkter. R-square-værdier blev beregnet ud fra mængderne af identificerede proteiner i hver referencemåling for at vise den tekniske reproducerbarhed. Den laveste R-square værdi observeret i de forskellige målinger lå mellem 0,84 og 0,93 (figur 2).
Reference prøve målt på forskellige tidspunkter under måling af NELSON en prøve sæt. En gengivelse af referenceprøven (x-aksen) blev sammenlignet med hinanden replikere prøve baseret på den rå overflod af hver enkelt funktion. En r-firkantet blev beregnet. Hver prik repræsenterer en r-square (y-aksen) værdi til sammenligning af den specifikke replikat med en anden gentagelse. For hver kopiere den gennemsnitlige r-pladsen og standardafvigelsen (SD) er vist.
Vi udførte den samme r-firkantet beregning for 5 tilfældige biologiske prøver taget fra den indstillede NELSON 1, der blev målt på to forskellige LC-kolonner (samme batch) på forskellige tidspunkter. Den tekniske reproducerbarhed inden for hver søjle resulterede i laveste R-square værdier fra 0.75-0.93, men den tekniske reproducerbarhed af de fem biologiske prøver målt på to uafhængige lignende kolonner var lavere. For de to uafhængige lignende kolonner blev observeret en median r-kvadrat 0,52. I figur 3 vises sammenhængen mellem hver prøve og mellem søjler er vist.
Denne dendrogram viser sammenhængen mellem fem forskellige biologiske prøver målt på to forskellige kolonner fra samme parti, kolonne 1 og kolonne 2 (y-aksen). På Y-aksen er vist de fem forskellige prøver. Prøve 1-5 måles på kolonne 1 og 6-10 måles på kolonne 2. Prøve 1 og 6 er fra samme individ. Dette gælder også for prøve 2 og 7, 3 og 8, 4 og 9 og 5 og 10. På x-aksen den euklidiske afstand mellem hver prøve er vist. En stærk korrelation per kolonne findes
I figur 4A retentionstiderne er vist for peptider identificeret med høj tillid (Mascot score 60). I Referenceprøver målt samtidigt med både NELSON 1 og NELSON 2. Denne figur viser, at kolonne præstation var sammenlignelig mellem de to forskellige LC kolonner for disse rigelige peptider (R-square 0,996). Derudover var de observerede for disse peptid også korrelerede godt mængderne (figur 4B; r-square 0,995). Dette antyder, at både chromatografi og massespektrometri udføres nominelt, i det mindste for peptider identificeret med stor sikkerhed ved relativt høj overflod. Således tekniske variation vi ser stammer primært fra peptider på lavere mængderne, tættere på detektionsgrænserne (Figur S3).
For reference prøver, der blev målt under både NELSON 1 og NELSON 2, vi sammenlignet peptider, der var identificeret med høj tillid ved en Mascot søgning med en score på mere end 60 i begge sæt. Til denne undergruppe af peptider, sammenlignede vi retentionstider observeret i Nelson 1 og Nelson 2 (A) og også deres overflod (B). For disse parametre observerede vi r-square værdier af 0,996 og 0,995 henholdsvis.
En estimering af biologisk variation blev udført og resulterede i en median r-pladsen på 0,43. Dette resultat var meget lavere end den laveste R-square (0,84) observeret for den tekniske variation. , Den biologiske variation er derfor højere i forhold til den tekniske variation.
Disse resultater viser, at der bør tages tekniske variation i betragtning og der er behov for justering for sammenligning af uafhængigt målte prøvesæt siden NELSON 1 og NELSON 2 datasæt var målt på to forskellige kolonner på forskellige tidspunkter. For at overvinde denne teknisk variation, vi anvendt en række filtre på data, før vi kunne starte en data-analyse som beskrevet i vejviseren Materiel og amp; Metoder sektion.
Med disse data udførte vi separat univariat analyse på alle peptider findes i tilfælde og kontroller fra den separate NELSON 1 og NELSON to datasæt. Vi var i stand til at observere 49 peptider, der var signifikant forskellig mellem cases og kontrol i NELSON 1 datasæt. Men disse peptider, med en enkelt undtagelse, viste ikke denne forskel i NELSON 2 datasæt. Der var ingen tendens (r-pladsen 0,004) i p-værdier for de to datasæt. Derfor tester univariately på denne måde var enten ikke den rigtige analyse strategi eller processen genereres tilfældigt udvalgte funktioner (chance). Derfor blev de betydelige peptider fra NELSON en analyseres som et næste skridt i en multivariat måde.
Antistof Peptide Model
En optimal kombination af 12 peptider blev identificeret ved de multivariat statistik bruges på NELSON 1 sæt (discovery sæt). Denne kombination af peptider kunne skelne lungekræftpatienter fra kontrol med følsomhed og specificitet på 96% og 100%, hhv. Dette antistof peptid model var i stand til at detektere lungecancer 373 dage i gennemsnit (interval 39-1193 dage) før diagnosen blev bestemt. I figur 5 viser vi, at kombinationen af de 12 peptider var i stand til at skelne sager fra kontroller. De 12 peptider svarede til 1-sekvensen overlapper med CDR2-regionen, 1-sekvensen overlappende CDR3 region, 7 sekvenser, der overlapper den ramme 1-regionen og 3 sekvenser, der overlapper med den ramme 3 region ifølge IMGT databasen (tabel 1).
de rå forekomster er udfyldt i modellen ligning (y = a
1 × 1 + a
2 × 2 + a
3 × 3 … .a
nx
n + c ) af det relevante prøvesæt. På y-aksen (i arbitrære enheder) er vist de tal, der genereres af ligningen.
Vi udførte en ekstern validering i NELSON 2 (validering) sæt. Når vi anvendte samme 12 peptid model til dette sæt, kan sager og kontroller ikke længere skelnes. Men med de samme peptider men efter re-optimering af modellen koefficienter, observerede vi en sensitivitet og specificitet på 84% og 90%, hhv. Da koefficienterne i ligningen er tilpasset havde vi til at kontrollere for chancen for overfitting af data. Derfor blev en evaluering baggrund udførte som vil blive beskrevet senere. Inden for NELSON 2 valideringssættet kombinationen af peptider var i stand til at detektere lungecancer 281 dage i gennemsnit (interval 54-777 dage) før diagnosen lungekræft.
Vi sammenlignede den rå overflod af de 12 peptider mellem de to NELSON datasæt. Vi observerede, at den gennemsnitlige rå overflod af fem peptider var højere i de tilfælde i forhold til den gennemsnitlige overflod af kontrollerne fra NELSON 1 datasæt. Disse data var i overensstemmelse med resultaterne fra NELSON 2 datasæt (tabel S4). De andre syv peptider havde en højere gennemsnitlig rå overflod i kontrollen af NELSON 1 datasæt sammenlignet med overflod i tilfælde af dette datasæt. Kun én af disse syv peptider, kunne denne forskel blive bekræftet i NELSON 2 datasæt (tabel S4).
Baggrund Evaluering af antistof peptid Model
Ud over konstateringen af den optimale kombination af peptider, som i væsentlig grad adskiller sager fra kontroller, blev udført en baggrundsanalyse. Da koefficienterne i ligningen af modellen blev justeret for hvert datasæt vi verificeret resultaterne for et bidrag på tilfældig udvælgelse af data og dermed chancen for at finde en sammenlignelig model ved en tilfældighed. Det samme arbejdsgang blev anvendt for modellen bygningen, bortset fra at i begyndelsen af arbejdsprocessen tilfældene og kontrol af NELSON 1 blev permuteret tilfældigt (figur S2). Discovery blev udført i de 12 gange permuterede NELSON 1 datasæt, hver gang med 12 forskellige peptider viser den laveste p-værdi (p 0,05) i NELSON 1 sæt for den pågældende permutation. Validering af disse modeller blev udført i NELSON 2. Udførelsen af multivariate model af de permuterede opdagelse sæt (NELSON 1) er vist i figur 6A (blå prikker), hvor følsomheden er afsat mod specificiteten. Den tilsvarende effekt i validerings- sæt (NELSON 2) er vist i figur 6B (blå prikker). Således hvert punkt i figur 6A (blå prik) svarer med et punkt (blå prik) i figur 6B. Også, udførelsen fundet til de faktiske datasæt, hvor antistoffet peptid model blev fundet plottes (rød prik). Det kan bemærkes, at den multivariate montering fra permuterede datasæt producerer fornuftige modeller selv for permuteret data i opdagelsen sættet.
Tolv gange en permutation (Baggrund) blev udført på NELSON 1 og NELSON 2 datasæt. Følsomheden og specificiteten af antistoffet peptid model er vist med rødt. vurdering Baggrund: A) Tolv permutation kørsler er vist med den tilsvarende følsomhed og specificitet NELSON 1 datasæt (blå). De samme 12 peptider fundet i baggrunden evaluering af NELSON 1 blev testet i NELSON 2. B) De 12 kørsler er vist med den tilsvarende følsomhed og specificitet NELSON 2 datasæt (blå). Bemærk, da nogle af resultaterne af baggrunden analyse forekom mere end én gang, et tilfældigt tal mellem -1 og 1, blev tilsat til hver følsomhed og specificitet nummer for at sikre hver analyse (blå prik) kan ses i figuren.
Men netop i validerings- datasæt, den reelle data (antistof peptid model) udføres signifikant bedre (p 0,05) end de permuterede datasæt, hvilket antyder, at de immunoglobulin-peptider harbor information relateret til sygdomstilstanden af patienten. Således behøver de resultater, vi opnåede ikke stammer fra et artefakt i databehandlingen.
CT Screening Resultat i NELSON 1 og NELSON 2 Datasæt
I figur 7A og 7B screeningsresultaterne af baseline CT-scanninger er vist for NELSON 1 og NELSON 2 sæt, hhv. Ifølge screeningen protokollen af NELSON forsøget blev en gentagelse CT-scanning udført efter en ubestemt screening resultat, ca 3 måneder senere.
CT scanning resultater af A) NELSON 1 og B) NELSON 2 prøvesæt er vist på tidspunktet for blodprøvetagning (grundlinje). Desuden er CT resultater vist for opfølgningen CT-scanning efter ca. tre måneder (Opfølgning). For et tilfælde fra NELSON 1 sæt var tilgængelig ingen Opfølgning CT-scanning resultat. Den sidste række repræsenterer antallet af positive, ubestemte og negative CT scanning resultater af baseline herunder opfølgende resultater.
Vi observerede, at 68% af tilfældene haft en positiv screening resultat i både NELSON 1 og NELSON 2 sæt i de første 3 måneder af screeningsprogrammet, blev de andre lungekræft diagnosticeret efter en anden gentagelse CT-scanning efter 3 måneder eller under den anden screeningsrunde. Efter i gennemsnit 367 dage (interval 39-1193 dage) for NELSON 1 og 269 dage (interval 54-777 dage) for NELSON 2, screeningen resultatet var positivt, dvs. mistanke for lungekræft og resulterer i klinisk oparbejdning af pulmonologist
Leave a Reply
Du skal være logget ind for at skrive en kommentar.