Abstrakt
Målsætning
Formålet med denne undersøgelse var at evaluere resultaterne af akut Fysiologi og kronisk Health Evaluation II (APACHE II), forenklet Akut Fysiologi Score 3 (SAPS 3), og akut Fysiologi og kronisk Health Evaluation IV (APACHE IV) hos patienter med cancer indlagt på intensiv afdeling (ICU) i en enkelt medicinsk center i Kina.
Materialer og metoder
Dette er et retrospektivt observationskohortestudie herunder ni hundrede og firs en konsekutive patienter over en 2-årig periode.
Resultater
hospitalet dødelighed var 4,5%. Når alle 981 patienter blev vurderet, området under modtageren opererer karakteristisk kurve (AUROC, 95% Fortroligt intervaller) af de tre modeller til at forudsige hospital dødelighed var 0,948 (0,914-0,982), 0,863 (0,804-0,923), og 0,873 (0,813 -0,934) for SAPS 3, APACHE II og APACHE IV hhv. De p-værdier i Hosmer-Lemeshow statistik for modellerne var 0,759, 0,900 og 0,878 for SAPS 3, APACHE II og APACHE IV hhv. Men SAPS 3 og APACHE IV undervurderet i-hospitalet dødelighed med standardiserede dødelighed ratio (SMR) på 1,5 og 1,17 henholdsvis mens APACHE II overvurderet i-hospitalet dødelighed med SMR på 0,72. Yderligere analyse viste, at magten diskrimination var bedre med SAPS 3 end med APACHE II og APACHE IV, om for akut kirurgisk og medicinske patienter (AUROC af 0,912 vs 0,866 og 0,857), eller for planlagte kirurgiske patienter (AUROC af 0,945 vs 0,834 og 0,851). Kalibrering var godt for alle modeller (alle p 0,05), om for planlagte kirurgiske patienter eller akutte kirurgiske og medicinske patienter. Men med hensyn til SMR, SAPS 3 var både præcis at forudsige in-hospital mortalitet for akut kirurgisk og medicinske patienter og for planlagte kirurgiske patienter, mens APACHE IV og APACHE II ikke var.
Konklusion
i denne kohorte, fandt vi, at APACHE II, APACHE IV og SAPS-3 modeller havde god diskrimination og kalibrering evne til at forudsige in-hospital mortalitet af kritisk syge patienter med kræft i behov for intensiv pleje. Af disse tre alvorlighed scoringer, SAPS 3 var bedre APACHE II og APACHE IV, uanset om det skyldes diskrimination og kalibrering magt, eller standardiserede dødelighed nøgletal
Henvisning:. Xing X, Gao Y, Wang H, Huang C Qu S, Zhang H, et al. (2015) Udførelse af tre Prognostiske Modeller i patienter med kræft i Need for Intensiv i en Medical Center i Kina. PLoS ONE 10 (6): e0131329. doi: 10,1371 /journal.pone.0131329
Redaktør: Olga Y. Gorlova, Geisel School of Medicine ved Dartmouth College, UNITED STATES
Modtaget: December 30, 2014, Accepteret: 1 jun 2015; Udgivet: 25 juni 2015
Copyright: © 2015 Xing et al. Dette er en åben adgang artiklen distribueres under betingelserne i Creative Commons Attribution License, som tillader ubegrænset brug, distribution og reproduktion i ethvert medie, forudsat den oprindelige forfatter og kilde krediteres
Data Tilgængelighed: Alle relevante data er inden for papir og dens Støtte Information filer
Finansiering:. undersøgelsen blev finansieret af Beijing Hope Run særlig fond (LC2011B38) (https://www.cfchina.org.cn/list.php?catid= 301)
konkurrerende interesser:.. forfatterne har erklæret, at der ikke findes konkurrerende interesser
Introduktion
de generelle sværhedsgrad-of-sygdom pointsystemer blev indført i forbindelse med intensivbehandling medicin i 1981 [1]. Siden da har adskillige sværhedsgrad-of-sygdom scores blevet udviklet til at vurdere kritisk syge patienter. I løbet af de sidste få år, har tre nye generelle prognose modeller blevet udviklet og udgivet: Forenklet Akut Fysiologi Score 3 (SAPS 3) [2], Akut Fysiologi og kronisk Health Evaluation IV (APACHE IV) [3] og Dødelighed Sandsynlighed Model III (MPM III) [4]. Undersøgelser har dog vist, at alle tre modeller er gode til at præsentere diskrimination, men med dårlig kalibrering [5-6]. På den anden side, er akut fysiologisk og kronisk helbredsevaluering II (APACHE II) score stadig bruges i intensivafdelinger ‘prognose af kritisk syge patienter [7].
Cancerpatienter repræsenterer 13-15% af patienterne indlagt på intensivafdelinger [8-9]. Groeger et al udviklet kræft dødelighed model i 1998 [10]. Imidlertid er denne særlige score model ikke almindeligt anvendt, da det ikke har vist sig at være bedre end andre modeller [11]. I de senere år har enkelt- og multi-center undersøgelser viste, at SAPS 3 model er mere præcis i prognosen for kræftpatienter med behov for intensiv pleje [11-12]. Men validering af SAPS 3 model blev kun foretaget blandt kritisk syge kræftpatienter i brasilianske intensivafdelinger.
Derfor er formålet med denne undersøgelse er at vurdere resultaterne af de tre prognostiske modeller (APACHE II, APACHE IV og SAPS 3) i kritisk syge kræftpatienter i Kina.
Materialer og metoder
Denne retrospektive undersøgelse blev gennemført i intensivafdelingen Institut for Cancer Hospital på det kinesiske Academy of Medical Sciences og Peking Union Medical College. Den Cancer Hospital er den højest rangerende hospital med speciale i kræft i Kina og dens ICU er en 10-sengs center til pleje af kritisk syge patienter. Hospitalets Institutional Review Board godkendte undersøgelsen og patienternes informerede samtykke blev givet afkald på grund af den observerende karakter af denne undersøgelse. Patientjournaler /oplysning blev anonymiseret og de-identificeret før analyse.
Patienterne undersøgelsen involveret, der er optaget til ICU fra oktober 2008 til og september 2010, men udelukkede dem under 18 år eller med et ophold på intensivafdelingen på mindre end 24 timer. Kliniske og laboratorium variabler af hver patient blev prospektivt indsamlet af seks intensivists (X. Xing, H. Wang, S. Qu, C. Huang, H. Zhang og H. Wang). Data, der anses for beregningen af SAPS tre blev indsamlet og registreret inden for 1 time af ICU optagelse, og forventede dødelighed blev beregnet som anbefalet [2]. APACHE II og APACHE IV scoringer blev beregnet ved hjælp af data i løbet af de første 24 timer af indlæggelse og forudsagte dødelighed blev beregnet efter litteraturen [1,3]. Patienterne blev klassificeret baseret på den grund af ICU optagelse, dvs. medicinsk, planlagt kirurgi og akut kirurgi. Hospitalet dødeligheden var den vigtigste slutpunktet.
Etik Statement
Institutional Review Board (IRB) på Cancer Hospital, Chinese Academy of Medical Sciences (ref. 11-75 /510) godkendt denne undersøgelse protokol. Informeret samtykke fra patienter blev givet afkald på grund af den observerende karakter af denne undersøgelse. Undersøgelsen blev udført i overensstemmelse med de etiske standarder, der er fastsat i 1964-erklæringen af Helsinki og senere ændringer. Patientjournaler /oplysning blev anonymiseret og de-identificeret før analyse.
Statistisk analyse
Data blev indgået en database af en enkelt forfatter (X. Xing). Statistiske analyser blev udført ved hjælp af SPSS software til Windows, version, 16,0 (SPSS Inc., Chicago, IL, USA). Kontinuerlige variabler blev præsenteret som gennemsnit ± standardafvigelse eller median (25-75% interkvartile område) og sammenlignet henholdsvis ved hjælp af t-test. Kategoriske variabler blev rapporteret som absolutte tal (frekvens procenter) og analyseret ved hjælp af χ2 test.
Statistisk analyse blev udført på samme måde som Soares et al [13]. Kort sagt, blev validering af de prognostiske scores udført under anvendelse af standard test for at måle diskrimination og kalibrering for hver af de prædiktive modeller. Arealet under Receiver Operating karakteristik (AUROC) blev anvendt til at evaluere evnen hos hver model til at skelne mellem patienter, som levede fra dem, der døde (diskrimination). Hosmer-Lemeshow goodness-of-fit C statistik blev anvendt til at evaluere aftalen mellem observerede og forventede antal patienter, der gjorde og ikke er døde på hospitalet på tværs af alle de lag af sandsynligheder for død (kalibrering). En høj p-værdi ( 0,05) ville indikere en god pasform til modellen. Kalibreringskurver blev konstrueret ved at plotte forudsagte dødelighed stratificeret med 10% intervaller på risiko dødelighed (x-aksen) mod observerede dødelighed (y-aksen) ved hjælp af Microsoft Excel-software. Standardiserede mortalitetsrater (SMR) med 95% fortrolige interval (CI) blev beregnet for hver model ved at dividere observeret af forudsagte dødelighed. En to-tailed p-værdi 0,05 blev betragtet som statistisk signifikant.
Resultater
Under forsøgsperioden, 1201 patienter blev indlagt på intensivafdelingen. I alt 220 patienter blev udelukket fra analysen på grund af alder under 18 år (n = 3), tilbagetagelse i samme hospital (n = 49) og en ICU ophold på mindre end 24 timer (n = 168). Derfor 981 patienter udgjorde befolkningen i denne undersøgelse. Patienternes egenskaber er vist i tabel 1. SAPS 3 var 36,9 ± 13,2 (spændvidde 16-102), APACHE II var 10,4 ± 5,5 (interval 0-42), og APACHE IV score var 37,7 ± 19,8 (spændvidde 3-160) (S1 data). Patienter i høj grad led af thorax og abdominale neoplasmer (80,1%), og hovedsagelig undergik planlagt operation (92,9%).
resultater evalueringen af de modeller for alle 981 patienter er vist i tabel 2. Diskrimination blev meget godt med AUROC for alle tre modeller i alle 981 patienter. AUROC af SAPS 3 (0,948) var større end dem observeret for APACHE II (0,863) og APACHE IV (0,873) (fig 1). Kalibrering var godt for alle modeller (alle
P
0,05) (Tabel 2 og figur 2A-2C). Ikke desto mindre, SAPS 3 og APACHE IV undervurderet i-hospitalet dødelighed, mens APACHE II overvurderet i-hospitalet dødelighed, og med SMR. 1,0 (tabel 2)
Areal under modtageren opererer karakteristiske kurve var 0,949 ± 0,017 for SAPS 3 (p 0,001, 95% CI: 0,916 til 0,982), 0,863 ± 0,030 for APACHE II (p 0,001, 95% CI: 0,804-0,923) og 0,873 ± 0,031 for APACHE IV (p 0,001, 95% CI: 0,812-0,934). SAPS 3 Forenklet Akut Fysiologi Score 3, APACHE II Akut Fysiologi og kronisk Health Evaluation II, APACHE IV Akut Fysiologi og kronisk Health Evaluation IV, CI fortrolige intervaller.
Kalibrering var godt for alle modeller (alle p 0,05). (A) APACHE II; (B) APACHE IV; (C) SAPS 3.
De opførelser af modellerne blev yderligere analyseret for planlagte kirurgiske patienter og akutte kirurgiske og medicinske patienter hhv. Resultaterne er vist i tabel 3. Igen AUROC af SAPS 3 (0,912) var større end dem observeret for APACHE II (0,866) og APACHE IV (0,857) i nødsituationer kirurgiske og medicinske patienter, og AUROC af SAPS 3 (0,945) blev større end dem, der observeres for APACHE II (0,834) og APACHE IV (0,851) i planlagte kirurgiske patienter. Disse data viste, at magt diskrimination var bedre med SAPS 3 end med APACHE II og APACHE IV uanset om akutte kirurgiske og medicinske patienter eller for planlagte kirurgiske patienter. Kalibrering var godt for alle modeller (alle p 0,05), om for planlagte kirurgiske patienter eller for akut kirurgisk og medicinske patienter. Men med hensyn til SMR, SAPS 3 og APACHE II var korrekte at forudsige in-hospital mortalitet for akutte kirurgiske og medicinske patienter, mens APACHE IV undervurderet i-hospitalet dødelighed. SAPS 3 og APACHE IV var præcis i at forudsige in-hospital mortalitet for planlagte kirurgiske patienter, mens APACHE II overvurderet i-hospitalet dødelighed.
Diskussion
I løbet af undersøgelsen, vi fundet, at APACHE II, APACHE IV og SAPS-3 modeller havde fremragende diskrimination og kalibrering magt. Med hensyn til SMR, SAPS 3 var mere præcist at forudsige in-hospital dødelighed end APACHE II og APACHE IV, uanset om akut kirurgisk og medicinske patienter eller for planlagte kirurgiske patienter.
Så vidt vi ved, er dette den første undersøgelse udforske validering af APACHE II, APACHE IV og SAPS 3 modeller i kræftpatienter i Kina, uanset om de er blevet opereret eller ej. Vi valgte APACHE II til sammenligning med APACHE IV og SAPS 3 modeller, fordi APACHE II er i øjeblikket anvendes i vores ICU og er den mest populære model i Kina [9,14]. Mange Kina intensivafdelinger er tilbageholdende med at implementere APACHE IV og SAPS 3 modeller på grund af den større fortrolighed med APACHE II og manglen på valideringsundersøgelser med APACHE IV og SAPS 3 i Kina. Med indførelsen af den generelle arealbetalingsordning 3 model i 2005 [2] og APACHE IV modellen i 2006 [3], er det blevet foreslået, at de ældre modeller ikke længere skal anvendes, fordi de bliver mere og mere unøjagtige [3]. God diskrimination og kalibrering af SAPS 3, især tilpasset ligning af SAPS 3, er blevet rapporteret hos kritisk syge kræftpatienter i enkelt- og multicenter studier i brasilianske intensivafdelinger [11-12]. Endelig vælger vi APACHE IV, fordi udførelsen af APACHE IV model tilbydes fremragende diskrimination og kalibrering i et stort fælles datasæt [15], men det er endnu ikke blevet valideret hos kræftpatienter i Kina. Vi vælge ikke at CMM model, fordi det overvurderer dødelighed uanset studere elektive kirurgiske patienter eller ej, og tidligere studier har ikke vist forbedring af dødelighed forudsigelse i sammenligning med generelle scores [11].
APACHE II model er stadig udbredt over hele verden, om generelt eller akademisk intensivafdelinger [16-21]. I denne undersøgelse fandt vi, at AUROC af APACHE II er 0,863 i samtlige 981 patienter, hvilket er i overensstemmelse med dem, der rapporteres af de fleste forfattere [16,18-20]. Men det overvurderet på hospitalet dødelighed med SMR på 0,72, selv om dens kalibrering var godt, med en p-værdi på 0,900. Efter at have udelukket planlagte kirurgiske patienter, det var præcis i at forudsige hospitalet dødelighed for akut kirurgisk og medicinske patienter. Kirurgiske patienter havde midlertidig fysiologisk forstyrrelse på grund af virkningerne af anæstesi. Det var derfor ikke overraskende, at brugen af APACHE II score førte til en overvurdering af dødelighed i kirurgiske patienter [22]. Tilpasning eller tilføje nye variable kan forbedre kalibreringen magt. Chang et al inkorporeret metastase og respirationssvigt variabler i APACHE II-modellen og fandt, at AUROC af APACHE II score for medicinske patienter steg fra 0,82 til 0,86 og pasformen af den modificerede model var fremragende i forhold til APACHE II-modellen alene [22 ].
APACHE IV modellen er udviklet ved hjælp af en meget stor database i USA [3] og adskillige valideringsundersøgelser er blevet rapporteret [6,15-16,19]. Ikke overraskende APACHE IV model tilbudt den bedste diskrimination og kalibrering primært i amerikanske intensive patienter [15], men dårlig kalibrering for patienter uden for USA, selv om det viste god diskrimination [16,19]. I vores undersøgelse fandt vi, at AUROC af APACHE IV er 0,873 i samtlige 981 patienter, hvilket er i overensstemmelse med dem, der rapporteres af de fleste forfattere [6,15-16,19]. Men det undervurderede i-hospitalet dødelighed med SMR på 1,17, selv om kalibrering af det var godt med en p-værdi på 0,878. Dens kalibrering magt faldt fra 1,17 til 1,61 for akut kirurgisk og medicinske patienter. Dette var imidlertid ikke tilfældet for planlagte kirurgiske patienter, og kalibreringen evne APACHE IV model for sidstnævnte var 0,97 i forhold til SMR, som viste god kalibrering. Samlet set den nye APACHE IV pointsystemet klarede sig bedre end ældre kolleger af APACHE II som følge af indførelsen af flere prædiktive variabler [6]. I udviklingslandene kan dog byrden af manuel dataindsamling af en masse variabler bliver relevante på grund af mangel på elektronisk kortlægning, som dels kan hindre valg og anvendelse af nye scoring modeller. Som et resultat, hvordan at afbalancere komplekse og brugervenlighed af nye pointsystemer er en udfordring.
Enkelt og multicenter valideringsundersøgelser ledet af Soares et al viste, at SAPS 3 prognostisk model var præcist at forudsige resultater i kritisk syge patienter med kræft med behov for intensiv pleje [11-12]. I deres studier, både diskrimination og kalibrering var gode for ikke-planlagte kirurgiske patienter til CSA (tilpassede ligning for lande fra Central- og Sydamerika) SAPS 3, men ikke for SAPS 3. I vores undersøgelse, valgte vi den generelle arealbetalingsordning 3 for validering som generelle SAPS 3 udviste god kalibrering og beskedne diskrimination i kritisk syge asiatiske patienter [23]. I denne undersøgelse fandt vi, at SAPS 3 havde bedre diskrimination evne end APACHE II og APACHE IV-modeller, og alle modeller havde god kalibrering magt. Med hensyn til SMR, SAPS 3 var mere præcist at forudsige in-hospital dødelighed end APACHE II og APACHE IV, om for akut kirurgisk og medicinske patienter eller for planlagte kirurgiske patienter.
De fleste undersøgelser rapporteret tilsvarende gode diskriminerende evner alle prognostiske modeller, men modstridende resultater vedrørende kalibrering [5-6,15-16,19]. Peek et al fandt, at kalibrering tests var ekstremt følsomme over for stikprøvestørrelsen [24]. I deres undersøgelse, fandt de, at i kalibrerings- prøver, hyppigheden af aftale steg fra 78% (250 observationer) til 86% (750 observationer) og 93% (1000 observationer). Men efter tilpasning, at Hosmer-Lemeshow test accepterede modellen i de fleste tilfælde (99% med en stikprøve på 250, 89% med en stikprøve på 5000). Derfor kan det være hensigtsmæssigt, at lokal tilpasning er obligatorisk at forbedre kalibreringen evne prognostiske modeller.
Sværhedsgraden af sygdom pointsystemer er designet til benchmarking, performance forbedringer, ressourceforbrug, og klinisk beslutningsstøtte [25] . En nylig undersøgelse viste, at fyrre procent af 40933 patienter havde en mortalitet risiko for mindre end 10% og ikke havde en intensiv behandling såsom mekanisk ventilation, noninvasive ventilation, blodprodukt administration, nyreerstatningsbehandling, eller behandling med et vasoaktivt medicin [26 ]. Som ICU er et sted for de mest kritisk syge patienter, har forskningen blevet gjort for at studere bedre andre end sværhedsgraden af sygdom triage beslutninger. En foreløbig undersøgelse viste, at anvendelsen af fremskridt i sundhed informationsteknologi (HIT) kan bidrage til bedre triage beslutninger [27]. Indtil nu har de nuværende resultat forudsigelse modeller i stigende grad fokuseret på benchmarks for ressourceforbrug [28].
Vores undersøgelse har potentielle begrænsninger. For det første var det et enkelt center studie og kun kritisk syge kræftpatienter blev inkluderet. Derfor kan resultatet af denne undersøgelse ikke generaliseres til andre generelle medicinske centre. For det andet, lokal tilpasning kan give en bedre kalibrering, derfor yderligere undersøgelser bør foretages for at vurdere andet niveau tilpasning af alle prognostiske modeller i kritisk syge patienter med cancer. For det tredje var der ingen patienter, der havde leukæmi eller lymfom, og få patienter lidt metastatiske solide tumorer. Derfor er resultatet af denne undersøgelse var den samme som for almindelige kirurgiske ICU undersøgelser [29]. Endelig er den samlede hospital dødelighed var meget lav, selv om vores kohorte omfattede 981 patienter. Dette kan have en indflydelse på udførelsen af alle prognostiske modeller.
Konklusioner
I denne kohorte, fandt vi, at APACHE II, APACHE IV og SAPS-3 modeller havde god diskrimination og kalibrering evne til at forudsige i-hospital mortalitet af kritisk syge patienter med cancer med behov for intensiv behandling. Af disse tre alvorlighed scoringer, SAPS 3 var bedre APACHE II og APACHE IV, uanset om det skyldes diskrimination og kalibrering magt, eller standardiserede dødelighed nøgletal.
Støtte Information
S1 data. En del af rådata fra alle 981 patienter
doi:. 10,1371 /journal.pone.0131329.s001
(RAR)
Leave a Reply
Du skal være logget ind for at skrive en kommentar.