Abstrakt
Målsætning
For at vurdere, om kommercielt sponsorerede undersøgelser er forbundet med højere succesrate end offentligt sponsorerede undersøgelser .
Study design og indstillinger
Vi foretog en systematisk gennemgang af alle træk, offentliggøres og ikke-offentliggjorte fase III-kræft lodtrækningsforsøg (RCT) gennemført af GlaxoSmithKline (GSK) og NCIC Clinical Trials Group (CTG). Vi inkluderede alle fase III kræft RCTs vurderer behandling overlegenhed fra 1980 til 2010. Tre målinger blev vurderet til at bestemme behandling succeser: (1) andelen af statistisk signifikante forsøg favoriserer den eksperimentelle behandling, (2) den andel af de forsøg, hvor nye behandlinger blev anset for overlegen ifølge efterforskerne, og (3) kvantitativ syntese af data for primære resultater, som defineret i hvert forsøg.
Resultater
GSK gennemførte 40 kræft RCTs hidrørende 19,889 patienter og CTG gennemført 77 forsøg indskrive 33,260 patienter. 42% (99% CI 24-60) af resultaterne var statistisk signifikante favorisering eksperimentelle behandlinger i GSK sammenlignet med 25% (99% CI 13-37) i CTG-kohorten (RR = 1,68; p = 0,04). Efterforskere konkluderes, at nye behandlinger var overlegen i forhold til standardbehandlinger i 80% af GSK sammenlignet med 44% af CTG forsøg (RR = 1,81; p 0,001). Meta-analyse af det primære resultat angivet større effekter i GSK forsøg (odds ratio = 0,61 [99% CI 0,47-0,78] sammenlignet med 0,86 [0,74-1,00]; p = 0,003). Men testning for effekten af behandling over tid viste, at behandling succes er blevet sammenlignelige i de sidste ti år.
Konklusioner
Mens den samlede industri sponsorering er forbundet med højere succesrate end offentligt sponsorerede undersøgelser forskellen synes at være forsvundet over tid
Henvisning:. Djulbegovic B, Kumar A, Miladinovic B, Reljic T, Galeb S, Mhaskar A, et al. (2013) Behandling Succes i Cancer: Industri Sammenlignet med offentligt støttede lodtrækningsforsøg. PLoS ONE 8 (3): e58711. doi: 10,1371 /journal.pone.0058711
Redaktør: Christian Gluud, Rigshospitalet, Danmark |
Modtaget: 10. oktober 2012; Accepteret: 5 feb 2013; Udgivet MT: 21. marts, 2013 |
Copyright: © 2013 Djulbegovic et al. Dette er en åben adgang artiklen distribueres under betingelserne i Creative Commons Attribution License, som tillader ubegrænset brug, distribution og reproduktion i ethvert medie, forudsat den oprindelige forfatter og kilde krediteres
Finansiering:. Dette arbejde blev støttet af en National Institutes of Health tilskud (NIH /NCI, 1R01CA140408-01 /02). De finansieringskilder havde ingen rolle i studie design, indsamling og analyse af data, beslutning om at offentliggøre, eller forberedelse af manuskriptet
Konkurrerende interesser:.. Forfatterne har erklæret, at der ikke findes konkurrerende interesser
Introduktion
randomiserede kontrollerede forsøg (RCT) er afgørende for opdagelse af nye terapeutiske indgreb. [1] Forskning i vurdering af nye kræftbehandlinger i RCTs opstår typisk i de kommercielle og offentlige sektor. [2] Hvad enten kommerciel eller offentlig sektor forskningsprogrammer genererer højere nye vellykkede behandlinger er ikke kendt. [2] Tidligere forskning baseret på analyser af offentligt støttede RCTs, viser, at omkring 25-50% af alle nye kræftbehandlinger testet i RCTs har succes. [3] til sammenligning industri-sponsorerede forsøg har været forbundet med succes satser, der er 45-50% højere i forhold til offentligt sponsoreret RCT [4] -. [7] Men tilsyneladende højere succesrate i industri-sponsorerede forsøg kunne afspejle bias (såsom valg af komparator) eller artefakt af indberetning (publikationsbias) [6]. Dette skyldes, at ingen undersøgelse til dato tog hensyn til korrekt vurdering af både nævneren repræsenterer det samlede antal af alle forsøg, der gennemføres af kommercielle og offentlige finansieringskilder og tælleren, som henviser til antallet af “succesrige” resultater begunstige den nye behandling i henhold til den primære resultat, der tjener som grundlag for forsøgsdesign. [8], [9] desuden vanskeligheder til præcist at vurdere sammenslutning af sponsorater og resultater er også på grund af mangel på de undersøgelser, der fokuserer på terapeutiske fremskridt på et område (fx kræft ) og lignende periode med forskning udvikling i industri og offentligt støttede undersøgelser.
i 2004 bilægge en lov-suit med staten New York, medicinalfirmaet GlaxoSmithKline (GSK), at der indførtes en omfattende online kliniske forsøg registreringsdatabasen gør resultater fra alle forsøg, der blev offentliggjort eller ikke-offentliggjorte, offentligt tilgængelige. [10] Dette gav systematisk undersøgelse af mønstret for behandling succes i industrien sponsoreret forsøg i forhold til offentligt sponsoreret RCT. I dette papir, vi sammenligner antallet af terapeutiske succes eksperimentel versus standardbehandling i RCTs involverer kræftpatienter, der blev udført af NCIC Clinical Trials Group (CTG [tidligere National Cancer Institute of Canada Clinical Trials Group] for yderligere oplysninger om CTG se Supplerende materiale), en akademisk kræft kliniske forsøg kooperativ gruppe, der udfører nationale og internationale rcts til de af GSK, den næststørste, privat finansieret farmaceutisk virksomhed.
Metoder
vurderingen af behandlingen succes industrien sponsoreret sammenlignet med offentligt sponsoreret fase III kræft RCTs blev udført i overensstemmelse med de metoder, anvendt med succes i tidligere undersøgelser [3], [11] -. [13]
kriterier
Alt i træk, offentliggjort og upubliceret, fase III kræft RCTs vurdering overlegenhed ene behandling frem for en anden foretaget af GSK eller CTG og afsluttet i juni 2010, var berettiget til inklusion. Da vores primære interesse var at vurdere andelen af RCTs hvor eksperimentelle behandlingsformer var overlegne eksisterende behandlinger, vi udelukket fra vores analyse forsøg, der var blevet designet til at vurdere ækvivalens eller noninferioritet snarere end overlegenhed. Alle RCTs fra begge kohorter dække rammer udviklingen forskning i samme periode (1980-2010).
datakilder og udvælgelse undersøgelse
En omfattende liste over alle fase III RCTs sammen med tilhørende protokoller og offentliggørelse citater blev opnået fra CTG. For GSK, en detaljeret liste over alle fase III RCTs i kræft blev skabt gennem en bred søgning af GSK kliniske forsøg registreringsdatabasen rådighed på worldwide web. [14] Alle forsøgsprotokoller fra GSK og CTG blev revideret uafhængigt af to korrekturlæsere til at bestemme deres berettigelse. Nøjagtigheden af den endelige liste (nævner) af inkluderede studier blev bekræftet ved CTG og GSK repræsentanter.
Dataudtræk
To korrekturlæsere uafhængigt udtrukne data fra støtteberettigede forsøgsprotokoller og publikationer standardiseret form. [3], [11] – [13] Udgivet og upublicerede studier blev inkluderet i den endelige analyse. I tilfælde af ikke-offentliggjorte CTG studier blev data tilvejebragt af CTG. For ikke offentliggjorte GSK undersøgelser blev data udtrukket fra sammenfattende retssag rapporter. Ekstraheret data inkluderet forsøg egenskaber, publikation status, type publikation, type kræft, behandling detaljer, behandling kategori, samt valg af kontrol intervention. Metodiske kvalitet domæner er relevante for at minimere bias og tilfældige fejl for hver inkluderet RCT blev registreret i henhold til etablerede metoder. [15]
Vurdering af behandlingen succes
overlegenhed eksperimentel eller standard behandling blev vurderet tre måder [3], [11] – [13]:
hvert resultat forsøg var klassificeret som statistisk signifikant eller ikke for
a priori
specificeret primære resultat (begunstige eksperimentel eller standard behandling) og endelige resultater blev sammenfattet som proportioner;
som statistisk signifikans ikke indfange alle finesser der er involveret i at identificere behandling succes eller afvejningen mellem fordele og skadelige virkninger af konkurrerende indgreb, vi også vurderet succesraten ved at bestemme andelen af forsøg, der ifølge efterforskerne domme blev anset for at være en succes (vurderet på en 6 trins-skalaen, hvor en score på 1 favoriserer standard behandling og en score på 6 favoriserer den eksperimentelle behandling). I tilfælde, hvor eksperimentelle behandlinger blev bedømt af efterforskere til at erstatte standard behandling som ny standard for pleje blev sådanne eksperimentelle behandlinger klassificeres som “egnet til vedtagelse som standard for pleje”. Yderligere oplysninger om vurderingsmetoder findes i det supplerende materiale. Disse metoder er blevet anvendt med succes i tidligere undersøgelser af os med høj pålidelighed, ansigt og indholdsvaliditet [3], [11] – [13] og af andre [16]. Yderligere detaljer om vurdering af succesraten som pr efterforskernes dom findes i supplerende materiale Figur S1;
som de første to metoder er baseret på ‘stemmeoptællingen «og ikke tager hensyn til størrelsen af effekten, prøve størrelse, eller tid til event data, vi udførte også en kvantitativ syntese af samlede data fra hver undersøgelse om primære og sekundære resultater til at vurdere en fordeling af udfald favoriserer standard eller eksperimentelle behandlinger som pr metoder anbefalet af Cochrane Collaboration. [15]
en grundlæggende forudsætning i den samlede vurdering af behandlingen succes er, at efterforskerne gøre deres “indsatser” vedrørende overlegenhed ene behandling frem for en anden, før et forsøg gennemføres. [3], [5], [11] – [13] evalueringen af succes ny behandling afhænger af forskernes overbevisning af effekten af behandling på det primære resultat uanset typen af behandlinger undersøgt. Det vil sige, skal overholdes en lignende fordeling af behandling succes for helbredende, adjuvans, palliativ osv terapier, uanset om primære resultat var overlevelse, sygdomsfri overlevelse, responsrate, symptomlindring og så videre. [3], [5] [11] – [13] Vi har derfor analyseret alle prøvelser sammen. Ikke desto mindre, vi rapporterer resultater i overensstemmelse med de forskellige kategorier samt andre undergrupper (se resultater).
sammenflettet med vurderingen af behandlingen succes er spørgsmålet, om efterforskerne kan forudsige resultaterne på forhånd med stor sandsynlighed. Det vil sige, selvom som regel efterforskerne håber altid, at nye behandlinger ville vende overlegen etablerede behandlinger [3], [11] – [13], [17], [18], har vi tidligere hypotese, at, i en uvildig test, kan forskerne ikke forudsige resultaterne [3], [5], [17] – [19]. det vil sige, nogle gange efterforskerne forudsigelser vil vise sig til højre, nogle gange kan de være forkert, og nogle gange ville der ikke være nogen sand forskel mellem de eksperimentelle og kontrollerede behandlinger. Som et resultat, ville vi forvente at observere om ligelig fordeling i andelen af forsøg, hvor eksperimentelle behandlingsformer er overlegne eller ringere end standardbehandlinger [3], [5], [17] – [19].
følsomhedsanalyser
Ud over analysen fokuserer på primære resultater, som afspejler forskere /finansieringskilder ” guldkorn ‘på forventede succes testet behandlinger for at vurdere robustheden af vores resultater, vi gennemførte følsomhedsanalyser i henhold til den metodiske kvaliteten af forsøg (bias og tilfældige fejl), publikation status, valg af kontrol indgreb samt i henhold til de vigtigste kræft resultater, typer af behandling, etc. (se resultater).
statistiske analyser
Forskelle i andelen af succes (eksperimentel versus standard) ifølge den statistiske signifikans og efterforskernes dom inden for hver gruppe af forsøg (GSK og CTG) blev vurderet ved anvendelse af en to-stikprøve binomialtest. Ved hjælp af en standard tilgang, data om primære udfald var meta-analyseret og rapporteret som odds /hazard ratio (OR /HR) med 99% konfidensintervaller (CI) under en tilfældig-effekter model. [15] Disse data typisk inkluderet time-to -event (f.eks overlevelse og event-fri overlevelse) og dikotomisk data (f.eks svarprocent). I tilfælde af data om primære resultat var baseret på den løbende data, blev de omdannet til OR og samles med de resterende data. [15] Test af interaktion blev udført for at vurdere for forskelle i behandlingseffekt mellem undergrupperne. [15]
Vurdering af mønstret for behandling succes over tid
for at vurdere, om behandlingen succes ændret sig over tid, vi ansat tidsserier metode og meta-regression. I tidsserie analyse, vi hypotese, at hvis behandlingen succes påvirker hinanden, ville vi forvente at se signifikant sammenhæng mellem eksperimentelle behandlinger på tid
t
og foregående gange. Hvis testning i hvert forsøg er uafhængig af en anden, vil en ‘hvid støj’ mønster med nogen væsentlig autokorrelation i analysen forventes. Fordi tidsrækkeanalyse kan gå glip af en tendens i resultater over tid på grund af forskellige udefra kommende faktorer såsom et skift i retning af valg af sammenligningsgrundlag, eller forøgelse af stikprøvens størrelse over tid, vi udførte også en meta-regression ved hjælp af studieår som en co -variate, og udtrykte data for ændringer i udviklingen i behandlingseffekt over hver årti herunder testning til statistiske interaktioner i behandlingseffekt mellem to kohorter. [20]
Alle statistiske analyser blev udført ved hjælp af STATA software. Dette arbejde er rapporteret i overensstemmelse med retningslinjerne PRISMA. [21]
Resultater
Trials og behandling Karakteristik
Identifikation og udvælgelse af undersøgelser for GSK og CTG kohorter er illustreret i figur 1. CTG kohorte bestod af 77 forsøg (84 sammenligninger) indskrive 33,260 patienter og GSK kohorte bestod af 40 kræft RCT (50 sammenligninger), som er indskrevet 19,889 patienter. Trial karakteristika alle medtaget RCTs til CTG og GSK kohorter er sammenfattet i tabel 1. Data om primære udfald var utilgængelig for 8 forsøg i CTG-kohorten (se figur 1). Overlevelse var det primære resultat i 48% (40/84) af CTG kohorten og 6% (3/50) af GSK sammenligninger (p 0,0001). Den hyppigste form for behandling undersøgt af CTG og GSK var i domæne af palliativ /understøttende behandling; dog en forskel i de procentsatser mellem to kohorter var signifikant (42% [35/84] i NCIC CTG vs. 84% [42/50] i GSK; p 0,001). Metodologisk kvalitet af inkluderede studier for begge kohorter er opsummeret i tabel 2. Samlet, kvaliteten af forsøg, der gennemføres af CTG og GSK var god. Der var imidlertid en signifikant forskel (p 0,05) i følgende risiko for partiskhed komponenter: tildeling fortielse var tilstrækkeligt beskrevet i 100% af CTG forsøg (n = 84) sammenlignet med kun 14% (7/50) af GSK undersøgelser ; beskrivelse af inddragelse /dropouts blev givet i 75% (63/84) af CTG forsøg sammenlignet med 88% (44/50) af GSK undersøgelser. Tilsvarende blændende blev beskrevet i 35% (29/84) af CTG forsøg, mens 82% (41/50) af GSK forsøg rapporterede det. Konsekvenserne af den metodiske kvalitet på de overordnede resultater er endvidere tilvejebragt i Discussion sektion. Vejviser
Evaluering af behandling Succes
Figur 2 viser succesraten for GSK og CTG kohorter i henhold til statistisk signifikans (Figure2A), efterforskerne domme (Figure.2B) og kvantitativ syntese (Figure2C). Som beskrevet i figur 3, var resultaterne statistisk signifikant i 44% (99% CI 26 til 62; 22/50) af GSK sammenlignet med 31% (99% CI 18 til 44; 26/84) af CTG forsøg (RR = 1,42; p = 0,128). Men i GSK kohorten, 42% (99% CI 24 til 60; 21/50) af de resultater, der var statistisk signifikante stillede forsøgsbehandlinger sammenlignet med 25% (99% CI 13 til 37 21/84) i CTG kohorte (RR = 1,68; p = 0,04) (figur 2A 3). Som pr efterforskere domme blev nye behandlinger begunstiget i forhold til standard i 80% (99% CI 65-94, 39/49) GSK forsøg sammenlignet med 44% (99% CI 30-58, 37/84) i CTG undersøgelser (RR = 1,81; p 0,0001) (figur 2B). GSK efterforskere skønnes 32% (99% CI 14 til 50; 14/44) af interventioner som “egnet til vedtagelse som standard for pleje” i forhold til 10% (99% CI 1 til 18, 8/82) af CTG efterforskere ( RR = 3,3; p = 0,002) (figur 2B)
(A) Fordeling af succesraten i henhold til statistisk signifikans af resultaterne for det primære resultat.; (B) Fordeling af succesraten ifølge efterforskerne domme. * Dataene for en sammenligning i GSK-kohorten var ikke til rådighed til at træffe en beslutning om efterforskernes domme. For ti sammenligning i GSK-kohorten og to sammenligninger i CTG-kohorten var data ikke er til rådighed til at foretage en vurdering af, om efterforskere overvejet den eksperimentelle behandling for at være et gennembrud (= egnet til vedtagelse som standard for pleje “). ** Resultaterne var tilgængelige i resuméet format (ikke publiceret). Derfor investigator domme ikke var muligt at vurdere i 10 sammenligninger. (C) Forest plot viser kvantitativ pooling af data om primære resultat for undersøgelser foretaget af CTG og GSK. Resuméet samlet estimat (odds /hazard ratio) er angivet ved rektangler, med linjerne, der repræsenterer 99% konfidensintervaller (CIS).
Meta-analyse af de primære udfald viste, at interventionen effekt var større i GSK forsøg (som angivet ved lavere OR /HR i sygelighed /dødelighed) end i CTG-kohorten (OR /HR = 0,61 [99% CI 0,47-0,78] i forhold til 0,86 [99% CI 0,74-1,00]; p = 0,003 for test af interaktionen mellem to undergrupper, figur 2C). Resultaterne for andre vigtige resultater er vist i figur 4. For resultatet af samlet overlevelse, viste resultaterne, at succesraten for GSK kohorte svarede til CTG og nye behandlinger er så tilbøjelige til at være ringere eller bedre end standard behandlinger (OR = 0,91 [99% CI 0,73-1,13] i forhold til 0,91 [99% CI 0,83-1,01]; p = 1,00 for test af interaktion mellem to undergrupper). Nye behandlinger blev lidt foretrukket for begivenhed overlevelse i både GSK (OR = 0,75, [99% CI0.57-0.97]) og CTG (OR = 0,84 [99% CI 0,75 til 0,93] kohorter, men testen af samspillet mellem undergrupperne var ikke signifikant (p = 0,28; figur 4). for resultatet af svarprocenter nye behandlinger blev begunstiget i standardbehandlinger i GSK-kohorten (OR = 0,54 [99% CI 0,38-0,76]), men ikke for CTG-kohorten (OR = 0,77 [99% CI 0,52-1,14; p = 0,08 for test af interaktion mellem to undergrupper,. figur 4) for resultatet af behandlingen dødelighed var så tilbøjelige til at være overlegen eller underlegen standard behandlinger for GSK nye behandlinger (OR = 1,03 [99% CI 0,71-1,50]) og CTG kohorte (OR = 1,39 [99% CI 0,57-3,38]; p = 0,423 for test af interaktion. figur 4) Tilsvarende begrænse analyse kun antiemetika terapi (som repræsenterede den største kategori af behandling i GSK og den næststørste i CTG forskning portefølje), vi fundet lignende behandlingseffekt med ingen forskel mellem to kohorter (OR = 0,52 [99% CI 0,34 til 0,81] sammenlignet med 0,55 [99% CI 0,25 til 1,23]; p = 0,873; figur 5).
Resuméet samlet estimat (odds /hazard ratio) er angivet ved rektangler, med linjerne, der repræsenterer 99% konfidensintervaller (CIS). Bemærk, at i modsætning til den samlede analyse for alle primære udfald (figur 2) test af interaktionen konstateres nogen statistisk signifikant forskel mellem undergrupper, men antallet af sammenligninger var for lille til at påvise en forskel mellem to kohorter.
Da forekomsten af undersøgelser med antiemetiske behandlinger, inkluderer vi denne undergruppe analyse. Resuméet samlet estimat (odds /hazard ratio) er angivet ved rektangler, med linjerne, der repræsenterer 99% konfidensintervaller (CIS). Testen af interaktion er statistisk ikke-signifikant mellem de to kohorter, men antallet af forsøg var lille.
Følsomhedsanalyser efter risiko for bias, type kræft, behandling kategorier, og forsøgsdesign er show i figurerne 6 til 8. resultaterne fra følsomhedsanalyser viser, at den samlede succesrate på eksperimentel versus standard behandlinger for GSK og CTG kohorter ikke var væsentligt påvirket af risiko for bias (figur 6 og 7) på trods af forskelle i risiko for partiskhed elementer inden og mellem de to kohorter (se tabel 2). Resultat af yderligere følsomhedsanalyse er rapporteret i den supplerende materiale (figur S2). Som vist i figur 8, mens GSK og CTG ansat placebo /nej terapi som en komparator ligeligt, effekten størrelse i GSK forsøg anvender placebo /nej terapi som en komparator var betydeligt mere udtalt end i CTG forsøg (se tabel 1 ). Ligeledes 100% (11/11) af forsøg, der er ansat placebo i GSK var statistisk signifikant sammenlignet med 30% (3/10) af forsøg i CTG-kohorten (p = 0,001) (figur 9).
resumé samlet estimat (odds /hazard ratio) er angivet ved rektangler, med linjerne, der repræsenterer 99% konfidensintervaller (CIS).
Resuméet samlet estimat (odds /hazard ratio) er angivet med rektangler, med linjerne, der repræsenterer intervaller 99% sikkerhedsgrænser (CIS). * Repræsenterer en statistisk signifikant test for samspil mellem undergrupper. Testen for interaktion var statistisk signifikant i kohorte af GSK forsøg rapportering versus ikke at rapportere forventede forskel for primære resultat.
Resuméet samlet estimat (odds /hazard ratio) er angivet ved rektangler, med linjerne, der repræsenterer 99% konfidensintervaller (CIS). * Repræsenterer en statistisk signifikant test for samspil mellem undergrupper. Bemærk, at de eksperimentelle behandlinger var statistisk overlegen i GSK forsøg, hvor komparatorer var placebo eller ingen behandling.
(A) Succes rate efter statistisk signifikante resultater, lægens vurdering og metaanalyse i placebo-kontrollerede forsøg. (B) Succes rate efter statistisk signifikante resultater, investigator dom og meta-analyse i forsøg med aktiv behandling som kontrol. Statistisk signifikante resultater blev observeret i GlaxoSmithKline (GSK) forsøg i henhold til alle 3 målinger af et resumé af behandling succes (en andel af statistisk signifikante resultater med eksperimentel behandling, ifølge efterforskerne domme og kvantitativ sammenlægning af data). (B). Hvornår blev anvendt den aktive komparator, kun var tilfældet for de målinger efter efterforskernes domme. Test af interaktioner i placebo-kontrollerede forsøg var meget signifikant til fordel for GSK i forhold til National Cancer Institute Canada Clinical Trials Group (CTG) sammenligninger (p = 0,001), mens det ikke var signifikant (p = 0,154) mellem forsøg, når blev brugt aktiv kontrol som en komparator.
Figur 10 viser virkningen af behandling over tid. Tidsserieanalyse var i overensstemmelse med den “hvid støj ‘mønster, hvilket indikerer, at hvert forsøg behandlet spørgsmålet uafhængigt af den foregående. Men en meta-regression viser en signifikant tendens til HR = 1 (logHR = 0) over tid i GSK kohorte. Det vil sige, de gennemsnitlige behandlingseffekt faldt over tid med 48% pr årti (figur 10B). For CTG kohorte, var der ingen ændring i størrelsen af effekten størrelse over tid. Determinationskoefficienten (R
2) var 24,5% i GSK-analyse, dvs. modellen tegnede sig for omkring 25% af den observerede variation i resultaterne, mens R
2 var næsten nul i CTG-kohorten.
A) Tidsserieanalyse af behandlingseffekt (naturlige logaritme hazard ratio [ln HR]). Dataene er i overensstemmelse med “hvid støj” mønster angiver ingen signifikant autokorrelation mellem undersøgelser med forskellige tidsintervaller. En ln HR mindre end 0 indikerer overlegenhed nye behandlinger; større end 0, overlegenhed standardbehandlinger. B) Meta-regressionsanalyse. Resultaterne viser en signifikant tendens mod HR = 1 (logHR = 0) med tiden i GlaxoSmithKline (GSK) kohorte. Det vil sige, den gennemsnitlige effekt størrelse af behandlinger faldet over tid [med 38% pr årti (= exp (0,48) = 1,62)] For National Cancer Institute Canada Clinical Trials Group (CTG) kohorte var der ingen statistisk signifikant ændring i behandlingen effekt over tid. R
2 = 24,48% for GSK dvs. modellen sig for ca. 25% af den observerede variation i resultaterne, mens R
2 var næsten nul i CTG kohorte. C) Meta-analyse stratificeret efter tidsperioder. Resultaterne bekræfter resultaterne af meta-regression. Lodrette linje viser linjer af ingen forskel mellem nye og standardbehandlinger. Bemærk, at en “ingen forskel” resultat kan opnås, når behandlinger er virkelig identiske, eller når eksperimentelle behandlinger er så vellykket som standardbehandlinger (dvs. undertiden nye behandlinger er bedre og undertiden standardbehandlinger er bedre). Firkanter viser punktestimater. Vandrette linjer repræsenterer 99% konfidensinterval (CI)
Sample størrelse var noget større i GSK forsøg [median (interval):. 296 (20 to8231) sammenlignet med 244 (31-5157; p = 0,062 ). Den steg også over tid i begge kohorter. For GSK i gennemsnit prøvens størrelse fordoblet hvert årti. For CTG i gennemsnit steg med 50% per årti. Den gennemsnitlige stikprøvestørrelse stigning (dvs. hældning) var statistisk signifikant mellem to kohorter (P 0,001). (Figur 11)
Der var en stigning i prøven størrelse over tid både for National Cancer Institute Canada Clinical Trials Group (CTG) og GlaxoSmithKline (GSK) kohorte. For CTG i gennemsnit prøvens størrelse er steget med 50% per tiår, mens GSK i gennemsnit det fordoblet. GSK forsøg var også noget større end CTG forsøg: [median (interval): 296 (20-8231) vs. 244 (31-5157); p = 0,062]. Prøve størrelse var noget større i GSK forsøg [median (interval): 296 (20-8231) sammenlignet med 244 (31-5157); p = 0,062]. Den steg også over tid i begge kohorter. For CTG gennemsnit prøvens størrelse er steget med 50% per tiår, mens GSK i gennemsnit det fordoblet per årti. Den gennemsnitlige stikprøvestørrelse stigning (dvs. hældning) var statistisk signifikant mellem to kohorter (P 0,001).
For at undersøge, om ændringen i brugen af komparator (aktiv versus placebo /ingen behandling), og forøgelse af stikprøvestørrelsen kan forklare ændringen af størrelsen af behandlingens effekt over tid, en meta-regression ved hjælp tid, blev komparator og stikprøvestørrelse udført. Resultaterne viser, at ingen af disse variabler påvirket resultaterne i CTG-kohorten (R
2 = -0,68%), som forblev stabil over tre årtiers observationer. Men i GSK kohorte, tid (udgivelsesår; p = 0,048) og valget af komparator (p 0,0001) blev forbundet med statistisk signifikant effekt på virkningen størrelse mens stikprøve viste ingen sådan forening (p = 0,08; Figur 12 ). Disse to variable tegnede sig for ca. 72% af den observerede variation i resultaterne (R
2 = 71,7%). Yderligere følsomhed analyseresultater fra meta-analyse for distribution af succesrate for forsøg med flere sammenligninger er illustreret i supplerende materiale Figur S2.
Ingen af de variabler var statistisk signifikante i NCIC CTG kohorte af forsøg (R
2 = -0,68%). I GSK viste kohorte prøvestørrelse ingen statistisk signifikant sammenhæng med resultaterne (p = 0,08), mens år (p = 0,048) og valget af komparator (p 0,000) blev statistisk forbundet med de observerede resultater i GSK kohorte. Disse to variable tegnede sig for ca. 72% af den observerede variation i resultaterne (R
2 = 71.69%). Generelt effekten størrelse var tættere på en (ln HR = 0), når den aktive komparator var ansat.
Diskussion
Mens andre undersøgelser evalueret en sammenhæng mellem sponsorering og sundhedsresultater [5], [6], [22], ingen studie specifikt undersøgt spørgsmålet, hvor ofte nye behandlinger er bedre end etablerede behandling som funktion af finansieringskilde. Vi præsenterer den første undersøgelse, der evaluerer behandlingen succes og mønster af terapeutiske opdagelser i industrien sponsoreret versus offentligt sponsoreret forskning. Ved hjælp af tre målinger til vurdering af terapeutisk succes, viste vi, at succesrater varierer mellem industrien og offentligt støttede forsøg. Eksperimentelle behandlinger var i gennemsnit begunstiget i industrien sponsoreret forskning. Nye behandlinger resulterer i statistisk signifikante resultater blev begunstiget oftere i GSK end i CTG-kohorten (42% versus 25%, p = 0,04). Tilsvarende vurdering af forskningen succes ifølge efterforskerne domme viste, at eksperimentelle behandlinger var overlegen i forhold til standardbehandlinger i 80% af GSK i forhold til 44% af NCIC CTG forsøg (p 0,001). Endelig kvantitativ poolet analyse af data for den primære resultat viste også, at succesraten for GSK forsøg var overlegne i forhold til CTG forsøg (odds ratio = 0,61 i forhold til 0,86; p = 0,003). Således, afhængig af den metriske anvendte, er industri-sponsorerede forsøg i forbindelse med 17 til 25% statistisk signifikant større sats af opdagelsen af nye succesfulde behandlinger end offentligt sponsorerede undersøgelser. Men tid analyse viste, at forskellen er forsvundet over tid, og at succesraten mellem industrien sponsoreret og offentligt støttede forsøg er blevet sammenlignelige (figur 11).
Hvordan kan forklares disse resultater? Et grundlæggende aspekt af enhver forklaring skal dreje sig om spørgsmålet om forudsigelighed af resultaterne på forhånd, og dens konsekvenser for klinisk forsøg systemet
Vores resultater er i overensstemmelse med flere hypoteser, som ikke er nødvendige udelukker hinanden:.
resultaterne repræsenterer “sandhed”. De observerede højere succesrater set i industri-sponsorerede forsøg er forankret i den måde, kommercielle sponsorer investere i udvikling af lægemidler, så kun forslag med meget lovende data og stor sandsynlighed for succes fremskridt til RCT test. [7] Det vil sige, at jo højere succes satser set i industrien sponsoreret forskning forventes, og kan forklares med omfattende forskning og udviklingsindsats kombineret med multimillion dollar investeringer [23], indviklede viden om narkotika, omhyggelig planlægning, og omhyggelig og professionel udførelse, i overensstemmelse med en tilhørende mål om at bringe et terapeutisk middel til licens godkendelse og marked. [7], [23], [24] Derfor er resultater, der viser, at andelen af nye behandlinger er bedre end standard behandlinger er betydeligt højere i kommercielt sponsorerede undersøgelser er reel og bør ikke tages som en overraskelse. [7], [24] Faldet i forskellene i behandlingen succes mellem offentligt sponsoreret og industri sponsoreret over tid kan afspejle stigende vanskeligheder med at udvikle “blockbuster” lægemidler (såsom onandenstron i palliativ felt, som tegnede sig for en række positive forsøg i denne GSK kohorte), som er typisk forbundet med store effektstørrelser. Som et resultat, forsøgene i senere årtier fokuseret på at opdage mindre behandlingseffekt, som krævede større stikprøvestørrelser.
Leave a Reply
Du skal være logget ind for at skrive en kommentar.