Følsomhed, specificitet og pålidelighed af RIPASA-scoren til diagnose af akut blindtarmbetændelse i forhold til Alvarado-scoren / Cirug Lyra Espa Sirupola (engelsk udgave)

introduktion

akut blindtarmbetændelse (AA) er forbundet med 10% sygelighed og 0,24% -4,0% dødelighed1 og er den hyppigste diagnose over hele verden for nødkirurger, der repræsenterer op til 20% af alle kirurgiske operationer.2 Det forekommer hyppigst mellem det andet og fjerde årti af livet med en rettidig diagnose, der er vanskelig og overvejende symptombaseret.3

procentdelen af negative appendektomier (10% -15%) er ikke ændret med indførelsen af ultralyd og computertomografi, mens procentdelen af fejldiagnose hos patienter, der gennemgår laparoskopisk appendektomi, er signifikant højere end i åben appendektomi. En milliard dollars bruges hvert år på negative appendectomies,4,5 så høje negative appendectomies er ikke længere acceptable. For at undgå forsinket diagnose, for at reducere fejlmargenen og identificere patienter, der har brug for akut operation eller patienter uden AA, ville anvendelsen af en scoringsskala være meget nyttig. Alvarado-scoren antyder med en højere score sandsynligheden for, at patienten har AA-symptomer.6

et nyt system, Raja Isteri Pengiran Anak Saleha Appendicitis (RIPASA) score, synes at have større følsomhed og specificitet til diagnose af AA og en signifikant reduktion af negative appendektomier.7,8

formålet med denne undersøgelse var at anvende begge skalaer i akutafdelingen i tilfælde af patienter med formodet diagnose af AA og at sammenligne disse med patologirapporterne efter appendektomi og derved sammenligne effektiviteten, følsomheden og specificiteten af Alvarado-og RIPASA-score i diagnosen AA på et tertiært hospital, der betjener befolkningen i det østlige Rusland.

metoder

en analytisk observationsundersøgelse blev udført mellem 1.juni og 31. December 2016 hos patienter af begge køn, der var 18 år eller ældre og kom til akutafdelingen på hospitalet de alta Especialidad af Veracruse med mistænkt diagnose af AA og gennemgik appendektomi. Inkluderet til undersøgelse var alle tilfælde behandlet med akut appendektomi, der havde patologiresultater. Undersøgelsen blev godkendt af hospitalets etiske udvalg.

instrumenter. De 2 forskellige klassifikationer, Alvarado-og RIPASA-scorerne, blev anvendt på hver af patienterne af en hjemmehørende læge i kirurgi uden at påvirke kirurgens beslutning om kirurgisk indgreb. Alvarado-score (offentliggjort i 1986) er et vurderingsdiagram (tabel 1), hvis sum giver maksimalt 10 point med større sandsynlighed for, at patienten har AA.6 RIPASA score (offentliggjort i 2010) hævdes at have større følsomhed og specificitet.7

tabel 1.

variabler i Alvarado og RIPASA skalaer og deres værdier.

Alvarado Score RIPASA Score
variabel værdi variabel værdi
smerter i RIF 2 mand 1
Positive Blumberg 1 kvinde 0.5
smerte migration 1 yngre end 40 1
kvalme eller opkastning 1 ældre end 40 0.5
anoreksi 1 udlænding 1
temperatur højere end 38 liter C 1 smerter i RIF 0.5
leukocytose højere end 10000 2 kvalme eller opkastning 1
neutrofili større end 70% 1 smerte migration 0.5
anoreksi 1
symptomer h 1
symptomer > 48h 0.5
overfølsomhed ved RIF 1
bevogtning 2
positiv rebound tegn 1
positive Rovsings tegn 2
feber > 37 kr C til kr C 1
leukocytose 1
negativ urintest 1

RIF: højre iliac fossa.

Alvarado-systemet indeholder 3 Symptomer, 3 fysiske tegn og 2 laboratorieparametre; hver variabel tildeles en værdi på 1 eller 2 point. Resultatet består af summen af værdierne med en maksimal score på 10. Jo højere den opnåede score er, desto større er sandsynligheden for, at patienten har AA. Når scoren er etableret, klassificeres diagnosen blindtarmsbetændelse som tvivlsom med mindre end 5 point, antydende fra 5 til 6 point, sandsynlig fra 7 til 8 point og meget sandsynlig fra 9 til 10 point. RIPASA-systemet har 18 variabler opdelt i 4 grupper (data, tegn, symptomer og laboratorieundersøgelser), der giver dem en værdi på 0,5 til 2, med en maksimal score på 16, og ifølge scoren er sandsynligheden for diagnose: mindre end 5 point (usandsynligt), 5-7 point (lav sandsynlighed), 7,5–11,5 point (høj sandsynlighed) og større end 12 point (diagnose af blindtarmsbetændelse).

uanset Alvarado-og RIPASA-score for hver patient med mistanke om AA anmodede den ansvarlige kirurg om supplerende undersøgelser i henhold til sagen. Hos alle patienter blev der anmodet om komplet analyse og urinalyse; abdominal ultralyd blev anmodet om hos 21 patienter ud over abdominale røntgenstråler, og hos 66 patienter blev der kun anmodet om abdominale røntgenstråler, da den sandsynlige diagnose af AA grundlæggende var klinisk, ligesom beslutningen om at udføre det kirurgiske indgreb. Det skal nævnes, at aksial tomografi ikke er en undersøgelse, der rutinemæssigt anmodes om på vores hospital i tilfælde af mistanke om AA.

de intraoperative fund for hver af patienterne blev registreret, og diagnosen AA blev bekræftet med patologiundersøgelsen af det udskårne appendiks. Efter at patienterne blev udskrevet, blev de fulgt op i ambulant indstilling i mindst 30 dage.

statistisk analyse

en beskrivende statistisk analyse af befolkningens demografiske data blev afsluttet samt analysen af diagnostiske tests ved hjælp af patologirapporten som en guldstandard (følsomhed, specificitet, positiv forudsigelsesværdi, negativ forudsigelsesværdi ). Med disse data blev ROC-kurver genereret for at sammenligne begge scoringer.

bagefter beregnede vi sandsynlighedsforholdet. LR er en god parameter til at bestemme, hvornår en diagnostisk test skal udføres. LR beregnes ved at dividere sandsynligheden for at opnå et positivt resultat, når motivet er syg af sandsynligheden for at opnå det samme resultat, når han/hun er sund; med andre ord følsomhed divideret med 1−specificitet. Jo længere væk fra 1, jo bedre er testen at skelne mellem syge og raske forsøgspersoner. For eksempel, hvis en LR er 5 (eller 5 til 1), vil testresultatet forekomme 5 gange hos dem, hvor sygdommen er til stede, for hver gang det forekommer hos de personer, hvor sygdommen er fraværende (LR+ vil altid være større end 1 og LR− vil være mindre end 1).

LR+ angiver på hvilket tidspunkt en person er mere tilbøjelig til at være positiv i virkeligheden (når testen siger, at den er positiv). I modsætning hertil angiver LR− på hvilket tidspunkt en person er mere tilbøjelig til at være negativ i virkeligheden, når testen er positiv.

i håndteringen af dataene blev fortrolighed opretholdt, og patientanonymitet blev respekteret. En af forskerne var ansvarlig for kodning af patientdata ved hjælp af tal i stedet for Navne.

resultater

i rekrutteringsperioden ud af de 218 patienter, der blev behandlet på et år, blev i alt 100 patienter inkluderet i denne undersøgelse (46%); 42 var kvinder og 58 mænd med et forhold mellem mand og kvinde på 1,7:1 (Tabel 2). Den gennemsnitlige patientalder var 36,5 til 16,2 år (interval 18-81 år). Fordelingen af AA-tilfælde svarede til andre rapporter, overvejende påvirker patienter mellem andet og fjerde årtier af livet.

tabel 2.

fordeling af variablerne for patienterne inkluderet.

Nej. % middel
køn
kvinder 42 42%
mænd 58 58%
alder interval 18-81 år 100 100% 36.5±16.2 år
BMI interval 17-36 kg / m2 100 100% 25.3±3.8 kg / m2
Comorbiditiesa
overvægt og fedme 65 76.5%
Type 2 DM 7 8.7%
HTN 4 50%
Type 2 DM + HTN 6 7.5%
andet 3 3.8%
Totala 80 100%
tidligere ledelse
analgesi 47 67.2%
antibiotika 1 1.4%
analgesi + antibiotika 22 31.4%
i alt 70 100%

kropsmasseindekset beregnes ved at dividere vægten i kilo med højden kvadreret i meter. Overvægt / fedme blev defineret ved en unormal/overdreven ophobning af fedt. BMI lig med eller større end 25 er overvægtig; BMI lig med eller større end 30 er overvægtig.

DM: diabetes mellitus; HTN: hypertension; BMI: kropsmasseindeks.

en

mere end en patient præsenterede mere end en comorbiditet.

det gennemsnitlige kropsmasseindeks var 25,3 liter 3,8 kg/m2 (interval 17-36 kg / m2). Ud af det samlede antal modtog 70 patienter forudgående medicinsk behandling, 65 (92,9%) ordineret af en læge og 5 (7,1%) selvmedicinering; 47 (67,2%) af disse patienter modtog kun analgesi, 22 (31,4%) patienter fik analgesi plus antibiotika og en patient (1,4%) kun antibiotikum.

smerter og overfølsomhed i højre iliac fossa forekom hos 100% af patienterne efterfulgt af leukocytose hos 91%, smerter ved abrupt dekompression hos 90%, neutrofili hos 90%, bevogtning hos 82%, negativ urintest hos 80%, stigning i kropstemperatur hos 75%, anoreksi hos 73%, kvalme og opkast hos 62% og migration af smerter hos 44%.

80% af alle patienter havde en eller flere comorbiditeter, hvoraf den hyppigste var overvægt hos 48 patienter og fedme hos 17 patienter (65 patienter, 76.5%); 7 (8.7%) patienter havde også type 2 diabetes mellitus; 4 (5%) patienter præsenterede hypertension; 6 (7, 5%) præsenterede begge dele; og 3 (3, 8%) patienter præsenterede andre comorbiditeter.

den gennemsnitlige tid mellem symptomdebut og den første medicinske vurdering var 45,5 liter 35 timer (interval 8-144 timer). Den gennemsnitlige tid, der gik fra den indledende vurdering af kirurgen indtil den kirurgiske opløsning, var 8,5 liter 4,0 timer (interval 2-48 timer). Med hensyn til operationen var alle appendektomier åbne operationer; i 69 blev McBurney-snittet anvendt, mens 31 blev udført med en midterlinie laparotomi. Edematøs blindtarmsbetændelse blev observeret i 2 tilfælde, flegmonøs blindtarmsbetændelse hos 30 patienter, nekrotisk blindtarmsbetændelse hos 21 og perforeret blindtarmsbetændelse i 33 tilfælde.

Postoperative komplikationer forekom hos 8 patienter (4 seromer, 2 infektioner på det kirurgiske sted og 2 resterende abscesser). Vi definerede resterende abscess som tilstedeværelsen af intra-abdominale purulente samlinger efter kirurgisk behandling af AA.

frekvensen af negative appendektomier (histologisk normalt appendiks) var 14%. Der var ingen dødsfald under den nuværende undersøgelse. Det gennemsnitlige hospitalsophold var 3,5 kr. 1.8 dage (interval 1-21 dage).

efter anvendelse af klassificeringssystemerne på patienterne i undersøgelsen fandt vi, at RIPASA-scoren viste større diagnostisk sikkerhed sammenlignet med Alvarado-scoren med en følsomhed på henholdsvis 98,8%, specificitet 71,4%, PPV 95,5% og NPV 90,9% vs følsomhed 90,7%, specificitet 64,3%, PPV 94,1% og NPV 60% (tabel 3). RIPASA-scoren viste et område under kurven (AUC) på 0,88 sammenlignet med Alvarado-scoren, som er 0,80 (Fig. 1).

tabel 3.

2×2 Beredskabstabel, hvor resultaterne blev opnået.

RIPASA Score
Patologiresultat patienter (+) sund ( – ) i alt
negativ 1 10 11
positiv 85 4 89
i alt 86 14 100
FN 1 TN 10
TP 85 FP 4
Alvarado Score
Pathology Result Patients (+) Healthy (–) Total
Negative 6 9 15
Positive 80 5 85
Total 86 14 100
FN 6 TN 9
TP 80 FP 5
rip side Score
følsomhed specificitet PPV NPV
0.99 0.71 0.96 0.91
Alvarado Score
følsomhed specificitet PPV NPV
0.91 0.64 0.94 0.60

FN: falsk negativ; FP: falsk positiv; TN: sand negativ; TP: sand positiv; NPV: negativ forudsigelsesværdi; PPV: positiv forudsigelsesværdi.

ROC-kurver opnået ved at beregne resultaterne af begge scoringer.
Fig. 1.

ROC-kurver opnået ved beregning af resultaterne af begge scoringer.

(0.12 MB).

senere beregnede vi LR for vores resultater og for hver af de tidligere lignende rapporter (Tabel 4). I tilfælde af vores undersøgelse var den positive LR 3,5 og den negative LR 0,02 for RIPASA-scoren sammenlignet med den positive LR på 2,5 og den negative LR på 0,2 for Alvarado-scoren. Den gennemsnitlige positive LR for alle undersøgelserne inkluderet i tabel 4 for Alvarado–score blev beregnet til 3,6 (interval 2,0–6,5) og var lidt højere for RIPASA-score ved 3,7 (med et meget bredere interval: 1,2-10,1); den gennemsnitlige specificitet var 77,8% (64.3% -90%) for Alvarado-skalaen og 63,3% (36% -90,5%) med et bredere interval for RIPASA; den gennemsnitlige følsomhed var henholdsvis 67,1% (52% -90,7%) mod 90,7% (75% -98,8%) for Alvarado-og RIPASA-score.

Tabel 4.

sammenligning af følsomheden og specificiteten af Alvarado Score og RIPASA Score i forskellige publikationer.

Alvarado Score RIPASA Score
følsomhed specificitet LR+ Lr− følsomhed specificitet Lr+ LR−
Chong et al., 20118 68.3% 87.9% 5.6 0.4 98% 81.3% 5.2 0.03
Alnjadat et al., 20139 73.7% 68.6% 2.3 0.4 93.2% 61.8% 2.4 0.1
et al., 201410 58.9% 85.7% 4.1 0.5 96.2% 90.5% 10.1 0.04
Repplinger et al., 201411 52% 74% 2.0 0.6 75% 37% 1.2 0.7
the mind et al., 201612 65.2% 90% 6.5 0.4 95.5% 65% 2.7 0.07
Golden et al., 201613 61% 74% 2.2 0.6 78% 36% 1.3 0.5
denne undersøgelse 90.7% 64.3% 2.5 0.2 98.8% 71.4% 3.5 0.02
gennemsnit 67.1% 77.8% 3.6 0.4 90.7% 63.3% 3.7 0.2

LR (+): positivt sandsynlighedsforhold; LR (−): negativt sandsynlighedsforhold.

vi sammenlignede følsomhedsresultaterne af begge klassifikationer mellem patienter med blindtarmsbetændelse; ligeledes sammenlignede vi blandt patienter uden blindtarmsbetændelse resultaterne med hensyn til specificitet (Mcnemars test for parrede data). De observerede forskelle mellem begge scoringer var ikke statistisk signifikante. AUC-værdierne (fra begge ROC-kurver) blev sammenlignet, og forskellen var ikke statistisk signifikant (DeLong-teknik, Med Cal-programmel).

Diskussion

formålet med vores undersøgelse var at sammenligne evnen hos to kliniske scoringssystemer, Alvarado og RIPASA-scoringerne, til at diagnosticere eller udelukke blindtarmsbetændelse siden computertomografi, ultralyd og laparoskopi har ikke været i stand til at reducere procentdelen af diagnostisk fejl.14

det er blevet foreslået, at antallet af negative appendektomier ikke bør overstige 15%, og samtidig bør vi reducere forekomsten af perforering.14 for at øge den diagnostiske sikkerhed og følgelig reducere procentdelen af negative appendektomier er disse kliniske scoringssystemer blevet udviklet. Vores forskning vurderede nytten af sådanne skalaer i befolkningen i den østlige del af landet, og større følsomhed og specificitet blev fundet med RIPASA-scoren. ROC-kurver blev genereret (Fig. 1), der viser en større AUC for RIPASA-score sammenlignet med Alvarado-score; Dette repræsenterer bedre følsomhed/specificitet for RIPASA-skalaen.

i undersøgelsen af Golden et al. i USA blev den rapporterede AUC omvendt: 0,67 for RIPASA-scoren og 0,72 for Alvarado-scoren.13 Dette kan skyldes den undersøgte population, da det er blevet rapporteret, at RIPASA-skalaen oprindeligt var designet til den asiatiske befolkning, fordi Alvarado-skalaen ikke demonstrerede diagnostisk pålidelighed i denne population.7

med hensyn til sensitivitet og specificitet, vel. rapporterede, at de brugte Alvarado-score hos 113 patienter, idet de observerede en følsomhed på 99% og en specificitet på 62%, hvilket svarer til vores data.15 Cedillo et al. observeret hos 99 patienter en højere specificitet af Alvarado-score (57%) sammenlignet med computeriseret tomografi eller ultralyd i de første 24 timer efter indtræden.16

inden for undersøgelserne, der sammenlignede begge systemer (Tabel 4), Chong et al. rapporteret for RIPASA score en følsomhed på 98% og en specificitet på 81.3%, mens de for Alvarado-score observerede en følsomhed på 68, 3% og en specificitet på 87, 9%.8 Alnjadat og Abdallah viste en følsomhed på 93,2% og specificitet på 61,8% for RIPASA og en følsomhed på 73,7% med en specificitet på 68,6% for Alvarado.9 yderligere to undersøgelser11, 13 rapporterede den laveste specificitet, der blev fundet for RIPASA-skalaen. Ligeledes, Sinnet et al.12 viste en specificitet på 65% for RIPASA, hvilket var lavere end specificiteten på 90% for Alvarado.

i modsætning hertil Nanjundaiah et al. rapporterede en følsomhed og specificitet for RIPASA på 96,2% og 90.5% og for Alvarado på henholdsvis 58,9% og 85,7%.10 Endelig er den ikke-sammenlignende undersøgelse af Butt et al.17 observerede en specificitet på 93% og en følsomhed på 96,7% (LR+ 13,8 og LR− 0,04) for RIPASA-scoren. Disse undersøgelser8-13 viser, at RIPASA såvel som Alvarado-scorerne generelt er relativt følsomme og specifikke for diagnosen AA. Nogle forfattere har også vist deres fordel i forhold til billeddannelsesundersøgelser,16 selvom dette ikke er blevet bekræftet af andre.13 specificiteten af RIPASA, som i artiklen af Nanjundaiah et al., 10 var bedre end Alvarado på vores hospital (Tabel 4). Variabiliteten af tal observeret mellem undersøgelserne kan også være sekundær til en effekt af den population, hvorfra prøven blev ekstraheret.

ligeledes bestemte vi, at afskæringspunktet for Alvarado-score kan være så lavt som 6,5 (anbefales mellem 7 og 7,510) og 9,25 for RIPASA-score ved hjælp af ROC-kurver, da dette afskæringspunkt opnår en balance mellem specificitet og følsomhed.

så nærmede vi os opgaven med at beregne den positive LR for hver sammenlignende rapport (Tabel 4), og gennemsnittet af disse undersøgelser var lidt højere (3,7 vs 3,6) for RIPASA-skalaen.

frekvensen af negative appendektomier rapporteret i vores undersøgelse var 14%, svarende til rapporter i den internationale litteratur.14,18,19 brugen af disse klassifikationer er rapporteret at have en effekt på procentdelen af negative appendektomier og i undersøgelsen af Chong et al., formåede disse forfattere at reducere satsen til kun 6,9%.8 selvom 70% af patienterne ankom til vores hospital med tidligere medicin (analgesi og antibiotika), reducerede dette ikke den diagnostiske effektivitet af scoringssystemerne.

på trods af at 80% af vores patienter havde en eller flere comorbiditeter, præsenterede kun 8% af patienterne kirurgiske komplikationer. Den gennemsnitlige tid mellem symptomdebut og den første medicinske vurdering var 45,5 timer. praktiserende læger bør trænes i brugen af disse skalaer for at undgå forsinkelse i diagnosen.

afslutningsvis præsenterer RIPASA-scoren større nøjagtighed og pålidelighed som en diagnostisk test sammenlignet med Alvarado-scoren og er nyttig til at træffe passende terapeutiske beslutninger. På hospitaler som vores er diagnosen AA meget afhængig af den kliniske evaluering udført af kirurger. Et passende klinisk scoringssystem ville undgå diagnostiske fejl og opretholde en tilfredsstillende lav frekvens af negative appendektomier ved tilstrækkelig patientstratificering, samtidig med at patientens eksponering for ioniserende stråling begrænses, da der er en øget risiko for at udvikle kræft med computertomografi, især for den pædiatriske aldersgruppe.13,20

interessekonflikt

forfatterne har ingen interessekonflikt at erklære relateret til denne forskning.